現代の音声合成技術は特定の人物の声を基にして、その人と非常に似た合成音声を生成する能力を持つ。このような実在の人物の声の合成は、なりすましや詐欺などの不適切な使用が問題視されていることに加え、声の再現や公開がその人物の人格的利益や名誉感情に影響を与える可能性もある。また声優や歌手のように、自らの声を職業活動に利用する人々にとっては、無許可での声の再現や使用によって経済的損失を被る恐れがある。 この研究の焦点は、特定の人物の音声データから学習させたモデルを用いて、任意のテキストをその人物の声で読み上げる合成音声技術にある。日本ではこの問題に関する具体的な法的争訟例はまだ存在しないとされるが、研究では架空の事例を設定し、この技術が引き起こしうる問題点を探究する。以下がその事例になる。(音声合成AIの利用場面における法的課題―「声」に権利はあるのか―より引用)。 声優Xは、所属するタレント事務所
『VOICEPEAK 小春六花』の商用利用に関しまして、多数のお問い合わせを頂いております。 販売を担当している株式会社AHS様のサイトにおいて、商用利用に当たる範囲、使用可能な用途を整理したサイトがありますのでご参照ください。 【非商用で利用可能な範囲について】 個人、同人活動を目的とする個人の集団(グループ)、法人格を持たず業務や商売を行っている個人事業主がVOICEPEAK キャラクター製品シリーズの合成音声を非商用・非業務目的で利用可能な範囲について
俳優・声優の権利保護活動を行う日本俳優連合は6月13日、「生成系AI技術の活用に関する提言」を発表した。著作権法の運用見直しやルール作り、「声の肖像権」の確立などを業界や国に求める。 提言内容は「国内外で活発に意見交換し、EUのAI規制を参考にしたガイドライン策定を行うこと」「著作権法の運用見直しをはかる」「AI生成作品であると明記すること」「AIの表現分野への進出について一定のルールを設けること」「声の肖像権を確立すること」。 日本俳優連合は「新しい技術の進化による人間社会の発展は望ましいこと」とする一方で、「実演家の、表現の模倣・盗用を安易に促し、職域を侵害する恐れがある」と問題視している。 「主体は人間であり、その補助をAIが行うという趣旨のもと、新たなガイドラインや法律の制定を強く望む」(日本俳優連合) 生成AIと俳優・声優を巡っては、実在の女優や女性声優などの画像を生成できる非公
AIを活用して声を学習し、本人そのままの高精度な声で生成する技術がここ数カ月で大きく進化しています。 RVCというAIボイスチェンジャー機能は、岸田首相の声真似を本人の前でデモするまでになり、AIフェイクボイスの問題が一部で取り沙汰されるようにもなりました。 そんな中、アップルがAIを使った人声の学習・生成機能「Personal Voice」を今年下半期のOSアップデートで提供すると発表しました。 iPhone、iPad、そしてAppleシリコンを搭載したMacで15分、ランダムに表示される150の文章を読み上げるだけで自分の声を学習することができ、テキストをタイプすると自分そっくりな声で相手に伝えることが可能になります。ただし、当初は英語のみです。 テキストした文章を音声化する機能(TTS、Text To Speech)をアップルは「Live Speech」という新機能で提供。これまでは
2023年4月18日にMicrosoft Research AsiaとMicrosoft Azureのカイ・シェン氏らの研究チームが拡散モデルを使用した小品質の音声合成システム(TTS)である「NaturalSpeech 2」を発表しました。NaturalSpeech 2では数秒の短い音声サンプルを利用する事で、人の声だけでなく歌声までも忠実にシミュレートすることが可能になっています。 [2304.09116] NaturalSpeech 2: Latent Diffusion Models are Natural and Zero-Shot Speech and Singing Synthesizers https://doi.org/10.48550/arXiv.2304.09116 NaturalSpeech 2 https://speechresearch.github.io/na
画像・文章生成AIが活気づくなか、人工知能と機械学習を使って吹き替えツールを製作するソフトウェア企業・Eleven Labsが、ゼロから新しい合成音声を設計できる音声合成モデル「Design Voice」を作成していることを明らかにしました。 This Voice Doesn't Exist - Generative Voice AI https://blog.elevenlabs.io/enter-the-new-year-with-a-bang/ Eleven Labsは映画やオーディオブック向けの吹き替えツールを開発している企業。このツールは元の話者の声の性質を維持しながら、自動的に別の言語で読み直すことができるという特徴があります。 Eleven Labsによると、吹き替えツールに使用する音声合成・音声複製手法をひもとくことで、新たな音声合成AIのアイデアが浮かんできたとのこと。実
これまでに誰でも簡単に「結月ゆかり」の声になれる音声変換技術や音声合成ソフト「VOICEVOX」を開発してきたヒホ氏の所属するドワンゴの機械学習技術研究部門Dwango Media VillageがAI音声合成ソフト「Seiren Voice」を発表しました。Seiren Voiceではマイクで録音した音声を自動で文字起こしして、イントネーションを再現したまま結月ゆかりや琴葉 茜・葵のボイスに変換可能とのことなので、実際に無料体験版をインストールして使い方や変換精度を確かめてみました。 高品質な音声変換ソフトウェア | Seiren Voice https://seiren-voice.dmv.nico/ ・目次 ◆1:Seiren Voice&音声ライブラリのインストール手順 ◆2:Seiren Voiceで音声を変換する手順 ◆3:Seiren Voiceで編集部員の声を結月ゆかりにボ
Seiren Voiceはユーザーが声を入力すると、キャラクターの音声に変換して出力するボイスチェンジャー。ドワンゴのAI研究部門「Dwango Media Village」が独自開発した声質変換エンジンを採用する。 ボイスチェンジャーにはリアルタイムに変換するものもあるが、Seiren Voiceは非リアルタイムに特定の人物の声に置換するもの。 入力音声を直接出力音声に変換するのではなく、音素や音の高さ、発音タイミングなどの要素に分解した後にキャラクターの音声として再合成する仕組み。ユーザーとキャラクターの声を対応付けた学習させなくていい点が特徴という。 関連記事 ドワンゴ、AIボイスチェンジャー公開 誰の声でも100人の声に変換 ドワンゴがディープラーニング技術を活用したボイスチェンジャー「Seiren Voice」をWebサイトで無償公開した。自分の声を100人分の声に変換できる。
AI歌声合成技術の開発を手掛けるテクノスピーチ(名古屋市)は2月18日、AI技術により人間らしい歌声を合成できるソフトウェア「CeVIO Pro」のα版を24日に無償公開すると発表した。既存バージョンの「CeVIO」「CeVIO AI」とは異なり、Windows・macOSの両方に対応。追加の許諾や利用料不要で商用利用も可能。 CeVIO Proは、楽譜と歌詞を入力すると、AIが人間らしい歌声をシミュレーションして出力する歌声合成ソフト。まずは無料で商用利用もできるキャラクター音源1種類と編集ソフトをα版としてリリース。当該音源は正式版のリリース後も無償提供する。 現在の最新版であるCeVIO AIは、Windows専用で音楽制作ソフト(DAW)との連携に未対応。販売方法も買い切り方式だが、CeVIO ProはmacOSにも対応し、DAWとの連携も可能。第2弾以降のキャラクター音源はサブス
日進月歩というより、秒進分歩で進化している感じのある音声合成、歌声合成の世界ですが、また新たな革命ともいえるAI音声合成ソフトが誕生しました。これまでDTMステーションでも何度も取り上げてきた歌声合成ソフト、Synthesizer Vを開発するDreamtonics株式会社と株式会社AHSと共同開発する形で、もはや人間の喋り声にしか聴こえない音声合成ソフト、VOICEPEAKを発表し、3月11日から発売を開始するのです。Synthesizer Vと同様、Windows、Mac、Linuxでも動くマルチプラットフォームソフトで価格はダウンロード版で23,800円(税込み)となっています。 このソフト「VOICEPEAK 商用可能 6ナレーターセット」という製品名になっていますが、実際には女性3人+男性3人+女の子1人=7人の声を切り替えることが可能なAI音声合成ソフトで、テキストを入力すれば
人間ではなくプログラムによって特定のテキストを読み上げさせる音声合成ソフトは数多く存在しています。ソフトに使われる音声合成エンジンにはさまざまな種類があり、複数の音声合成エンジンや音声ライブラリを使うことができる汎用合成音声エディタ「ユニコエ」をビスさんが公開しています。 ユニコエ 公式サイト https://sites.google.com/view/unicoe/%E3%83%9B%E3%83%BC%E3%83%A0 ユニコエがどういうアプリなのかは以下のムービーを見るとよくわかります。 【ユニコエ】アプリ紹介 - ニコニコ動画 ユニコエでは音声合成エンジンや音声ライブラリを複数登録することができます。 選択した音声合成エンジンが、中央に入力されたテキストを読み上げてくれます。 イントネーションはフレーズごとに調整可能。 また、音声ライブラリの立ち絵も表示されます。 ユニコエは、公式サ
シロワニさん氏が趣味で開発したというWindows向けのAIトークソフト「COEIROINK(コエイロインク)」が無料で公開されています。COEIROINKは連絡不要で商用利用もOKなフリー素材キャラクター・つくよみちゃんに好きなテキストを誰でも簡単に読み上げてもらうことが可能なので、自作アニメやボイスドラマのキャラクターボイス、実況動画や解説動画のナレーションなどの作成にお役立ちです。 COEIROINK https://coeiroink.com/ ✨COEIROINKリリース✨ 無料の音声合成エンジン「#COEIROINK」が登場! 文章を読み上げます! ■公式サイト⇒https://t.co/66YStrCYu0 ■COEIROINK開発:シロワニさん様 @shirowanisan ■VOICEVOX開発:ヒホ様 @hiho_karuta 第1弾は「#つくよみちゃん」! 商用利用O
スマートフォンやスマートスピーカー、銀行ATM、券売機など、あらゆる場面で合成音声が使われるようになって久しい。近年では特に機械学習技術を活用した音声合成システムの製品化やサービス化が進んでいる。 音声合成の研究開発や製品化を行う際には、学習素材として大量の音声が必要だ。しかし学習に適した上質な音声ファイルはネット上にもあまりない。いまだに素材を集めにくい状態にある。 これまでは研究開発用の素材を得るため「音素バランス文」と呼ばれる台本を用意し、それをアナウンサーや声優などに読み上げてもらい、まとまったデータを取得していた。 「しかし、これまでの音素バランス文には『使用料』『ライセンス』『台本の読みにくさ』3つのハードルがありました」 そう話すのは明治大学で音声合成の研究をしている小口純矢さんだ。音声合成ソフトの販売を手掛けるSSS(仙台市)と小口さんが所属する明治大学、九州工業大学は6月
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く