タグ

歌声合成に関するNATのブックマーク (112)

  • NEUTRINOがいつの間にか4周年 AIシンガー懐古厨|くろ州

    ↑これから4年たちました。今日はAIシンガーが一般人の手に落ちてくるまでの話を懐古していきます。 衝撃までの3年間私が「AIシンガーすっっっっっっっご」と初めて感じたのは、今はなき「VoiceText」でした(今はブランド名が変わっている)。 すごい。しゃくりあげや声色の自然な変化。それまでもCeVIOがあったし、CeVIO登場時も「すごい自然な声だ!」って思った。それ以来の感動だったと思う。なお、DNN歌声合成みたいなデモ自体は名工大さんが16年末に出してたけど、そちらはしゃくりとか入れなかったはず。だからこのデモを聞いて私は「これほしい!」って思ったんだ。 その次に衝撃を受けたのは東北大ボイスメイドプロジェクトだった。これに関しては今もまだ「この音源売ってくれ」って思ってる。 これ、当時は研究室のHPにこっそり1番丸ごとの動画へのリンクが張られてて、私はこっそり保存して今も持ってる。こ

    NEUTRINOがいつの間にか4周年 AIシンガー懐古厨|くろ州
    NAT
    NAT 2024/02/23
    NEUTRINOリリースから4年。当時最速でNEUTRINOカバー動画を上げた、くろ州さんの記事。初めて一般人でも使えるAI歌唱合成ソフトがNEUTRINOで、SSSと森勢先生による東北きりたん歌唱DBから誕生。今ではAI歌唱が当たり前に。
  • #7 AI歌声合成と楽譜の問題|tamachang@tama-music

    VOCALOIDやVX-βでの歌声制作に触れて、歌唱を五線譜に記譜するという次元ではなく、五線譜よりもより精細な情報を書き込めるノート・データの次元で考えるようになりました。 以降は、歌唱をノート・データで記述する経験の中で、自分なりに考えたことを書き連ねたものです。 VX-βでの歌声制作に役立つ内容ではありませんので、ご興味のある方だけお読みくださればと思います。 X(旧Twitter)で書き込んだか、書き込もうとした文を改めて書き直したものです。 1. 符号化(エンコード)と復号化(デコード)音声言語(話しコトバ)が文字(書きコトバ)として固定されたように、音楽や歌声が楽譜に固定されたという歴史があります。 「音声言語→文字」であるように「(演奏された)音楽→楽譜」という順序だったはずです。 やがて、その順序を逆さまにして、「(台として書かれた)文字→(セリフとして発せられる)音声言

    #7 AI歌声合成と楽譜の問題|tamachang@tama-music
    NAT
    NAT 2023/10/02
    いわゆる「耳コピ」、歌声/演奏を楽譜に落とす符号化は非常に曖昧であること、それによりAI歌声合成における学習が難しい話。では、AI歌声合成はどのようなスタンスをとるべきかという考察。
  • Synthesizer V AI 技術デモ 「RLHFによるピッチ生成の強化」

    NAT
    NAT 2023/07/19
    Dreamtonics が研究開発中の技術紹介。Synthesizer V AI に人間のフィードバックによる強化学習(RLHF)を取り込む試み。AIリテイクに対する選択をフィードバックに使う仕組み。
  • みんなの投票で決まる『DLsiteアワード2022』結果発表!: 同人誌・同人ゲーム・同人ボイス・ASMRのダウンロードなら「DLsite 同人」

    NAT
    NAT 2023/02/20
    PCソフト部門に、すずきつづみ トークボイス、夏色花梨トークボイス、SynthesizerV夏色花梨が入賞。アツい想いが届いた作品に、花隈千冬や双葉湊音、タンゲコトエ、結月ゆかり凪、星界のソフトが。
  • 幻の和歌山県勢歌、ボカロで再現 戦前「大毎」紙面に楽譜 | 毎日新聞

    1939(昭和14)年に発表されたが、歌い継がれずに幻となった和歌山県テーマソング「県勢歌」。県立博物館(和歌山市)の調査で、大阪毎日新聞(現・毎日新聞)の記事から楽譜と歌詞が見つかった。判明した全容を館のパネル展「よみがえる『和歌山県 県勢歌』」で紹介。音声合成ソフト・ボーカロイドによる歌唱を館ホームページや会場のQRコードで公開している。展示は3月5日まで。 県では48年、現在も歌われる山田耕筰作曲、西川好次郎作詞の「県民歌」が制定されている。20年ほど前から時折、「終戦前に歌った県の歌について教えてほしい」と、高齢者から歌詞や楽譜の問い合わせが県に寄せられたが、既に関係資料は処分され回答できなかったという。2022年10月になり作曲者、鈴木富三さん(1997年死去)の横浜市在住の遺族、鈴木徹さんから、義母の記憶を頼りに書かれた楽譜や、作曲当時の写真…

    幻の和歌山県勢歌、ボカロで再現 戦前「大毎」紙面に楽譜 | 毎日新聞
    NAT
    NAT 2023/01/22
    戦前発表されたが幻となった和歌山県テーマソング「県勢歌」。県立博物館の調査で楽譜と歌詞が見つかり、音声合成ソフトによる歌唱をホームページや会場のQRコードで公開している。NEUTRINOめろうが使われてる。
  • 好きな人の声で歌える、破壊的でヤバい「Diff-SVC」はAI歌声合成を民主化するのか(CloseBox) | テクノエッジ TechnoEdge

    それを、完全とは言えないまでも、かなり元の人に肉薄する品質で再現できる技術がDiff-SVCです。元になる音声データが1時間くらいあれば、与えた音声を、希望する声質に変換することが可能になるのです。 しかも、基的にお金はかかりません。AI歌声合成が、ちょっとハードルは高いものの、無料で使えて、データさえ集めてくれば誰でも手が出せる。AI歌声合成の民主化と言っていいでしょう。 筆者は10年近く前に旅立ったの歌声を、UTAU-Synthという、短く切り出した音素をピッチや長さを合わせながら組み合わせていくソフトウェアで再構成しています。1フレーズずつ音素を繋いで、できるだけ不自然にならないように調整していくため、短くて数日、長いと数カ月も時間をかけて完成させていきますが、もうその作業をしなくてもよくなります。 ただ、自分で歌って、もしくは他のボーカルシンセソフトでボーカルトラックをDiff

    好きな人の声で歌える、破壊的でヤバい「Diff-SVC」はAI歌声合成を民主化するのか(CloseBox) | テクノエッジ TechnoEdge
    NAT
    NAT 2023/01/20
    AIを使っ声質変換手法「Diff-SVC」を使って、個人である妻の歌声で歌を合成するまでの解説。AI美空ひばりのような故人の歌声合成を、公開技術を使って、(スキルは必要だが)一般の人が実現できる凄い時代。
  • Synthesizer Vに超強力な女性ボーカル、Maiがまもなく登場。もうAIと人間の違いは認知できないレベルに|DTMステーション

    10月27日、Synthesizer Vの新しい歌声データベースとして、Maiがお披露目となり、その歌唱動画が公開されました。実際にユーザーが入手可能になるまでには、まだもう少し待つ必要がありそうですが、遅くとも年内には登場するそうですから心待ちにしたいところです。 今回、Synthesizer Vの開発元であるDreamtonicsによって公開されたMaiの歌声のビデオを見ると、驚くほど滑らか、スマートな歌い方であり、もはや人間の歌声と区別がつかない次元まで進化しているように感じます。しかも、とくに調声をしなくても、音符と歌詞を入力するだけで、非常にリアルな歌い方をしてくれる、というのも、嬉しいところです。一方で、先日リリースされたSynthesizer V Studio Proの最新バージョン1.7.1において、歌声データベースの複数バージョンを利用できる機能が追加されています。なぜそ

    Synthesizer Vに超強力な女性ボーカル、Maiがまもなく登場。もうAIと人間の違いは認知できないレベルに|DTMステーション
    NAT
    NAT 2022/11/03
    SynthesizerV 日本語女声音源 Mai の紹介記事。SynthV の歌声のリアルさを示すフラッグシップ製品になりそう。歌声DBのバージョンアップで歌声が変わる問題の対策としてバージョン選択機能も紹介。
  • カラオケ史上初!誰でもEvery Little Thingの持田香織になれる「なりきりマイク」がビッグエコーに登場!

    カラオケ史上初!誰でもEvery Little Thingの持田香織になれる「なりきりマイク」がビッグエコーに登場!3店舗にスペシャルルームを8月25日から10月11日までオープン憧れのアーティストの声で歌える機会を見逃すな!! 株式会社第一興商(以下、当社)は、ヤマハ株式会社(以下、ヤマハ)が開発した、人の歌声を別人にリアルタイム変換する新技術『TransVox (トランスヴォックス) TM』*1 を活用し、音楽グループ・Every Little Thing(以下、ELT)の持田香織の声でカラオケが歌える【なりきりマイク feat.ELT持田香織 スペシャルルーム】を、当社が展開するビッグエコー3店舗にて、8月25日から10月11日までの期間限定でオープンします。 昨年、デビュー25周年を迎えたELT。当社はヤマハとコラボレーションし、今もなお全世代からカラオケで人気のELT・持田香織の

    カラオケ史上初!誰でもEvery Little Thingの持田香織になれる「なりきりマイク」がビッグエコーに登場!
  • リアルタイムで“あの人”の歌声になれるAI歌声変換技術『TransVox™』の実証研究を開始

    「なりきりマイク」で「Every Little Thing」持田香織さんの声を再現 リアルタイムで“あの人”の歌声になれるAI歌声変換技術『TransVox™』の実証研究を開始 店舗:ビッグエコー渋谷センター街店、浜松有楽街店、梅田茶屋町店 「なりきりマイク feat.ELT持田香織 スペシャルルーム」 日時:8月25日(木)から10月11日(火)まで期間限定オープン ヤマハ株式会社は、歌声の分析・合成とAIに関係する最新技術を駆使し、人の歌声を別人の歌声にリアルタイム変換する新技術『TransVox(トランスヴォックス)』を研究開発しています。このたび、『TransVox』の実証研究として、音楽グループ「Every Little Thing」とコラボレーションした「なりきりマイク feat.ELT 持田香織 スペシャルルーム」を株式会社第一興商が運営するビッグエコー3店舗にて8月25

    リアルタイムで“あの人”の歌声になれるAI歌声変換技術『TransVox™』の実証研究を開始
    NAT
    NAT 2022/08/27
    ヤマハのAI歌声変換技術TransVoxは、歌声の発音や抑揚を瞬時に分析、あらかじめAIが学習した特定の歌手がそれを真似て歌い直すような仕組みで歌声を再合成。これを活用した「なりきりマイク」が登場。
  • 誰でも人気歌手の歌声に…ヤマハの技術で同時変換

    別人の歌声に同時変換し、誰が歌っても人気の女性歌手を再現できる技術を「ヤマハ」が開発しました。 新しい技術は楽曲や歌手の特徴、歌い方の癖をAI人工知能)に学習させます。 実際に歌う人の声を瞬時に分析し、変換することで、歌手が歌っているように再現できます。 この「なりきりマイク」は東京・渋谷、大阪、浜松にある「ビッグエコー」3店舗で25日から10月11日まで利用できます。 新型コロナの影響で需要が減少したカラオケ店では、新たなサービスの導入で客足のさらなる回復を目指しています。 カラオケ音源協力:DAM

    誰でも人気歌手の歌声に…ヤマハの技術で同時変換
    NAT
    NAT 2022/08/24
    別人の歌声に同時変換し、誰が歌っても人気の女性歌手を再現できる技術を「ヤマハ」が開発しました。「なりきりマイク」は東京・渋谷、大阪、浜松にある「ビッグエコー」3店舗で25日から10月11日まで利用できます。
  • 誰が歌っても持田香織さんの声になる「なりきりマイク」、ビッグエコーに登場 ヤマハのAI歌声変換技術で

    カラオケボックス「ビックエコー」を展開する第一興商は8月24日、誰が歌っても「Every Little Thing」の持田香織さんの声になる「なりきりマイク」を期間限定で導入すると発表した。8月25日から10月11日まで「渋谷センター街店」など3店舗に展開する。 ヤマハが開発中のAI歌声変換技術「TransVox」(トランスヴォックス)を活用する。Every Little Thingの楽曲からボーカル部分を抜き出してAIが学習。なりきりマイクで歌うと、その人の発音や抑揚を分析し、持田さんがそれを真似ているかのような歌声にリアルタイムで変換するという。 変換時のライムラグは「違和感のないレベル」。男性向けに声を1オクターブ上げる機能も用意した。ヤマハは「持田さんになりきって歌うほどその再現度は高くなると思われる。ぜひ挑戦してほしい」としている。 なりきりマイクを設置するビックエコーの店舗は

    誰が歌っても持田香織さんの声になる「なりきりマイク」、ビッグエコーに登場 ヤマハのAI歌声変換技術で
    NAT
    NAT 2022/08/24
    ヤマハが開発中のAI歌声変換技術「TransVox」を活用。Every Little Thingの楽曲からボーカル部分を抜き出してAIが学習。発音や抑揚を分析し、持田さんがそれを真似ているかのような歌声にリアルタイムで変換するという。
  • スマホで手軽に自分のAIシンガーが作れる「歌叽歌叽」を試してみた! - アマノケイのまったり技術解説

    どうもアマノケイです。 結構前に「コエステーション」という自分の声を収録するとAI歌声合成にしてくれるサービスが流行りましたね。 自分でしか使えないですが、あのサービスの登場はかなり話題になりました。 今回は歌を数曲歌うと自分のAIシンガーを作ってくれる中国のサービス「歌叽歌叽」について解説していこうと思います。 やり方 ①インストールする 公式サイトからアプリとソフトをインストールしましょう。 Win, Mac, iPhone, Android版があります。 虚拟歌曲制作-虚拟歌手-作词作曲-虚拟偶像-酷狗音乐歌叽歌叽 ②アプリ側の設定 歌叽歌叽で自分の歌をAI化させるにはアプリで歌声を録音する必要があります。 まずアプリを起動します。 ありがちな規約が表示されるので同意します。(公式サイトからも読めますがコピペができないのでGoogleの翻訳アプリを使って全文取得するか、ソースを開いて

    スマホで手軽に自分のAIシンガーが作れる「歌叽歌叽」を試してみた! - アマノケイのまったり技術解説
    NAT
    NAT 2022/08/20
    歌を数曲歌うと自分のAIシンガーを作ってくれる中国のサービス「歌叽歌叽」の解説。最低でも女声は1曲、男声は5曲歌えば、AI歌声合成の音源が作られるとのこと。少ない曲数でも作れるのは良いな。
  • Symphoneme(シンフォーニーム)公式サイト

    2023/09/27 Symphoneme-Sのβ版テスト運用を終了いたしました。頂いたご意見等の反映を今後検討させていただきます。

    Symphoneme(シンフォーニーム)公式サイト
    NAT
    NAT 2022/08/14
    歌声合成を中心に展開するメディア・コンテンツ Symphoneme。キャラクター、ストーリー、クラウド型音声合成サービスSymphoneme-Sを中心に展開する模様。現在、3人のキャラクターと歌声合成のオープンβ版が公開。
  • Synthesizer Vの歌声合成は次の次元へ。調声は不要、AIリテイク機能で好みの歌い方を選べる時代に|DTMステーション

    についても、発表があり、「これは何なんだろう?」と気になっていました。この時は具体的な内容まではわからず、その翌日にHigh Dynamics Voice Modelに関する紹介ビデオも公表されたのですが、ここでもいま一つ、ピンときませんでした。が、それが実装されたβ版を使わせてもらうとともに、Kanruさんに話を聞いて、ようやくこれが歌声合成における革命であることが分かりました。 以下が、そのAIリテイクの様子を捉えたビデオです。 だいたいの雰囲気が、理解いただけたでしょうか? そう、このAIリテイク機能は、High Dynamics Voice Modelという技術をSynthesizer Vの機能として実装させたものであり、歌声を新たに作り直すというものなのです。 「歌声合成は、ここ数年で大きく進化してきましたが、やはり人間の歌声の魅力にはかなわない面があります。その大きな理由の一つ

    Synthesizer Vの歌声合成は次の次元へ。調声は不要、AIリテイク機能で好みの歌い方を選べる時代に|DTMステーション
    NAT
    NAT 2022/07/21
    AIリテイク機能は、先に発表していたHigh Dynamics Voice Modelという技術をSynthesizer Vの機能として実装したものだとか。
  • Synthesizer V Studio 1.7.0 アップデートでAIリテイク機能を搭載

    NAT
    NAT 2022/07/21
    リテイクすると歌い方を変えるとか、人間の歌手の収録のようだ。そしてナレーションはVOICEPEAKで、その宣伝も怠らない。
  • News detail | CeVIO Pro (仮)

    NAT
    NAT 2022/05/13
    これまでα版を公開していたCeVIO Pro(仮)が、6月下旬にβ版を公開予定。AUプラグイン対応やApple M1対応、48KHz以外のサンプリングレート対応など予定。名前も正式名称に変更予定。
  • 音楽的同位体 星界(SEKAI) 予約販売開始!

    NAT
    NAT 2022/02/28
    ヰ世界情緒の音楽的同位体として生まれた星界(SEKAI)のティザー動画。
  • GitHub - stakira/OpenUtau: Open singing synthesis platform / Open source UTAU successor

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - stakira/OpenUtau: Open singing synthesis platform / Open source UTAU successor
    NAT
    NAT 2021/09/27
    オープンソースなUTAU編集環境。モダンなUIを提供。現在はWindowsのみ動作だが、クロスプラットフォーム版が開発中。合成エンジン(resampler)は別途必要。
  • 楽曲・作り手掲載ポリシー - CeVIO・Synthesizer V +etc 楽曲データベース

    NAT
    NAT 2021/09/27
    「初音ミクWikiおよびUTAU楽曲データベースが掲載の対象としない合成音声使用楽曲を掲載対象」とする楽曲データベース(Wiki)。VOCALOIDライブラリが無いキャラ(小春六花や可不など)が掲載可。
  • DTMer寄りの観点で、メジャーな歌声合成ソフトに(F○te風)パラメータを付けてみた! - アマノケイのまったり技術解説

    そいえば各種の歌声合成についての説明は色々あるけど、全体的に評価したものは無い感じがしたので、主に以下の項目で勝手にランク付けしてみました ベタ打ち性能 エディタの操作性 声質パラメータの豊富さ パラメータの編集方法 DAWとの提携 重さ 音源の豊富さ 有志による内部拡張性 導入コスト なるべくは私情は入れないようにしていまが、独断と偏見が大いに含まれている可能性があるのでご了承ください 正直DTMer寄りか微妙な部分もあります 評価ランク付け一覧 VOCALOID4 VOCALOID5 VOCALOID4.5 (for Cubase) Piapro Studio Piapro Studio NT UTAU UTAU-Synth(上記UTAUのMac版) CeVIO CeVIO AI CeVIO Pro DeepVocal(Sharpkey) SynthV(+AI) NEUTRINO 結論

    DTMer寄りの観点で、メジャーな歌声合成ソフトに(F○te風)パラメータを付けてみた! - アマノケイのまったり技術解説