タグ

機械学習とVocaloidに関するrin51のブックマーク (2)

  • AI技術により超高精度な歌声合成を実現

    株式会社テクノスピーチ(所在地:名古屋市千種区、代表取締役:大浦 圭一郎、以下 テクノスピーチ)と国立大学法人名古屋工業大学 国際音声言語技術研究所(所在地:名古屋市昭和区、代表:徳田 恵一、以下 名古屋工業大学)は、このたび人間の声質・癖・歌い方をこれまでになく高精度に再現できる歌声合成技術を開発いたしました。 ​ テクノスピーチと名古屋工業大学は共同で音声合成・歌声合成技術の研究・開発に取り組んでおり、これまでに業務用カラオケ機器「JOYSOUND」や音声創作ソフトウェア「CeVIO Creative Studio」等に音声合成・歌声合成技術の導入を進めてきました。研究では、特定の歌唱者の約2時間の歌声データベースに対して、深層学習等のAI技術を適用することにより、歌唱者の声質・癖・歌い方を学習しました。合成の際は、任意の歌詞付き楽譜を入力するだけで高品質な歌声を合成することができま

  • ディープラーニングの力で結月ゆかりの声になってみた

    目次 (背景)自分の声を結月ゆかりにしたい。前回はあまりクオリティが良くなかったので、手法を変えて質を上げたい。 (手法)声質変換を、低音質変換と高音質化の二段階に分けてそれぞれ学習させた。画像分野で有名なモデルを使った。 (結果)性能が飛躍的に向上し、かなり聞き取れるものになった。 (考察)精度はまだ改善の余地があり、多対多声質変換にすることで精度が向上すると考えられる。今回の結果を論文化したい。 デモ動画 背景多くの人が可愛い女の子になりたいと思っている。 CG技術やモーションキャプチャ技術の向上により、姿は女の子に仮想化できるようになってきた。 しかし、声に関してはまだまだ課題が多い。 声質変換は「遅延」「音質」「複数話者」などの難しい課題がある。 今回は、自分の声を結月ゆかりにするための、低遅延で実現可能な高音質声質変換を目指した。 手法大きく分けて3つの工夫をした。 画像ディープ

  • 1