発想と実装の間をつなぐ AI:人工知能特化型メディア

たった10分で自分の声そっくりのダミーが作れる『LYREBIRD』。早速使ってみた

簡単に誰でも自分の声を作れる時代がきてしまいました。

今回は、AIによる音声合成システム『Lyrebird』の紹介です。

説明する前にまずは、下の動画を見てみてください。

この動画のオバマ大統領の声、実は本人が話したものではなく、AIが声データを元に作成したものなんですが…ちょっとすごいです。

ここまで似過ぎていると怖さを感じてしまいますよね。早速、サービスをみてみましょう。

人の声を学習して、思い通りの文章を読ませる

Lyrebird』は、人の声を学習して、デジタル音声を生成するサービス。

つまり、声のデータさえあれば、その人が話してないことも、まるで本人が話しているかのような音声を作ることができるんです。

これを使えば、

  • メッセージテキストを送り主の声で機械に読み込ませる
  • ビデオゲームのアバターに自分の声で話させる

など、できることはたくさんありそうですよね。エンタメ領域でも大きな可能性を感じます。

実際に声を学習させて、あなたの声を無料で合成できる

『Lyrebird』は誰でもアカウント登録して使うことができるということで、編集部でも使ってみました。

登録&ログイン後、下のように読む文章が表示されるので、『Start recording』を押して、自分の声を30センテンスほど録音します。この声を元にAIが学習を行い、その人の声質の特徴量をつかんでいく……といった感じでしょうか。

躓かなければ、10分ほどで録音完了です。

最低数を学習させたら、下のようなテキストボックスが出てくるので、AIに読ませたい文章を入力。

すると、AIが学習した声で、入力したテキストを読み上げてくれます。

試しに下のテキストをAIと人間で読み比べてみました。どちらが人の声かわかりますか?

artificial intelligence is the simulation of human intelligence processes by machines, especially computer systems.

・Voice1

・Voice2

かなり似てますよね!

実は、前者がAIが読んだものです。ここまで簡単に自分の声を作ることができるのは驚きです。

さらに、自分の声に似せるには、高品質なマイクを使ったり、より多くの声を学習させれば良いとか。

また、今は英語しか対応していませんが、今後、別の言語にも対応していくそう。性能に関しても、今はベータ版しかないので、今後さらに改良したものが出てくるのが楽しみですよね。

音声合成の光と闇

『Lyrebird』を使えば、有名人の声で メディアの文章を読んでもらうことも、まるで、バージョン変更をするかのように、アニメの声を変えることも可能だと思います。

近い将来には、声に値段がつくような時代になるかもしれませんね。

ただ、用途が幅広い反面、問題点もあるかと。

音声合成技術は、最近騒がれているフェイクニュースや、犯罪などに使われる可能性もあり、その技術の使い方には注意が必要です。詐欺などにも使われそうですし。

テクノロジーの進化を純粋に楽しみつつ、そのあたりも念頭に引き続き情報を追っていきたいと思います。

小野寺 雄大 by
「曲がったことが大嫌い」が信条。デジマラボではマーケティング全般の記事を担当。その他、クラウドファンディングやHR-Techになどに強みがある。