ボイスオーバー 解説

ボイスオーバーとAI音声はもう少し大丈夫そうだ

ひろ
ひろ
こんにちわ、ひろです。

専業でボイスオーバーアーティストを生業にしています。

まずボイスオーバーってなに?という人はこちら。

要するに、「声優・ナレーションをはじめとする宅録で行う声のお仕事全般」を指します。

専業1年目にしてボイスオーバーで月収50万円を達成した経験を元に、

声を仕事にしてみたい、副業を作りたいという人、

TV・アニメで活躍する声優やナレーターを目指しているという方へも、

有益な情報をお届けしたいと思っています。

AI音声の進化

本日バラエティにて、最新技術ということで、人の読みをAIに読み込ませて、作った文章をその人の声で読み上げる事ができる、というテクノロジーの紹介をしていました。

その結果の出来は、まぁまぁといったところ。
悪く無い流れ時もあるけど、少し長くなると違和感はどうしても出る。

それを作ったのは若き大学生でまだ初めて一年ということなので、これからもっと精度を上げていくのでしょうけれど、その作成手順としては、

声の主に400文ほど読んでもらう。

なかなかの労力をかけて収録し、それをAIが読むこむ。

そこではその読みの抑揚や音の流れも読み取るようで、それは読んだ元の抑揚をコピーするというもの。

ということで、作成された音声は、400文も読んで疲れた上に声のプロでない人の音声でそのままコピーされていくというものでした。

AIの弱点

400文も読まないといけない。抑揚を変えたければ読み手がまた違う抑揚を持った読み上げをして学習させないといけない。それでも違和感は出る。

そこに対してのコストが人間をボイスオーバーとして雇うコストを下回るのは相当先じゃないかなぁと思われます。

さらにもう一つその場で話題に上がっていたのが、人間の、それも特定の人物の音をコピーしてしまうことの危険性というもの。

確かに、完全に声をコピーしてそれを誰もが使えるようになってしまったら、オレオレ詐欺などの悪用にはもってこいの技術となってしまうかもしれません。

今後作声技術が上がっていくにつれ、そういったセキュリティやプライバシーの部分というところもどんどんと整備されたり規制されたりしていく中で、また使い勝手が悪くなったり、その為のコストがまた加算されていくのではないでしょうか。

やっぱり意図を汲んで、指示すればそれにオリジナリティを持って沿うことのできる、ボイスオーバーアーティストVS AI音声では、コストの面でまだまだ優勢の時代が長くなるだろうと思われ、なんとか逃げ切らせて頂けないモノでしょうかと思っています。

おそらく、よっぽどそれを使うことに意義を感じる人に限定される、それを使って何かを表現したい、というような、住み分けの聞いた、声の世界ではプロの二の次のテクノロジーとして活用されていくと思います。

まぁ優秀でありすぎるな!と祈りながらそのコーナーを見ていましたので、イスを奪われたくない自信の無い人間の楽観的考えなのかもしれませんけれども。

科学系ゆっくり解説が最近の小ブームで、その解説によると、人間の脳は多くのニューロンが複雑に接続することで、その機能を発揮し、ニューロンの構造が3、4次元を遥かに超え、最大11次元まで広がっているそうです。

つまり小さな宇宙が人間の脳には入っていると。

それをまだまだ3、4次元で生きている人間の理解の及ぶ範囲で作り出したAI技術に負けるわけにはいきませんよね。まぁオセロや将棋は推されているわけですけれども。。

でもでも藤井聡太さんはAIも使った練習で前人未到の技術を身に付けたわけですから、そうった共存関係も探りながら高め合っていくんじゃないでしょうかねぇ?(擦り寄り)

ということで、急にちょいスピも入れてしまいましたが、これだけ長い間研究が進んで解明しきれない人間の脳の神秘を信じながら、今日もボイスオーバーを世界へお届けしていきたいと思います。

ではでは。