中国人が開発したと思われる最新のAIボイスチェンジャー「RVC」がいま話題になっている。学習モデルを生成すれば、誰でも簡単に「その人の声」を発声することができる。

今回は、使い方次第では危険とまで言われているRVCについて見ていこう。ライフスタイル誌から誕生した男の隠れ家デジタルが、知的好奇心をくすぐる情報を解説する。

■そもそもAIボイスチェンジャーとは?

AIボイスチェンジャーとは、人工知能(AI)の機能を使用し、音声を別の声やアクセントに自動変換する機能・ツールのことだ。近年ではAIの技術が進歩したことで、誰でも自然で高度な音声変換ができるようになった。

またリアルタイムで音声を出力することも可能で、さまざまなアプリケーションで活用されている。ネット上での通話だけでなく、ゲームや映画、テレビ番組、オーディオブックなど、その用途は多岐にわたる。

最近は中国でのAIボイスチェンジャーの開発が加速しており、いくつもの高機能サービスが発表・リリースされている。今回は、なかでも革命的なAIボイスチェンジャーであるRVCを紹介しよう。

(広告の後にも続きます)

■AIボイスチェンジャー「RVC」の機能・魅力

RVCは「Retrieval-based-Voice-Conversion」の略称であり、開発者は中国人だと言われている。その根拠となるのが、サービスの表記がほぼすべて中国語であるということ。

日本語化されている箇所も一部あるが、説明文は基本的に中国語表記なので、インストールする際には苦労を要する。気になるサービスの内容は、学習モデルと言われるAIが学習した音声データを利用することで、自分の音声をその学習モデルに置き換えるというもの。

また学習モデルは他者と共有でき、特徴的な音声を用いた会話も行える。さらにRVCで作られた学習モデルは、「VC Client」という別ツールを使うことで、リアルタイムの音声変換が可能になる。

そのほか、歌のボーカル音声を学習モデルの声にしたり、2つの学習モデルを融合させて新たな音声を作り出したりなど、RVCの機能は多岐にわたる。