どうも。
コエステーションを使って自分の『コエ』を作ってみたCHASUKEです。
『コエステーション』とは
東芝デジタルソリューションズ社が東芝コミュニケーションAI「RECAIUS(リカイアス)」の音声合成技術を活用して「声」を収集・蓄積・提供するプラットフォーム
『コエステーション』の無料スマホアプリを使えば、簡単に、自分の声の分身を作ることができます。そして、作った『コエ』を使って好きな文章を喋らせることができます。なんか新しいですね!!
▼現在公開されているのはiPhone版のみ
現在(2018.4.21)のところ、アプリで作った『コエ』を使ってできることは限られてますが、もっとこの技術がオープンになってこれば、今後の進展がとても面白そうです。
例えば、ゲームの主人公が自分の声になってたり、ホームアシスタントの声を好きな俳優さんにしてみたり..
こんな面白い技術をアプリで簡単に体感できると聞いて、試さないわけにはいきません。早速やってみました♪
『コエ』の作り方は、短い文章を読み上げるだけ
ここで言う『コエ』とは、『声』と区別してて、東芝によれば「あなたの声(肉声)の特徴を抽出したあなたの声の分身」とのことです。
『コエ』の作り方ですが、僕にはさっぱりわかりません。単純に「あ」から「ん」まで覚えさせてけば..なんて単純なものではありません。
じゃあどうするか?
コエステーションアプリで用意された短いセリフを録音するだけでOK。わずか10フレーズのセリフを読み込めば、レベル1の『コエ』が完成します。
レベル1の『コエ』を作ってみた
事前にアプリを起動して、会員登録すると『コエ』が作れるようになります。
『コエ』をしっかり作り込むためには、雑音がない静かな空間が必要です。録音前に、作成する環境にふさわしい場所かをアプリからチェックできます。
▼マイクボタンを押して、雑音レベルが指定範囲を越えると適していない環境となります。
僕は家族が寝静まった夜を狙いました!!
▼続いて、サンプルのセリフで練習できます。
録音にはイヤホンマイクをつけると、綺麗に録音できるということで、「AirPods」をつけてやったりました。無い場合は、マイクと口との距離を一定に保って録音するのがポイントとのこと。
▼こんな感じの短いセリフが出てきます。
マイクボタンを押して、録音するだけ。自分のいつもの喋る感じで録音しました。難しいセリフで噛んでしまってもやり直しが何度でもできるので安心。
▼録音を10回繰り返したら、コエステーション側で『コエ』を作ってくれます。
作成には、1時間〜数日とあったのですが、30分もしないうちに完成しました♪
『コエ』で任意のセリフを喋らせてみた
自由なセリフを喋らせることができます。
これで、喋ります。マナーモードだと音が出なかったので注意。
まだまだ「コエレベル1」なので、残念ながら全く似てないですね。
▼ちなみに、LINEで共有するとこんな感じになりました。
「コエレベル」をMAXまで上げてみた
MAXはレベル5です。200フレーズを録音します。真夜中でしたが、もくもくと独り言のように頑張りましたw
コエレベル2
40フレーズを録音するとレベルが上がります。
合成音声を聞いてみると、、
ぬぉっちょっとそれっぽくなってる印象です!!
これは、今後に期待が持てる。
コエレベル3
さらに50フレーズを録音するとレベルが上がります。
フレーズも少しずつ難易度が上がっているような気がします。
合成音声を聞いてみると、、
だいぶ、絞られてきたなぁという印象。まだ電子音っぽいのが残っている。
コエレベル4
さらに50フレーズを録音するとレベルが上がります。
だいぶ疲れてきます。
声はだいぶ似ている。イントネーションに少し違和感がある程度。
コエレベル5
これが、今のところのマックスです。
より自然な自分の声に近づいたと思う!!
自分の声って、自分でわからないので、嫁や親、友人や兄弟に聞いてもらったら、ほとんどの人がコレって「自分の声?」って気づいてくれた♪
レベルマックスだと、声自体は本物と間違えるほどの精度です。だが、文章を読ませると抑揚や語尾のイントネーションに若干の違和感が出るってのが感想です。
パラメータを使ってリアルな声に近づける
時と場合によって、同じ文章でも話し方は変わってきます。
だが、感情ごとに録音する必要はありません。よりリアルに近づけるためにパラメータを操作して『コエ』にアレンジを効かせられます。
たくさん項目がありますねー。
▼喜びを増すと語尾が上がったり、悲しみを増すと下がったりです。
パラメータでチューニングした『コエ』はLINEなどSNSでバラまけますよ♪
AIが自動でチューニングできるようになると面白くなってきそうですね!!
最後に
コエステーション使って、声の分身を作ってみました。200フレーズの短い文章を読み込むだけで、コエをコピーできる時代なんですね。
例えば、テレビやラジオのナレーションとかも、本人が話す必要なんてなくなります。医療分野においても、声を失ってしまった患者が『コエ』を使ったコミュニケーションが期待されています。色々と常識が覆されていきそうです。
もちろん、オレオレ詐欺など犯罪の恐れもありますが、ぜひ成長してほしい分野ですね。先端技術を無料で体験できるので興味のある方はぜひ試してみてください♪
それではまた。