じぶん更新日記

1997年5月6日開設
Copyright(C)長谷川芳典



02月のインデックスへ戻る
最新版へ戻る
§§
 昨日に続いて、雪化粧の写真。今回は時計台と半田山(2月11日09時頃撮影)。なお2月11日の楽天版にも別のアングルからの写真あり。

2月11日(金)

【思ったこと】
_b0211(金)音声合成技術の無限の可能性と危険/「詠太」

 夕食時にNHK サイエンスzero「(No.334)ヒット連発!!あのボーカルソフトの秘密」の再放送を視た(初回放送は2月5日)。タイトルから歌声合成の話題だと思っていたが、実際の内容は、歌声だけでなく、自然なしゃべり方を作り出す技術、さらには、特定個人のしゃべり方をそっくり真似てしまうという技術についての紹介であった。これらの技術がさらに発展すると、おそらく次のようなことが実現するものと思われる。まず、歌声に関しては、
  • 生身の俳優が登場しないCG映画と同様、生身の歌手が出演しない、合成歌声だけの音楽会が可能。
  • すでに亡くなった歌手の歌声を合成して新作の曲を歌わせることができる。
  • いろいろな時代の歌手の歌声の合成から大合唱をさせることもできる。
などなど。
 しかし、今回紹介された技術は歌声に限るものではない。自分の話し声を何通りか録音しておくと、声そのものの声紋的な特徴や、喋り方のリズムなどから、自分が喋っていないことまで合成することができるのである。これはかなり恐ろしい。今でさえ、オレオレ詐欺の被害者がたくさん出ているのに、こういう形で合成ができてしまえば、まさに本人の声で振り込みが懇願されるわけだからたまったものではない。電話でやりとりする時には、合い言葉でも決めておいたほうがいいかもしれない。

 さらに恐ろしいのは、容疑者の何気ない喋りをもとに音声を合成し、本人があたかも自白したような録音をでっち上げてしまうことだ。他には、セクハラ発言をでっち上げたり、自殺を決めたような音声を合成しておいてから当人を殺して自殺に見せかけるといった犯罪にも悪用されかねない。要するに、声を録音するということの証拠性が失われる時代が来るかもしれないということだ。

 もっとも、すでに、写真の証拠性はかなり疑わしくなりつつある。私なども時たま、こちらや、こちらにあるような下手な合成写真を楽しむことがあるが、手間暇かけて細工すれば、本当にその場に居合わせたような合成写真を作ることもできるはずだ。このほかEメイルにしたって、本文はもとより受け取ったメイルのヘッダが元のままであるという証拠はどこにもない。

 個人の音声合成にはもちろん、いろいろなメリットもあるとは思う。例えば、両親や配偶者の生前に声を録音しておいてこれを合成し、仏壇の前に座るたびに、故人から毎日違った慰めの言葉が発せられるようにする。あるいは、生前には一度も謝らなかった配偶者の声から「ごめんなさい」、「すまなかった」、「どうか許して」といった声を合成し、線香を上げるたびに喋らせて憂さを晴らすということも可能であろう。

 余談だが、2月10日に、一太郎の2011年版が発売され、さっそく購入したばかりであるが、その中の「詠太(えいた)」の読み上げ技術が格段に向上していることにも驚いた。私自身はかつて、自閉症の子どもの漢字熟語学習用に「音次郎」という読み上げソフトを使っていたが、アクセントはイマイチながら、その時よりは遙かに自然のしゃべり方になっていた。しかも、読み間違いがきわめて少ない。試しに、いま書いている日記本文を読み上げさせてみたが、デフォルトで読み間違えたのは、「遙かに」を「ようかに」、「詠太」を「えいふとし」と読み上げてしまうことぐらいだった。自身の商品名「詠太」を特別扱いしないのはフェアかもしれない。なお2語とも、読み上げを追加登録すれば簡単に訂正できる。