音声合成ビジネス進行中

記事
コラム
現在、音声合成を核にしたビジネスを絶賛立ち上げ中。
なにやら、真剣に取り組むと、色々なところが見えてきました・・・


音声合成は難しい?

使うだけなら一見簡単です。テキストデータをコピペして変換ボタンを押すだけ。あとはその音をどう使うか?は自由です。

でも、難しかったのです。。。

そのあたりをちょっとずつ紹介

難しさ1 日本語

そもそも日本語が難しい!
いつも喋ってるんですが、入力するテキストを良く見ると結構自分が意識せずに間違った使い方をしていたり。

・今日は
さて、なんて読みますか?後ろに〇〇に行った、と付けば「きょうは」。
後ろに〇〇さん、と人の名前が付いたら「こんにちは」。

同じ字で、文章のどこに来るか、で読み方が変わるのです。

同じように、

・そちらの方に
これも。

そちらの「ほう」、という方向か。
そちらの「かた」、という人か。

これも、文脈で決めないといけません。

音声合成は文脈を解析します

がんばって、文脈を解析して、どうあるべきか、をルールに基づいて決めるわけです。でも、今度は人間側がルールを守らない文章を書くことがほとんど。自分を含め。

結局人間‥でも、新聞社の校閲担当者がすごい!

人間の国語ルールの理解と再生、これによるのです。

そういった中で、超優秀な業界があります。新聞です。新聞社は、校閲、という日本語の鬼みたいな部隊が、世の中に出す前に徹底チェック。本当に正しい日本語を守っているのはこの人たちかもしれません。いや、「共通理解用のある種の標準ルールの日本語」と言った方がいいかもしれませんが。

とにかく、ニュースのテキストは、さくっと入力、即再生、でほぼ修正無しの音声が出来上がります。

こんな話をぼちぼちしていきます!
サービス数40万件のスキルマーケット、あなたにぴったりのサービスを探す