チャットGPTが進化!日本語対応で会話がもっとスムーズに

チャットGPTが進化!日本語対応で会話がもっとスムーズに

記事
IT・テクノロジー
米オープンAIは、対話型AI「チャットGPT」に新たな音声対話機能を導入し、その発表がありました。

この新機能により、応答速度が大幅に改善され、AIと人間の会話がよりスムーズに行えるようになりました。

日本語にも対応しており、オープンAIの技術力がさらに進化していることを示しています。

新機能は「アドバンスドボイスモード」と名付けられ、有料会員向けに順次提供が開始されます。

旧来の音声回答では3~5秒かかっていたところ、この新機能では0.3秒で回答が可能となり、発音やアクセントも自然で感情を伴った表現が可能です。

日本語や英語を含む50以上の言語に対応し、合計9種類の声色が選べるようになっています。

しかしながら、利用にあたっては回数の上限が設けられており、将来的にはスマートフォンのカメラを使った文字や文章の理解、音声回答機能などの導入も計画されています。

新機能は5月に発表されましたが、当初は米国女優に似た声と指摘され、一部機能が一時停止されました。

その後、今夏から限定されたユーザーに向けて試験的に提供が始まっています。

新機能はユーザーの指示に基づいて様々な声色に変わることができるため、悪用され詐欺や偽情報の温床となる恐れがあります。

今年11月に米国大統領選を控える中、「ディープフェイク」の拡散が懸念される状況です。

そのため、オープンAIではAIによる実在する人の音声模倣や、著名な曲や歌手に対する著作権侵害の問題に対し、徹底的な対策を講じているとのことです。

私の観点としては、この技術の進化はワクワクさせられるものですが、エンジニアとしては性能の向上だけでなく、倫理的な側面を常に考えておく必要があると感じています。

AIが人間の音声や感情を巧みに模倣する時代において、技術そのものを楽しみつつ、その影響範囲をよく理解し、注意深く扱うことが求められています。

阿修羅ワークスの出品リスト

阿修羅ワークスのプロフィール



サービス数40万件のスキルマーケット、あなたにぴったりのサービスを探す ココナラコンテンツマーケット ノウハウ記事・テンプレート・デザイン素材はこちら