Googleは、最新の音声モデル「Gemini 3.5 Live Translate」を発表した。話し手から数秒遅れで継続的に音声を生成し、シームレスな同時通訳に近い体験を提供する。70以上の言語を自動検出し、イントネーションやペースを維持したまま訳出可能。Google翻訳やGoogle Meetを通じて順次展開される。
Googleは米国時間6月9日、リアルタイムの多言語会話をより自然にする新しい音声モデル「 Gemini 3.5 Live Translate 」を発表した。発言を交互に処理する従来の翻訳システムとは異なり、Gemini 3.5 Live Translateは継続的に音声を聞き取り、翻訳して発話する。これにより、わずか数秒の遅延で会話が進み、自然な会話のペースを再現できる。
最優のAIのひとつだと思います。 英語から日本語への翻訳に特化したローカルLLM「PLaMo翻訳(plamo-2-translate)」。バケモノじみた翻訳能力は「便利」の次元を越えており、気づいたらいちばん使うAIに。見える世界も変わっていました。 長い外国語の文章を1 ...
外国語のページを見る際に、読み取りたい部分を毎回コピー&ペーストして翻訳するよりも、ページ全体をブラウザの機能や拡張機能で翻訳できる方が便利です。しかし、ページ全体を翻訳する拡張機能には、精度が高くないものや、翻訳した結果ページの ...
米OpenAIが翻訳ツール「ChatGPT Translate」をひっそりと公開しているようだ。日本語を含む50以上の主要言語に対応しており、テキストだけでなく、音声や画像も翻訳できる。 ユーザーインターフェイス(UI)は「Google 翻訳」や「DeepL」などと似た二画面構成に ...
YouTubeチャンネル「AI大学【AI&ChatGPT最新情報】」が、「【もう通訳いらない?】Googleの多言語AI音声翻訳モデル「Gemini 3.5 Live Translate」を無料で使う方法・性能・活用事例まとめ!」と題した動画を公開 ...
Amazonが、AIを活用した翻訳サービス「Kindle Translate」のベータ版を発表しました。Kindle Direct Publishing(KDP)で本をリリースする際に著者がKindle Translateを選択すると、数日以内に複数の言語に翻訳されたバージョンもリリースすることができます。 KDPで本を ...
以下の記事が面白かったので、簡単にまとめました。 話者が話している最中に、低遅延で音声を文字起こしする新しいストリーミング音声認識モデルです。 音声は、ソフトウェアをより自然に使うための重要なインターフェースになりつつあります。
無料でこれは大盤振る舞いだな〜。 OpenAIが無料翻訳ツール「ChatGPT Translate」を公開しています。軽く触ってみたのですが、長文翻訳に対応しており、翻訳品質もいい感じです。主要な言語にはほぼ対応しており、英語⇄日本語の翻訳はもちろんお手の物。
Googleは6月9日、70以上の言語に対応するライブ音声翻訳向けAIモデル「Gemini 3.5 Live Translate」をリリースした。話者が話し終わるのを待たず、同時通訳のように順次音声翻訳できる点が特徴で、Android/iOS向けGoogle翻訳アプリでは本モデルにより、話者のトーンを再現したシームレスなライブ音声翻訳機能が利用可能となっている。 本モデルはGemini Live ...
Googleは9日(米国時間)、ほぼリアルタイムの音声対音声翻訳に対応する音声モデル「Gemini 3.5 Live Translate」を発表した。70以上の言語を自動検出し、話者のイントネーション、ペース、ピッチを保った翻訳音声を生成する。 一般向けにはAndroidおよびiOS版のGoogle ...