
Googleは、火曜日に開催されたGoogle I/O 2024開発者会議で、最小のAIモデルであるGemini Nanoを直接Chromeデスクトップクライアントに組み込むことを発表しました。これは、同社によれば、開発者がデバイス上のモデルを使用して独自のAI機能を提供できるようにするものです。Google自体は、GmailのWorkspace Labにある既存の「助けて文章を書く」ツールなど、この新機能を活用する予定です。
同社は、ChromeのWebGPUおよびWASMサポートに対する最近の取り組みによって、これらのモデルが幅広いハードウェアで適切な速度で実行できるようになったと述べています。
火曜日の発表の前に、Chromeの製品管理ディレクターであるJon Dahlkeは、他のブラウザベンダーと協議して、彼らのブラウザでも同様の機能を有効にする計画が進行中であることを明らかにしました。
「他のブラウザと協力しており、開発者向けの早期プレビュープログラムを展開する予定です」とDahlkeは火曜日の発表の中で述べています。「webGPU、WASM、そしてChromeに組み込まれたGeminiを活用すれば、私たちはWebがAIに対応していると信じています。」
しかし、ほとんどのChromeの競合他社がGoogleのAIモデルに単独で賭けることを望むかは疑問です。もっとも理にかなっているのは、ブラウザや開発者が自分たちの選択したモデルを実行できるようにすることです。Googleは明らかに、自社のアプリケーション用にGeminiを実行するでしょうが、これらのモデルは開発者が自分たちのアプリケーションに望むモデルを選択できるほど小さいものです。
ただし、Googleの賭けは、Chromeに高レベルのAPIを数多く導入して、Geminiモデルを使用してブラウザ内でテキストを翻訳、キャプション付け、および逐次文章化することです。
「この機能を提供するために、Geminiの最も効率的なバージョンを微調整し、Chromeを最適化しました」とDahlkeはI/Oのデベロッパー基調講演で述べています。「今、ChromeでGeminiモデルにアクセスできるようにしたいと考えています。数十億のユーザーに最もパワフルなAIモデルを提供するためには、プロンプトエンジニアリング、微調整、容量、コストを気にする必要がないようにしたいと考えています。すべきことは、いくつかの高レベルAPIを呼び出すだけです - 翻訳、キャプション、逐次文章化。これはWebにとって大きな転換点であり、私たちが正しく行います。」
開発者向けには、GoogleはChrome DevToolsコンソール内の新機能を動かすために組み込まれたGemini Nanoモデルを使用しています。これにより、Chrome Devツールは、コンソール内でエラーを説明し、デバッグソリューションを提供できるようになりました。
我々はAIニュースレターを開始します!ここでサインアップして、6月5日から受け取るようにしましょう。