2023.12.07

Google、新大規模言語モデル「Gemini」を発表　脅威の性能、もはや人

namiten

【東京総合 = テクノロジー・欧米総合 = シリコンバレー（IT）】
Googleは日本時間7日、大規模言語モデルの「Gemini」を発表した。「Ultra」「Pro」「Nano」の3サイズを用意し、用途によって使い分けを可能にする。テキストや画像、音声、動画、コーディングなど様々な分野の情報を同時に活用できる「マルチモーダル」が特徴だ。

MMLUスコアベンチマークでは、32のうち30で米スタートアップOpenAIの開発する「GPT-4」を上回る結果を残したほか、一部環境で専門家を超える場面があったという。同社は「人間専門家を超えた初のAI」とアピールする。同社のサンダー・ピチャイCEOも「Google が企業として取り組んできたサイエンスおよびエンジニアリングの取り組みのなかでも最も大きなものです。」と成果を強調する。

Google AIが今年5月に発表したPaLM2の後継として開発された。文章に限らず画像や音声など複合的な学習モデルをゼロから構築した。その結果、GPT-4やPaLM2と比較して、同時理解能力が飛躍的に向上したという。

その能力は驚異的だ。今までとは一線を画す最新AIの姿を映す。Googleが7日にYouTubeに投稿したプロモーションビデオでは日本語字幕付きで使用例が紹介されている。

紙に直接、数秒で書いた鳥を見せると「これは鳥ですね」と答え、周りに水面を描くと「これはおそらくアヒルでしょう」と言う。アヒルを青色で塗ると「青色のアヒルはいませんよ」とアドバイスをくれる。

世界地図を見せ「これで何かゲームを考えてよ」とプロンプトを与えると、「国当てゲームはどうですか」と返答する。正解を指差すと「見事正解ですね！」と褒めてくれた。

さらに、自分の身を写した状態でじゃんけんしてる動画を渡すと「これはじゃんけんをしているシーンです」と答えた。両手で蝶の真似をしても、見事に正解している。限られた情報を元に、回答を生成することができるようになった。

音楽生成も可能だ。エレキギターと南国の木の絵を書いた紙を見せると瞬時にその状況にあった音楽を生成する。緑とピンクの毛糸を見せると、複数の制作例を画像で教えてくれた。

ユーモアもある。先ほどのアヒルの例で行くと、「青色のアヒルはいない」と答えたGeminiに、青色のアヒルのおもちゃを見せる。すると「信じられない！」と反応した。「このおもちゃは水に浮きますか？」とおもちゃの音を鳴らしながら質問すると「浮きます。音が鳴るアヒルは絶対に浮きます」と返答する。

Microsoft・OpenAI連合に遅れをとるGoogleは、複数のタスクをこなせるマルチモーダルな生成AIで巻き返しを狙う。2023年に大きな成長を見せた生成AI市場は2024年にどのような進化を見せるのか。生成AI市場は瞬きをする間に力関係が変わる一方で及ぼす経済効果は膨大だ。

日本時間の今日には、NVIDIAの独走状態が続く半導体市場ではAMDが新製品を発表し、これから70%市場が拡大するとの予測を示した。個人も企業も、インターネットの登場以来の変化と位置付けられるAIブームに乗り遅れぬよう、普段から使っておくことが何より重要だ。

※SNSシェアの場合、必ず利用規約をご確認ください。
コンテンツの翻案、リンクを含まない引用・スクリーンショットの共有は法律・法令、当サイト利用規約で禁止されています。

#GAFA #OpenAI #生成AI

Google Newsでnamiten.jpをフォロー