OpenAIとGoogleのAIがプログラミング大会「ICPC 2025」に参加し金メダル相当の記録を達成、OpenAIは全問正解でGoogleは2問ミス – GIGAZINE


OpenAIとGoogleが国際大学対抗プログラミングコンテスト「ICPC 2025」の世界大会に参加し、金メダル相当の記録を達成をしました。OpenAIのチームは開催地を訪れてローカル試験に参加し、複数回の提出を経て12点満点を獲得。一方で、Googleのチームはインターネット経由のオンライン試験に参加して12点満点中10点を記録しました。

OpenAI | ICPC World Finals Baku
https://worldfinals.icpc.global/2025/openai.html

Google DeepMind | ICPC World Finals Baku
https://worldfinals.icpc.global/2025/gdm.html

Gemini achieves gold-level performance at the International Collegiate Programming Contest World Finals – Google DeepMind
https://deepmind.google/discover/blog/gemini-achieves-gold-level-performance-at-the-international-collegiate-programming-contest-world-finals/

ICPC 2025の世界大会はアゼルバイジャンのバクーで開催されました。OpenAIのチームは実際に会場を訪れ、特別に用意されたAIテスト用の環境で競技に挑みました。この際、問題の内容や時間制限(5時間)は人間と同じでしたが、順位を決めるために定められている「間違った解答を提出した際のペナルティ」などは適用されませんでした。


OpenAIは「GPT-5」と「OpenAI内部で実験中の推論モデル」を用いて12問の問題に挑みました。各問題の解答は「GPT-5と実験推論モデルで複数の解答候補を生成し、別の実験モデルで適切な解答を選択する」という方法で導き出されました。12問中11問でGPT-5の解答が採用され、一発で正解することに成功。残り1問は実験推論モデルの解答が採用され、9回の提出を経て制限時間内に正解を導き出すことができました。人間の最優秀チームの正答数は11問だったとのことで、OpenAIは自社のAIの性能の高さをアピールしています。


一方で、Googleのチームはオンラインで大会に参加し、Gemini 2.5 Deep Thinkの強化版を用いて問題に挑みました。その結果、開始45分で8問を解き、さらに3時間かけて2問の問題を解くことに成功。合計10問の問題の正解を導くことができました。以下のグラフは各問題の解答にかかった時間を強化版Gemini 2.5 Deep Thinkの記録(青)と人間の最速記録(灰色)で比較したものです。解答に要した時間は問題によってバラつきが大きく、人間より高速なものもあれば時間がかかったものもあります。


競技に使用された強化版Gemini 2.5 Deep Thinkは一般提供されていませんが、軽量版Gemini 2.5 Deep ThinkはGemini Ultraの加入者向けに提供されています。Googleは競技参加で得られた知見を今後の製品に統合する姿勢を示しています。

なお、人間チームの記録は以下のリンク先で確認可能。日本からは4チームが参加しており、そのうち東京大学のチームは12問中10問を解いて2位でした。

49th ICPC World Finals Baku
https://worldfinals.icpc.global/scoreboard/2025/finals/index.html


また、OpenAIとGoogleは2025年7月に開催された数学オリンピックにも参加しており、双方ともに6問中5問の問題を解くことに成功して金メダル相当の実力が認められています。

OpenAIの「実験的推論モデル」が数学オリンピックで金メダル相当のスコアを達成、GPT-5は近日中にリリース予定で「実験的推論モデル」はまだ先 – GIGAZINE


Googleの強化版Geminiが数学オリンピックで金メダルを取る性能に到達、自然言語で動作し人間と同じ制限時間で解答を導き出す – GIGAZINE

この記事のタイトルとURLをコピーする




Source link

関連記事

コメント

この記事へのコメントはありません。