人間なら当然の“省エネ思考”がAIを苦しめる

ARC-AGI-2の検証から見えてきたのは、AIがいくら大規模データや強力な演算力を備えていても、人間のような柔軟性や省エネルギー性を簡単には獲得できないという現実です。

専門家の多くは「従来のモデルは膨大なパターンを学習するには優れているが、初見の場面で抽象的な意味を再解釈する力が弱い」と指摘しています。

文脈やシンボルの意味を独自に理解する仕組みが不足しているため、ARC-AGI-2のような「人間ならさほど苦労せず対応できる」タスクでつまづいてしまうのです。

もう一つの大きな示唆は、AIの推論コストと効率がAGI開発において本質的な課題になりつつあるということです。

人間の脳は非常に省エネかつ高速に多様なタスクをこなしますが、現状のAIでは、莫大なリソースを投入しても「不完全な正答」にとどまる場面が多く見受けられます。

つまり、今後の研究では「どうやって少ないリソースで柔軟に推論できるか」を模索する必要があるわけです。

仮に今後、ARC-AGI-2を大きく突破するようなAIが出てきても、その先にはARC-AGI-3のような新たなベンチマークが待ち受けるかもしれません。

AGIとは何をどこまで指すのか、という哲学的な問題は依然として議論が続いており、ほんの一部のタスクを解けるようになっただけでは「汎用」とは呼べないという意見も根強いからです。

とはいえ、この研究が示す意義は非常に大きいでしょう。

AIにとって“当たり前のようで難しい”分野をあえて可視化し、次なる突破口を探る道筋を提示したからです。

実際、多くの研究者が「記号の意味を取り扱う理論」や「文脈を見極める推論アルゴリズム」などの新しいアイデアに着手し始めています。

単純な“データの量×モデルの巨大化”路線が限界を迎えつつある今、ARC-AGI-2が次世代AIの可能性を再考するきっかけになることは間違いありません。

要するに、このテストで明確になったのは「人間が普段何気なくこなしている柔軟性や効率性を、AIがいかに模倣できていないか」という点です。

AGIへの道のりは決して楽ではありませんが、だからこそ真のブレイクスルーが起きたときの衝撃は計り知れないともいえます。

今、私たちが見る“本物の汎用人工知能”はどんな姿なのか。

ARC-AGI-2という新たなハードルが、その疑問を一層刺激し、研究者たちの挑戦心をかき立てているように思えます。

参考文献

ARC-AGI-2 + ARC Prize 2025 is Back
https://arcprize.org/blog/announcing-arc-agi-2-and-arc-prize-2025

ライター

川勝康弘: ナゾロジー副編集長。
大学で研究生活を送ること10年と少し。
小説家としての活動履歴あり。
専門は生物学ですが、量子力学・社会学・医学・薬学なども担当します。
日々の記事作成は可能な限り、一次資料たる論文を元にするよう心がけています。
夢は最新科学をまとめて小学生用に本にすること。

編集者

ナゾロジー 編集部