Image may contain Chart and Line Chart

「Chatbot Arena」で米国と中国の最も優れたモデルの性能を比較。

Courtesy of Stanford HAIオープンウェイトモデルの拡大

報告書は、現在、優れたAIモデルのいくつかが「オープンウェイト」として提供されていることを示している。つまり、無料でダウンロードや改変が可能なモデルということだ。​メタは2023年2月に初めて公開したモデル「Llama」を通じて、このトレンドの中心的存在となっている。​同社は4月上旬に、その最新バージョンである「Llama 4」を公開した。​また、DeepSeekやフランスのMistralも高度なオープンウェイトモデルを提供している。

OpenAIも今年3月、GPT-2以来となるオープンソースモデルを今夏に公開予定であると発表した。調査によると、2024年にはオープンモデルとクローズドモデルの性能差は8%から1.7%へと縮まっている。ただし、高度なモデルの大半(60.7%)は依然としてクローズドモデルだ。

スタンフォード大学の報告書は、AI業界における効率性の向上にも注目しており、過去1年間でハードウェアの性能が40%向上したことを指摘している。これにより、AIモデルにクエリを出して回答を得るコストが下がり、比較的高性能なモデルを個人の端末で動かすことが可能になった。

効率の向上により、最大規模のAIモデルであっても、従来ほど多くのGPUを必要としないで済むのではないかと推測する人もいる。しかし、多くのAI開発者は、むしろ必要な計算リソースは増えていると話す。調査によると、最新のAIモデルは数十兆のトークン(文中の単語などデータの一部を表す単位)と数百億ペタフロップス(コンピュータの処理速度の単位)の計算量を用いて構築されている。

しかし、インターネット上にある訓練用のデータの供給は、2026年から2032年の間に枯渇する可能性があるという研究結果を報告書は引用している。その結果、AI生成による「合成データ」の活用が加速すると考えられる。

社会への影響

今回の報告書は、AIがもたらすより広範な影響についても包括的にまとめている。報告書には、機械学習のスキルをもつ人材への需要が急増しており、AIによって自身の仕事が変化すると考える労働者の割合が増えていることを示す調査結果が引用されていた。2024年には、民間投資額が過去最高となる1,508億ドルに達している。

また、各国政府も2024年、数十億ドル規模の資金をAIに投資している。米国では、2022年以降に制定されたAI関連の法律の数が倍増した。

企業は、先進的なAIモデルの開発手法について以前にも増して秘密主義的になっている一方で、学術研究は活発化しており、その質も向上しているとパーリは指摘する。

今回の報告書は、AIの普及によって生じている問題にも言及している。過去1年の間に、AIモデルが誤作動したり悪用されたりする事例が増加しており、それに伴い、モデルをより安全かつ信頼できるものにするための研究も進んでいる。