【ニューヨーク=小林泰裕】生成AI「チャットGPT」を手がける米オープンAIは13日、新たなAI基盤モデル「GPT―4O(ジーピーティーフォーオー)」を発表した。従来モデルより音声と画像の認識能力を向上させたことで、スマートフォンやパソコンを通じ、人間を相手にしているかのように滑らかにAIと会話することが可能になるとしている。

スパコン「富岳」使い日本語理解力の高い生成AI技術開発、無償公開…東工大や富士通など

オープンAIのロゴ=ロイターオープンAIのロゴ=ロイター 発表によれば、無料会員でもGPT―4Oを利用できる。GPT―4Oの「O(オー)」は、「万能」という意味の「オムニ」の頭文字から取ったという。

 従来モデルでは、音声による回答に3~5秒かかっていたが、GPT―4Oでは0・3秒と、人間とほぼ同じスピードで応答できる。画像の認識技術も改善しており、13日の発表では、スマートフォンのカメラから手書きの計算式を読み取って計算したり、手書きの文章を理解して音声で回答するなどの機能を公表した。 一方、GPT―4Oでは声色を様々に変えて音声で回答できるため、悪用されれば詐欺や偽情報の温床となる恐れがある。そのため、GPT―4Oによる文章や画像の処理は13日から可能になるが、音声については安全対策を徹底させた上で数週間後にサービスを開始するとしている。

Share.