Naver Labs Europe、自律走行ロボット向け汎用エンコーダ「DIVINE」を発表

画像=「DIVINE」のイメージ（Naver提供）

Naver Labs Europeは23日、自律走行ロボット向けの汎用エンコーダ「DIVINE」を発表した。カメラやLiDARで取得した情報の処理を単一モデルに集約し、エンコーダのメモリ使用量を約90%削減するとともに、処理速度を最大12倍に高めたという。

DIVINEは、産業現場や日常空間で稼働する自律走行ロボット向けに開発した技術だ。ロボットがカメラやLiDARセンサーで収集したデータを、AIモデルが活用しやすい形に変換する。

従来の自律走行ロボットでは、自己位置推定、深度推定、空間理解、人認識といった用途ごとに別々のAIモデルやエンコーダを使うのが一般的だった。このため、同じデータを個別に処理する必要があり、計算負荷やメモリ消費の大きさが課題となっていた。

これに対しNaver Labs Europeは、複数の専門モデルの知識を1つのモデルに集約する「マルチ教師蒸留」手法を適用した。2D画像理解、3D空間再構成、人認識などの機能をDIVINEに統合したとしている。

実験では、複数のエンコーダを搭載した場合と比べ、エンコーダのメモリ使用量を約90%削減し、エンコーディング処理速度は最大12倍に向上した。ロボットシステム全体でも、メモリ使用量を約62%削減し、処理速度を最大4倍に改善したという。

同社は、こうした効率化により、大規模な計算機器を搭載しない小型ロボットでも高性能なAI機能を実装しやすくなり、ロボットの適用範囲拡大につながるとみている。

Naver Labsのビジョングループリーダー、イ・ドンファン氏は「フィジカルAIの商用化に向けて、ロボットの頭脳をいかに軽量化するかが世界的に大きなテーマになっている。DIVINEは、日常空間から産業現場まで、AIロボット導入のハードルを下げるのに寄与する」とコメントした。

DIVINEに関する研究2件は、欧州コンピュータビジョン会議「ECCV」と、コンピュータビジョンとパターン認識に関する国際会議「CVPR」にそれぞれ採択された。