公開
2026年06月30日 17時33分

更新
2026年07月01日 17時04分

【修正履歴:2026年7月1日午前10時52分 事後学習で利用されている技術について「高性能な教師モデルの知識を学習させる『蒸留』」と記載していましたが、「外部の高性能モデルを使わず、モデル自身が生成した出力を学習に使う『OPSD』(オンポリシー自己蒸留)」と修正しました】

 ソフトバンク傘下のSB Intuitionsは6月30日、国産大規模言語モデル(LLM)「Sarashina3シリーズ」の提供を始めた。独自の技術や品質評価によって、高品質な日本語を安定して出力できるとうたう標準モデルと軽量モデルに加え、3つの専門モデルも提供する。ソフトバンクが米Oracleの基盤を利用して国内データセンターで運用するクラウドサービス「Cloud PF Type A」を通して提供する。

Sarashina3シリーズを発表(出典:プレスリリース)

 標準モデル「Sarashina3 mini」(以下、3 mini)は外部APIを自律的に呼び出すエージェント機能や、数理的理解力、コード生成能力を備えるとうたう。日本語と英語を中心とした30兆トークン超のデータで事前学習を行い、事後学習では外部の高性能モデルを使わず、モデル自身が生成した出力を学習に使う「OPSD」(オンポリシー自己蒸留)と強化学習を組み合わせることで、ビジネスシーンで必要な能力を高めたという。

 3 miniは、日本語対話やコーディングなどのベンチマークにおいて前世代の「Sarashina2 mini」から性能が向上。他社の「Qwen3-235B-A22B-Instruct-2507」や「GPT-5.4 mini(non-reasoning)」と同等性能とされる。

ベンチマークスコア(出典:公式ブログ)

 3 miniと軽量モデル「Sarashina3 nano」(以下、3 nano)の事前学習で使用したデータ構築においては、独自の品質フィルタリングやデータ合成技術によって、多様かつ有用性の高いデータを拡充したと説明。また、両モデルが出力する日本語の自然さ、丁寧さ、簡潔さ、実用性をSB Intuitionsの専門チームが評価、検証し、その結果を強化学習などに利用することで、高品質な日本語を安定して出力できるよう調整したという。

 Sarashina3シリーズのラインアップは、3 miniと3 nanoに加えて、入出力テキストの有害性を判定するガードモデル「Sarashina3 guard」、テキストをベクトル化する「Sarashina3 embedding」、複数の文書を入力クエリと関連度の高い順に並び替えるリランキングモデル「Sarashina3 rerank」の5種類だ。

Copyright © ITmedia, Inc. All Rights Reserved.

関連記事

Share.