Stability AI、日本語ベースの大規模言語モデル「Japanese Stable LM」をリリース

masapoco
投稿日
2023年10月25日 18:26
stable lm japanese

Stability AIはこのほど、2つの日本語大規模言語モデル「Japanese Stable LM 3B-4E1T」と「Japanese Stable LM Gamma 7B」を発表した。前者は約30億のパラメータを誇り、後者は70億のパラメータを持つモデルである。これらのモデルはApache 2.0ライセンスのもと、商用利用が可能となっている。

これらのモデルは、過去にリリースされた英語モデル、具体的にはStability AIが2023年8月に、Mistral AIが9月にそれぞれ発表した「Stable LM 3B-4E1T」と「Mistral-7B-v0.1」をベースに構築されている。これらのモデルは当初、主に英語のデータで学習されたため、英語の能力は高いが、日本語のデータが少ないため、日本語の能力は限られていた。

日本語能力を向上させるため、これらのモデルはWikipedia、mC4、CC-100、OSCAR、SlimPajama(Books3を除く)などのソースから約1000億トークンに及ぶ日本語と英語のデータセットを利用し、事前学習を継続した。

これらのモデルの性能評価は、2023年8月にリリースされた「Japanese Stable LM Alpha」と同じ手法で行われた。評価対象は日本語理解ベンチマーク(JGLUE)タスクで、文分類、文対分類、質問応答、文章要約の計8タスクである。

日本語安定版LM 3B-4E1Tは、パラメータが30億個しかないにもかかわらず、日本語安定版LM Base Alpha 7Bよりも優れた性能を示した。Japanese Stable LM Gamma 7Bはさらに高いスコアを達成し、これらのモデルによって日本語の自然言語処理が著しく進歩したことを示している。


Source



この記事が面白かったら是非シェアをお願いします!


  • dji osmo pocket 3 4
    次の記事

    DJI、1インチセンサーと回転大画面スクリーン搭載の「Osmo Pocket 3」を発表

    2023年10月26日 5:45
  • 前の記事

    重力波観測装置が“量子限界”を越える事に成功し宇宙の60%以上を探査することが可能に

    2023年10月25日 14:11
    LIGO 1 GeorgiaMansell WEB.original

スポンサーリンク


この記事を書いた人
masapoco

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です


おすすめ記事

  • openai

    OpenAI、15秒の音声サンプルから感情豊かで自然な音声を合成できる「Voice Engine」を発表

  • a04c35e8e555c1cc7ae1d6a5f3159856

    MicrosoftとOpenAI、1000億ドル以上をかけて超人的AI開発のためのスーパーコンピューター「Stargate」を開発する計画

  • Sam Altman TechCrunch SF 2019 Day 2 Oct 3 cropped cropped

    ベンチャーキャピタリスト、OpenAIのSam Altman氏を“誇大妄想的”と非難

  • google logo image

    Googleが非営利団体を対象に2000万ドルの資金を提供し生成AI活用を支援

  • Pixel 8 in Rose.max 936x936.format webp

    Google、方針を転換しPixel 8にもGemini NanoによるオンデバイスAI機能を搭載へ

今読まれている記事