CyberAgentの日本語言語モデルを試してみる - きしだのHatena

テクノロジーカテゴリーの変更を依頼記事元:

nowokay.hatenablog.com

147 usersがブックマークコメント

規約違反を報告

CyberAgentの日本語言語モデルを試してみる - きしだのHatena

CyberAgentが日本語LLMを公開していたので、とりあえず動かしてみました。サイバーエージェント、最大6... CyberAgentが日本語LLMを公開していたので、とりあえず動かしてみました。サイバーエージェント、最大68億パラメータの日本語LLM（大規模言語モデル）を一般公開 ―オープンなデータで学習した商用利用可能なモデルを提供― | 株式会社サイバーエージェントモデルは次のように6サイズ提供されています。 ※ Rinna社も同時に新しいモデルを出したので試しています。 Rinnaの新しい3Bモデルを試してみる - きしだのHatena open-calm-small(160M) まずはopen-calm-small。160Mパラメータです。このあたりは動作確認用なので、内容は気にしない。 GPUメモリは1.3GBくらいの消費です。 open-calm-medium(400M) 次にopen-calm-medium。400Mパラメータです。このへんも細かいことは気にしないけど、なんかま