研究 2025年6月3日

Shisa.AI 开发出具备行业领先性能的多语言大语言模型

发布了一款参数规模达 405B 的开源大语言模型，在日语任务中表现超越 GPT-4。

Shisa.AI 宣布正式发布 "Llama 3.1 Shisa V2 405B" 模型，这是日本本土研发的多语言大语言模型中的标杆之作（[新闻稿详情](https://prtimes.jp/main/html/rd/p/000000034.000111581.html)）。该模型在日语处理能力上已超越 GPT-4，并在主要日语基准测试中展现出与 GPT-4o 和 DeepSeek-V3 等前沿模型相媲美的性能，彰显了日本 AI 研究在全球范围内的强劲竞争力。

基于在开发顶级日语模型中积累的深厚经验，我们打造了全新的高质量日语训练数据集，并经过数百次实验与评估测试进行了深度优化。这些数据集及所有模型均以 Apache 2.0 等开源协议在 Hugging Face 上免费发布，支持商业用途。

这一成果证明了日本在研发前沿语言模型方面的世界级竞争力。Shisa.AI 将继续致力于提升大语言模型的性能、可靠性与研发效率，持续为以日语为核心的多语言 AI 基础设施建设贡献力量。

News

Shisa.AI 开发出具备行业领先性能的多语言大语言模型

更多新闻

Shisa 7B 发布

Shisa-Gamma-7b-v1 下载量突破 100 万次

Shisa.AI ​开发​出​具备​行业​领先​性​能​的​多语​言​大语言模型

更​多​新闻

Shisa 7B ​发布

Shisa-Gamma-7b-​v1 下​载量​突破​ ​100 万​次

Shisa.AI 开发出具备行业领先性能的多语言大语言模型

更多新闻

Shisa 7B 发布

Shisa-Gamma-7b-v1 下载量突破 100 万次