Shisa.AI 开发出具备行业领先性能的多语言大语言模型
发布了一款参数规模达 405B 的开源大语言模型,在日语任务中表现超越 GPT-4。
Shisa.AI 宣布正式发布 "Llama 3.1 Shisa V2 405B" 模型,这是日本本土研发的多语言大语言模型中的标杆之作([新闻稿详情](https://prtimes.jp/main/html/rd/p/000000034.000111581.html))。该模型在日语处理能力上已超越 GPT-4,并在主要日语基准测试中展现出与 GPT-4o 和 DeepSeek-V3 等前沿模型相媲美的性能,彰显了日本 AI 研究在全球范围内的强劲竞争力。
基于在开发顶级日语模型中积累的深厚经验,我们打造了全新的高质量日语训练数据集,并经过数百次实验与评估测试进行了深度优化。这些数据集及所有模型均以 Apache 2.0 等开源协议在 Hugging Face 上免费发布,支持商业用途。
这一成果证明了日本在研发前沿语言模型方面的世界级竞争力。Shisa.AI 将继续致力于提升大语言模型的性能、可靠性与研发效率,持续为以日语为核心的多语言 AI 基础设施建设贡献力量。
更多新闻
Shisa 7B 发布
一款基于合成数据驱动方法的双语通用聊天模型。
阅读全文Shisa-Gamma-7b-v1 下载量突破 100 万次
在作为演化模型合并的核心底座发布一年后,我们的模型达成这一重要里程碑。
阅读全文