研究 2023年12月6日

Shisa 7B 发布

一款基于合成数据驱动方法的双语通用聊天模型。

Shisa 7B (shisa-7b-v1) 是一款双语日语/英语 (JA/EN) 通用聊天模型，旨在通过合成数据驱动的方法，在保持强大的英语能力的同时实现卓越的日语表现。

该模型基于 Mistral 7B 构建，采用了专门针对日语优化的扩展分词器，其日语分词效率是 Mistral 原生分词器的 2 倍以上。基础模型额外进行了 80 亿 token 的日语预训练。随后，该模型使用扩展并经机器翻译的 airoboros-3.1 数据集、来自 ultrafeedback_binarized 的高分样本集以及针对目标语言新生成的 airoboros 数据进行了微调。

我们以宽松的 Apache 2.0 许可证发布了基础模型、数据集和流水线代码，可用于任何商业或其他用途。此外，我们正在项目 Wiki 上发布更详尽的撰写内容，包括消融实验结果、测试方法论和关键发现，供研究人员参考。

News

Shisa 7B 发布

更多新闻

Shisa-Gamma-7b-v1 下载量突破 100 万次

Shisa.AI 开发出具备行业领先性能的多语言大语言模型

Shisa 7B ​发布

更​多​新闻

Shisa-Gamma-7b-​v1 下​载量​突破​ ​100 万​次

Shisa.AI ​开发​出​具备​行业​领先​性​能​的​多语​言​大语言模型

Shisa 7B 发布

更多新闻

Shisa-Gamma-7b-v1 下载量突破 100 万次

Shisa.AI 开发出具备行业领先性能的多语言大语言模型