近日英伟达开源Nemotron-4 340B(3400亿参数)系列模型。开发人员可使用该系列模型生成合成数据用于训练大型语言模型(LLM)用于医疗保健、金融、制造、零售和其他行业的商业应用。

智通财经06-16

近日英伟达开源Nemotron-4 340B(3400亿参数)系列模型。开发人员可使用该系列模型生成合成数据用于训练大型语言模型(LLM)用于医疗保健、金融、制造、零售和其他行业的商业应用。Nemotron-4 340B包括基础模型Base、指令模型Instruct和奖励模型Reward。英伟达使用了9万亿个token(文本单位)进行训练。Nemotron-4 340B-Base在常识推理任务如...

网页链接
免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法