智通财经APP获悉,人工智能初创公司Cerebras今日宣布推出Cerebras Inference,据称是世界上最快的人工智能推理解决方案。该公司表示:“Cerebras Inference为Llama 3.18B每秒提供1800个token,为Llama 3.170B每秒提供450个token,比基于英伟达(NVDA.US)GPU的超大规模云快20倍。”Cerebras Inference由...
网页链接智通财经2024-08-28
智通财经APP获悉,人工智能初创公司Cerebras今日宣布推出Cerebras Inference,据称是世界上最快的人工智能推理解决方案。该公司表示:“Cerebras Inference为Llama 3.18B每秒提供1800个token,为Llama 3.170B每秒提供450个token,比基于英伟达(NVDA.US)GPU的超大规模云快20倍。”Cerebras Inference由...
网页链接免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。
关于我们·老虎社区守则·老虎社区账号管理规范·老虎社区服务协议·老虎社区隐私政策
公司名称:北京至简风宜信息技术有限公司
违法和不良信息投诉:010-5681-3562(工作时间9:30-18:30)
© 2018-2025 老虎社区 版权所有
营业执照:91110105MA01A4U55R
ICP备:京ICP备18016422号