图片 过去6年亏了500亿。 @科技新知 原创 作者丨樱木 编辑丨伊页 商汤的转折来得猝不及防。 4月24日,商汤科技在二级市场突然开始爆发,单日涨幅超30%。随后几天,这种势头持续蔓延,股价一路从0.58元一路暴涨至1.32元,不到一周时间完成翻倍。 从消息面来看,能够支撑商汤上涨的理由非常简单,即公司发布了日日新5.0大模型。根据公告显示,公司于4月23日推出6000亿参数大模型日日新5.0,在知识、数学、推理和代码能力方面大幅提升,综合性能全面对标GPT-4 Turbo。同时,公司推出行业大模型一体机版本以及移动端大模型SDK版本。 与此同时,官方对于股价的波动也宣称,除了日日新5.0的推出外,董事会不知悉有关价格及交易量变动的任何原因。 近6年亏损了500亿的商汤是否就此翻盘了?日日新5.0真的如多家媒体报道一般超越了GPT-4吗? 投资人朱啸虎曾言,“大家都说自己很快能超越GPT-4,但好像没有一家能做得出来。”根据公开信息显示,GPT-4的参数量达到了1.8万亿,这是其前身GPT-3参数量的10倍以上。GPT-4采用了混合专家模型(MoE)的设计,其中包含了16个专家模型,每个专家模型大约有1110亿参数 。这种架构允许模型在保持合理成本的同时,处理更复杂的任务。GPT-4的训练数据集包含了约13万亿个tokens,这些数据经过了重复计算,覆盖了多个epoch的训练。 对比来看,商汤的日日新5.0并未达到上述水平。根据官方资料显示,日日新参数水平上达到了6000亿参数,同时超过10TB的数据tokens进行训练。 那么一些报道之中所谓的超越GPT-4究竟指的是什么?从商汤官方的表述来看,其实并未提出超越而是用了对标。发布会上介绍的一些应用场景上的细分功能,日日新确实从某种程度上超越了GPT-4。如以下这个广为流传的例子,有13个小