在李彦宏高调发布文心大模型4.0和十余款AI原生应用之后,百度连续两天大跌。有一说一,这不是一个正常的市场表现。
当然,产品好不好,用了才知道。我们在第一时间拿到了文心一言4.0的测试资格,和3月份文心一言刚发布时的测试一样,我们对配备ChatGPT-4的New Bing和文心4.0提出相同的问题,看看他们回答的情况以及反应速度,最后再让文心4.0写一篇文章。
话不多说,一起看看他们的表现吧!
先来一个简单的问题:如何看待百度发布文心一言4.0之后股价下跌?
对于这个问题,NewBing是这样回答的:
很明显,在这里NewBing的回答是混乱的。在百度世界2023大会发布之后,港股百度的跌幅为6%左右,点开NewBing的引用链接也可以发现,这个下跌幅度的引用链接其实是今年3月16日百度刚刚发布文心一言时的股价表现,呈现出与事实不同的结果。
对比来看,文心4.0的提升一方面在于响应速度,在同样的网络条件下,内容生成的响应速度远胜于NewBing和前代的文心一言;另一方面在于回答的质量,它明显考虑到了多重影响公司股价的因素,并对如何综合评估一家公司进行了阐述。这是在问题之外的回答,但确实包含在问题背后的大逻辑中。
而不足之处也是有的。即便文心4.0集成了百度的搜索插件,但还是比不上NewBing的即时性,上面这段由文心4.0生成的内容并没有任何事实层面的论证,显得相当单薄。从二者的对比来看,在回答中融合时效性更强的内容方面,各自都有一些问题需要提升。
问题问完了,再看各自的创作能力,这也是在昨天百度的大会上李彦宏着重演示的一个能力。
集成了ChatGPT-4之后,NewBing对于财经文章创作的案例我们在此前的文章中已经有了展示,详细的可以看这篇《用GPT-4写一篇市场分析文章,能超过X%的投资人?》
这里,为了尽可能考察文心4.0的能力,我们让它自己出了一份提纲并进行创作。
虽然分析框架依然没有什么大毛病,即便整合了百度搜索的插件,在文章中它并没有结合上半年真实的情况创作出一篇内容来。而在另一种文体——小说的创作上,它体现出的进步就相当明显了。
我们要求文心4.0创作一个包含五个角色设定的连环凶杀悬疑武侠小说的框架,它给出了这样的回复。
但在设定中,影行者是凶杀案的凶手,当我们指出这个逻辑错误之后,文心4.0是这样找补的:
既然是一个连环凶杀悬疑武侠小说,这个故事框架的矛盾冲突、紧凑、逻辑和内容丰富度是相当不错的,并且文心4.0并没有出现前后矛盾不一的情况。从这个层面来说,文心4.0的确有了不小的进步,相比之下,配备了ChatGPT-4的NewBing就做不到。
也因此,我们认为,像财经类专业的投资分析,也许并不是如文心一言这种通用大模型的“任务范畴”,在AI应用的创业中,相关垂直领域的大模型的开发也是一个很好的方向,比如镶嵌在炒股软件的“ChatGPT”、在图像处理软件的“ChatGPT”、在教育领域的“ChatGPT”等等。
还有一个值得提的亮点是,文心4.0更新后的一个大变化:多模态。制作视频、制作图表、制作思维导图、根据图片解析内容等等,这些功能我们基本都尝试了一个遍。以识别图片为例,这是ChatGPT-4在发布时一个重点介绍的功能,文心4.0展示了相当不错的理解能力。
你看,文心4.0的审美是在线的,并且也能引申出更深的想象空间,符合人的思维方式和逻辑。整体体验下来,昨天大会上李彦宏说的“与GPT-4相比毫不逊色的自然语言处理能力”确是有现实依据的。
我们坚信,AI不是短期爆炒的题材,大模型在各行各业中的应用会带来巨大的价值,但体现在上市公司的业绩中,的确需要相当长的一段时间。
今年第三季度,宏观环境有很多指标显示出向好的迹象。根据国家统计局的数据,前三季度国内GDP为913027亿元,按不变价格计算,同比增长5.2%。分季度看,一季度GDP同比增长4.5%,二季度增长6.3%,三季度增长4.9%。从环比看,三季度GDP增长1.3%,二季度环比增长0.8%。
考虑到去年二季度的基数比较低,三季度同比增速回落很正常,三季度环比向好的趋势也基本确立。对于像百度这样的大型互联网企业来说,宏观经济的向好,就意味着业绩预期大概率也是向好的。
宏观环境向好,百度这次发布的产品也都不错,进一步超跌可能只说明一个事实:机会到了。
声明:本文仅用于学习和交流,不构成投资建议。 $百度(BIDU)$ $百度集团-SW(09888)$ $微软(MSFT)$
精彩评论
自从有了AI,应付学校里那些毫无意义的作业就很方便了哈哈哈
Ai的好处就在于解放了人类一部分重复且有固定套路的东西
个人觉得文心一言在内容质量是与gpt有一些差距
人工智能是个漫长又史无前例的科技革命