写在百度大跌之际：文心一言4.0到底怎么样？_老虎社区_美港股上老虎

写在百度大跌之际：文心一言4.0到底怎么样？

在李彦宏高调发布文心大模型4.0和十余款AI原生应用之后，百度连续两天大跌。有一说一，这不是一个正常的市场表现。

当然，产品好不好，用了才知道。我们在第一时间拿到了文心一言4.0的测试资格，和3月份文心一言刚发布时的测试一样，我们对配备ChatGPT-4的New Bing和文心4.0提出相同的问题，看看他们回答的情况以及反应速度，最后再让文心4.0写一篇文章。

话不多说，一起看看他们的表现吧！

先来一个简单的问题：如何看待百度发布文心一言4.0之后股价下跌？

图片

对于这个问题，NewBing是这样回答的：

图片

很明显，在这里NewBing的回答是混乱的。在百度世界2023大会发布之后，港股百度的跌幅为6%左右，点开NewBing的引用链接也可以发现，这个下跌幅度的引用链接其实是今年3月16日百度刚刚发布文心一言时的股价表现，呈现出与事实不同的结果。

对比来看，文心4.0的提升一方面在于响应速度，在同样的网络条件下，内容生成的响应速度远胜于NewBing和前代的文心一言；另一方面在于回答的质量，它明显考虑到了多重影响公司股价的因素，并对如何综合评估一家公司进行了阐述。这是在问题之外的回答，但确实包含在问题背后的大逻辑中。

而不足之处也是有的。即便文心4.0集成了百度的搜索插件，但还是比不上NewBing的即时性，上面这段由文心4.0生成的内容并没有任何事实层面的论证，显得相当单薄。从二者的对比来看，在回答中融合时效性更强的内容方面，各自都有一些问题需要提升。

问题问完了，再看各自的创作能力，这也是在昨天百度的大会上李彦宏着重演示的一个能力。

集成了ChatGPT-4之后，NewBing对于财经文章创作的案例我们在此前的文章中已经有了展示，详细的可以看这篇《用GPT-4写一篇市场分析文章，能超过X%的投资人？》

这里，为了尽可能考察文心4.0的能力，我们让它自己出了一份提纲并进行创作。

图片

虽然分析框架依然没有什么大毛病，即便整合了百度搜索的插件，在文章中它并没有结合上半年真实的情况创作出一篇内容来。而在另一种文体——小说的创作上，它体现出的进步就相当明显了。

我们要求文心4.0创作一个包含五个角色设定的连环凶杀悬疑武侠小说的框架，它给出了这样的回复。

图片

但在设定中，影行者是凶杀案的凶手，当我们指出这个逻辑错误之后，文心4.0是这样找补的：

图片

既然是一个连环凶杀悬疑武侠小说，这个故事框架的矛盾冲突、紧凑、逻辑和内容丰富度是相当不错的，并且文心4.0并没有出现前后矛盾不一的情况。从这个层面来说，文心4.0的确有了不小的进步，相比之下，配备了ChatGPT-4的NewBing就做不到。

也因此，我们认为，像财经类专业的投资分析，也许并不是如文心一言这种通用大模型的“任务范畴”，在AI应用的创业中，相关垂直领域的大模型的开发也是一个很好的方向，比如镶嵌在炒股软件的“ChatGPT”、在图像处理软件的“ChatGPT”、在教育领域的“ChatGPT”等等。

还有一个值得提的亮点是，文心4.0更新后的一个大变化：多模态。制作视频、制作图表、制作思维导图、根据图片解析内容等等，这些功能我们基本都尝试了一个遍。以识别图片为例，这是ChatGPT-4在发布时一个重点介绍的功能，文心4.0展示了相当不错的理解能力。

图片

你看，文心4.0的审美是在线的，并且也能引申出更深的想象空间，符合人的思维方式和逻辑。整体体验下来，昨天大会上李彦宏说的“与GPT-4相比毫不逊色的自然语言处理能力”确是有现实依据的。

我们坚信，AI不是短期爆炒的题材，大模型在各行各业中的应用会带来巨大的价值，但体现在上市公司的业绩中，的确需要相当长的一段时间。

今年第三季度，宏观环境有很多指标显示出向好的迹象。根据国家统计局的数据，前三季度国内GDP为913027亿元，按不变价格计算，同比增长5.2%。分季度看，一季度GDP同比增长4.5%，二季度增长6.3%，三季度增长4.9%。从环比看，三季度GDP增长1.3%，二季度环比增长0.8%。

考虑到去年二季度的基数比较低，三季度同比增速回落很正常，三季度环比向好的趋势也基本确立。对于像百度这样的大型互联网企业来说，宏观经济的向好，就意味着业绩预期大概率也是向好的。

宏观环境向好，百度这次发布的产品也都不错，进一步超跌可能只说明一个事实：机会到了。

声明：本文仅用于学习和交流，不构成投资建议。 $百度(BIDU)$ $百度集团-SW(09888)$ $微软(MSFT)$

免责声明：上述内容仅代表发帖人个人观点，不构成本平台的任何投资建议。

写在百度大跌之际：文心一言4.0到底怎么样？