华泰证券
数学能力: MathGPT 在小学阶段正确率超过通用大模型;整体仍待突破
目前通用大模型在文字创作和语义理解上已有较好表现,但在数理逻辑方面仍有较大进步 空间。我们分别选取一套小学、初中、高中试题,对 MathGPT 和通用大模型进行测试对比。 我们的测试结果显示,在小学阶段,MathGPT 的正确率显著高于通用大模型,达到约 86%。 我们认为这与好未来(TAL US)在小学数学领域多年的教研教学积累密不可分。在初中和 高中阶段,随着题目难度的快速提升,参与测试的大模型的正确率均出现明显下滑。我们 认为整体来看,现有大模型的数学能力仍需进一步突破。
精彩评论