全文约7500字,阅读时间15分钟 文/王吉伟 差不多每个春节前后,科技界都会有些“大事件”发生,尤其是这几年日新月异的AI领域。 往年都是国外产品吸引眼球,而今年换成了中国技术惊艳全球。 春节前幻方量化发布的大模型DeepSeek-R1,一经亮相便迅速炸场AI领域,全球的企业管理者、创业者、项目经理、分析师乃至相关部门领导人都现身说法,感慨DeepSeek-R1在大模型领域取得的突破性进展。 DeepSeek-R1在后训练阶段采用了大规模强化学习技术,使得在标注数据极少的情况下,依然能实现显著提升推理能力。这一技术的进步使它在数学、代码及自然语言推理等多项任务中,表现出可与OpenAI的最新版本相媲美的性能,真正实现了开源化。这意味着,AI领域正在朝着“低成本+高性能”方向迈进。 重要的是,基于DeepSeek-R1的browser-use 等很多智能体实操案例已经证明,DeepSeek能够有效降低部署AI Agent的门槛,能够大幅提升AI Agent性能和效率,增强场景适应能力。 在LLM Based AI Agent亟待落地的当下,一个高效且性价比可观的大模型对于智能体的重要性可想而知。可以预见,接下来DeepSeek-R1等强化学习类大模型,将会极大地提升智能体的构建与应用效率,进一步加速AI Agent的落地应用。 当然,在智能体成为AI应用主旋律的当下,春节前后更精彩的仍然是AI Agent行业,产品研发与生态扩建方面全球技术厂商都在马不停蹄。 谷歌于 2024 年 12 月发布了全新多模态大模型Gemini 2.0,其性能全面提升,支持图片、视频和音频等多模态输入与输出。基于Gemini 2.0架构,谷歌推出了三个新的AI智能体原型:通用大模型助手Project Astra、浏览器助手Project Mariner和编程助手Jules。其中,编程助手Jule