2025年11月3日,明略科技在港交所主板挂牌上市,首日股价暴涨超过110%,市值一度突破400亿港元。资本市场用真金白银投票,表达了对这家数据智能企业的认可。但明略又一大动作,发生在上市不到三个月后的2026年1月——面向全球开源First Data,目前最全面的结构化数据源知识库。 这不是一次普通的技术发布。在AIGC内容泛滥、AI幻觉问题日益严重的当下,明略选择将耗费大量人力技术提炼的核心资产以MIT协议完全开源,其战略意义远超技术层面。作为长期跟踪科技产业的观察者,我们认为这代表着AI竞赛正在进入新的阶段——从"比参数"到"比可信",从"卷算力"到"卷底座"。 AI幻觉:一个被低估的产业瓶颈 要理解明略的战略选择,需要先看清AI行业正在发生的深刻变化。 过去两年,大模型赛道经历了疯狂的参数竞赛。从百亿级到千亿级再到万亿级,各家厂商不断刷新数字。但一个尴尬的现实是:企业级市场的渗透率远低于预期。问题出在哪里?答案藏在"幻觉"这两个字上。 AI幻觉指的是大模型生成看似合理但实际错误的内容。在聊天娱乐场景,这可能只是个小瑕疵;但在金融分析、法律咨询、医疗诊断等专业领域,一次幻觉就可能带来严重后果。据行业调研数据显示,通用大模型在专业场景的幻觉率普遍处于较高水平,这直接导致企业客户的态度从"想用"变成了"不敢用"。 更棘手的是幻觉的传染效应。当AI生成的内容大规模涌入互联网,大模型开始"用AIGC训练AIGC",质量形成螺旋式下降。一个AI产生错误信息,被另一个AI引用传播,假信息就这样在数字世界里完成了自我验证的闭环。学术界将这种现象称为"模型崩溃"。 明略科技敏锐地捕捉到了这个痛点。他们提出的核心理念是"Clean Data大于Big Model"——高质量数据优于大模型。这句话的潜台词非常清晰:在人工智能的底层架构中,数据质量比模型规模更具决定性意义。 明略的解法:三