范式智能的个人主页

范式智能官方号

老虎认证：范式智能（6682.HK），领先的全栈AI云服务平台。

IP属地：北京

0关注

244粉丝

范式智能（6682.HK），领先的全栈AI云服务平台。

范式智能

06-05

范式入选太空计算工委会副主任委员单位，共筑空天智能新基石

近日，中国计算机行业协会太空计算工作委员会（以下简称“工委会”）成立大会暨第一次全体成员大会在北京召开。范式作为国内领先的全栈AI云服务平台，成功当选副主任委员单位。本次入选的副主任委员单位均来自头部企业、专业科研机构及知名高校。未来，范式将与产业同仁一道，共同推动太空计算技术与生态建设。大会现场，工业和信息化部电子信息司副司长史惠康、电子系统处处长金磊，中国科学院院士、西北工业大学常务副校长张艳宁，中国科学院院士、中国科学院大学杭州高等研究院院长王建宇，中国电子信息产业发展研究院总工程师、工委会筹备组组长李宏伟及首批成员单位代表共同出席。史惠康表示，2026年是“十五五”规划开局之年，也是我国太空计算产业布局的关键之年，建议从强化统筹布局、促进融合创新、完善生态建设三方面推动产业发展。张艳宁院士指出，太空计算是国家战略布局的关键点，也是航天强国建设的必然要求与重要基石，未来计算将向空天地海一体化方向发展。经大会选举，王建宇院士担任工委会主任委员，同时选举产生副主任委员单位、秘书长、副秘书长等。范式凭借在AI基础设施领域的全栈技术积累，成为十五家副主任委员单位之一。范式围绕太空算力发展，在算力调度、模型适配、场景落地及安全合规等方面具备相应能力，可支撑星载算力管理、卫星智能体构建及跨域数据服务等需求。太空计算工委会的成立，标志着我国太空计算产业协同发展迈出关键一步。范式将充分发挥自身在AI算力管理与优化方面的核心能力，与工委会成员单位一道，为空天地海一体化智能计算生态贡献技术力量。范式智能（ $06682(06682)$ ）是领先的全栈AI云服务平台，提供包括先知AIOS、HAMi vGPU、信创模盒等高效AI基础设施，具备从底层异构算力纳管优化到智能体模型调用的全栈能力，赋能千行

范式入选太空计算工委会副主任委员单位，共筑空天智能新基石

范式智能

06-03

信创模盒认证模型突破10万！范式率先突破国产AI基础设施适配瓶颈，打造极致高效的“Token工厂”

今天，范式 $06682(06682)$ 正式宣布：信创模盒认证模型突破 10 万！在“国产芯片×大模型规模化适配”的问题上，范式再次给出了一份漂亮的成绩单。依托自研 vGPU 虚拟化技术与十余年AI工程化经验，范式在 Token 调用效率上形成了"国产算力×全球模型"的差异化优势，持续刷新了国产AI基础设施的适配边界，走出了一条可规模化的“Token工厂”路径。这意味着，范式精准破解了当前AI规模化落地中最棘手的“国产芯片×大模型”双向适配难题。通过自研的底层异构算力优化与全场景模型适配能力，范式已让****、寒武纪、海光、壁仞等主流国产芯片，与 Llama、Qwen、DeepSeek、GLM 等全球主流开源模型实现真正的“即插即用”，告别过去“A芯片能否跑B模型”的不确定性。这一突破，不仅夯实了范式在”底层异构算力优化+全场景模型适配“的核心技术壁垒，更助力构建起高客户粘性、可持续增长的“Token 工厂”的商业模式。刚刚过去的一季度，范式的 Token 调用量同比去年激增近 6 倍。在这场正向飞轮中，范式做到了：让同样的芯片跑更多模型、同样的模型可选型更高效的算力，真正将国产AI基础设施从“能用”推向“好用”，从“试点”推向“规模”。我们在实践中感受到：国产AI 基础设施的拐点，正在加速到来！ 01 解决“国产芯片×大模型”双向规模化适配难题，打造领先的 Token 工厂当前，全球 AI 产业正在经历一场从“单点突破”转向“规模化落地”的“Token产能竞赛”。Token 经济的爆发，本质是海量推理需求的爆发；而推理规模化落地的核心瓶颈，正是"多芯片×多模型"的适配难题。范式以十余年&n

信创模盒认证模型突破10万！范式率先突破国产AI基础设施适配瓶颈，打造极致高效的“Token工厂”

范式智能

05-29

政策再加力 | 范式邀您见证：信创模盒冲刺10万认证模型里程碑！

5月以来，国内AI产业持续释放重磅政策：算力跨区域协同、数据要素流通、开源合规治理全面加速。范式 $06682(06682)$ 信创模盒（ModelHub XC），高度契合这一系列政策导向——以标准化模型适配与安全合规能力，成为国产算力从“能用”走向“好用”的关键引擎。 01 政策风口下的新范式去年，《算力互联互通行动计划》明确提出，推动全国 2028 年实现全国公共算力标准化互联。而今年 5 月，新政策进一步强调算力跨区域协同与普惠应用。信创模盒通过标准化的模型与硬件匹配体系，正在构建一套属于信创生态的“算力标识规范”——为跨域任务调度、算力互联互通打下坚实基础。政策所指，正是范式所向。范式信创模盒，正站在这一系列政策风口上，加速国产算力从“能用”走向“好用”。 02 为什么是范式信创模盒众所周知，信创领域最难解决的一个现实困境就是：芯片买得到，模型跑不通。为了啃下国产芯片“跑不通模型”这个“硬骨头”，范式推出信创模盒 ModelHub XC 及 EngineX AI 引擎体系，给信创领域带来了“全栈加速器”。 · 效率革命：底层算法架构适配，实现“引擎驱动、多模型即插即用”。适配周期从“周”缩至“天/小时”。 · 跨平台兼容：支持**、天数智芯、沐曦、海光、摩尔线程、壁仞等主流国产平台，算力无感迁移。 · 认证模型 9 万+：截止本周，信创模盒已适配认证模型突破 9 万+，覆盖全球主流开源体系。同时，每款模型带“硬件适配标签”，用户一眼便能清楚哪款国产芯片跑得最稳。 03 下周邀您一起，见证 10 万里程碑 9 万只是新起点。下周，信创模盒适配认证模型数即将突破10万！这不仅是数字跃升，更是国产算力生态

政策再加力 | 范式邀您见证：信创模盒冲刺10万认证模型里程碑！

范式智能

05-26

范式率先将DRA标准推向生产级！范式主导开源的HAMi-DRA正式生产可用，三大主流芯片已完成方案落地

近日，由范式 $06682(06682)$ 主导开源的 vGPU 架构 HAMi，宣布其 HAMi-DRA 模式正式达到生产可用状态。 HAMi-DRA 的正式发布，意味着 Kubernetes 用户第一次可以在不改动业务代码的情况下，平稳迈入下一代设备资源管理时代。 01 源于范式，定义生产级标准去年 9 月，随着 Kubernetes v1.34 正式发布， DRA 已被社区确立为 GPU、NPU、FPGA 等异构设备的标准管理路径。CNCF 2025 年度报告也明确指出：对于管理 GPU 集群的团队，DRA 是一个重大进步。” 众所周知，HAMi 是目前 Kubernetes 上最活跃的开源 vGPU 方案，其源自范式内部 vGPU 技术，已服务数百家企业，而 HAMi-DRA 是开源项目 HAMi 的轻量演进版。此次发布的 DRA 版本，标志着范式在 Kubernetes 下一代设备资源标准领域率先完成生产级落地。 02 范式率先将 DRA 推向生产级值得注意的是，早在 Kubernetes v1.35 正式发布前，范式就已率先完成 HAMi-Core 与 DRA 的深度适配，推出 GPU 动态资源驱动（DRA Driver），成为国内最早将 DRA 推向生产实践的技术团队之一。这一成果的核心使命是：让 DRA 这项先进标准能够真正落地到生产环境，以最友好的方式服务于用户，同时加速行业向标准化、开放式的 GPU 调度体系过渡。围绕这一使命，第四范式主导了 HAMi-DRA 的核心设计与关键工程突破，包括 libvgpu.so 动态注入、环境变量配置、临时目录管理等一系列 DRA 落地的核心技术难题。同时，该项目兼容

范式率先将DRA标准推向生产级！范式主导开源的HAMi-DRA正式生产可用，三大主流芯片已完成方案落地

范式智能

05-21

范式出席世界互联网大会研讨会，共议负责任的AI国际标准与开源生态

近日，世界互联网大会人工智能专业委员会标准推进计划研讨会在北京召开，会议聚焦“发展负责任的人工智能国际标准机遇与挑战”核心议题。范式作为产业界代表受邀出席，与来自国际组织、标准化机构、科研院所的权威代表，以及百度集团、科大讯飞、联想集团等优秀企业的30余位专家共同探讨AI国际标准的演进路径与产业实践。会上，专委会副主任委员、标准推进计划联合牵头人、中国信息通信研究院人工智能研究所所长魏凯介绍了2026年度标准推进计划，标准推进计划联合牵头人、国际人工智能治理协会主席约翰·希金斯分享了年度工作思考。在产业实践交流环节，范式结合自身在全栈AI云服务平台的长期积累，分享了负责任AI标准的落地思考。范式指出，随着AI在金融、政务、能源等关键行业深度渗透，模型可解释性、公平性与安全性已成为企业规模化应用的核心关切。对此，范式正以云平台和Token驱动模式加速AI服务普惠——基于Phanthy（万神殿）平台整合超70,000个适配模型，提供标准化API能力，并将负责任AI原则嵌入算力调度、模型安全与数据治理的全流程。同时，范式主导的开源异构算力管理项目HAMi已适配多家国产芯片，以开放生态促进技术透明与标准共识，为负责任AI的规模化落地提供坚实基础设施支撑。与会专家一致认为，开源生态与国际标准深度耦合，是推动人工智能普惠与负责任发展的重要路径。各方应加强开放协作，在标准研究、安全治理、算力协同等领域形成合力。世界互联网大会相关负责人表示，本次会议成果将为7月ITU AI for Good全球峰会专题研讨会奠定坚实基础。未来，范式将继续秉持“AI for Everyone”使命，深度参与国际标准研制与开源生态共建，助力全球人工智能治理体系向更安全、更可信、更负责任的方向演进。范式智能（ $06

范式出席世界互联网大会研讨会，共议负责任的AI国际标准与开源生态

范式智能

05-20

范式 × 欢喜传媒｜强强联合，共拓“AI+文娱”智能新生态

5 月 20 日，范式 $06682(06682)$ 正式宣布，与头部影视文娱企业欢喜传媒签订战略合作与合资框架协议。双方将依托范式全栈AI能力，结合欢喜传媒丰富的影视数据、IP 及制作资源，共同推动文娱产业完成数字化向智能化的跨越式升级。根据协议，双方拟成立合资公司为合作平台，计划在多个领域落地深度合作布局，涵盖数据合作、影视领域大模型研发、探索AI解决方案在新文娱领域落地、影视项目联合出品制作以及相关知识产权开发，以及探索建立资源合作。三年 2 亿美元 API 采购目标双方同步订立大模型 API 服务框架协议，欢喜传媒意向采用范式的大模型 API 服务，计划在三年内，通过 Token 消耗产生的累计服务金额预计不低于 2 亿美元。该项长期采购规划，充分彰显行业市场对范式技术平台实力、系统稳定性及商业化落地能力的高度认可，不仅为公司带来长期稳定且可预期的营收增量，更进一步夯实业绩增长根基，显著提升经营增长确定性。强强联合，引领 AI 文娱迈向高质量发展过去，AI 在影视行业更多停留在概念验证阶段，而此次强强联手，则是首次将“大模型调用”、“Token消耗”、“长期采购”等核心指标真正落实到长期商业合作框架中，这代表着范式的全栈 AI 能力实现了从平台到文娱生态的关键一跃。欢喜传媒是长期深耕影视内容领域的头部公司，长期与张艺谋、王家卫、陈可辛、宁浩、徐峥等知名导演保持深度合作，在电影制作、内容开发及线上娱乐领域拥有丰富的产业资源与内容积累。范式则具备覆盖模型、平台、Agent及API服务的大模型全栈能力，能够为产业客户提供从模型能力到平台接入、再到场景落地的完整 AI 交付体系。凭借范式在国产算力适配及软硬件一体化交付方面的独特优势，本次合作将显

范式 × 欢喜传媒｜强强联合，共拓“AI+文娱”智能新生态

范式智能

05-13

范式贡献 vLLM 关键 Bugfix，多卡高并发场景下吞“Token”大坑解决了！

今年以来，“如何 Tokenmaxxing” 成为了大洋两岸都在讨论的问题。然而，在真实企业场景中，大家都在用的主流开源大模型推理框架 vLLM 一直隐藏着一个“吞 Token 大坑”：系统看起来正常运行，请求也正常返回，但模型的回答质量却在高并发、多卡并行等复杂环境下悄悄下降。近日，范式 $06682(06682)$ 工程师向开源大模型推理框架 vLLM 提交的一项关键 Bugfix 已被官方社区合并。该修复解决了 vLLM 在 Pipeline Parallelism（流水线并行）模式下，高并发请求可能导致 prompt token 丢失，并进一步引发模型推理准确率下降的问题。 01 多卡流水线并行，会“吞掉”用户的 Token 可以把大模型想象成一条很长的生产线。模型太大，一张 GPU 放不下或算不过来，就把它按层拆成几段：前面几层放在 GPU 1，中间几层放在 GPU 2，后面几层放在 GPU 3。请求进来后，数据会像产品上流水线一样，依次经过每一段 GPU，最后产出结果。在有多个请求或 micro-batch 时，不同 GPU 可以同时处理不同阶段，从而提高整体吞吐。图片它的好处是：让多张 GPU 一起干活，跑更大的模型、扛更多请求。但难点也在这里：请求多了以后，每一站都要记清楚“这个请求处理到哪了、上下文有哪些”。一旦记录错了，模型就可能漏看一部分题目背景，答案自然会变差。所以，流水线并行看起来是“多卡分工”，本质上考验的是：多张 GPU 能不能配合得又快又准。但当系统同时处理大量请求时，问题就出现了。vLLM 在流水线并行模式下，需要一边拆分任务、一边分批处理输入内容，还要不断调整请求顺序。原有逻辑在少数复杂场景下，可能把某个请求的上下文记录错

范式贡献 vLLM 关键 Bugfix，多卡高并发场景下吞“Token”大坑解决了！

范式智能

05-08

告别“从零开始”｜范式发布企业级成长型AI Agent——PhanHermes

员工每次与AI协作，都需要重复介绍项目背景、公司规范、业务流程；AI不记得昨天的会议决议，也无法沿用上周刚教会它的周报模板——这种“每次从零开始”的体验，让厌倦重复解释上下文的业务用户苦不堪言，也使有重复性工作流的员工始终无法摆脱机械劳动。这正是当前通用AI工具在企业落地中的真实困境。针对上述痛点，范式今天正式推出PhanHermes——一款支持本地化部署、完全私有化的企业级成长型AI Agent。它具备持久记忆、主动学习与多端协同能力，同时严格守护企业数据隐私，让AI真正成为“属于企业的智能伙伴”。无论你是被重复解释消耗耐心的业务用户，还是需要持久运行、自我进化、支持多模型Agent框架的开发者，PhanHermes都能为你提供专属解决方案。从开源命令行到企业级安全协作 PhanHermes源自开源项目Hermes Agent——2026年GitHub上最受欢迎的“成长型 Agent”。但Hermes仅限命令行，无法满足企业对数据隔离、权限管理和合规性的要求。范式将其核心能力完整迁移至企业办公环境，支持私有化部署于飞书、企业微信、钉钉、邮件、Telegram、Slack等主流协作平台。所有交互数据均保留在企业内部，杜绝外泄风险，让日常工作的每个触点都能拥有一个会持续成长的专属AI。五大核心功能重塑人机协作持久记忆，沉淀企业知识：PhanHermes拥有跨会话的长期记忆，能够记住每位员工的偏好、部门规则、项目背景。后续协作无需重复“自我介绍”——尤其适合“厌倦重复解释上下文”的用户，单项目信息检索时间有效缩短。自动学习，工作减负：需要反复执行某项任务（如整理纪要、生成周报、审查代码）时，PhanHermes会将其提炼为“技能”（skill）以供随时调用。让“有重复性工作流的用户”告别机械劳动，把精力留给创造。主动通知机制：继承Hermes的nudge机制，

告别“从零开始”｜范式发布企业级成长型AI Agent——PhanHermes

范式智能

05-07

范式推出龙虾农场：让每个人都能拥有自己的云端AI工作队

范式推出龙虾农场（PhanClaw Farm），一款面向 AI Agent 时代的云端生产力平台。随着AI从“聊天工具”逐渐变成“数字员工”，越来越多创作者、开发者、产品经理、设计师和团队，开始让AI参与真实工作：写代码、做设计、整理资料、分析需求、生成内容、处理项目。但当AI 真正进入工作流后，新的问题也随之出现：一个AI不够用，多开几个又不好管；放在本地跑，设备成本高；不同任务混在一起，环境也容易乱。龙虾农场（PhanClaw Farm）要解决的，就是让用户可以在云端用合理的成本创建和管理多只“龙虾”。每一只龙虾，都可以理解成一个独立的云端AI工作环境。用户可以让一只负责写代码，一只负责做设计，一只负责整理资料，一只负责产品分析。它们各干各的事，互不打扰，又可以被用户统一管理。简单来说，过去用户可能需要买多台电脑、打开多个工具、切换多个账号；现在，可以直接在龙虾农场里开多只龙虾，让它们在云端分别完成不同任务。低成本背后，是范式的虚拟化技术龙虾农场的核心特点是：用起来专属，但底层更高效。对用户来说，每只龙虾都是有独立环境，可以长期使用的；在底层，范式通过虚拟化技术，把 GPU、Token、模型调用等资源统一调度起来，让资源不浪费，也让使用成本更低。虚拟化技术要做的，就是在保证用户体验和环境隔离的前提下，把底层资源更高效地利用起来。用户感受到的是自己的独立龙虾，平台底层则通过统一调度，让GPU、Token和模型能力被更灵活地分配。也正因为如此，龙虾农场不是简单地把电脑搬到云上，而是通过虚拟化和资源调度，把多个AI工作环境变得更容易创建、更低成本运行，也更适合长期管理。数据不丢、隐私不出，是AI Agent真正干活的前提当AI Agent进入真实工作流程后，数据安全就不再是附加能力，而是基础前提。因为它可能需要处理项目文件、历史记录、账号信息、代码仓库等敏感内

范式推出龙虾农场：让每个人都能拥有自己的云端AI工作队

范式智能

05-07

以一当十！单张显卡虚拟显存狂飙256GB

传统GPU的显存就像一间固定的“备菜台”——空间有限，菜一多就手忙脚乱。想做大餐？只能加钱上多卡，成本直接起飞。现在，选择Virtual VRAM——突破当前GPU硬件的物理显存容量限制，给“备菜台”配上一个超大的“储藏室”。它巧妙地将高速内存虚拟为显存使用，让单张显卡的虚拟显存容量可扩展至256GB。什么概念？相当于10张4090的物理显存之和。无需更换硬件，就能在接近原生显存的性能下，轻松承载大规模AI训练与推理。一卡顶十卡，做大模型，从此不再畏手畏脚。高性能+大容量，这次真的“一力当十”！ $范式智能(06682)$

以一当十！单张显卡虚拟显存狂飙256GB

范式智能

04-30

范式加码算力基础设施，全面扩容API业务产能

范式今日宣布，计划以总价4亿元人民币采购GPU服务器及相关配套设备。该批服务器将用于模型推理与训练，并重点投入API业务线，以应对市场快速增长的API调用需求。目前，范式API业务正处于高速增长通道——2026年第一季度，客户Token调用量较2025年第四季度增长超过400%，且季度内每月调用量均实现环比翻倍。此次算力资源的及时部署，将为业务持续高速扩张提供坚实支撑。凭借领先的vGPU技术与丰富的大模型适配经验，范式能够在同等算力条件下不断提升Token调用效率，实现算力资源的深度释放。本次扩容彰显了公司对算力资源的中长期战略部署。未来，范式将持续加大投入、稳步扩充算力基础设施，以长期匹配并支撑API业务的高速增长需求，全力抢抓Token产业发展红利。范式智能 $范式智能(06682)$ 是领先的全栈AI云服务平台，提供包括先知AIOS、HAMi vGPU、信创模盒等高效AI基础设施，具备从底层异构算力纳管优化到智能体模型调用的全栈能力，赋能千行万业智能化转型，并致力于在AI 2.0时代打造高效规模化的“Token工厂”。范式以“AI for Everyone”为使命，作为“驾驭AI的领航者”，成为全球领先的通用人工智能科技公司。

范式加码算力基础设施，全面扩容API业务产能

范式智能

04-29

用AI训练模型！范式发布PhanthyModel

4月28日，范式正式发布 PhanthyModel，一款帮助科学家和开发者“做模型”的 AI 工具，也是范式在“AI 自主进化”方向上的一次重要产品化尝试。很多科学研究和工业场景里，都需要先做模型。比如预测一个结果、模拟一次实验、分析一组数据，或者找出某个问题背后的规律。但这个过程并不简单：要整理数据、选方法、搭模型、跑实验、看结果，还要不断修改和调整。过去，这类工作通常需要专业人员花5-6个小时完成，甚至更长。 PhanthyModel 要解决的，就是这件事太慢、太依赖专家经验的问题。有了PhanthyModel，用户只需要告诉它想解决什么问题，它就可以帮忙看数据、想方案、搭模型、跑实验、分析结果，并根据专家的反馈继续改进。在早期测试中，过去5-6个小时的人工建模工作，现在可以缩短到约10分钟。它的价值不只是“做得更快”。更重要的是，每一次专家的修改、评价和反馈，都会被沉淀为宝贵的建模经验，成为后续模型迭代升级的重要依据。随着真实任务和专家反馈不断积累，PhanthyModel 会在下一次模型升级中进一步提升建模能力，越来越懂得如何处理复杂的真实建模任务。所以，PhanthyModel不只是一个提高效率的工具。它代表的是一种新的AI工作方式：AI不再只是回答问题，而是开始真正参与复杂工作，并在工作中持续变强。对于科研、工程、工业和数据分析行业来说，这意味着复杂建模的门槛会降低，实验和研发速度会变快，更多想法也能更快被验证出来。范式智能 $范式智能(06682)$ 是领先的全栈AI云服务平台，提供包括先知AIOS、HAMi vGPU、信创模盒等高效AI基础设施，具备从底层异构算力纳管优化到智能体模型调用的全栈能力，赋能千行万业智能化转型，并致力于在AI 2.0时代打造高效规模化的“T

用AI训练模型！范式发布PhanthyModel

范式智能

04-17

范式华东总部迎国际投资人团共探AI2.0产业机遇与跨境合作

近日，范式华东总部迎来由国际科技投资平台Tech Buzz China组织的国际商务考察团到访。考察团成员来自新加坡、印度、美国、荷兰等国家，涵盖家族办公室、影响力投资机构及专业投资顾问，此行旨在深入了解范式全栈式AI2.0生态系统，并就AI技术驱动产业变革的跨境合作机遇展开交流。图片图片考察团一行首先参观了范式上海展厅，对公司在AI技术研发与商业化落地方面的实践进行了实地了解。随后，考察团与范式管理层围绕AI大模型、AI Agent、世界模型等前沿技术议题进行座谈。双方重点探讨了人工智能如何赋能金融、医疗、零售等行业的智能化转型路径。图片图片参与本次交流的机构包括新加坡ASIAMIN Capital Advisors、美国TenCore Partners及荷兰Fourstones Advisors FZE等，上述机构在亚洲跨境资产配置、全球市场深度基本面投资及中东家族办公室多元资产组合管理等领域拥有多年实践。交流期间，双方聚焦AI技术如何服务于产业的长期价值创造交换了具体看法，并一致认为，AI2.0阶段的核心价值在于通过技术普惠推动各行业实现可持续增长，跨境协作是释放这一潜力的关键路径之一。图片图片 Tech Buzz China是国际科技投资平台，专注中国AI等前沿领域，由马睿创立。通过研究、活动及播客《TechBuzz China》连接全球资本与创新者，推动跨境合作。范式智能（ $06682(06682)$ ）是领先的全栈AI云服务平台，提供包括先知AIOS、HAMi vGPU、信创模盒等高效AI基础设施，具备从底层异构算力纳管优化到智能体模型调用的全栈能力，赋能千行百业智能化转型，并致力于在AI 2.0时代打造高效规模化的“Token工厂”。范式以“AI for

范式华东总部迎国际投资人团共探AI2.0产业机遇与跨境合作

范式智能

04-13

信创模盒ModelHub XC｜适配认证模型突破40000大关基于自动化引擎的规模化增长与算力兼容实践

信创模盒ModelHub XC今日数据显示，已完成适配与认证的AI模型数量超过40000个。距离上次突破30000个的节点仅过去不到一个月，实现日均新增约330个，适配效率较上线初期提升超百倍。这一数据更新了目前国内信创模型库的规模情况，也反映出在国产算力与AI应用之间，中间层适配技术的推进状态，标准化适配能力日渐成熟。 40000个适配模型的数据构成在信创产业推进过程中，硬件性能逐步提升的同时，上层应用生态的丰富度成为当前阶段关注的重点。信创模盒社区目前累积的40000余个适配模型，覆盖自然语言处理、计算机视觉、语音识别、大语言模型及多模态模型等多个技术方向。这些模型已在社区完成对主流国产算力平台的验证，为不同行业的数字化场景提供能够调用的资源储备。适配方式的转变：从人工调试到EngineX自动化处理信创AI应用部署在早期面临的一个具体问题，是不同国产芯片架构与开源模型框架之间的指令集差异。传统做法中，需要技术人员针对特定硬件手动进行算子适配与调试，单个模型的部署周期较长。信创模盒上线初期，适配模型数量在数百个级别。随着底层适配工具EngineX的应用，模型适配流程由人工操作转向自动化处理，适配效率发生变化。社区数据显示，适配模型数量在随后数月内先后达到千级、万级规模，直至目前的40000余个。对信创算力平台的覆盖范围目前，信创模盒社区已支持的主流信创算力平台包括天数智芯、**、寒武纪、海光、昆仑芯、沐曦、曦望等。对于近期发布的模型版本，如DeepSeek V3.1、OpenAI开源版本、智谱GLM-5等，社区已同步完成适配与基础验证，开发者可在社区内查看相关兼容性信息。提供全生命周期支持的服务平台在适配模型数量增长的同时，信创模盒社区也在同步构建面向开发者与企业的服务支撑体系。社区目前提供的能力覆盖从底层引擎到上

信创模盒ModelHub XC｜适配认证模型突破40000大关基于自动化引擎的规模化增长与算力兼容实践

范式智能

04-08

OpenClaw漏洞警告！？范式PhanClaw构建安全可审计的Agent基础设施

近期，OpenClaw曝出的安全漏洞，如同一记警钟，为追求效率的个人与企业敲响了警报：当Agent频繁调用核心业务接口时，数据“裸奔”往往成为效率提升背后不得不付出的沉重代价。这时，用户亟需在生产力释放与防线加固之间，找到那个极其微妙的平衡点。范式PhanClaw，正是这一平衡的解法之一。作为PhanthyCloud生态中深植安全基因的Agent平台，PhanClaw从构思之初便将“安全受控”置于效率之前。它不只是一个部署方案，更是一套成熟的全场景智能体治理体系。依托低成本、高安全的特性，PhanClaw让AI Agent真正成为个人与企业可掌控、可信赖的生产力工具。针对个人：隐私无忧的本地堡垒对于个人用户，PhanClaw提供本地安全运行环境。通过进程隔离与数据加密技术，确保个人设备中的Agent行为完全可控，让交互不留隐私隐患。针对企业：架构级的安全重构企业版的安全理念与个人版一脉相承，但在架构层面更为严苛。PhanClaw与市面上大多数Agent工具的核心区别在于——强制企业内网私有化部署。我们将Agent关进“安全的笼子”，从物理结构层面彻底规避数据暴露风险。内网隔离降低外部渗透风险：PhanClaw采用容器化或Kubernetes(K8s)方式部署于企业内网，构建严密的网络边界。外部流量通常无法直接触达运行中的实例，有助于从源头减少远程指令注入与系统被控的风险。终端脱敏访问边界清晰可见：Agent生成的内容、工具调用记录及对话历史均存储于服务端，与个人设备实现有效隔离。Agent不直接读取用户本地文件，用户也难以绕过系统直接接触服务器原始敏感数据。全量审计过程透明，治理有据：数据可持久化存储于企业自有挂载卷，IT审计团队可随时追溯Agent的历史操作与生成内容。这种“黑匣子”式的记录机制，有助于满足内容溯源与合规核查的硬性需求。流转受控

OpenClaw漏洞警告！？范式PhanClaw构建安全可审计的Agent基础设施

范式智能

03-30

范式2025年财报｜总营收人民币71.35亿元同比增长35.6% 实现扭亏为盈

今天（3月30日），范式发布2025年财报。财报显示，本期内（截至2025年12月31日），范式总营收人民币71.35亿元，较上年同期实现高速增长，增幅约为35.6%；经调整归母净利润为人民币1784万元，实现扭亏为盈，公司在经营效益、业务模式与发展韧性上得到三重提升。值得一提的是，2025年也是公司发展极具里程碑意义的一年，这年，公司完成了从“第四范式”到“范式集团”的全面战略升级，实现了从企业级AI平台向全栈AI生态的全面跨越，AI Platform、API及Agentic AI三大核心业务板块协同发力，分别实现营收人民币65.52亿元、0.8亿元及5.03亿元，同比增幅分别为32%、129.2%及93.2%。此次业绩突破，体现出范式长期坚持的AI发展理念与战略判断的准确性，并表现出公司对行业发展的前瞻性视野与长期价值创造能力。 2025年，AI Platform、API及Agentic AI三大核心业务板块形成多轮驱动、相互赋能的全新增长格局，共同推动公司实现高质量发展。 AI Platform持续成为业务增长核心驱动力受益于国产化替代需求持续旺盛及“AI+”行动的推动，AI Platform作为公司核心业务板块，凭借全栈式产品体系与领先的市场地位，实现算力业务与平台的深度协同，降低客户AI落地门槛；同时，依托完善的技术体系与核心客户资源，有效拉动公司业绩提升，为全年盈利突破提供有力支撑。产品层面，公司持续推进技术迭代升级，重点聚焦ModelHub XC、HAMi vGPU、PhanthyCloud三大核心产品： • PhanthyCloud作为全栈式AI PaaS云服务的核心载体，致力于整合各类AI能力，为客户提供便捷、高效的云端AI服务。目前，PhanthyCloud已实现与ModelHub XC、HAMi vGPU的无缝对接，可输出模型适配、算力调度等核心

范式2025年财报｜总营收人民币71.35亿元同比增长35.6% 实现扭亏为盈

范式智能

03-27

范式推出OpenClaw MINI PC｜本地运行大模型开箱即用的AI智能体主机

今日，范式推出全新硬件产品——范式OpenClaw MINI PC，为用户提供高性能、本地化的AI智能体运行解决方案，实现“开箱即用”，直击开发者搭建AI智能体时面临的硬件溢价缺货、环境配置复杂、云端隐私与成本高三大核心痛点，以预装就绪、本地推理、零Token消耗的技术优势，提供一站式本地部署方案。普通OpenClaw（龙虾）vs 范式OpenClaw MINI PC 普通OpenClaw（龙虾）自身无足够算力，核心计算必须频繁调用云端大模型API，每一步推理、每一次工具调用都要消耗Token、产生持续费用；而范式OpenClaw MINI PC自带强劲本地算力，大模型全本地运行，绝大多数AI计算无需调用云端API，真正实现零Token消耗。简单说：云端部署像“租房子”，按月付费、按需使用，但数据不在自己手里，缺乏自主控制权；本地部署像“买房子”，一次投入即可终身使用，数据完全自主可控，无需依赖外部网络。核心突破：本地跑大模型，零Token成本范式OpenClaw MINI PC是面向OpenClaw项目打造的桌面级迷你主机，核心优势在于预装就绪、本地推理、零Token消耗，支持最高32B参数规模大模型本地运行（如Qwen3.5-9B、Qwen3.5-27B等）。产品采用先进的异构计算架构，将独立GPU与Intel Core Ultra处理器的多核心单元协同调度，构建统一计算资源池，让不同AI任务自动分配至最适合的硬件单元，在优化能效与推理速度的同时，轻松驾驭大参数量模型的实时推理与微调。由于OpenClaw框架与主流模型权重已预装完成，用户无需代码调试与环境配置，开机即可使用；内置50余款技能插件，涵盖开发、办公、数据分析等场景，用户可根据需求灵活切换模型，无需额外硬件投入。产品还提供多种配置版本，可选配板载加密芯片，支持国密算法，满足金融、医疗、政务等敏感行

范式推出OpenClaw MINI PC｜本地运行大模型开箱即用的AI智能体主机

范式智能

03-25

信创模盒ModelHub XC｜适配认证突破30000个深度攻克大模型部署工程瓶颈

近日，范式 $范式智能(06682)$ 宣布旗下信创模盒ModelHub XC累计完成的信创算力适配认证模型数量突破30000个。自2025年9月上线至今，6个月内实现从100到30000的规模化跨越，近14天新增适配5,000个，信创模盒在异构算力环境下的标准化适配与工程化能力不断提高，紧密联系起国产芯片与主流算法框架，为开发者提供开箱即用的国产算力部署方案。算力覆盖：9家主流芯片厂商完成系统级适配信创模盒已完成对国内9家核心加速芯片厂商的系统级优化，包括： ****（Ascend 910-B3/B4）、摩尔线程（MTT S4000）、海光（Hygon K100-AI）、沐曦（MetaX C-500）、天数智芯（Iluvatar BI/BI-150/MRV-100）、寒武纪（MLU370-X4/X8）、曦望（Sunrise PT-200）、昆仑芯（Kunlunxin R200-8F/P-800）、壁仞（Biren 166M）等。上述芯片已支持从基础NLP任务到多模态大模型的稳定运行，算子库覆盖率达95%以上。生态协作：3家新增厂商启动批量适配近期，曦望（Sunrise）与壁仞（Biren）已启动批量适配流程，通过信创模盒标准化测试套件加速产品商业化部署。瀚博半导体（VastaiTech）已启动前期对接，双方围绕底层软硬件接口对齐与推理引擎优化展开合作。 "先导合作+批量加速"模式有助于持续引入前沿硬件算力，丰富用户选择。技术攻坚：智谱GLM-5完成异构算力部署验证在30000余项适配任务中，智谱大模型GLM-5在国产异构算力上的部署具有代表性。国产芯片驱动、固件版本与大模型软件栈（如PyTorch、vLLM）之间存在版本依赖，团队在环境解耦与内核调优上进行了系统性投入。模型量

信创模盒ModelHub XC｜适配认证突破30000个深度攻克大模型部署工程瓶颈

范式智能

03-25

范式亮相KCD Beijing 2026：持续引领DRA技术演进，推动GPU调度从"可用"走向"好用"

2026年3月21日，由CNCF云原生计算基金会发起的Kubernetes Community Days（KCD）北京站与vLLM社区年度盛会vLLM2026在北京圆满落幕。本次大会由KCD Beijing社区与vLLM社区联合主办，是云原生与AI基础设施领域的深度共创盛宴。来自AWS、阿里巴巴、Red Hat、字节跳动、蚂蚁集团、月之暗面、Kong、DaoCloud等顶尖科技企业的技术专家齐聚一堂，围绕AI、vLLM与Cloud Native三大主题展开前沿分享。范式与蜜瓜智能联合带来的技术演讲《从Device Plugin到 DRA：GPU调度范式升级与HAMi DRA实践》成为Cloud Native分会场的焦点议题，系统展示了范式在Kubernetes动态资源分配（DRA）方向上的持续深耕与最新进展。早在Kubernetes v1.35正式发布前，范式就已率先完成HAMi-Core与DRA的深度适配，推出GPU动态资源驱动（DRA Driver），成为国内最早将DRA推向生产实践的技术团队之一。这一成果解决了GPU虚拟化与DRA架构融合的关键难题，包括 libvgpu.so动态注入、环境变量配置、临时目录管理等，让"GPU像CPU一样灵活共享与调度"从概念走向现实。近半年来，范式持续迭代该技术路线。此次KCD Beijing首次公开HAMi DRA Webhook自动化机制：用户只需沿用熟悉的nvidia.com/gpu、nvidia.com/gpumem等传统资源声明，系统即可自动转换为复杂的DRA ResourceClaim配置，将"写 50 行 YAML"简化为"写 3 行配置"，实现从"专家可用"到"全员易用"的跨越。未来，范式将持续完善HAMi DRA能力：近期对齐HAMi Device Plugin的 ConfigMap配置能力；中期增强 NUM

范式亮相KCD Beijing 2026：持续引领DRA技术演进，推动GPU调度从"可用"走向"好用"

范式智能

03-23

范式先知AIOS关键模块升级：以本体论重塑企业数据生产力

近日，范式宣布对其核心产品——先知AIOS数据融合平台的关键模块Ontology完成架构升级。此次更新深度融合AI Agent（智能体）技术，旨在将企业中原本分散、异构的数据资源，转化为可直接运营的业务对象。这一变革推动数据在企业中的角色从传统的“静态分析素材”跃迁为“动态决策依据”。在范式的新架构下，数据不再仅仅是报表上冰冷的数字，而是能够自主执行、驱动业务增长的活跃生产力。当前，全球企业的数智化转型已进入深水区，传统数据平台普遍面临三大挑战：各系统间数据无法互通，导致决策依据碎片化、不完整；同一概念在不同系统中定义不一，业务人员难以理解技术数据；分析结果需人工介入才能执行，极易错失关键业务时机。随着AI Agent技术的普及，市场对数据提出了更高要求：统一语义、实时可用、自主执行。这些问题的本质，是数据与业务之间的语义断裂——数据被存储、被分析，却无法直接驱动行动。作为企业自主决策中枢的关键支撑，本体论（Ontology）技术正成为破解行业痛点、加速数智化升级的核心路径。此次Ontology的架构升级，正是针对上述挑战提供的一套系统性解决方案。 Ontology数据融合平台全面落地本体论的三层架构，实现同源治理与业务对象化能力，将分散、异构、孤立的数据，统一转化为可理解、可关联、可运营的核心业务资产。在语义层，统一企业数据语言，消除跨系统术语差异，底层技术字段被精准映射为贴合业务场景的具象对象，使业务人员无需技术背景即可直接读懂并使用数据。在动力层，构建业务关系网络，确保数据实时同步，跨部门数据自动联动，大幅降低人工协调成本，持续保障数据的一致性与完整性。在动态层，叠加业务规则与AI模型，实现“数据触发行动”的闭环运营，从“分析后决策”转向“数据自动执行”，业务响应速度实现质的飞跃。三层架构的核心价值在于，真正让数据“能干活”。立足国内重点行业的实际诉求，Ontol

范式先知AIOS关键模块升级：以本体论重塑企业数据生产力

去老虎APP查看更多动态

范式入选太空计算工委会副主任委员单位，共筑空天智能新基石

信创模盒认证模型突破10万！范式率先突破国产AI基础设施适配瓶颈，打造极致高效的“Token工厂”

政策再加力 | 范式邀您见证：信创模盒冲刺10万认证模型里程碑！

范式率先将DRA标准推向生产级！范式主导开源的HAMi-DRA正式生产可用，三大主流芯片已完成方案落地

范式出席世界互联网大会研讨会，共议负责任的AI国际标准与开源生态

范式 × 欢喜传媒 ｜强强联合，共拓“AI+文娱”智能新生态

范式贡献 vLLM 关键 Bugfix，多卡高并发场景下吞“Token”大坑解决了！

告别“从零开始”｜范式发布企业级成长型AI Agent——PhanHermes

范式推出龙虾农场：让每个人都能拥有自己的云端AI工作队

以一当十！单张显卡虚拟显存狂飙256GB

范式加码算力基础设施，全面扩容API业务产能

用AI训练模型！范式发布PhanthyModel

范式华东总部迎国际投资人团 共探AI2.0产业机遇与跨境合作

信创模盒ModelHub XC｜适配认证模型突破40000大关 基于自动化引擎的规模化增长与算力兼容实践

OpenClaw漏洞警告！？范式PhanClaw构建安全可审计的Agent基础设施

范式2025年财报｜总营收人民币71.35亿元 同比增长35.6% 实现扭亏为盈

范式推出OpenClaw MINI PC｜本地运行大模型 开箱即用的AI智能体主机

信创模盒ModelHub XC｜适配认证突破30000个 深度攻克大模型部署工程瓶颈

范式亮相KCD Beijing 2026：持续引领DRA技术演进，推动GPU调度从"可用"走向"好用"

范式先知AIOS关键模块升级：以本体论重塑企业数据生产力

范式 × 欢喜传媒｜强强联合，共拓“AI+文娱”智能新生态

范式华东总部迎国际投资人团共探AI2.0产业机遇与跨境合作

信创模盒ModelHub XC｜适配认证模型突破40000大关基于自动化引擎的规模化增长与算力兼容实践

范式2025年财报｜总营收人民币71.35亿元同比增长35.6% 实现扭亏为盈

范式推出OpenClaw MINI PC｜本地运行大模型开箱即用的AI智能体主机

信创模盒ModelHub XC｜适配认证突破30000个深度攻克大模型部署工程瓶颈