AIX财经
AIX财经认证媒体
老虎认证: 北京艾莉亚信息科技有限公司官方账号
IP属地:未知
0关注
3427粉丝
0主题
0勋章
avatarAIX财经
06-01 20:00

身价13亿美元的OpenRouter,国内学不了?

AI中转站,技术门槛不高,但想合规很难。 AIX财经(AIXcaijing)原创 作者 | 王璐 编辑 | 魏佳 你日常用Cursor写代码,用ChatGPT建界面,但你可能不知道,这些调用背后,有一类平台正在悄悄抽佣。它们什么模型都不做,只负责把各家大模型的接口打包在一起,让开发者通过一个入口自由调用全球的大模型。这就是AI中转站,也叫API聚合平台。 2026年5月以来,这门生意快速升温。 海外最大的API中转站OpenRouter,近日宣布完成1.13亿美元B轮融资,由谷歌母公司Alphabet旗下成长基金CapitalG领投,英伟达NVentures等知名风投机构跟投,原有股东a16z和Menlo Ventures也继续加码支持。完成融资后,OpenRouter估值飙升至13亿美元,相比一年前的5.47亿美元翻了一倍多。业务发展方面,OpenRouter目前每周处理的tokens数量达到25万亿个,折合每月约100万亿tokens,相比半年前暴涨了5倍,其全球用户数量也已超过800万。 国内也有人开始盯上这门生意,猎豹移动CEO傅盛宣布上线EasyRouter,网易有道正式发布了大模型聚合平台ThinkFlow。 但想在国内复制OpenRouter的生意并不容易,不仅要搭建稳定的接口服务、兼容各种大模型格式,还不得不直面一个现实:很多海外主流模型,从注册、付费到调用,都对国内用户设置了门槛。 更为复杂的是,由于AI中转站缺乏明确的监管体系,哪些可做、哪些踩线,往往没有清晰界限,参与者鱼龙混杂,产生了一系列乱象。 国内的OpenRouter们,还在寻找答案。 01.AI中转站,是怎么赚钱的? AI中转站商业模式的核心在于抽佣,而收入的增长速度十分惊人。以行业头部平台OpenRouter为例,其年化收入从去年10月的约1000万美元,猛增至2026年4月的超5000万美
身价13亿美元的OpenRouter,国内学不了?

Anthropic估值万亿,但Claude 4.8没那么惊艳

图片 小版本迭代,试验属性强。 AIX财经(AIXcaijing)原创 作者 | 王璐 编辑 | 魏佳 Claude再次成为焦点。 5月29日凌晨,AI行业又上演了一场“深夜突袭”。美国大模型公司Anthropic正式发布Claude最新旗舰模型Opus 4.8,并同步宣布完成H轮650亿美元融资,投后估值高达9650亿美元。在不到三个月的时间里,Anthropic的估值增长约154%,正式超过竞争对手OpenAI。 本次模型更新,覆盖编码、智能体任务、推理与知识工作等核心能力,其中重点提升了模型的“诚实度”,并新增了支持大规模复杂任务并行处理的“动态工作流”功能。 然而,若仅从功能列表来看,很容易高估此次发布的意义。实际上,Opus 4.8并没有带来架构层面的颠覆性突破,从业者一致认为其属于“渐进式进步”。 但本次发布也传递出一个明确信号:大模型的竞争重心,正从技术突破,转向谁更可靠、更好用、性价比更高。 这种转向,也体现在Claude的迭代节奏上,Opus 4.8距离上一版本Opus 4.7的发布仅43天。快速的更新速度,既是大模型竞争白热化的缩影,也反映了Anthropic当前的处境。它必须以更快的节奏,同时向开发者、企业客户与资本市场证明,Claude值得信赖。 01.进步有限,“诚实”是最大亮点 先看官方发布的Opus 4.8成绩单。 在编程、多学科推理、金融分析等主流基准测试中,Opus 4.8的得分全面超越前代Opus 4.7,也压过了竞争对手GPT-5.5。但有一个细节值得关注:在最贴近开发者真实工作流的“终端编码”测试(Terminal-Bench 2.1)中,Opus 4.8以74.6%拿下本次所有单项测试中最大的提升幅度,但仍落后于GPT-5.5的78.2%。 图片 不过,这个差距在实际使用中的影响,可能比数字看起来要小。 资深开发者张钰枢告诉「AIX
Anthropic估值万亿,但Claude 4.8没那么惊艳

6个电子牛马替我上班,腾讯马维斯好用吗?

文章配图-1 人设拉满,能力待定。 AIX财经(AIXcaijing)原创 作者| 雷晶 编辑| 金玙璠 每个打工人都想过,能不能找个替身,不偷懒、不顶嘴、还能帮自己把活干了? 5月20日,腾讯上线了AI助手马维斯(Marvis),Windows、Mac、安卓三端同步开放下载。它由六个AI Agent组成,一个主管Agent负责理解需求、拆解任务,五个专项Agent分别负责文件管理、系统设置、应用操控、网页交互和信息搜索。 造型上,六位“员工”都是顶着牛角、围着企鹅围脖的黑色小马。应用内还配了间虚拟办公室。没活的时候,它们会在工位打盹、去健身、端着咖啡闲逛,把“牛马”人设拉满。 人设是立住了,但电子牛马到底能不能替打工人分担工作呢? 我们决定当一回赛博老板,模拟打工人会遇到的六类场景,把任务丢给马维斯,看看它的表现。 接下来,请看电子牛马的一天。 01.定时任务:简单推送没问题,发文件掉链子 打工人的一天,先从刷新闻开始。 与其自己挨个网站翻,不如直接让电子牛马上岗。我们让它每天上午9点推送当天的科技新闻热点。设置的过程很简单,告诉它你的需求和时间间隔就能搞定。 定时任务设置页面 推送的视觉呈现比较朴素,但该有的都有,基本涵盖了当天的热点,每条附上了信息来源,还做了简单的总结。作为一个帮你几分钟了解今天发生了啥的工具,够用。 推送情况动图 尝到甜头之后,我们开始加码。除了推新闻,能不能帮我干点正事? 定时任务很适合用来发周报,这可是打工人的刚需,谁不想到了周五下午,周报就自己“飞”出去了呢? 于是我们让它每周五下午6点半帮发工作周报。马维斯发送邮件前需要层层授权确认,这点让人比较安心。 到点了,周报确实准时发出去了。但问题也跟着来了,它不仅没有发送电脑桌面上的周报文件,而且实际发出去的文件也根本打不开。 发送的周报文件错误 看来,简单的定时推送没问题,但涉及到文件操作的任务
6个电子牛马替我上班,腾讯马维斯好用吗?

SpaceX值2万亿美元,中国同行该哭还是该笑?

图片 资本市场买的,是马斯克的下一次奇迹。 AIX财经(AIXcaijing)原创 作者 | 陈丹 编辑 | 魏佳 2026年5月20日,太空探索技术公司(以下简称SpaceX)的招股书正式在SEC公开。这家成立24年、长期停留在私募市场、靠火箭直播和马斯克宏大叙事维持热度的公司,财务数据终于第一次完整摆在了公众面前。 这不是一家普通科技公司的IPO。 SpaceX计划通过此次上市募资700亿美元至800亿美元,目标估值达1.75万亿至2万亿美元,预计于6月12日在纳斯达克挂牌。如果顺利完成,它将成为美股史上首家上市估值突破万亿美元的公司,也可能创造人类历史上最大规模IPO。 被推上台前的,是一家2025年全年营收186.7亿美元、净亏损49.4亿美元的公司。它拥有约9600颗在轨卫星和1030万星链订阅用户,2026年第一季度单季资本开支已突破100亿美元。 值得注意的除了数字本身,还有SpaceX正在向资本市场讲述一个什么样的故事。 从招股书来看,SpaceX已经不再把自己定义为一家火箭发射公司。它被归类于“计算机编程与数据处理服务”,业务边界也从火箭发射、卫星互联网,延伸至AI、X平台、Grok、轨道数据中心,甚至火星城市与多星球文明。矛盾也在这里,SpaceX已经把火箭回收、卫星互联网、载人航天都做成现实的公司,这些成就已经被反复验证过,但它这一次要向市场出售的,仍然是一个还没有落地的未来。 这份招股书,对中国正在排队冲刺资本市场的商业航天公司而言,同样是一道难题:当全球最大的参照物把“火箭+卫星+AI+社交数据”打包成一个2万亿美元的故事,中国的“学徒们”该用怎样的故事为自己定价? 01.星链负责挣钱,AI负责烧钱 外界对SpaceX最熟悉的印象,是火箭。猎鹰9号的回收、星舰试飞、发射台上的爆炸与成功,是这家公司过去二十多年最具传播力的画面。 但翻开招股书,会发现
SpaceX值2万亿美元,中国同行该哭还是该笑?

“打折”卖机器人冲进前四,乐聚智能要上市了

图片 亏损逐年扩大,盈利至少等到2028年。 AIX财经(AIXcaijing)原创 作者 | 王汉星 编辑 | 魏佳 两天之内,连续两家头部具身智能公司公开招股书,在上市热潮的背后,行业最真实的一面也被越来越清晰地呈现在所有人面前。 5月19日,深交所受理乐聚智能(深圳)股份有限公司(下称乐聚智能)创业板IPO申请,这也是首家选择使用创业板第四套标准申请上市的企业。 乐聚智能成立于2016年,成立之初以基础编程教育为市场切入点,推出首款小型人形机器人产品,随后在2018年开始涉足全尺寸人形机器人。 这家公司招股书中最显眼的一组数据是,2025年公司全尺寸人形机器人Kuavo(夸父)系列卖出577台,相比2024年的32台,销量涨了17倍。 销量上升让乐聚智能在这一年迈入了具身智能行业的第一梯队。Omdia和Counterpoint Research的2025年销量报告中,均把乐聚智能排在了全球第四,前面是宇树、智元、优必选。 但硬币的另一面是,夸父系列产品的平均售价在2025年同比下降了25.56%。 乐聚智能在招股书里给出的解释是,公司为巩固并提升产品的市场竞争力,实施积极的市场化定价策略,主动下调了Kuavo系列产品的售价。 2025年被认为是具身智能的商业化元年,而这恰恰是一份典型的具身智能商业化元年“应试”成绩单,销量爆发、收入翻倍、市场份额冲进全球前列,但毛利率连续两年下滑,亏损反而扩大。 现在留给投资者最大的问题是,这是规模化前夜必要的代价,还是一场以价换量的赌局? 01.七五折卖机器人,销量暴涨17倍 创业板第四套标准要求,上市公司预计市值不低于30亿元,最近一年营业收入不低于2亿元,并且最近三年营业收入复合增长率不低于30%。 乐聚智能正好完美符合这一要求。 招股书显示,乐聚智能最近一次融资的投后估值为43.27亿元,综合考虑同行业可比上市公司估值情况,公
“打折”卖机器人冲进前四,乐聚智能要上市了

谷歌最新发布会:没发最强模型,开卷Agent全家桶

图片 不拼参数了,想要AI帮你干活。 AIX财经(AIXcaijing)原创 作者 | 雷晶 编辑 | 金玙璠 北京时间5月20日凌晨,2026 Google I/O开幕。从2008年首次举办至今,这场大会已成为谷歌每年“秀肌肉”的主要舞台。 而它之所以值得行业关注,在于它作为科技巨头的技术秀场,能一定程度上反映行业未来的走向。 回到本届大会,近两个小时走完全部议程,发布节奏极密,几乎不留间隙。 谷歌CEO桑达尔·皮查伊在开场抛出一个数字:3200万亿Token。这是谷歌全平台每月的AI处理量,两年前这个数字是9.7万亿,去年是480万亿,一年翻了近七倍。这个数字说明,谷歌的AI产品在被大规模使用。 先来拉一张清单,看看这场发布会到底讲了什么: 模型:Gemini 3.5输出速度为同类产品的四倍、成本不到一半,成为Gemini App和搜索的默认引擎;Gemini Omni支持图文音视频混合输入,生成可编辑视频,支持指定镜头和拍摄角度,通过Gemini App和Google Flow使用。Gemini 3.5 Pro预计6月发布,目前处于内测阶段。 搜索与购物:搜索框迎来25年来最大改版,支持多模态输入,可输入文本、图片、视频、文件;Universal Cart打通搜索、YouTube、Gmail的AI购物车,Nike、Walmart等首批接入。 智能体:Gemini Spark作为24小时个人Agent,云端运行;Antigravity 2.0升级为多Agent编排平台,全面摆脱coding场景局限,和Claude Code以及Codex直接竞争。 硬件:Android XR音频眼镜今秋上市,由三星制造,兼容iOS,联合眼镜品牌Gentle Monster和Warby Parker共同设计;纯音频版本今年秋季率先推出,带显示屏的版本将于明年推出。 订阅:新增100美元/月
谷歌最新发布会:没发最强模型,开卷Agent全家桶

跟宇树一比,云深处太贵了?

图片 营收仅宇树五分之一,估值倍数贵了约60%。 AIX财经(AIXcaijing)原创 作者|王汉星 编辑|魏佳 宇树科技最大的竞争对手之一要上市了。 5月18日,上交所官网将杭州云深处科技股份有限公司(下称云深处)的IPO状态更新为“已受理”,这是“杭州六小龙”中继群核科技、宇树科技之后,第三家冲刺IPO的公司,同时也是第二家计划在科创板上市的具身智能本体公司。 云深处的创始人朱秋国是浙江大学控制科学与工程学院的教授和博士生导师。2016年,美国机器人公司波士顿动力的机器狗取得了技术突破,第一次让机器人走出实验室,这让不少业内人士看到了发展机遇。 身在浙大的朱秋国也看到了这个机会。2017年,他创立云深处,比宇树晚了一年,但做的是同一类产品:四足机器人。 招股书显示,从2023年到2025年,云深处的收入从5011万增长至3.37亿,翻了近7倍;2025年,公司95%以上的收入来源于机器人本体销售;净利润在2025年首次实现扭亏。 按照云深处此次拟发行新股占发行后总股本18%、募资25.03亿元推算,其发行估值约为139亿元。结合公司2025年3.37亿元的营业收入,市销率约为41倍。 以不久前递交招股书的宇树科技作为对比,2025年营收17.08亿元,以同样方式推算的发行估值约为420亿元,市销率约25倍。 一家营收只有宇树五分之一、净利润只有宇树十分之一的公司,估值倍数却贵了约60%,为什么? 01.营收三级跳,刚刚摸到盈亏线 云深处早期投资人之一的英诺天使基金执行董事王建明曾在一次播客节目中透露,当初由于错过了宇树,所以选择投了宇树的竞品——云深处。 在具身智能一级市场上,这两家公司在很长一段时间内都被视为彼此在国内最大的竞争对手,主要产品都是电机驱动的四足机器人。 与宇树不同的是,云深处并没有着急切入人形机器人赛道,直到招股书的报告期末仍然以四足和轮足机器人为主
跟宇树一比,云深处太贵了?

实测淘宝、京东AI购:能用,但代替不了我

AIX财经(AIXcaijing)原创 作者| 雷晶 编辑| 金玙璠   大模型落地这两年,“AI+电商”被认为是最有想象力的应用场景之一。购物本质上是一种信息筛选,需要整合、对比各种商品信息,这恰恰是大模型最擅长的。但在过去两年,各家电商平台的AI功能大多停留在智能客服、猜你喜欢这类协助功能上,消费者真正感知到的变化并不多。 直到这半年,两家巨头先后出手。5月11日,阿里官宣千问与淘宝全面打通,在淘宝内上线千问AI购物助手。在去年12月底,京东上线独立APP京东AI购,底座是自研的言犀大模型,主打对话式购物。 阿里把AI能力嵌入现有的电商生态,京东选择另起炉灶做一个AI原生入口,两者路径不同,方向都直指AI购物助手。我们对两款产品进行了深度实测,看看AI购物助手,到底好不好用? 01.AI试穿:换装快、能穿搭,但都不贴合身材 在网上买衣服,很容易“翻车”。模特图好看、买家秀也好看,但是衣服穿在身上总会发现有不合适的地方。退货很麻烦,不退穿不了,这个痛点的原因在于,消费者看不到衣服穿在自己身上的效果。而AI试穿想解决的正是这个问题。 第一轮测试,我们先从AI试穿开始,看看AI生成的试穿效果到底能不能帮你做判断。 先看淘宝。上传一张全身照后就能开始“试穿”,生成速度较快,切换不同衣服也比较丝滑。我们上传的是一张梨形身材的全身照,但试穿效果不能看出人的真实体型,AI是把衣服套在标准身材的模板上。 在搭配上,淘宝比较灵活,支持跨店搭配上装、下装和连衣裙,能从购物车、收藏夹、浏览足迹里直接选衣服,不用在不同商品页之间来回跳转,用起来比较方便。但在AI试衣间内不能直接进行搜索,需要提前将想“试穿”的衣服加入购物车。 图源 / 淘宝AI试穿页面 不过,它也有明显的槽点。一是不够稳定,切换性别和形象之后,推荐列表里依然会推女装。二是比较死板,它的逻辑是把衣服“贴”在上传照片上,
实测淘宝、京东AI购:能用,但代替不了我

京东找到了AI时代的乘数

图片 不做流量表层玩法,京东AI走出产业厚度。 AIX财经(AIXcaijing)原创 作者 | 王汉星 编辑 | 阮梅 时隔22年,刘强东又一次下注了。 2004年初,在中国零售行业线下连锁模式盛行的年代,刘强东做了一个让所有员工都感到意外的决定。他关掉苦心经营的十几家线下门店,把全部身家压在一个名叫“京东多媒体网”的网站上。他坚定地认为,互联网技术正在重塑零售业的体验、成本与效率结构,而京东必须站到这场变革的源头。 他的想法最初没有得到太大支持,后来发生的事,证明了他的判断。 22年后的今天,当大多数人沉浸于和AI聊天,当大多数公司还在执着于抢夺AI流量入口之时,刘强东意识到,AI的价值在于物理世界。 只不过这一次,他看到的不再只是一个新的零售渠道,而是一种可以服务全社会的全新生产力。AI正在以一种更深层的方式,重塑着千行百业的底层逻辑。 5月12日,京东集团发布2026年Q1财报,报告期内实现营收3157亿元,同比增长4.9%;截至季度末期,年度活跃用户数超7.4亿,从2023年Q4以来已实现连续10个季度的双位数增长。 在经营数字之外,一幅“AI画像”正在展开:从开源大模型到能“吃播”的数字人,从覆盖物流全链路的“狼族”机器人到全球最大的具身智能数据采集中心,AI已经融入京东的每一条业务线。 当整个AI行业开始从卷算力、卷模型参数进化到卷生态、卷自我闭环的时候,京东围绕AI也建立了从模型算力、产业应用、用户体验的商业模型:人工智能的价值=模型×体验×产业厚度的平方。这个看似朴素的公式背后,是京东22年深耕供应链积累下的全部底气。 01.研发增速连续两个季度超50%,AI融入每一条业务线 不同于其他公司在财报中大谈AI愿景,京东的Q1财报更多是在展示AI为各条业务线带来的具体变化。 支撑这些变化的,首先是持续加码的研发投入。 今年Q1,京东研发开支同比增长48.6%,
京东找到了AI时代的乘数

平板电脑洗牌:**联想狂飙,三星小米大跌

图片 存储涨价,平板也难熬。 AIX财经(AIXcaijing)原创 作者 | 李梦冉 编辑 | 魏佳 Omdia近日发布2026年第一季度全球平板电脑市场报告,苹果以1480万台出货量排在第一;**和联想分别以324万台、305万台的出货量位列第三、第四,成为本季度增速最快的两家厂商;三星和小米则双双下滑,分别排在第二和第五。 这份榜单背后,整个市场的处境并不乐观,当季平板电脑全球出货量为3700万台,同比仅微增0.1%。 Omdia在报告中指出,增长主要源于渠道库存积累,而非终端用户真实需求的回暖。货从厂商仓库搬到了渠道仓库,却没有真正进入消费者的背包。 图片 线下门店的情况印证着这一趋势。近期的一个周末,「AIX财经」前往北京某地处CBD核心商圈的购物中心走访,**、小米、苹果三家门店紧挨着,人流量不少,但平板展台前,却是另一番景象。 **店里看手机的顾客挤满了展台,平板区却几乎无人驻足;苹果店同样如此,偶有顾客停下来看几秒就走了;只有小米店里有一位顾客仔细询问了价格和配置,这些都和店里其他展台前的热闹形成鲜明对比。 Omdia研究经理Himani Mukka对此解释:面对当前严峻的环境,无论消费者还是厂商,都在更加精细地决定优先购买和投入的设备。PC厂商正将重点转向笔记本和台式电脑,同时布局智能手机与平板的厂商,则更倾向于优先发展智能手机,因为其对整体业务贡献更高。 平板的处境向来尴尬,它既不像手机那样是刚需,也不像笔记本那样有明确的生产力场景,夹在中间,成了消费者可买可不买的选项。今年存储价格持续上涨,让这个本就不好卖的产品,又多了一个让人犹豫的原因。 涨价的浪潮,正在重新洗牌平板电脑的格局。 01.苹果、**、联想:三条不同的增长路线 2026年第一季度,苹果、**、联想是前五大厂商中实现正增长的三家,但增长的逻辑各不相同。 苹果稳居第一,出货1480万台,同比
平板电脑洗牌:**联想狂飙,三星小米大跌

AI四小龙,估值破万亿

图片 身价集体暴涨。 AIX财经(AIXcaijing)原创 作者 | 金玙璠 编辑 | 魏佳 中国的AI四小龙,加起来值一万亿了。 5月初,《金融时报》援引消息人士披露,DeepSeek新一轮融资估值锁定在450亿美元,由国家大基金(国家集成电路产业投资基金)领投。4月初,DeepSeek首次被曝出融资消息,外界流传的估值版本是超100亿美元。照此估算,一个月时间估值涨到了4.5倍。 图片 智谱、MiniMax两家公司自2026年1月初在港股上市以来,股价分别累计涨了7倍、近4倍,最新市值分别为4347亿港元(3775亿元)、2573亿港元(2235亿元)。 月之暗面(Kimi)在一级市场的估值已突破200亿美元(约1362亿元人民币),据《晚点LatePost》报道,Kimi母公司月之暗面即将完成20亿美元(约合人民币136亿元)新一轮融资,由美团龙珠领投,中国移动、CPE等参投,仅龙珠一家出手就超过2亿美元。Kimi累计融资超376亿元。 图片 如果将DeepSeek的估值按照450亿美元(约合3065亿元人民币)与其余三家加在一起,中国AI四小龙估值已突破一万亿人民币,从高到低排列为:智谱、DeepSeek、MiniMax、月之暗面。 需要说明的是,DeepSeek是一级市场谈判中的估值,智谱、MiniMax是二级市场市值的波动价格,月之暗面是新一轮融资的投后估值。即便如此,最高的智谱仍是最低的月之暗面的近3倍。市场究竟在按照什么逻辑给这些AI大模型公司定价? 01. 为什么估值差异这么大? 首先要明确的是,市场不是在按收入给它们定价。如果按收入排序:智谱(2025年收入7.24亿元)>MiniMax(2025年收入7903.8万美元,约5.6亿元)>月之暗面(约2亿元)>DeepSeek,收入和估值的排序对不上。 关注AI公司的投资人表示,美国A
AI四小龙,估值破万亿

被AI抢走工作的人,在忙什么?

图片 既然改变不了环境,就改变自己。 AIX财经(AIXcaijing)原创 作者 | 李梦冉 雷晶 王璐 王汉星 陈丹 金玙璠 编辑 | 陈丹 AI来了,有人看到新大陆,有人没了工作。 历史上,每一次生产力的大幅提升,都会伴随恐惧。从砸毁纺织机的工人,到抗拒汽车的车夫,本质都是对“被替代”的反应。但这一次更不同,AI触碰的,是白领们赖以立足的能力结构。它带来的,是消失的岗位、暴增的工作量,以及漫无边际的“无价值感”。 在宏大的技术博弈与社会动荡之下,具体的职场人正经历着更细微、更惊心动魄的转折。 我们与几位在风暴中心的普通人聊了聊。在TA们的讲述中,听不到狂热的技术崇拜,更多的是一种“既然来了,就得接招”的无奈。投资分析师用了三四天啃透的竞品报告,AI半天完成;后端程序员发现自己70%到80%的日常工作可以直接交给AI;包装设计公司不再招初级岗位;通信外企程序员部门的十几号人被集体优化…… 他们的遭遇各不相同,但有着相同的疑惑:当重复性工作被AI接管之后,我的价值在哪里? 这场变革中,消失的或许是岗位,但留下来的,仍然是一个个具体的人。 01. 我一边享受AI的便利,一边被AI代替了 春风|95后 北京 投资分析师 我是一名投资分析师,在一家五六百人的公司做技术落地项目分析。更简单点说,我的工作就是给甲方写技术投资报告。 去年9月,我记得很清楚,部门里有同事第一次用AI生成了一份竞品分析报告。那一天,我们整个办公室都沉默了。 AI片刻间就做完了我们三四天的活儿,数据、图表、竞品分析一应俱全,虽然还需要人工核对,但对甲方来说,那种程度已经足够交付。 你要知道,以前光啃透一份英文竞品资料,我就要花三四天,现在把资料往AI一丢,半天时间,它就能完成信息筛选、重点提炼,甚至直接出图表。同事们都在用,尤其是分析国外竞争对手时,把资料导进去让AI过一遍,重点抓得极准。 我们一边享受着
被AI抢走工作的人,在忙什么?

即梦、可灵、HappyHorse三强测评,谁翻车了?

图片 AI视频模型进入“三国杀”。 AIX财经(AIXcaijing)原创 作者 | 陈丹 编辑 | 魏佳 随着HappyHorse的正式公测,中国视频生成模型进入“三国杀”时代。 在过去半年里,字节的即梦(Seedance 2.0)、快手的可灵3.0、阿里的HappyHorse先后登顶 Artificial Analysis视频模型榜单第一。 「AIX财经」用六段统一的提示词对三款模型进行了横向测试——四组古典艺术题材、两组现代落地题材。这六组覆盖了AI视频生成关键的能力维度:动作叙事、静态情绪、多人调度、文化符号还原、现代写实质感、商业可用性等。 三家模型在叙事密度、镜头语言、文化辨识度上,给出了三种完全不同的解法,也在不同的环节翻车,如中文文字乱码、多人面孔的“克隆人”现象,以及对特定文化符号的还原失误等。 以下是完整的测试报告。 01. 测试一:赵子龙单骑救幼主 提示词:0-3秒:远景。黄昏战场,烟尘弥漫,残阳如血。一员白袍银甲的年轻将军单骑自远处疾驰而来,白马奔腾,红色披风在身后猎猎飞扬。他怀中紧抱一个襁褓婴儿,一手紧握长枪。 3-6秒:中景。镜头跟随推近,白袍上已溅有斑斑血迹,银甲反射夕阳余晖。他长枪一挑,挑落迎面而来的一名敌将,动作迅猛如梨花纷飞。四周曹军黑甲红旗如潮水般涌动,他穿插其中。 6-10秒:近景特写。将军回首一望,目光坚毅决绝,缰绳一带,白马长嘶人立,他低头看了一眼怀中婴孩,随即扬枪策马,冲入更深的尘烟之中。镜头定格于他冲入尘雾的背影。 整体:中国古典战争电影质感,冷暖对比强烈——白袍银甲与黄沙血色的对比,慢动作与实时动作交错,尘土飞扬,胶片颗粒感,自然光。参考《赤壁》《影》《满城尽带黄金甲》战场镜头美学,4K。 难点:多镜头、多景别、连续叙事;高速动作与慢动作交错;密集群体交互;特定历史风格与画面质感。 战争戏是影视拍摄难度最高的场面之一。模型生
即梦、可灵、HappyHorse三强测评,谁翻车了?

实测混元Hy3 preview:腾讯AI,终于能打了?

图片 代码能跑,复杂逻辑会翻车。 AIX财经(AIXcaijing)原创 作者| 雷晶 编辑| 金玙璠 AI圈近期动作频频,腾讯混元Hy3 preview也正式亮相。 4月23日,腾讯混元正式发布并开源了新一代语言模型Hy3 preview。据官网介绍,该模型采用快慢思考融合的混合专家架构,总参数295B、激活参数21B,最大支持256K上下文长度。这是被官方称为混元迄今最智能的模型。 三个月前,姚顺雨带着ReAct框架和OpenAI的实战经验加入腾讯,主导完成了预训练和强化学习基础设施的重构。Hy3 preview是重建后的首份答卷。官方表示,该模型在复杂推理、指令遵循、上下文学习、代码生成及智能体等能力均实现大幅提升。 从官方披露的数据和评测结果来看,Hy3 preview在多项基础测试中展现出亮眼的实力,虽然未必在所有维度都达到行业顶尖水准,但足以满足多数场景下的实用需求。 在实际运行效率和稳定性方面,Hy3 preview也有所突破。官方数据显示,这款模型的首Token延迟降低54%,端到端时长降低47%,大幅提升了响应速度。同时,任务成功率也有所提升,已能稳定驱动复杂的Agent工作流,覆盖文档处理、数据分析等多种业务场景。 此外,它的推理成本也有所下降。在腾讯云API输入低至1.2元/百万Tokens,个人套餐最低28元/月,在同尺寸模型中属于最低价梯队。目前,Hy3 preview已在腾讯云、元宝、WorkBuddy等腾讯核心产品中上线。 接下来,我们将根据官方提到的四个方向,实测混元大模型在实际应用中的表现。 01. 推理能力:复杂逻辑能拆解,陷阱识别仍需加强 我们首先测试了模型的推理能力。逻辑推理题是网友最喜欢拿来测模型“智商”的类型之一。在这一环节中,我们先用经典的“洗车问题”在元宝内进行测试。 图片 在这个经典陷阱题中,Hy3 preview起初并未答
实测混元Hy3 preview:腾讯AI,终于能打了?

GPT-5.5实测:更聪明,也更爱“说谎”

图片 值得尝鲜,但不够可靠。 AIX财经(AIXcaijing)原创 作者| 王璐 编辑| 魏佳 4月23日,OpenAI发布新一代旗舰模型GPT-5.5,并在其官网写道,是其迄今为止最智能、最直观易用的模型,也是在计算机上完成工作的新方式的下一步。 这一发布迅速引发行业关注,不仅因为它号称在智能体任务上实现突破,更因其在多项基准测试中展现出的“统治力”。根据第三方评测机构Artificial Analysis公布的综合智能指数榜单,OpenAI凭借GPT-5.5系列在前六名中独占四席,该机构认为,“GPT-5.5让OpenAI重回AI领域的第一位,打破了与Anthropic和谷歌的三方平局。” 但与高性能一同被曝光的,还有高幻觉率。在Artificial Analysis的私有基准测试AA-Omniscience中,GPT-5.5的幻觉率高达86%,远高于Claude Opus 4.7的36%。 这意味着,当这个目前“最聪明”的AI大脑面对不确定或未知的问题时,选择“坦言不知”的概率极低,反而更倾向于“自信地虚构”一个答案。而这种高幻觉率一旦放在需要高可靠性的工作场景中,很可能导致分析偏差、决策失误甚至财务损失。 最强的AI也是最危险的“说谎者”?面对高幻觉率,GPT-5.5究竟能否在实际应用中可靠地完成复杂的知识任务?为了回答这些关键问题,我们对GPT-5.5进行了实测,从处理家庭账本到编写实时对战游戏,测试其应对长上下文、复杂逻辑的知识工作与编程实战能力。 此次测试不仅关乎一个模型的性能,更关乎AI技术进入深水区后,我们如何在拥抱其强大能力的同时,应对其潜在风险。 01. 知识能力:它真的像职场人一样会干活 根据官方发布的基准测试结果,GPT-5.5在几乎所有核心指标上都超越了前代GPT-5.4,在知识工作领域表现尤为突出。 在一项覆盖44个职业的GDPval测试中,
GPT-5.5实测:更聪明,也更爱“说谎”

灵光砸1亿,能养出生态吗?

图片 爆发式热度能否转化为长期用户留存? AIX财经(AIXcaijing)原创 作者| 王璐  编辑| 魏佳 4月20日,蚂蚁灵光扔出了一枚“重磅炸弹”。一边是启动“灵光闪应用创作者激励计划”,豪掷1亿元专项基金,每天最高用100万激励10000个优质闪应用,每周再砸100万奖励100名优秀创作者。另一边,灵光完成了闪应用功能大升级,并推出了“灵光圈”——一个专门用来分享、点赞、评论闪应用的社区。 这套组合拳打出来,其目标似乎是要重新定义“谁能做应用”。它喊出的“30秒生应用”、0代码、0部署、0门槛,背后是要把创作应用的权利,从开发者手中还给每一个普通人。过去,做一款应用意味着漫长的需求拆解、代码编写、测试上架,门槛拦住了绝大多数有想法的人。而灵光想做的,是把这道门彻底拆掉。 这个逻辑并非没有先例。图文时代,微博、公众号让“人人都是内容生产者”成为现实;短视频时代,抖音、剪映把拍摄和剪辑降到零门槛,创作者规模指数级提升。灵光押注的是同一条路,把“做应用”变成像发朋友圈一样简单。 有人将灵光视为“AI应用创作工具”与“创意展示社区”的结合体,其中工具属性为其确定价值基础,社区属性则助力其传播与破圈。从模式上看,它确实具备在AI时代重塑应用生态的潜力。 但争议也存在。有人觉得,在鼓励快速、轻量创作的机制下,灵光可能会催生出大量的“日抛型”应用。如何让海量的“一次性创意”,逐渐沉淀为大家“经常用、离不开”的好工具,是灵光在未来能否真正留住用户、保持活力的根本所在。 01. 撒钱1亿,用户真的嗨了吗? 涂涂是一位大厂产品经理,也是独立开发者。2025年底灵光APP刚上线,她就手搓了四个应用:热量换算表、姨妈记录器、体重记录仪,还有一个心情日记。而且每个应用从输入文字指令到生成添加到桌面,整个过程只用几分钟,这让她很意外。 “灵光做应用最大的优势就是快。”涂涂说。 用简
灵光砸1亿,能养出生态吗?

对话优艾智合:工业具身智能大规模落地需要在“应用中泛化”

图片 工业具身智能最值得关注的样本。 AIX财经(AIXcaijing)原创 作者 | 王汉星 编辑 | 阮梅 科技行业往往偏爱那些颠覆性叙事,比如“iPhone时刻”,比如马斯克设想的通用具身智能,可以进厂打螺丝、进家庭做保姆、上火星建基地,一台机器人包揽一切。 这类故事让人兴奋,也足够遥远。 眼下,具身智能公司正密集涌现。它们大多脱胎于AI大模型或硬件制造,把工业视为一个等待被征服的应用场景,从实验室出发,朝着工厂的方向进发。 但有一家公司的路径与此相反。 2017年,优艾智合创始人、CEO张朝辉与几位早期核心成员在西安交通大学的实验室里成立了一家机器人公司,成立的当年就完成了首个兼具“手”“眼”“脚”的移动操作机器人产品的开发与初步打磨。这个时间点,比“具身智能”这个概念在中国真正火起来早了将近六年。 和其他因为VLA技术成熟才决定做机器人的公司不同,它是在持续服务工业客户的过程中,一路从控制论、强化学习、深度学习,走到今天的大模型时代。可以说,它是一家从工厂里长出来的具身智能公司。 这个出身,决定了它对于一个核心问题有着截然不同的答案:工业具身智能,到底怎样才能大规模落地? 这就涉及到一个关键概念——泛化。通俗来说,就是一台机器人在学会一项任务之后,能不能快速迁移到另一个场景、另一个工种,而不需要从头训练。这在工业场景里,难度极高。 工信部数据显示,我国一共拥有41个工业大类、207个中类、666个小类,背后关联的垂直生产场景可能有数十万个。例如,制造矿泉水瓶和加工晶圆,从设备到流程到操作标准,几乎没有任何共通之处。 大多数具身智能公司的思路是,在出厂前把泛化做到位,训练一个足够全能的大脑。优艾智合的答案不同,与其追求出厂即全能,不如让机器人在应用过程中持续生长,通过极低样本量的快速迁移训练,让它在进入一个新场景后迅速成为熟练工。 优艾智合副总裁关健认为,未来的工业
对话优艾智合:工业具身智能大规模落地需要在“应用中泛化”

荣耀机器人夺冠,只是“应试”高手?

图片 AIX财经(AIXcaijing)原创 作者 | 王璐 编辑 | 魏佳 4月19日,第二届人形机器人半程马拉松在亦庄开跑。300台人形机器人、100多支参赛队伍从通明湖跑向南海子公园,全程21.0975公里,赛道融合城市主干道、坡道急弯、公园生态路段等十余种地形,难度较首届全面升级。 比赛结果出人意料。赛前几乎没有人把荣耀列为夺冠热门,这家公司入局人形机器人不过一年多,在外界看来只是“手机厂商跨界玩票”,上一届冠军天工和春晚红人宇树才是公认的种子选手。 但最终,荣耀旗下三支队伍包揽前三,冠军“闪电”以50分26秒跑完全程,不仅大幅超越去年冠军天工Ultra的2小时40分42秒,更打破了人类半程马拉松57分20秒的世界纪录。这也是人形机器人第一次在耐力赛场上跑赢人类。与此同时,天工Ultra因系统紊乱被抬离赛道,宇树H1在逼近终点时摔倒,同样以担架收场。 对于这一结果,有从业者指出,荣耀起步较晚,其机器人研发方向可以根据特定场景设计,“闪电”是一台更加适配马拉松场景的机器人,这比其他更早量产的品牌占优。甚至有从业者提醒需冷静看待,马拉松考验的是特定场景下的特定能力,赢下比赛并不等于综合能力最强。 除了结果,大家同样关注人形机器人的进化速度。 一年前,首届人形机器人半程马拉松被网友调侃为一场“翻车”表演秀,20支参赛队伍中,不乏中途摔断腿的、跑掉脑袋的、跑着跑着累趴下的。今年即便仍有“翻车”场面出现,但多支队伍完成了全程,整体完赛率和稳定性较首届大幅提升。“进步飞速”是网友对今年赛事的集中评价。 短短一年时间,人形机器人究竟解决了哪些难题?马拉松验证的能力,又能否真正走进现实场景? 01. 荣耀成黑马,宇树、天工“累倒” 本次半程马拉松共吸引100余支队伍、300余台机器人参赛,阵容比去年豪华,有去年的冠军选手天工,有春晚红人宇树、松延动力,还有来自各大高校和海外的团队。
荣耀机器人夺冠,只是“应试”高手?

全行业都在藏拙,这家机器人公司反着来

AIX财经(AIXcaijing)原创 作者 | 陈颐 编辑 | 方展博 你想象过机器人干家务的样子吗? 4月15日,博主“我是HYK”把他请机器人保洁的视频发到了网上。他花了149块钱,在深圳体验了一项上门保洁服务,上门的是三个角色:一台轮式仿人形机器人、一名负责工程师,还有一位保洁阿姨。 打扫现场很“赛博朋克”:机器人埋头摆玩具、收桌面、归置玩具和书本;工程师全程随行兜底;保洁阿姨负责沟通需求和精细活儿。 这位博主重点提到的是效率。机器人叠一件衣服要十分钟,阿姨十几秒就能搞定;三个小时,机器人才收拾好鞋柜、餐桌和沙发三个区域,每个场景大概一个小时,同样的时间,阿姨一个人把厨房、衣柜、卧室的活儿都干完了。 IMG_256 视频发出来后,评论区很多人“想体验”,但也有质疑声,“看着它慢悠悠的确实头大”。 视频里的机器人来自自变量。今年3月,自变量和58集团旗下58到家联合推出上门保洁服务,在深圳率先落地,用户可以在58同城App上预约,按单付费。这是全球第一次有机器人真正以服务者的身份走进普通人的家庭。博主说,深圳的档期已经排到了下个月。4月21日,这项服务将在北京上线。 面对用户的吐槽,自变量官方没有回避,在当天做出了回应。对于最核心的效率质疑,官方直接承认:机器人现在确实比人慢很多,但需要理解的是,慢恰恰是它在真实场景里一步步学习的必经阶段;噪音方面,官方给出了具体的数字,控制在50到60分贝,相当于两个人正常聊天的音量;对于小户型、有门槛的房子暂时进不去的问题,机器人的体积和过坎能力都在优先改进中;至于网友担心的碰坏东西,官方说机器人会主动避开易碎品,如果真出了问题,承诺按实际价值足额赔付。 机器人做家务水平够不够好?显然还不够好。但更值得思考的是,在各大厂商纷纷发布完美演示视频的今天,为什么自变量会让一个干活比阿姨慢十倍的机器人上门,当着用户的面
全行业都在藏拙,这家机器人公司反着来

匿名霸榜、阿里认领,HappyHorse让谁紧张?

Seedance和可灵还睡得着吗? AIX财经(AIXcaijing)原创 作者 | 陈丹 编辑 | 魏佳 一匹匿名黑马,成为了AI视频圈最热的话题。 近日,Artificial Analysis的视频竞技场排行榜更新。一个从未出现过的名字——HappyHorse-1.0,同时出现在四个子榜单的前两位:截至4月9日中午,文生视频(无音频)赛道Elo1378分,领先第二名Seedance2.0整整105分;图生视频(无音频)赛道Elo1411分,刷新全平台历史最高纪录。在带音频的赛道上,它以1分和2分的微弱优势与Seedance 2.0并驾齐驱。 图源 / Artificial Analysis 没有发布会,没有任何公司背书,这匹黑马在短时间内完成了从零到双榜第一的跨越,将此前稳坐榜首数月的字节跳动Seedance2.0拉下了王座。在它的模型名称旁边,只有四个字:“即将推出”。这匹马,还没有真正跑起来。 直到4月10日,阿里官宣它来自ATH旗下创新事业部。接下来,HappyHorse会给行业带来什么? 01. HappyHorse的第一,含金量如何? 要理解HappyHorse的真实水平,需先拆解它在Artificial Analysis(以下简称“AA”)不同榜单上的得分情况。 AA视频竞技场设四大核心赛道:文生视频(无音频)、图生视频(无音频)、文生视频(带音频)、图生视频(带音频)。截至4月9日的最新数据,在纯画质维度,HappyHorse已经建立统治地位;但一旦进入音画融合,它的领先优势并没有那么明显。 在文生视频(无声)赛道,HappyHorse斩获1378分,领先第二名字节跳动Seedance2.0 105 分。在Elo体系中,超过百分的差距意味着用户在盲测中几乎呈现“一边倒”的偏好。而在图生视频(无声)赛道,它跑出的1411分更是刷新了平台历史记录。对于追求极致
匿名霸榜、阿里认领,HappyHorse让谁紧张?

去老虎APP查看更多动态