识别美食PK,Kimi和豆包谁赢了?

虎嗅网12-13

作者|余杨

编辑|苗正卿

头图|视觉中国

有没有发现,降温后,下班回到楼道,家家户户的外卖似乎都香了很多。

这不是错觉,更不是变馋了。

科学研究表明,一方面,寒冷天气中,人体需要更多的能量来保持体温,高热量食物可以提供这些所需的能量。另一方面,在进化过程中,人类为了在食物稀缺的季节生存,会自然地增加脂肪储备以备不时之需。虽说现在有暖气,没有天寒地冻的威胁,但深藏在基因里的本能,还是会驱使人们寻求高热量食物。

另外,食物与情绪之间存在强链接,高热量食物如甜食可以刺激大脑释放多巴胺,有助于缓解压力和提升情绪。毕竟,”晚来天欲雪“的天气,白居易下了班,也要“红泥小火炉,能饮一杯无?”。

随着气温持续走低,是选择“贴膘”,还是继续做控卡达人呢?

控卡首先是得掐着热量吃饭。

但没几天就会发现,算热量太累了。于是想到,AI或许可以一试。拍照让AI估算食物热量,管理自己的热量摄入。

iPhone发布后新上线的一键拍照调用 AI 功能也发掘出了这个思路。最近,跃问app因为针对iPhone16开发了一键调用相机接入 AI 提问的功能而火出了圈。

这一方面释放出AI场景化的控卡垂类用户信号,另一方面也考验着 AI 的图像分析能力。

话不多说,今天我们就来浅浅测评AI的食物热量估算能力,push一下图像端侧AI应用能力生长。

今天参与测评的选手则包括Kimi、豆包、秘塔AI和跃问。

Prompt为:假设我中午把这些都吃完了,请问我一共摄入了多少热量,附件图片如下。

我们先粗略估算一下参考答案。

图中是:

一份漏奶华,大约250g,总热量约400kcal;

一份叉烧饭,叉烧约100g,青菜约40g,滑蛋约50g,米饭150g,总热量约600kcal;

一份烤香肠玉米蔬菜拼盘,甜玉米30g,嫩南瓜70g,烤肠120g,总热量约400kcal;

一份咖喱鱼蛋,共6个,约120g,总热量约120kcal;

一杯港式冰奶茶,约200ml,总热量约200kcal。

图中所有食物热量约为1720kcal。

饿了吗?记住这份标答。

Kimi

首先是Kimi,大约10秒钟Kimi就交了卷。

首先,Kimi十分懂中国人的胃,不仅准确识别了食物名,热量估算也大致准确。把奶茶识别成了热巧克力,倒也情有可原。

这直接抬高了我对接下来测评的期待。

豆包

然后是豆包:

豆包的食谱显然需要丰富一下。漏奶华也许可以约等于松饼,咖喱鱼蛋也可以约等于蘸酱了的炸丸子,但是鸡蛋盖饭上的肉直接被无视了,和标答的热量差额也就出来了。

不过,豆包还贴心的给出了食物的方位。

秘塔AI

秘塔的回答则是:

这是目前为止唯一一个识别出烤蔬菜的AI。

秘塔正确识别了玉米、烤蔬菜、香肠、咖喱鱼丸、奶茶。

漏奶华也可以约等于巧克力吐司,但芝士培根饭的芝士颜色,是不是深了点呢?

此外,秘塔的回答简单明了的同时,也缺失了食物数量的描述,总体来说,我认为秘塔不善此道。

跃问

最后到跃问:

有意思的是,按照跃问的文本输出逻辑来推算,其他的AI都是从上到下扫描识别食物,但跃问是从左到右扫描识别食物,因此奶茶在第二顺位?这个细节所显示的,可能是底层程序的差异。

另外,从跃问给出的答案来看,它对食物的尺寸和比例没有概念,从而把漏奶华识别成了提拉米苏。

同样,跃问也没有给出食物的数量,都是一块、一杯、一份的总量词描述,对于图片中的同类项合并能力还尚待观察。

语言陈述方面,我也建议,可以试着更加 AI 一些,不要“我建议你”。

总结

Kimi在食物识别和热量估算方面表现较好,尽管有小错误,但总体准确。

豆包对方位更敏感,但需要丰富食谱库。

秘塔AI在识别多样性上表现不错,但在食物数量和分量的描述上有所欠缺。

跃问的图片识别逻辑可能与其他AI不同,对图片所显示的食物尺寸、比例、数量等变量显然不够敏感。

不同AI在图像分析和食物热量估算方面的能力各有所长,也显示在实际应用中的潜力和需要改进的短板。

总的来说,成为人类的生活助理,AI们还得加把劲儿。

免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法