巨头盘踞的智能语音市场还有机会吗?

根据 ReportLinker的预测,全球智能语音市场规模将从2018年的75亿美元增长至2024年的215亿美元,其中医疗健康、移动银行以及智能终端智能语音技术快速增长的需求将成为主要的驱动因素。尽管全球语音市场CR5高达88%,但国外市场的巨头eg. Nuance、Google并未在中国市场取得同样的的地位。这不仅是因为语言之间的语法逻辑差异,更多还是来源于中国本土互联网和移动端市场的起高,国内智能语音企业拥有先发的天时地利。

智能语音核心技术主要体现在语音识别、语音合成、自然语言处理(NLP)几个维度。

下图:人机交互的语音处理(来源:Aspect)

与一般的单向语音应用相比,对话式人工智能的人机交互是双向的,从整条需求产业链来看需要芯片、方案集成、终端设备、渠道、消费者等参与方,而人工智能平台是对话式智能技术的中间枢纽。

下图:截止201811主要厂商在智能语音领域的专利数量(来源:超凡知识产权)

对话交互型人工智能在下游拥有广阔的运用前景,消费级市场如家居、车载、随身终端上有较大需求,主要需求发生在双手甚至眼睛被占用的场景内,声控指令可为使用者带来的安全及便利性,而对话更为使用者提供了多样选择和更精细的管理可能性,因此在这类情景多发的行业,智能语音和语音交互有可能会成为系统标配。专业级市场应用于特定场景,如医疗、教育、呼叫中心等,作为辅助工具,智能语音可以通过基础性工作如就医时的分析症状、个性化推荐就诊、语音导入电子病例及临床报告,大幅提高工作效率。

IDC在2018年10月的报告中预测,中国对话式人工智能市场规模将在 2022 年将达到78亿人民币,2018-2022年年复合增速为 57%。从IDC的能力象限来看,科大讯飞、百度、阿里巴巴、小i机器人和思必驰为领先企业。虽然IDC将科大讯飞和小i机器人都列为对话式人工智能平台前位厂商,但科大讯飞主要是一家语音识别和语音自动化公司,而小i机器人主要是一家自然语言处理公司,垂直类AI企业和互联网平台争相布局,但各家保持自身差异化,短期内不会出现白热化竞争。

下图:中国对话式人工智能平台厂商评估2018 (来源:IDC)

为了吸引更多用户并连接业务合作伙伴,大多数 AI 公司都希望构建支持应用生态系统的云平台。语音智能领域有不同类型的开放平台。简单的平台只提供易于使用的 SDK,例如出门问问和思必驰。云知声提出的“云端芯”生态,避开了只售卖芯片或者云端SDK的模式。科大讯飞则于 2010 年推出了语音云,并于 2015 年推出了 AIUI 平台 (对话式人工智能平台),领先于互联网厂商 BAT。

下表:平台方对比矩阵(来源:公开信息)

下表:音频平台对比矩阵(来源:公开信息)

面对全新的市场机会,互联网巨头或垂直领头羊都快马加鞭的将产品推向市场,提前占领份额的同时也通过自下而上的供给侧打通产学研投整个脉络。

下表:2019Q2 全球智能语音设备销售市场(来源:Strategy Analytics)

百度在2019年开发者大会展示的信息,小度音响已具备“全双工免唤醒”能力,不仅能在无需多次唤醒的情况下和机器顺畅交流,还能在与他人对话的同时互不干扰地实现人机交互,Canalys和Strategy Analytics公布的数据显示,2019年小度智能音箱连续两个季度成为中国市场第一名,并与亚马逊、谷歌一起位列全球市场前三名。

从2009-2018的十年间,科大讯飞收入从3亿飞升到79亿,领跑国内AI市场无人超越,截至20190630,科大讯飞按产品分类,教育产品和服务占比23.15%,信息工程、智能硬件、开发平台、政法业务分别占比19.05%、11.66%、11.48%、10.86%。业务以G&B端客户为先发优势,并依靠多年研发取得的成果转化产品逐步渗透向C端用户,通过打开教育、智能硬件等软硬件赛道铺垫,未来增速可期。

下表:讯飞客户类型

智慧课堂产品是把将人工智能技术融合在师生的课堂教学互动中,一方面能够让老师更加快捷、智能化的搜索所需教学资源。另一方面,可以通过多终端的产品体系来实现基于手写的过程化的数据采集,同时基于自动评测技术等等来实现课堂上的互动,学生课堂数据都能够被过程化采集,未来为老师的精准教学提供基础,在实际中形成了“刚需+代差”的技术优势,具备B端业务的技术护城河。另外,个性化学习产品是讯飞教育中2C方向的核心产品,收费校的续约率持续保持在98%以上,得到消费者认可份额稳步提升。

今年9月16号,科大讯飞正式成为2022年北京冬奥和冬残奥会自动语音转换及翻译的独家供应商。即未来从明年的东京奥运会一直到2024年的巴黎奥运会上,所有跟这个赛事相关的,不论日常交流、办公或对公翻译服务,涉及到语音合成、语音转写、语音识别的以及翻译,全部将使用科大讯飞的产品。

讯飞输入法可在应用商店免费下载,按可靠统计口径应为大陆移动市场第二大输入法。目前总下载量超过6亿,月活用户超过1.4亿。该产品拥有诸多独特功能点,包括连字叠写,拍照输入等功能,特别是在语音输入功能上最为强大,通过语音识别可在一分钟内输入400字,准确率超过97%,并支持20多种国内主流方言和多种外语的语音输入与即时翻译。目前最新版本已支持中英文,普通话与粤语无切换混合输入。

智医助理系统可以在基层医院、乡镇医院、社区医院去帮助基层医生解决常见病。“很多人说智医助理系统和IBM的Watson比较相似,但我们认为双方还是有很大不同的。当然核心技术中间都是基于人工智能深度学习的一些框架来做,都是基于认知智能去训练海量的高水平医生的过程化数据,但是我们立意和定位不一样。”(quote from投资者关系活动反馈)根据公开的信息,当时Watson在医疗方向着重解决的是帮助高水平的医生解决疑难杂症问题。这是一条技术路线。而智医助理系统主要是帮助基层医生解决常见病,也就是卫计委定义的总共接近1000种左右的需要在基层解决的病种。通过持续训练脱敏数据,目前此类常见病已经得到广泛收效,每个县接近400万采购金额的体量。医疗业务智医助理产品今年在安徽50+区县实现采购,当前的首要任务是完成现有的采购区县的产品交付工作,并在明年进一步推动安徽剩余区县完成智医助理产品采购,达成全省并在其他省份试点。

出门问问成立于2012年,团队来自于Google系,拥有自主研发的语音交互、智能推荐、计算机视觉及机器人SLAM技术,累计融资额超过2.55亿美元。公司以语音搜索引擎和Ticwear软件为基础,发布智能可穿戴设备、智能音箱、问问魔镜等产品。2018年发布问芯智能语音芯片、商用智能语音解决方案,智能手表是公司的主打产品,Ticwatch在2018年亚马逊黑五“Best seller”榜单中位居智能手表品类第三位,TicWatch已成为全球Top 4的智能手表品牌,全球累积销量达到100万块.

下图:出门问问软硬件产品+方案(来源:公司官网)

公司在2017年成为谷歌助手的首批合作伙伴,并与大众汽车合作,2020年问众智能车载语音方案将实现对大众全系品牌的覆盖,或将成为前装语音交互市场占有率No.1的公司。

被称为科大讯飞强劲挑战者的云知声,从创立之初就在各种国际研究领域斩获头角。荣誉墙包括:2002-2012年间多次在美国国家标准技术署说话人识别评测(NIST SRE)项目获SRE主任务第一名;连续三年获得国际音频检索评测大赛 (MIREX) No.1,同期参赛机构包括: Nuance、 IBM、 SRI、 CMU、Microsoft、科大讯飞;发布智能家居方案(类似Echo),使用2mic降噪技术,实现5米远讲,比谷歌Home的发布早了两年,以及获得“中国智能科学技术最高奖”—“吴文俊人工智能科学技术奖”。云知声强调构建“云端芯”生态,搭建了支持通用深度学习框架的异构可扩展超算平台Atlas,自主研发的AI芯片UniOne及多模态场景芯片海豚、雨燕、雪豹,已经覆盖云平台、家装、车载、医疗、儿童智能机器人等领域。

下图:部分产业智能化板块图示(来源:云知声)

拼技术

讯飞成立20年,挂牌11年,作为全球领先的人工智能自主研发开发商,成立至今其开放平台提供267+项AI能力及方案,覆盖160万生态伙伴。科大讯飞主持和参与制定国家标准 4 项,国际标准 1 项,行业标准 3 项,公司及全资、控股子公司累计获得国内外有效专利 900 余件,技术研发优势显著。

开放平台智能语音等核心技术始终保持业界领先水平:语音合成技术在国际最高水平的语音合成大赛 (Blizzard Challenge)中连续十三年蝉联全球第一,摘得10个测评项目中的9项第一,且在最关键的自然度和相似度评测指标上均大幅领先第二名,保持显著技术优势。语音识别技术继2016年获得第四届国际多通道语音分离和识别大赛(CHiME-4)全部三项子任务冠军后,2018 年 9 月再次包揽CHiME-5 全部四个子任务的冠军并大幅刷新各任务最好成绩;率先在行业内做到实际场景下通用语音识别率 98%。2019年3月,在机器阅读理解国际权威评测SQuAD 2.0任务中,同时在EM和F1两个指标上全球首次均超越人类水平,创下比赛的全新纪录;同在2019年3月,科大讯飞在另一项对话型阅读理解权威评测QuAC中凭借所研发的ConvBERT模型荣获冠军,并全面刷新所有评测指标。

视觉:2019年6月,在计算机视觉与模式识别国际会议(CVPR 2019)举办的物体检测挑战赛DIW 2019(Detection in the Wild challenge Workshop 2019)上取得Objects365 Tiny Track第一的佳绩。此外,科大讯飞还在文档分析与识别国际会议(ICDAR 2019)举办的场景文本视觉问答挑战赛ST-VQA(Scene Text Visual Question Answering)挑战赛上获得了全部三项任务的冠军;在国际医学影像顶级会议ISBI设置的CHAOS评测任务中,刷新了最受关注的CT肝脏分割子任务的世界纪录。从考量肺结节检测的国际医学影像领域权威评测LUNA,到目前公认自动驾驶领域内最具权威性、专业性的图像语义分割评测集Cityscapes,到医学影像领域的国际顶级会议ISBI举办的糖尿病视网膜病变分割与分级挑战赛(IDRiD),再到ICPR 2018 MTWI挑战赛,科大讯飞均取得了世界前列的亮眼成绩。可以说,讯飞在计算机视觉领域虽“征战”时日不长,却已处处开花。

云知声是业内第一家基于深度学习的语音识别云服务上线识别率提升10%以上,超过科大讯飞。业内第一个同时支持语义解析、问答和多轮对话的开放平台。2012-2014,团队连续三年获国际音频检索评测大赛(MIREX)No.1,2015年,自然语言理解(NLP)技术的全球最高大赛BMT上,击败了Nuance等AI语音领域全球知名企业,综合指标位列世界第一,2018年,首战WMT国际机器翻译大赛中英翻译比赛,以仅低于冠军0.7分的微弱分差位列第三。2018年首战WMT国际机器翻译大赛中英翻译比赛综合排名第三,医疗翻译评测排名第二。

拥有业内独有的自研专业芯片,2018年起AI芯片流片成功进入量产化,基于UniOne芯片的智能家居/音箱方案开源,车载芯片明年确定加进吉利的E02平台,月销2万台。 芯片业务作为物联网布局的底层支持硬件,在今年的发布会上,创始人黄伟表示5G与人工智能的结合,将真正促使万物智联(AIoT)的落地与实现。未来巨量的多维数据(如语音、图像、视频等)集中处理与边缘式分布计算的需求,势必将进一步挑战AI底层支持硬件——芯片的计算能力。具备多维度AI数据集中处理能力的多模态AI芯片将成必由之路,为此云知声已从布局上占领先机。

视觉:2018年在国际权威的人脸识别标准评测数据库LFW和MegaFace上,团队研发的人脸识别UFaceID算法系统性能分别达到99.80%和98.47%,首次参与内部测评,系统性能即位居业内前列。

拼市场

科大讯飞在语音市场占有率44%,科大讯飞已在教育、 医疗、政法、智能服务、智慧城市等行业领域全面布局,并在消费者领域推出从手机应用、到智能车载、 智能家居、智能终端等多种产品。公司建立了覆盖全国的营销渠道和服务网络,设有营销大区25个,签约渠道 400 余家;与三大运营商、金融机构、手机、家电、汽车等行业领先企业实现了广泛战略合作。 刘庆峰曾公开表示,从2018年开始,科大讯飞有一个非常重要的变化,那就是B+C双轮驱动战略的扎实推进。科大讯飞在B端业务上有很强的优势,但似乎并不满足于此想要成为既有行业品牌又有公众品牌的公司。讯飞消费者BG自成立以来每年都保持60%的高速增长,2018年C端业务实现营业收入25.17亿,同比增长96.54%,在整体营收中占接近1/3。双轮驱动的良好格局正在形成,在各种经济周期下实现相互补充、相互促进。在6.18电商节期间,公司全线产品销售额一举摘获五大品类六个第一。

作为后进者的云知声面对头部的占坑采取差异化市场定位,在商业化初期暂时回避了讯飞最大布局的政法、教育产品,搭载自己强大的云端芯体系从“分蛋糕”跨阶为“做蛋糕”,车载领域从切入汽车后装市场开始,比进入预装市场难度小速度快,成为后装车机市场占有率第一。合作伙伴的选择上采取深耕各垂直领域,并与可持续规模化的partner以引入战略股东和成立合资公司的方式深度绑定合作,目前合作方数量超2万家,覆盖用户超2亿,覆盖城市超647个,覆盖设备超2.5亿台。不仅是国内首家推出医疗云服务的公司,也是白店领域唯一落地出货的芯片供应商,教育云社会化口语评测服务市场占有量第一保持者,覆盖超 5,000 万人,日调用量2.7亿次。

拼团队

据公开资料,科大讯飞团队规模在五千人左右,上市以来总监以上30多位高管无一人离职;股票期权激励的近 700 多位核心骨干,离职率不足 1%;2017年限制性股票激励计划的骨干人才中,获授10万股以上的骨干员工未出现一人离职。经过多年发展和培育,公司积累了智能语音及人工智能产业最优秀的专业技术人才与复合型高端人才,每年研发投入均占总营收的 20%以上。

云知声秉持轻装快跑的原则,有意在管理费用、营销费用等方面控制成本,团队规模保持着500人的规模并有计划于19年底进行进一步优化,保留350左右的人员编制并适当提高人员收入用以稳定团队,推测在团队建设和职能分配上还会有一定调整预期。$科大讯飞(002230)$

拼数据

从历史来看,科大讯飞自2008年上市以来,营收从当年的2.58亿元增长到2018年的79.17亿元,十年增长了30倍。从净利润来看,仅由最初的0.77亿元增加至5.42亿元,增幅不过7倍,目前估值700+亿元,ps8倍左右。

云知声从2018年营收已过亿,2019年的营收预计4亿元左右,2020年获出现翻倍增长。净利润部分暂时未公开,以研发和芯片量产为主要投入以此判断短期内正向净利润有一定挑战,最新融资估值80亿元,ps2倍左右。

作为巨头的踢馆代表,一个漫长艰难的战争正等待着云知声们这样的后起之秀入局,市场足以畅想,希望与挑战永远都并存。

李开复在撰写《人工智能》一书曾提到过回顾过去十年现实与年轻时的理想憧憬有所不同,技术颠覆整个社会模式之路漫漫而长远兮。我们当然相信AI语音技术落地到行业的未来空间巨大,而单个场景的下沉程度或盈利规模还有待时间的培育,企业级还是消费级的打通时点不同,导致变现路径势必有先后,宏图将至,未来可期。

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论8

  • 推荐
  • 最新
  • 品狼星
    ·2019-11-25
    详实的内容给予鼓励!但能不能更接地气一些。
    回复
    举报
    收起
    • MidasMike
      谢谢 我们很多内容都是投资工作中产生的 交流对象也是机构同业为主 风格确实和专针对个人投资的媒体平台不一样
      2019-11-25
      回复
      举报
  • 小虎AV
    ·2019-11-25
    欢迎大美妞入驻[开心] [开心] ,大家一起来关注叭[可爱]$老虎证券(TIGR)$ //@Giselle: 自己转发自己😂
    回复
    举报
  • MidasMike
    ·2019-11-25
    作者是公众号搭档 @Giselle 美女哦[害羞]
    回复
    举报
    收起
    • 鑫鑫洋
      自己说自己是美女,看来是美到一定程度了,果然很美
      2019-11-25
      回复
      举报
  • Giselle
    ·2019-11-25
    自己转发自己😂
    回复
    举报
  • 天剑狂族
    ·2019-12-16
    小米呢😃😃
    回复
    举报
  • Seven8
    ·2019-11-25
    好专业,有点看不懂
    回复
    举报