图灵运维管家

错过了这次影响全行业的语音智能峰会?这篇文章或许还能抢救一下 WARE 2017

  原标题:错过了这次影响全行业的语音智能峰会?这篇文章或许还能抢救一下 WARE 2017

  7 月 15 日,由硬件创新社区深圳湾全程策划出品的「WARE 2017 语音智能平台与应用峰会 第 II 季」在深圳泰华梧桐岛拉开序幕。

  从初创团队到行业巨头,从平台到硬件到内容,从人工智能公司到硬件设备企业再到传统音频企业……超过 400 名语音智能相关领域的先行者和资深人士,纷纷赶往现场,聆听大咖分享,洞悉潮流趋势前的先行者的实践和思考。全程 6 个小时的会议,从语音先行、能力开放、场景应用、百箱争鸣,共 4 个篇章,首次全方位的解读这个行业。

  本文将带大家一起回顾这场盛会的精华内容,每一位嘉宾的演讲或对话全文,也将在接下来的这一周,陆续推送给大家,请大家持续关注深圳湾(公众号 ID:shenzhenware)。

  早在 3 个月前,当我们已经非常清晰地感觉到了语音结合人工智能之后所表现出的真实的能量,我们策划和组织了国内首个语音智能峰会。

  在 4 月 15 日的那场峰会上,我们邀请了在这个方向上树立起标杆的,已经展示出在语音领域的发力的,以及围绕智能音频的方案提供者、制造商、和朝这个方向转型的传统音频品牌,来探讨在这个已经开始起来的新方向上,有哪些新的技术、产品、和商业的可能性。

  短短3个月的时间过去了,国内语音智能领域所发生的变化,出乎了我们所有人的预料,语音智能的生态在短时间内迅速繁荣。

  在平台厂商、解决方案厂商、应用终端厂商、系统集成商、以及上下游企业的推动下,我们思考了将用怎样的内容和形式,去呈现给大家一个可以解读行业和相互交流的机会。除了紧跟这股潮流的脚步之外,还希望让大家看到潮流中的玩家在选择这个方向背后的思考,看到火热的语音智能繁荣背后的冷静思考,让每一位在周末赶来梧桐岛的深圳湾伙伴不虚此行。

  四大主题论坛,首次深度呈现,多位重磅嘉宾,唤醒产业生态。我们和你们一起发出了「AI+硬件」开发者社区最强音,我们和你们一起探索着「智能硬件」创新者未来之路。

  百度景鲲语音智能市场正在急剧升温,DuerOS 要为智能产品解决基础问题

  就在本次峰会召开的 10 天前,百度在北京召开了 AI 开发者大会,会上展示了百度集中发力人工智能以来的阶段性成果,对话式人工智能系统 DuerOS 则是展示的两大主要成果之一。时隔 10 天,景鲲专程从北京来到深圳湾的活动现场,面向语音智能领域的硬件、内容开发者,进一步从产品落地应用的角度,解读了 DuerOS 能为硬件产品赋予的能力。

  在「WARE 2017 语音智能平台与应用峰会 第 II 季」的活动开场,景鲲用「听清、听懂、满足」三个维度定义了一个优秀语音智能服务体系的基本标准,在听清、听懂上,体现的是语音识别和语义理解方面的技术基础。在自然语言理解能力的优化上,百度在数据上积累优势得以体现,景鲲说道,DuerOS 给自己设立的目标是要能听懂「FREESTYLE」,即用户日常随意的表达方式,「这是我们的一个短期目标。」

  谈到DuerOS 的内容体系,DuerOS 已经拥有丰富的内容与服务,将全部开放给接入 DuerOS 的合作伙伴使用。同时,景鲲强调,包括两千万的音乐资源在内的所有内容资源都将全部免费提供,「我们自己承担内容的成本,就是希望能够更块地推进语音交互的发展。」DuerOS 还将集成更多来自第三方合作伙伴以及开发者的优秀内容。

  面向不同需求的开发者,DuerOS 提供了三种开发套件。在软件方面,DuerOS 还开发了包含设备管理、技能商店在内同时具备支付功能的 APP「小度之家」,能够直接与接入 DuerOS 的设备配套使用,甚至可以让硬件厂商省去 APP 开发的成本。

  值得一提的是,作为继百度 AI 开发者大会后首次与开发者们面对面交流,景鲲会后仍在现场与开发者们持续讨论了一个多小时。开发者的问题集中在如何获取到开发者资格和套件以尽快开始开发、硬件产品的联合推广和未来云端收入分成模式的相关细节,以及硬件企业在基于 DuerOS 打造批量产品时的具体对接方式等等。

  海翼(Anker)阳萌语音智能未来将普及为产品的标配功能,而产品竞争力最终还是要回归到产品本身

  此前,海翼的Anker品牌主要是以其充电产品为人们所知晓。实际上,在语音智能领域,恐怕还找不出几家,像Anker一样,可以同时成为亚马逊Alexa、Google Assistant和百度DuerOS的首批合作伙伴。

  在本次 WARE 大会上,海翼创始人兼 CEO 阳萌表示,此前 Anker 旗下充电产品的市场布局主要集中在海外,与百度 DuerOS 合作、进军语音智能产品,将是海翼在国内市场的新起点。

  阳萌强调,应该更多从「赋能」的角度来理解语音智能,思考语音智能作为一种新的交互方式能为现有的产品和场景带来哪些体验上的改进,而不应把它作为单一的孤立概念来看待。

  谈到基于第三方平台的硬件产品如何做出差异化的问题时,阳萌认为,语音智能未来将普及为产品的标配功能,只是一个额外的加成,产品竞争力最终还是要回归到产品本身的特征上来,例如音响产品还是拼好的音质、好的设计,而不能只是靠语音和智能为噱头吸引眼球。

  此外,除了在智能家居领域的布局,Anker 看重语音智能在移动场景下的潜力。不久前,Anker在Kickstarter众筹了一款可连接Alexa等语音助手的蓝牙耳机,正体现了这一点。「语音助手可以有两种形态,一种开放的,像是音箱这样的家庭中控;另一种则是私人的,供个人使用的,比如耳机。」

  Rokid 祝铭明(Misa)组了博士团在线下零售店蹲点半个月,就是想知道用户怎么看我们的产品

  Rokid将自己定位于一家注重用户体验的人工智能产品公司,如何将技术转化为能够提供良好用户体验的产品,是Rokid思考最多的部分。现在的人工智能技术的整体水平,可能还无法支撑产品提供JARVIS那样的「完美」或超出预期的体验,在这样的技术和体验的博弈中,Rokid是怎样定位一款「足够好」的人工智能产品,它的用户体验应该达到什么程度?

  祝铭明回答,打造一款用户体验好的产品是一件不容易的事情,其中涉及大量的工作,而Rokid着重做的事情主要有以下几件:第一,客观的认识当前技术的边界,清楚认识AI当前能力的边界,包括产业、研究、工程、生产上的边界。第二,尽量让用户形成相应的产品使用习惯。第三,AI产品,尤其是电子消费类产品,主要由软件、硬件、内容、后端服务等方面组成,每项技术与硬件之间都要在算法上进行调和,因为,我们要做的是将算法调优,将边界点调到最低。

  如果说,Rokid的第一代产品Rokid.Allien是一款主打极客市场的产品,那么,第二代的Rokid.Pebble则是Rokid拓展消费市场的象征。祝铭明认为,这两类产品所面向的两类消费群体,极客与大众,其关键差异在于这两类消费群体对智能的敏感程度,对于AI和产品的理解,早期用户和客户都已经形成了一定的认识,而新用户额理解还存在一定的偏差。

  关于 AI 产品如何卖的问题,在访谈中,祝铭明用了较大的篇幅,分享了 Rokid 团队近期组织他们的博士团,在奇客巴士蹲点卖货的所见所闻和感悟。值得欣喜的是,从这些线下零售店的销售数字来看,到目前为止,AI 产品(特指 AI 赋能后的消费硬件产品)的月平均销量,Rokid 是居于榜首的。

  在与大量真实用户的面对面交流中,Rokid发现,要想增加销量和刺激用户购买,最好的方式就是让用户直接摸到、听到、感受到。Rokid产品的线个人停下来看产品,有10个人买单。而相比3~5‰的新品类线上销售转化率,Rokid感受到了这个品类(特指像Rokid一样的智能新生命,或者可以通俗的理解为智能语音终端)的市场,虽然不至于成为所谓的超级爆品,但「比大家想象的要乐观」,只是还需要一点耐心。思必驰 赵恒艺语音开放平台之战打响,用对话定制 DUI 平台「赋能」万物 AI

  基于人机对话交互模式的智能音箱成为了行业的热点,已有大量的语音平台技术厂商与其合作伙伴都做了类似的产品布局。据不完全统计,行业内已有40

  DUI开放平台项目之前,思必驰副总裁赵恒艺就已经率领团队对国际和国内的相关领域进行全方位的调研,包括各个语音对话平台的优点和不足之处,以及相关开发者对平台的诉求。思必驰的调研报告显示:

  。基于自身构建的框架基础,思必驰结合了不同客户、开发者的需求,力求做出拥有竞争优势、满足不同需求且能够定制化的

  DUI开放平台提供了一整套完整的自主对话交互内核,开发者只需要做引擎和语义等相关的开发。DUI开放平台以任务型对话为核心,重视落地应用体验。在支持

  与VUI良好融合的同时,DUI平台还支持高度的定制化,包括对话逻辑、技能服务等,开发者可针对特定场景进行特殊定制。另外,DUI还能实现本地和云端双重技能的定制,让设备在没有联网的情况下能执行用户使用频率相对较高的任务,如车载场景下的导航等。DUI可视化的编辑界面,提供了文字、列表、图文卡片、音乐播放、内嵌网页等可视化组件,使得非专业的开发者能快速上手。

  2亿元的基金,用于鼓励平台开发者。富士康 李国瑜不仅是制造王国,还要成为 AI 硬件赋能的生态航母

  大众认知下的富士康是制造业巨头,是电子产品的代工帝国,是遍布全中国乃至全世界的厂房和120

  AI的硬件赋能者」转型。演讲开始,富士康科技集团副总经理李国瑜博士首先向观众展示了一个富士康作为「制造王国」的实力:从最早的

  iPhone、iMac,再到iPad、HomePod,富士康几乎承包了苹果的整条产品线。经过多年与苹果、亚马逊及一些世界顶级3C品牌厂商的合作与磨合,富士康的制造水准已经代表了当今制造业的最高水平。然后,富士康的团队走到台前,最重要的使命就是向业界展示富士康「创新」的力量。富士康将在中国大陆事业的起点——富士康在深圳的第一栋厂房,交给以设计、创新见长的 B 次集团,担起重振夏普白色家电的使命,改造成为夏普全球智能家电产品研发设计中心,全力进军创新产业,重新设计和定义了夏普的智能家居产品。

  ,未来硬件的智能化,应该是能够拥有集视觉与听觉于一体的立体感知系统。富士康将其智能产品的研发基础定位于「平板+」,基于触屏体验为出发点,富士康重新打造了夏普空气清新器、智能冰箱等一系列产品。而其中最为核心的,则是一款完全原创、具有音屏的智能互动能力的家庭智能管家「晓乐」。与此同时,富士康还联合智能语音企业、推出了名为

  。该平台融声屏开发技术创新孵化与开放式营销平台于一体,对智能硬件进行表情加声纹的双重定制,提高硬件的智能度。富士康将打造一条「从产品到平台思维的软硬整合商运模式的价值生态链」,同时也将是一艘能广纳软硬技术行业各路英豪的巨型商业航母,从硬件整合、软件整合、数据融合、服务接入四个部分,实现复杂的跨领域跨学科资源整合。

  赋能硬件,硬件实现AI,富士康所代表的深入的硬件的设计能力,以及软硬整合的能力,就像是这艘生态航母上的军火,助力大家走向更远更美好的未来。」DeepBrain 李传丰离语音交互 OS 线 年,而作为创业公司,我们专注于语义技能

  NLP)领域的团队之一,曾在2011年苹果发布集成了Siri智能语音助手后,推出过国内第一款基于智能手机的中文语音助手——智能360,并积累了千万级的用户。团队在2014年还做出了国内第一款语音智能音箱小智超级音箱,比Echo的推出还要早半年。经过长时间的准备,

  2017年5月推出了DeepBrain AI云平台,并在国内率先推出了中文语义技能商店,「这或许是打造语义技能生态关键的一环」,DeepBrain李传丰强调。此前,深圳湾曾与 DeepBrain 有过深入的访谈和交流,并率先在国内对「

  」进行深度解读。在本次 WARE 大会上,李传丰对语音智能未来市场进行了预测:「未来基于语音交互的语义技能,其数量应该达到上百万种,语音交互 OS 才能真正成熟。」鉴于 Alexa 技能商店目前的数量为 15000 个,要达到这个成熟市场的状态,「在我看来,至少还需要 5~10 年。」DeepBrain 目前已经上线 种,以音频、智能家居、娱乐及儿童教育为主。

  在经历了很多年的研发积淀之后,DeepBrain 已经拥有了语义技能商店、AI 人机对话引擎、机器人功能组件、精细化大数据及家居互联网服务等五大核心能力。与行业解决方案公司不同的是,DeepBrain 愿意与语音交互产业链各环节公司形成战略合作关系,而自己专注于做语义技能平台,共同推进产业 AI 升级。

  Alexa 认证的不是技术方案,而是用户体验米唐科技作为亚马逊认证的Alexa

  PTT按键交互到远场语音交互的完整解决方案,帮助行业快速开发和量产Alexa兼容产品,构筑语音交互生态。米唐科技(Sugr)

  宋少鹏在消费电子和音频信号处理行业14年,在看到2014年亚马逊推出了Echo和Alexa后,他坚定的认为,语音交互是未来的方向,而智能音箱只是语音交互落地的第一代产品,如同亚马逊推出Echo只是作为Alexa的一个参考设计一样,未来语音交互产品的形态将越来越丰富。而基于亚马逊的内容和电商平台,智能音箱不只是一个消费级的硬件产品,智能音箱更重要的使命是承载第三方服务

  在 4 月 15 日举办的「WARE 2017 语音智能平台与应用峰会第 I 季」的活动上,深圳湾邀请到了,现场与会者有不少是在海外市场发力 Alexa+ 的设备厂商,他们都向深圳湾表达了在 Alexa 认证方面遇到的问题。

  Sugr是一家注重用户体验的公司,Sugr交付的不仅仅是产品,更是完整的用户体验。Sugr团队中有交付设计师,有设计师的方案团队,以帮助客户完善产品体验,响应亚马逊对于用户体验的高要求。哈曼 宋柏勋为语音智能系统打造专门的「耳朵」和「嘴巴」

  今年 5 月微软发布了与三星全资子公司哈曼合作、内置微软 Cortana 语音助理与 Skype 电话服务的。当时,「WARE 2017 语音智能平台与应用峰会第 I 季」的与会者哈曼麦克风系统负责人宋柏勋告诉深圳湾,Invoke 背后的远场语音技术是由哈曼的嵌入式音响事业部提供的。很快,在 6 月初的 CES Asia 上,哈曼举行了语音识别解决方案。

  宋柏勋从如何让人机语音交互更自然的角度,谈了现有的语音交互技术在实现从技术到感性的跨越时,还需要哪些方面的努力。

  一方面,哈曼提供高精度的麦克风单元和麦克风阵列,另一方面,哈曼也专门设计了应用于语音产品的低失真喇叭

  ,二者可以组合适用于各种场景的多种方案,为语音智能系统高质量地解决前端输入和末端输出的问题。VINCI 朱大卫在 On The Go 的移动场景下,语音对话式交互,才是耳机未来的交互方式

  智能头机首次在大众视野里亮相,这台顶着一块彩色屏幕、几乎违背了人们对耳机的所有基本认知的头戴产品被业界和消费者吐槽得很惨。尽管朱大卫一直试图强调,VINCI的头机是跟耳机不在同一维度的全新品类,但在面世之初,像是语音控制、AI情景匹配之类的卖点并没有引起人们的兴趣,大家的注意力都放在了这块看起来功能鸡肋又羞耻感爆表的屏幕上,突破常理的大胆设计成了VINCI的「原罪」。这个「原罪」背后的「始作俑者」,就是

  AI创新。2014年,我在查尔斯河旁边跑步的时候,发现大部分人戴着 iPhone 和有线耳机跑步,这个场景下,人本身还是需要和信息连接的,但是解决的办法非常奇怪。如何让 On The Go 场景中的人与信息连接的更紧密?便成了日后我的创业课题。

  朱大卫很早就开始思考移动场景的产品变革。过去的听歌体验其核心是手动式交互,而VINCI

  80%的日常交互需求,但在语音交互受限时仍需要一套弥补方案,在考虑了诸多交互设计之后,VINCI最终还是选择了触摸屏。关于声+

  VUI)和以智能手机屏幕为代表的图形交互界面(GUI)之间并不是替代关系,VUI是另外一种东西,这上面的许多服务是还未被发掘的、只能存在在VUI上的。」LifeSmart 董熠未来的房子是一个有自主意识的机器人,在家庭场景下打造产品,让 AI 无所不在

  APP的「伪」智能家居产品,其诟病也让这个行业对智能家居的信心有了不同程度的损伤。如今,LifeSmart

  AI在云上调度数据和信息。这样才能达到完全自动控制的境界。面对着智能音箱的火爆,

  人工智能有一个分布式的部署架构,语音也是如此。不光是连接到云端的时候智能设备有深度学习的能力,在本地的时候,也要有离线技术的支持。董熠说:「人工智能应该在云端和本地同时部署,当网络断开的时候,仍然可以完成很多智能化的功能。当连到云端的时候,这个时候再具有一种深度学习的能力,这是我们对于未来家庭的理解。」

  本次 WARE 大会,我们试图从不同场景去探索语音智能的产品形态。教育场景、家居场景、移动场景、移动场景、办公场景

  这些是语音技术应用最广泛的几个场景。但除此之外,还有新的可能。狗尾草智能科技(GoWild

  Holoera琥珀·虚颜AI 3D全息主机,突破性的将语音技术应用在二次元领域。琥珀·虚颜是一款拥有人工智能的虚拟艺人,主要「生活」在全息3D主机Holoera中。邱楠认为,一款聊天机器人要称为强人工智能的杀手级应用,还需要面对不少的挑战。一是,多轮对话的处理;二是,对话场景从垂直领域扩散到开发领域的困难;三是,上下文的结合;四是,识别用户多样化的表达和意图;五是,个性化的对答;最后,还要在对话中体现机器人的情感。

  5个技术的落地。另外,邱楠认为,我们接触世界的手段不仅仅是文字,而是结合图像、语音和文字等多模态来了解外部世界的。因此,我们所构建的知识图谱也应该从单纯的文本扩展到多媒体知识图谱,而ImageNet

  TYMPHANY)音响总经理刘晓彤,共同分析国内音箱行业现状,探讨未来音箱创业的风口。魏强,现任京东和科大讯飞合资公司北京灵隆科技有限公司总经理。叮咚音箱的语音交互系统由科大讯飞开发,渠道则由京东负责。从

  8月起,已推出6款智能音箱,领跑其他智能音箱企业。从叮咚音箱概念诞生、产品设计、生产制造以及市场销售的整个过程,魏强一路趟过了不少坑。而叮咚音箱也几乎成为业界示范性的产品——几乎每一个启动智能音箱项目的团队,都有拆解过叮咚音箱。在世界范围内,几乎所有的大厂商都在做智能音箱,这是一个很明显的信号,智能语音产品很可能会成为下一代交互入口。而国内很多公司其实并没有想清楚智能音箱火起来靠的是哪股风,就一窝蜂全涌上来做产品,争抢市场,这并不见得是好事。「我们不希望大家一窝蜂上,去做低水平的重复性投入,每家公司应该找恰当的点切入特定的应用场景可能会更合适,而不是毫无目的的涌入。」

  作为「猫王」复古收音机品牌的缔造者,曾德钧还有一个更为大众所了解的抬头「猫王之父」,自

  50万台。作为在音响行业混迹几十年的老兵,深谙这一片蓝海要打出一片新品牌之难,因此他选择了并不智能的蓝牙音箱作为创业方向。面对「百箱大战」的行业「风口」,曾德钧十分冷静的并没有跟风,而是把精力放在最有效的地方,把产品和品牌做好

  DuerOS的参考设计音箱。刘晓彤,惠州超声音响总经理、深圳市音响行业协会会长、中国电子音响工业协会专家组成员。在音响ODM

  30年的行业前辈。超声(TYMPHANY)是几乎所有国际大牌音响品牌背后的ODM厂商,和所有基本上你能想到的品牌都有过紧密的合作。作为行业领军企业之一,超声音响在智能音箱项目上,近几年持续的投入了很大的人力、物力,在新技术、新方案上进行预研,同时在传统优势—声学研发上,持续加大投入进行配合。就在 WARE 大会召开前的半个月,刘晓彤向深圳湾透露,公司在智能音箱上的业务收入,只占全部代工业务的 1%。时隔半个月,超声又因为一笔大生意,而让这个收入比例,上升至 10% 以上。

  。对于希望希望进入智能音箱领域的传统音响行业人士,刘晓彤对他们的建议是:「如果有能力走在前面,那就去尝试;如果现在还没有迈进去,不如等一等,等像百度这样的公司把平台做好,借平台之力完成产品从不智到智能的转型

  7点才散场。应上下游厂商的需要,配合峰会而开展的「语音智能平台与应用创新展」聚合了AI设备及应用、AI平台及方案,以及AI生态及周边展示。旨在推动人工智能与硬件创新生态的融合,让机器赋能。参展企业包括:富士康科技集团、

  Sugr米唐科技、RAK瑞科慧联、希巨科技、爱普泰科、云之讯、灵隆科技、疯童科技、云动创响、VINCI玩起。富士康收购夏普后,重新设计的智能空气净化器。富士康不仅把这款企业内的创新产品带到了「WARE 2017」大会的现场,还特别赞助了 10 台空净到大会主会场,为已经座无虚席的主会场空间,解决「空气污染」问题。在现场实测汇总,这款空净从最初的警示红灯,逐渐变成了代表健康空气的绿色灯。

  的开源硬件套件WisCore,帮助产品开发者快速构建支持Amazon Alexa的产品。能够为智能音箱快速搭建通信能力的云之讯也吸引了不少开发者。

  值得记录的精彩瞬间还有在会议当天上午开展的精致主题私享会。「梧桐 CEO 早茶会」本是深圳湾联合泰华梧桐岛在 2016 年联合开展的高端社交活动,已经连续举办过 4 场颇受好评的活动。借「WARE 2017」的活动,我们将与会的嘉宾邀请到了这个早茶会。

  品味过美味茶点之后,我们精选了 30 多个语音智能领域的新闻事件,与嘉宾席地而坐,一起畅聊新闻背后的故事。透过这些新闻事件,大家增进了彼此的了解和认识。

  特别感谢,富士康 B 次集团的团队,你们的敬业热情与专业精神,打动了到场的每一位与会者。感谢你们为会场带来的新鲜气息和创新力量。

  特别感谢,美丽的生态办公园区,泰华·梧桐岛,你们对于产品的专注和用户体验的关注,另每一位来到梧桐岛的人,都被这里的美丽所感动。

  声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

评论