继北京站之后,4月18日,云知声开放日(Open Day)第2场来到了深圳。这一天聚焦人工智能技术、应用和行业,云正董事长/CTO梁佳恩博士和众多云正技术专家到深圳合作伙伴,向业内人士展示全栈人工智能硬核技术,腾讯杰出科学家/腾讯人工智能实验室副主任余东,技术联合创始人叶明,同行技术联合创始人叶伟,金鹰卡通产品总监戴文波、Sano声智连副总经理焦焦等嘉宾分析了AI技术在酒店、汽车、教育等领域的应用和落地。

全栈:技术能力全栈,工业服务全栈梁佳仁博士表示,作为人工智能行业的资深从业者,与我们一起在现场恢复发展过程,人工智能大潮退去后,技术产业化能力已成为制胜的关键。如果技术不能解决工业问题,那么技术就会成为企业“华而不实技术”的产物。在此基础上,梁博士总结了云正的AI 哲学:“全栈”和“硬核”。

云志生董事长/CTO梁佳仁博士的“全栈”包含两个维度:全栈AI技术能力和全栈AI落地能力。经过多年的发展,目前云石的AI能力已经超越了单一的语音技术,涵盖了Atlas机器学习超级计算平台,对信号、语音、图像、文本的感知和表达能力,以及知识、理解、分析、决策等认知技术,正朝着多模态人工智能系统的方向发展。同时,云还通过在自主研发的AI芯片中封装能力,打磨“云芯”集成产品体系,将AI技术推广到家居、汽车、儿童、教育、医疗、金融、零售等领域,实现了从AI技术到产业应用的生态闭环。核心:可靠有效地解决产业规模痛点“硬核”是指技术解决方案能够可靠有效地解决产业规模痛点,为终端用户提供相对成熟的用户体验。以当时最受欢迎的智能语音为例,经过两年的市场教育,语音交互技术已广泛应用于各种场景,成为人工智能技术最典型的应用案例。但在实际使用中,人工智能需要面对比实验室复杂得多的情况,如果产品的硬件和硬件的某些方面处理不好,很容易出现“不听、不懂、不听”等问题。针对这样一个行业痛点,在本次云升开放日深圳站,云升技术团队从语音交互技术的提取、识别、交互等方面深入分析了技术难点和解决方案。在AIoT场景中,设备首先需要解决的是远场拾取问题。云正人工智能实验室技术专家关海欣表示,解决远程语音识别的关键在于前端信号处理阶段,解决回声、混响、噪声三大核心问题,让设备能够准确识别用户的指令。目前,云基静音响在回声消除、混响抑制、噪声处理等方面已经有了成熟的技术解决方案,相关技术指标处于行业领先地位。此外,未来的远程语音识别将呈现DSP+DL结合、分布式拾取两大趋势,云也开始了相应的技术部署。

在语音识别阶段,云江人工智能实验室技术专家关海欣要求机器在声学和语言层面上感知和能力语音命令。云正人工智能实验室技术专家李一杰表示,在声学方面,云正基于大数据、尖端声学建模和自适应学习构建了声学模型。在语言层面,云计算创造了大数据规模、强大的集成能力、灵活个性化的语言模型,并基于超级计算平台优化迭代。此外,云智英还将语音识别能力扩展到语音评估、语音模式识别、情感识别等方向。

Yiyjie AI实验室技术专家Yiyjie Li围绕更自然的人机交互,在对话阶段创造了流媒体交互、语用计算和智能对话三大核心功能。云正人工智能实验室的技术专家表示,流媒体互动的最大特点就是不会在多回合对话中醒来,这极大地提高了人机对话过程的流畅度。实用主义计算是将人机交互的内容放在适当的上下文中,使设备能够准确地理解人的意图。最后,智能对话通过将知识图谱应用到人机交互过程中,使设备能够准确地回答用户的问题。

基于上述技术,2013年,云升将为合作伙伴开放对话技能开放平台(语义云),帮助合作伙伴创造更自然的人机交互体验,实际上是不断提升语义分析能力。目前,该平台支持200多个会话内容,涵盖通信、休闲、娱乐、医疗健康、交通、设备控制等多种场景,语义分析准确率达93%。语音感知和表达、语言和知识计算只是云声音硬核AI技术的冰山一角,目前云声音硬核技术还包括AIoT芯片、超级计算平台和图像、翻译扩展等。落地:得益于大数据、深度学习、覆盖酒店、汽车、儿童、音箱等场景的超级计算平台,人工智能底层技术将突破门槛,带来成熟体验。在技术和需求的双重推动下,人工智能将进入黄金发展阶段,开启新一轮AIoT产业转型。在下午的“Smart+”分论坛上,云正副总裁、云正AIOS架构师郭宏光先生以及Carriage Technology、Peer Technology、Golden Eagle Cartoon、Sannosheng Zheng等众多合作伙伴结合真实案例,深入探讨了AI技术在酒店、汽车、儿童、扬声器等场景中的应用。云正副总裁康亨表示,人工智能技术是整个产业链的“基础设施”,这种基础设施不需要定制就无法应用于所有场景。在AI落地的过程中,需要充分考虑使用场景和落地行业。基于对场景和行业的深入思考,2014年云升开始整合产业链,让云升的AI技术赋能行业。

对于行业而言,云推出了一站式AI平台UniOS。云正AIOS架构师郭宏光表示,与同类产品相比,UniOS具有开放性和垂直性两大特点。其中,开放是指云正面向行业和合作伙伴的开放技能平台和设备平台,在此基础上与第三方AIOS兼容。垂直方向意味着UniOS将提供针对特定行业需求量身定制的解决方案,并帮助行业转型。

AIOS架构师郭宏光介绍了技术联合创始人叶明和AI技术在酒店场景中的应用案例。叶明表示,对于酒店场景而言,基于AIoT技术,通过各种设备的联动和场景的定制,为酒店客户带来全新的智能互联场景体验。与此同时,通过信息集成和大数据分析,人工智能也将有助于提高酒店管理的效率

科技联合创始人叶明叶分享了AI语音技术如何帮助汽车行业升级。叶伟说,在车载场景中,语音是一种服务。语音是连接用户和设备、互联网的主要手段,承载着车载网络资源整合和用户接入功能。因此,车载场景中的AI需要汇集丰富的内容和服务,并根据场景进行智能匹配,创造出数千张面孔的智能体验。

Peer Technology联合创始人、Golden Eagle Cartoon卫星电视产品总监Dai Wenbo分享了Golden Eagle Cartoon对儿童产品智能化的思考。戴文波指出,孩子和家长对智能产品的需求与平常场景有很大的不同。在此基础上,金鹰卡通围绕儿童场景的特点,深度融合AI技术和“我的卡”形象,打造了我的卡智能亲子智能产品生态系统。

金鹰卡通卫星电视产品总监戴文波三诺生副总经理蒋介石从产品的角度分享了人工智能产品设计思路。焦指出,人工智能时代的设计方向是感知设计,产品可以将形状、外观、听觉、触觉等诸多因素整合成完整的信息,充分调动人类的本能,设计出更通用、通用的产品。

乔以屏幕音箱为例,屏幕为人机交互补充重要的视觉信息,更贴近用户的本能,“未来5年,单屏智能音箱将达到3亿多,超过PC的尺寸。OpenDay是云技术共享与交流的年度盛会,也是云之声聚焦人工智能核心技术,与合作伙伴、相关学术和产业研究机构等分享人工智能前沿技术和产业应用,并探讨合作的平台。2019年第一个云之声开放日将在北京、深圳、上海和厦门设有四个车站。继北京、深圳火车站之后,上海火车站活动将于5月初正式开放。云公司成立于2012年,是一家拥有自主知识产权的智能语音人工智能公司,专注于物联网人工智能。它是中国人工智能行业发展最快的,也是商业上最好的人工智能公司之一。云知识之声业务主要覆盖智能生活和智能服务两大场景,在家居、汽车、医疗、教育、政府、机器人等领域有着广泛的布局。客户覆盖格力、美、长虹、海尔、华帝、北京协和医院、吉利、平安集团、京东、360等。2018年5月,云知音正式发布了第一代UniOne物联网AI芯片及其解决方案Swift。该芯片是由Cloud Sound独立设计开发,采用Cloud Sound独立AI指令集,性能比一般解决方案提高50倍以上。基于该芯片的标准化解决方案将帮助传统硬件产品以更短的时间、更低的成本快速实现AI,实现人机交互智能。