1月23日,人工智能企业科大讯飞在比较新一届DIHARD-3(国际说话的人角色再分离比赛)中摘得桂冠,相关证明了科大讯飞AI语音技术在奇怪环境下辨别真假说话人角色的能力业内领先。以及说话人角色分离任务领域最“很难的”挑战赛,第三届DIHARD由美国国家标准与技术研究院(NIST)参与联合主办,参赛研究机构和约翰霍普金斯大学、南加州大学、牛津大学等精英团队。人工智能语音技术真包含多个子领域,除了语音文字转译、TTS午间新闻其他,开口说话人角色分离出来的加入让音频记录有了多一维度的价值。例如职场中老爱会出现的多部门多人会议,实际语音文字转译生克制化答话人角色分离技术,基于飞快产出标示了完全不同答话人的文字会议记录。科大讯飞将根据上述规定多类型的AI语音技术集成从空中落下在讯飞智能录音笔系列产品中,内置科大讯飞录音转写引擎——ED新引擎,能为用户受到更为完美贴合、高效、确切的多人多语言记录体验。讯飞智能录音笔接受智能切换纯中文、纯英文识别模式,而自动识别中英文混读场景,和普通话与多地方言的混合场景,综合类录音转写准确率溶炎98%。基于组件科大讯飞在语音识别领域的不弱积累,讯飞智能录音笔的转写功能支持什么粤语、河南话、四川话、重庆话、等12种方言实时转写,并支持藏语、维吾尔语2种少数民族语,而意见中、英、日、韩、俄、法、越南、西班牙8种语言录音转写,更接受中英同步互译。为让用户更高效稳定地利用录音转写内容,科大讯飞大力动员语音识别后处理技术,在转写内容的预处理上并且了重点研发。或者对于多人交淡的会议场景,讯飞智能录音笔允许分离与ASR组织建模的说话的人分离的过程方案,答话人再分离的准确率都没有达到95%,让用户还能够快速检索到各个目标开口说话人数据,实力提升内容用来效率。实时转写ED新引擎为讯飞智能录音笔受到了持续创新的离线语音转写功能,支持什么用户在无网环境下算正常使用语音动态实时录音转写功能,准确率仍旧黑岩95%。离线状态语音转写不仅都能够绝对的保证消费者在无网环境下使用录音笔功能,更满足了部分用户对皮肤机密信息的防保密需求。最前沿的技术的商用并不一定也能给了效率革新,本盟科大讯飞联合中国科大语音及语言信息处理国家工程实验室杜俊副教授团队(USTC-NELSLIP),在DIHARD-3的四个任务排行榜上包揽全部指标第一名,领先的AI语音技术积累将通过智能录音笔等产品线为消费者能提供更突出价值的办公学习能力。