记者近日从工信部获悉,我国将加大力度支持新一代语音识别框架、口语语音识别、智能对话、音文章融合、语音合成等技术的创新应用,推动在智能制造、智能家居等重点领域的应用。到2020年,多场景中文语音识别平均准确率达到96%。

成立于八年前的中英语言传播是一家拥有大比例数据资产的科技企业。在其最近的年度峰会上,发布了三款产品:智能搜索引擎NexMagic、数据可视化分析引擎DataMap4.0和智能知识图谱Data Galaxy。中英语言传播CEO杨宇表示,这是大数据和人工智能驱动下的技术应用成果,为大数据在语言领域的智能化应用探索提供了新的路径。

数据驱动,技术让语言更智能

近年来,自动语音识别技术发展迅速。作为人工智能领域相对成熟的技术,语音和语言在大数据的海洋中更加智能,“导出成章”不再是梦想。目前ASR技术根据不同语言的差异准确率接近90%,深度学习技术构建的深度神经网络让语言翻译产品更加智能。

事实上,作为人工智能的一种新的交互方式,语音识别和合成技术已经广泛应用于输入法中。2013年,中英语言通信发布了一款名为“Yeehub”的多语言呼叫中心产品,全球12种语言24小时响应,每月接听来自世界各地的电话100万分钟,接通时间不到10秒。

曾经,自然语言理解、口音方言、应用场景声音、复杂数据等诸多方面影响了语音识别和深度学习技术的迭代升级。杨宇表示,随着人工智能等新一代技术的发展,机器翻译正在经历从基于统计规则的机器翻译(SMT)到神经网络机器翻译(NMT)的转变期。

“NMT是人工智能和机器翻译技术的融合。它可以更准确地理解自然语言,提高交流效率,将成为一项关键的AI技术。”杨宇表示,在大规模数据和深度整合优质语料的基础上,中英语言通信自主研发了用于深度学习框架训练的语音识别引擎。中文、英文、日文、韩文、德文、葡萄牙文等多种语言积累了超过10000小时的语音数据,中英文语音识别准确率超过90%,日文、韩文、德文、葡萄牙文语音识别准确率超过80%。

据说这款精准的语音识别引擎已经应用到了中英语言链接推出的找翻译app、输入法等众多语言技术产品中。“未来,我们将专注于开发解决嘈杂环境和移动设备中语音识别问题的产品,并继续扩展语言,为全球不同语言和不同场合的用户提供服务。”杨宇说。

创新突破,培育行业核心竞争力

“地球村”变得越来越小。中文翻译语言Link发布的三款产品中,NexMagic将于本月底上线。这款基于人工智能和大数据技术自主研发的自然语言理解搜索引擎产品,将实现新闻资讯、科技、专利等领域的垂直多语种搜索应用。并能收集全球文字、语音、图片、图像等数据进行分析,构建知识图谱。

“我们剥离的每个垂直分类产品都是独立的。比如医学影像有独立的团队,我们只是提供更多的资源支持和顶层设计。”杨宇说,在过去的三年里,汉英语言交流在技术研发方面投入了大量资金。“我们仍然可以扩展不同的产品。基于整个大数据领域,一旦有新的业务,预计会有一些公司和团队来运营。”

作为基于自然语言分析的跨语言搜索引擎产品,智能化的标志是多语言语音识别和交互。中国科学院声学研究所语言声学与内容理解重点实验室主任闫永红表示,跨语言处理仍面临诸多挑战,如多语言数据获取困难、语言差异导致的语言处理方式不同等。

事实上,作为一家拥有翻译基因的科技公司,杨宇更坚信他们的产品功能具有大数据和人工智能技术基因。一系列持续的创新突破将给整个行业带来革命性的影响。

业内人士分析,对行业数据价值的深度挖掘和以语音识别为代表的智能交互能力,将成为引领移动终端和行业发展的核心驱动力。“以机器翻译、语音识别、计算机视觉、数据挖掘共享为代表的人工智能技术的演进,将赋予未来更多的可能性。人工智能的最终目标是实现人机一体化。”杨宇最后说道。