从语音识别的角度扒一扒,为什么讯飞翻译机译得更准

科技 每日财经网

如今人工智能的发展过程,就如同我们求学的过程:不停地努力学习,不停地扩充知识,不停地刷新成绩。

当成绩刷到语言这一关,翻译机出现了。而且为了帮人类越过语言障碍这条“沟”,翻译机做了许多努力,才最终行的“通”。

“听得清才能译得准。”

对于翻译机而言,这句话不光是一句广告词,更说出了翻译机的本质。

云图片

想要翻译机译的准,首先需要的就是对你说的话有一个准确的识别。就像如果要正确的回答问题,就一定要先听清、听懂问题。如果连你说的话识别出来都是错的,那还谈何翻译的准呢?

所以翻译机工作的第一步,就是从听懂你说话开始。

讯飞翻译机依托讯飞语音识别技术,应用强大的神经网络模型,中文语音识别准确率超过98%,并且支持5种汉语方言识别,2016和2018连续两届包揽CHiME语音识别大赛冠军。

所以今天我们就来扒一扒,有科大讯飞语音识别技术傍身的讯飞翻译机,到底为什么能译的更准。

云图片

1、

记得上学那会儿,老师洋洋洒洒讲完一个知识点,总喜欢最后接一句“都听懂了没有?”

台下的学生七零八落的点着头,但也不知道有多少人只是因为听见了老师说的每个字而点头,又有多少人是因为真正听懂了每句话的含义而点头。

市面上的翻译机,其实就像是一个班里水平层次不齐的学生。老师教学方式是相同的,但有人资质平平,勉强及格,对外界信息需要一定时间消化才能反馈(或者不能);而有的人学习能力强、成绩优秀,对外界的信息能迅速做出准确的反应。

翻译机在开始的语音识别阶段,从收到声音到转换成对应的文字,过程都是相同的:接收声音信号-提取声音特征-综合声学模型和语言模型-解码形成文字。

难就难在如何把你说的话能够意思分毫不差、一字不差的识别出来。这也就是不同品牌的翻译机从一开始拉开差距的地方。

为什么说识别的一字不差很难呢?

如果在安静的环境下说着语法、发音都标准的普通话,机器可以很容易准确识别,而一旦夹杂了多音字、方言口音,或者说话环境嘈杂、有回音等声音干扰,机器的识别过程就没那么轻松了。

云图片

在收到了有特征的声纹信息后,机器会通过声学模型组成单词或拼音,再通过语言模型来让识别结果变得更准确。

这其中,语言模型是非常重要的,它通过训练大量文本语料、学习词与词之间的相互关系,来估计你所说的话对应的每个字的可能性,并利用语言本身的统计规律来帮助提升识别正确率。如果还了解特定领域或任务相关的先验知识,语言模型可以识别的更准确。但如果不使用语言模型,机器面对大量的声音信息,识别出的结果则会是一团乱麻。

所以说,机器也和人一样,越学习、越优秀。但不是所有翻译机都能有足够的学习资源,而讯飞翻译机恰巧就是“饱读诗书”的那一个。

2、

众所周知,科大讯飞深耕人工智能技术,为医疗、教育、家庭、城市等智能化建设作出了相当的成就,也因此,讯飞拥有了千万级各行业平行领域数据的支撑,也因此为语言模型带来了丰富的学习文本。

随着对各行业学习的不断深入,基于大量垂直领域语料,不断对特定垂直领域的语音听写模型进行训练,这样一来,机器不仅能听懂日常口语,连那些专业术语也能听懂了。

这就是讯飞翻译机行业翻译官工作的基础——先听清楚你在说什么,再为你翻译出专业的结果。

打开讯飞翻译机,我们能看到医疗、金融、外贸、法律、体育、能源、计算机、电力八大行业翻译官。行业翻译功能的到来,也就意味着讯飞翻译机相较于其他翻译机,对你说话含义的理解又更深入了一步。

云图片

3、

另一个影响翻译机识别能力的关键,是翻译机的耳朵——麦克风。

回想一下,当我们和别人说话时,面对着对方和背对着对方,听到的清楚程度是有区别的。

麦克风作为翻译机的耳朵,如果想要各个方向都听的清楚,获得较好音质的音频,就需要360度无死角、多带几个麦克风在身上。

所以,讯飞翻译机采用四麦克风阵列,利用阵列方位信息进行噪声抑制,将阵列原始信号与深度学习结合,加强识别模型训练,以便让翻译机听得更清楚,从而提高翻译机在嘈杂环境、声音源过远等情况下的语音识别准确率。

云图片

4、

了解讯飞的人都知道,方言识别是讯飞语音识别技术中的一大特色。从最开始的维吾尔族语和藏语与中文普通话互译在新疆、西藏等少数民族地区建设上的应用,到现在翻译机支持粤语、东北话、河南话、四川话、五种英文口音、一种法语口音及一种孟加拉语口音,方言口音识别的应用越来越为大众所用。

这离不开讯飞在声学模型层面针对不同地区人的口音、发音方式的优化,使声学模型更加个性化且具有差异化。

有了方言口音识别能力的加持,就算你只会说方言,讯飞翻译机也能听懂;就算你和一个印度口音浓重的人交流,讯飞翻译机也能给你一个准确的翻译结果。

云图片

对我们消费者而言,选择翻译机时最关心的就是看它翻译的准不准,通过翻译结果来判断翻译机的好坏虽不失为一个最直观的方法,但如果想从本质上判断它的性价比,不妨从翻译机工作的源头——语音识别这一环节开始对比。

Mellanox 25G/100G以太网解决方案为科大讯飞的人工智能语音识别技术提供支持

西溪平安产险:永远从客户角度出发——最美西溪人徐晓云

2019年春节火车票价该不该涨?从经济学的角度思考

✽本文资讯仅供参考,并不构成投资或采购等决策建议(承兑)。

来源:人民日报 浙江平安产险 习近平总书记强调,人工智能作为新技术新领域,政策支持很重要。要综合运用知识产权、财政税收、政府采购、设施开放等政策,做好科技金融文章。 如何强化财税金融政策支持,更好为人工智能发展添动力、增优势?金融活水精准滴…
  • 科技
  • 4天前
  • 每日财经网
来源:新华网、浙江平安产险 开年以来,国产大模型DeepSeek刷新下载纪录,机器人扭秧歌迅速出圈,无人机“赛博烟花”引发关注,新能源汽车加速出海……新产业新业态新模式竞相涌现。 新消费场景的激活、新产业的蓬勃跃迁与新科技的广泛应用,正成为…
  • 科技
  • 4天前
  • 每日财经网
来源:中国网 浙江平安产险 在数字化浪潮的推动下,作为金融“五篇大文章”压轴之作的数字金融已成为国家战略的重要组成部分。 写好数字金融大文章,是机遇也是使命。2024年11月,中国人民银行等七部门在日前联合印发的《推动数字金融高质量发展行动…
  • 科技
  • 4天前
  • 每日财经网
近日,在国际文档分析与识别会议(ICDAR)举办的世界顶级赛事中,平安产险(参赛团队名称PA-VCG)在“多模态文档推理理解”这一高复杂度任务中,凭借领先的大模型技术体系与卓越的多模态理解能力,从全球众多顶尖科研机构与知名科技企业中脱颖而出…
  • 科技
  • 5天前
  • 每日经济新闻
6月30日,字节跳动旗下全球顶流 MOBA 手游决胜巅峰(MLBB)通过官方渠道正式宣布,与顶流歌手蔡徐坤达成深度合作——蔡徐坤将担任《决胜巅峰》主题曲创作人。 https://img2.danews.cc/upload/images/20…
  • 娱乐
  • 12小时前
  • 每日财经网
百悅澤、索托克拉和BTK CDAC的資料(包括合併用藥)顯示:產品有望全面滿足各類慢性淋巴細胞白血病(CLL)患者的未盡之需 包括CDK4抑制劑、B7-H4 ADC和新型PRMT5抑制劑在內的乳癌、肺癌和胃腸道癌領域的管線產品新資料振奮人心…
  • 公司
  • 16小时前
  • 文传商讯
纽约--(美国商业资讯)--全球投资者权益律师事务所Rosen Law Firm提醒投资者,一名股东代表在2024年5月3日至2025年2月26日期间购买Digimarc Corporation(NASDAQ:DMRC)证券的购买者提起集体…
  • 公司
  • 16小时前
  • 文传商讯
4月26日,全球将迎来第25个“世界知识产权日”。这一重要的全球性纪念日,旨在提升全社会对知识产权的重视,促进创新与创业精神的传播和发展。作为国家重要金融基础设施,中国银联多年来持续探索知识产权保护与金融科技创新深度融合,取得一系列创新成果…
  • 科技
  • 4月23日
  • 每日财经网
近日,吉林省国有企业吉林省泰洋兴联投资有限公司宣布,向见明信息集团旗下数据信息项目注资 500 万元,并签订为期 5 年、标的金额 300 万元的数据信息服务采购协议。这标志着吉林省在数据要素市场化配置领域迈出坚实一步,发力加速本地数据产业…
  • 科技
  • 5月30日
  • 每日财经网