快捷搜索:

【澳门新葡8455手机版】谷歌(Google)双语助理来

日期:2019-08-28编辑作者:澳门新葡8455手机版

责任编辑:

我们考虑的一个用例是人们通常在查询中使用同一种语言(用户通常也希望 “智能助理” 使用该语言作出回应),除非所查询实体的名称使用不同语言。这意味着,在大多数情况下,即使句子中包含使用不同语言的实体,“智能助理” 也可以通过关注查询的第一部分来对所说的语言作出初步猜测。借助这种早期识别,我们可以通过切换到单个单语言语音识别器来简化任务,这与我们处理单语言查询一样。然而,快速决定如何以及何时切换为单一语言需要最终的技术整合:具体来说,我们使用随机森林技术来结合多个情境信号,例如所使用的设备类型、所发现的语音假设数量、我们接收类似假设的频率、单个语音识别器的不确定性,以及每种语言的使用频率。

Google Assistant 现在能够识别语言、解释查询并使用正确的语言提供回复,而无需用户手动设置设置。

理解多种语言

理解多种语言

今天,我们将推出 “Google 智能助理” 的多语言支持功能,让用户在查询时可以切换两种不同的语言,而无需返回语言设置。用户从英语、西班牙语、法语、德语、意大利语和日语中选择两种受支持的语言后,便可使用其中任意一种语言与 “智能助理” 对话,而 “智能助理” 会以相同的语言回应。之前,用户需要为 “智能助理” 选择一种语言设置,而每当他们想使用另一种语言时,便需要更改设置,但现在,多语言家庭无需动手,即可享受简便的体验。

澳门新葡8455手机版 1

多语言家庭正变得越来越普遍,一些数据来源 [1][2][3] 表明,多语言使用者的人数已超过单语言使用者,而且这一数字还会继续增长。鉴于多语言使用者人群庞大且不断增加,与以往相比,我们更需要使 Google 开发产品能够同时支持多种语言,以便更好地为用户服务。

另外一种简化和改进系统质量的方法是限制用户可以选择的候选语言列表。用户可以谷歌智能助理设备目前支持的六种语言中选择两种语言,这已经能够支持大多数多语使用者。

重要的是,我们需要在几毫秒的时间内评估 “Google 智能助理” 和用户查询中提及的其他服务异步生成的实时增量结果。我们借助另一种算法来完成这项工作。该算法使用由 LangID 产生的候选语言概率、我们的转录置信度和用户偏好(例如最喜欢的艺术家),对两个语音识别系统中每个系统提供的转录假设进行排名。

人类是有能力识别出别人在说另一种语言的,即使他们自己不会说这种语言,只需要注意语音的声学特征(语调、音域等等)。但是,即使借助于全自动语音识别系统,定义一个自动口语语言识别的计算框架也是很有挑战性的。

澳门新葡8455手机版 ,1:人们通常认为,口语识别比基于文本的语言识别更具挑战性,后者只需要基于字典的相对简单技术就能出色地完成工作。语音内容的时间/频率模式很难加以比较,而且由于用户在讲话时可以不加停顿,语速也有所不同,并且麦克风除了录制语音以外还会保留背景噪声,因此确定语音内容也更加困难。返回搜狐,查看更多

原标题:谷歌双语助理来了!中英夹杂也不怕,递归神经网络和随机森林显神威

从一开始,我们的目标就是让 “智能助理” 可以自然地与所有用户对话。多语言支持是用户翘首以待的功能,也是我们团队几年前就提上日程的项目。然而,现在全球不只有许多双语使用者,还有使用三种语言的用户,或使用两种以上语言的家庭,我们也想让他们的生活更加便利。

更重要的是,Google Assistan 以及在用户查询中异步引用的其他服务会生成需要在几毫秒内评估的实时增量结果。这是借助另外一种算法实现的,该算法使用 LangID 生成的候选语言的概率、我们对转录的信心以及用户的偏好(例如,最喜欢的艺术家)对两个语音识别系统提供的转录假设进行排序。

然而,实现这项强大的功能却并非易事。事实上,我们付出多年的努力解决了诸多难题。最终,我们将问题拆分成三个独立的部分:识别多种语言、理解多种语言,以及为 “Google 智能助理” 用户优化多语言识别。

不过,随着 LangID 技术的不断改进,谷歌希望接下来能够解决三语支持的问题,这将进一步提升多语用户群的体验。而且,谷歌负责产品的副总裁 Nick Fox 此前表示,接下来的几个月里 Google Assistant 将增加支持丹麦语、荷兰语、印地语、印度尼西亚语、挪威语、瑞典语和泰语。到今年年底,谷歌助理将支持超过 30 种语言,覆盖 Android 手机使用语言的 95%。返回搜狐,查看更多

文 / 副总裁 Johan Schalkwyk 和 Google Speech 工程师 Ignacio Lopez Moreno

在 2013 年,谷歌开始使用深度神经网络开发口语识别(LangID)技术。今天,谷歌最先进的 LangID 模型已经可以使用递归神经网络区分超过 2000 种可供选择的语言对。递归神经网络特别适用于序列建模问题,例如语音识别、语音检测、说话人识别等。研究人员遇到的挑战之一是使用更大的音频集——获取能够自动理解多种语言的模型,并达到允许这些模型正常工作的质量标准。

原标题:Google 智能助理,支持多种语言功能!

要同时理解一种以上的语言,需要并行地运行多个进程,每个进程都会产生增量结果,这样智能助理不仅可以识别查询所使用的语言,还可以解析查询以创建可操作的命令。

“Google 智能助理” 现在能够识别语言、解读查询内容,并使用正确的语言作出回应,而且用户无需触摸 “智能助理” 设置,便可完成这些操作

有了这种早期识别,我们就可以像处理单语查询那样,通过切换到单语语音识别器来简化任务。然而,快速决定如何以及何时切换到一个单语言,在最后会需要一个技术转折:具体来说,我们使用随机森林(random forest)方法,结合多个上下文信号,例如正在使用的设备类型、发现的语音假设的数量、多久收到类似的假设、各个语音识别器的不确定性、以及每种语言的使用频率等。

责任编辑:

Google Assistant 使用的多语言语音识别系统与标准单语语音识别系统的示意图。排序算法用于从两个单语语音识别器中选择最佳的识别假设,利用了用户的相关信息和增量的 langID 结果。

识别多种语言

为了最大限度地减少这些不良影响,系统决定使用哪种语言的速度越快越好。如果系统在用户完成查询之前确定了所使用的语言,那么它将停止通过 losing recognizer 运行用户的语音,并丢弃 losing hypothesis,从而降低处理成本,减少任何潜在的延迟。

要同时理解多种语言,便需要并行运行多个进程,且每个进程产生增量结果,从而使 “智能助理” 不仅能够识别用户提出查询时所使用的语言,还可以解析查询以创建可操作指令。举例来说,即使是在单语言环境中,如果用户要求 “设定下午 6 点的闹钟”,则 “Google 智能助理” 必须理解 “设定闹钟” 的意思是打开闹钟应用,输入 “下午 6 点” 的显式参数,而且还要推断出闹钟应该设在今天。要对受支持语言的任何给定语言对执行这项操作可谓一项挑战,因为 “智能助理” 执行与在单语言情况中相同的工作,但现在必须额外启用 LangID,并且不只是一个,而是同时运行两个单语言语音识别系统(在本篇博文的稍后部分,我们会进一步说明当前两种语言的限制)。

例如,即使是单语环境,如果用户要求 “设一个下午 6 点的闹铃”,谷歌助理必须理解“设置闹铃” 意味着打开时钟 app,完成 “6pm” 的显式参数,并推断闹钟应该设在今天。为任何一对支持的语言实现这个功能都是一项挑战,因为智能助理需要执行与单语环境时相同的工作,但现在还必须另外启用 LangID。这不仅是一个语言识别系统,而是相当于两个单语言识别系统。

从双语支持到三语支持

本文由澳门新葡8455手机版发布于澳门新葡8455手机版,转载请注明出处:【澳门新葡8455手机版】谷歌(Google)双语助理来

关键词:

REx正式观测到Bennu小行星,探测小行星的前世和今

一九九两年十二月十日的夜幕,Bennu在出名的林肯近地小行星研商巡天项目LINEA奥迪Q5中被发掘,它的直径唯有0.5km左右...

详细>>

中原名片,人脸识别本事七夺世界亚军

原标题:《人民日报》《新闻联播》8月三连报,世界冠军智造“中国名片” 人脸识别技术七夺世界冠军 2018年是改革...

详细>>

基于深度学习的目的检查测量试验算法综述,目

原标题:干货 | 基于深度学习的目标检测算法综述 cs231n学习笔记-CNN-目标检测、定位、分割 目标检测(ObjectDetection)...

详细>>

她俩摊上如何事情了,一项新加坡人商讨被指违

原标题:发了一流随想,却被官方跨国手撕,他们摊上怎样事情了? 一项印度人探讨被指违反伦理准则 做了商量、发...

详细>>