所有讨论都涉及自然语言处理并能够与谷歌Assistant进行对话


我与Google即时的语音命令(或现在称为Google助手)之间存在一种讨厌的关系 。我喜欢一天之内可以做什么的想法,并且喜欢它工作时可以做什么 。如果可行 。仇恨就在其中 。那样的延迟 。在说“ Ok Google”和继续执行命令之间不自然的半秒间停顿 。半秒钟的停顿使我最喜欢的自定义激活想法成为了Moto X Play几乎无法忍受实际使用(我个人是“ Would You Kindly”,“ Hello Moto”和“ Bridge to Engineering”的粉丝,但停顿使它们全都停滞不前) 。
Google即时语音徽标确定Google助理半秒的停顿通常足以打破您的讲话模式,也足以阻止您正常说句子 。它改变了从命令“本Weeknd劳驾播放音乐”到“本Weeknd拜托...播放音乐” 。它迫使您犹豫,有时甚至把您甩在后面的句子中(导致偶尔的命令混乱) 。
暂停一下是Google助手的主要问题 。尽管所有讨论都涉及自然语言处理并能够与Google Assistant进行对话,但它们几乎没有空间给您进行自我纠正 。如果您的脑海中没有一个完整的罐头和练习好的电话线,如果您说错了一个字是因为您被暂停拖延了,如果您说错话,如果您犯了常见的会话错误,或者您做错了什么,它可以并且将给您不正确的结果 。
如果我知道它有一个错误,我的第一个直觉是去尝试纠正它(“我的意思是……”),但是你不能只跟它谈谈 。如果要进行更正,则需要首先使用激活命令(即使这样,有时还是成功的),我可以坦白地说我从未记得这样做 。现在,这不仅超出了延迟,而且Google声称他们正在努力,但是Google Assistant仍有很长的路要走 。
如果保持一致,停顿不会那么糟糕 。暂停的最大问题之一不是暂停本身,而是有时快多少,有时慢 。如果您使用的是坚如磐石的网络连接,那么它可能足够快,您只需在激活短语之后继续进行通话即可,但是如果您使用的网络很慢,天哪 。如果您的网络连接速度很慢,则可能要等待几秒钟才能开始识别任何内容 。现在由于没有发出蜂鸣声而加剧了这个问题 。我完全理解为什么删除了蜂鸣声(为了与普通语音对话与Google Assistant对话,以使经常说话的句子成为可能),但还没有完全解决 。将来可以通过在本地处理更多的转录来解决此问题,但现在非常令人沮丧 。
Google Home Google Assistant功能图片通过蓝牙使用“ OK Google”仍然很痛苦 。不仅上述滞后现象仍然存在,而且蓝牙连接本身还会遇到其他滞后现象,具体情况因设备而异 。在某些设备上,延迟非常低,可以轻松使用Google 。在其他车辆(例如我的汽车)上,时滞如此之长,以至于您在播放音乐时尝试使用它,它将在音乐播放完毕之前停止收听,并且您会听到“ Google Now就绪”的提示音(蓝牙仍然存在)连接) 。实际上,我很惊讶他们没有在蓝牙连接上使用蜂鸣声来帮助标记录音的开始位置(并确保录音不会过早超时) 。这将是一个相对简单的添加,并在使蓝牙更容易使用OK Google方面大有帮助(特别是因为它可以让电话保证扬声器停止播放音乐,从而减少背景噪音) 。我也有一些蓝牙扬声器,好吧,谷歌似乎根本无法使用(除了激活短语之外),但是我还没有机会测试导致该问题的原因,所以我真的不能怪Google 。
Google一直试图解决此问题已有一段时间,而Google Home是其最新尝试的一部分 。他们正在尝试通过Google Home与Amazon Echo竞争和他们的Alexa助手(与Google当前的实施方式相比非常流畅),说实话,在演示中看起来非常可靠 。是的,这是一个安静的房间,命令相对简单,可能具有出色的Internet连接,但是Rishi Chandra与Google Home交互时听起来比较自然 。停顿似乎是他常规讲话方式的一部分,而不是他需要考虑的额外内容 。老实说,谷歌已经解决了这个犹豫不决的问题,这让我激动 。不幸的是,随后出现了广告位,幻觉崩溃了 。
亚马逊Alexa Echo和Echo Dot演员们没有Rishi平静的节奏 。他们用正常的声音说话,顿时,钟声响起了 。可能只是因为与Rishi的对比,但停顿明显 。他们足以阻止它成为一个流畅的句子 。他们让它感到脱节(这仅仅是听句子,更不用说了) 。
而且,这甚至还不包括在商业广告期间屏幕底部有很大的
我认为在这一点上确实需要强调的是,Google Home的主要竞争对手Amazon Echo的运作非常灵活 。激活短语与其开始聆听之间的停顿不仅很短,而且几乎没有引起注意 。至少从步调的角度来看,Amazon Echo确实可以说是自然的句子 。这并不完美,Amazon Echo肯定会继续取得实质性的进步,但是在这个特定领域,他们目前在Google方面遥遥领先 。
我对Google Assistant仍然感到很兴奋,迫不及待地想看看物联网如何发展 。助手(通常是Google的标志性声音)的发音方式以及通过跟踪对话而表现出的人性化方面肯定有令人印象深刻的波兰语 。但是,当涉及到实际操作时,用户既不能像与他人进行交互那样人性化或顺畅地进行交互 。也就是说,我认为Google需要解决的一个关键问题是,要真正将人工智能作为输入输出助手来销售 。
【所有讨论都涉及自然语言处理并能够与谷歌Assistant进行对话】

    推荐阅读