让虚拟助手听起来像人对设计师来说是一个挑战


2008 年的电影《钢铁侠》中有一个场景,让我们得以一瞥未来人类与人工智能助手之间的互动 。在其中,托尼·斯塔克的虚拟助手贾维斯以讽刺和幽默的方式回应了斯塔克的命令 。
Siri 和 Alexa 等现代语音助手尚未提供如此自然、细致入微的社交聊天功能 。为此,我们在不列颠哥伦比亚大学的计算机科学研究团队调查了可能遗漏的内容 。
我们发现语音界面设计师处理了一个有趣的困境:提供社交对话和完成工作之间的紧张关系 。
友好还是高效?
【让虚拟助手听起来像人对设计师来说是一个挑战】语言学家将人类对话分为两类:社交对话,如问候、幽默和闲聊,用于表达社会关系和个人态度,以及“交易对话”,它传递事实或命题信息 。
人们可以毫不费力地以自然的方式将这两种类型的对话结合起来 。然而,这种神奇的融合是在某种程度上下意识的 。语音设计师通常无法找到理想的组合,因为这两种类型的对话是互补的,但也有冲突 。
当设计师创建语音助手来帮助用户完成诸如查看天气或预订餐厅等任务时,问题就变得明显了 。设计师试图通过社交礼貌来丰富他们的语音代理的对话,例如同情反应或闲聊,以增强自然性 。
我们的研究还表明,设计师在为有效的助手和和蔼可亲的伙伴设计之间找到适当的权衡时遇到了挑战 。一位参与者强调,添加的个性越多,对话时间就越长,并导致过于健谈或冷漠和机器人的语音代理 。
语音设计师的工具和设计指南支持有助于解决这个问题 。用于设计语音助手对话框的适当脚本工具应该可以帮助设计人员平衡权衡 。例如,高级对话创作工具可能会建议设计人员在脚本中添加友好的评论,或者如果社交聊天太长,也会发出警告 。
此外,设计指南应提供有关如何在不同情况下结合这两种类型的对话的说明性指导 。例如,语音助手应该只在检测到用户的语气心情好时才使用诙谐的讽刺 。
托尼·斯塔克和他的人工智能助理贾维斯在一个项目上工作 。
收集我们的情绪
为了通过语音代理提供自然的对话体验,苹果、亚马逊和谷歌等科技巨头需要收集大量关于用户对话上下文的信息,例如他们在哪里、他们做什么、他们想要什么甚至他们的感受. 事实上,亚马逊的科学家正试图根据我们的话语来理解我们的情绪 。
通过倾听对话,企业可以了解很多关于用户健康、财务和社交生活的信息 。用户是否愿意将大量数据提供给这些科技巨头,以提供更自然的语音代理对话体验?使用语音代理实现更合乎道德和理想的未来需要什么?
通过与语音助手的自然对话,我们应该能够轻松解锁尖端的人工智能技术,而无需经历图形用户界面经常经历的繁琐学习过程 。最近的技术进步,例如近乎人类水平的语言生成模型和语音合成的发展,预示着真正自然的语音代理的出现 。
在仁慈的助手和友好的对话者之间取得平衡是可以实现的,但需要更多的研究来为语音界面设计师提供更好的工具支持,并且需要用户共享他们的数据 。

    推荐阅读