UE设计中智能助手的悖论:可用性差,采用率高

UE视界网    ()  ()

2019-11-28 02:06:19

Siri,Alexa和Google Assistant的经常用户报告尝试进行低复杂度的任务,例如简单的事实检索,天气预报,导航,播放音乐,设置计时器。


当我们最近测试 Siri,Alexa和Google Assistant等智能助手的可用性时,我们发现与这些代理的交互存在许多问题,从对命令的理解不充分到语言输出的固有限制。


尽管存在这些问题,基于语音的助手却越来越受欢迎。皮尤研究中心(Pew Research Center)的数据显示,2017年,有46%的美国成年人报告使用语音控制的数字助理。最近,当我们要求211名每天使用智能助手的用户回想上一次与助手互动时,最能描述他们的成功经历,并且许多人对助手的出色表现充满热情:


“我定期与Google Assistant交流,每天,每天都在使用它。我相信这是创造出来的最好的东西之一。我就是喜欢它,我离不开Google Assistant。”


“ Siri绝对非常有用。我每天都会多次使用它。我一天可能会使用30次。我所做的一切基本上都是通过Siri进行的,我对此感到不满意。”


“我爱我的Alexa。”


显然,我们观察到的可用性问题并没有阻止人们使用智能助手。为了了解尽管这些系统的可用性很差,用户仍将如何做出积极反应,我们查看了语音助手的高频用户以及他们在帮助下通常执行的任务。


智能助手的当前用法:用户研究

我们邀请有兴趣参加有关智能助手的研究的人员回答有关其使用此类界面的一些问题。在回应我们电话的464位用户中,有211位是Siri(72),Google Assistant(手机上为57位,智能扬声器上为22位)或Alexa(60位)的日常用户。


在本文中,我们重点关注受访者对一个关键事件问题的答案:告诉我们您上次使用您的[智能助手]的情况。你想做什么?成功了吗?用户上传了自己的视频,回答了这个问题。除了回答实际问题之外,许多人还提供了有关他们通常如何使用助手的其他意见。


任务类型

尽管将代理人奢侈地描述为“管家”或“最好的朋友”,但最常使用的用户并没有使用智能助手来完成人类助手可以做的所有事情。相反,他们有选择地将某些类型的任务分配给其助手。


人们报告的最常见 的单一用途是简单的信息检索-琐事,单词含义或事实,例如度量转换,体育统计和地理。接下来最常见的用途是检查天气并与人沟通(通过打电话,发短信或通过电子邮件发送)。

1574877888213_0.png

该图显示了与当今助手一起完成的常见活动:信息检索40%,天气29%,通信29%,播放音乐或播客22%,方向19%,计时器或警报16%,提醒11%,物联网控制9%,建议目的地8%,新闻7%,计划5%,将商品添加到列表中5%,电话控制4%,流量3%,游戏2%,购物1%,想法1%和交易1%

此图表显示了报告每个特定活动的每日助理用户的百分比。(这些数字很可能是下限,因为有些人可能没有提到他们从事的所有活动。)

助手的一个显着用途是用于智能家居设备或设备的语音控制-电灯开关,电视系统,恒温器或具有“物联网”连接的门锁。约9%的用户报告了一项此类活动(归类于IOT控制下)。


少一些常见的任务包括获得配方创意(分类为Idea),关闭电话上的应用程序或控制电话音量(分类为Phone control)以及玩游戏(尤其是使用Alexa)。


人们喜欢(或不喜欢)助手的原因既支持可用性的重要性,又解释了为什么尽管当前的可用性存在局限,许多用户还是如此看重助手。这些原因包括良好(或不良)的语音识别,良好(或不良)的结果准确性和效率(与打字相比)。但是,迄今为止,人们最常提到的使用语音助手的功能是可以免提交互(主要是在开车时),每天有35%的用户注意到了这一点。免提操作的高价值表明,语音助手需要达到的性能水平目前非常低:实际上并不需要良好的可用性,它只比获得交通票证或获得交通便利性要少一场车祸。(对于电流可用性差带来的认知负担实际上会减少驾驶员的注意力,从而防止发生事故。但是对于人们喜欢UI的人来说,即使它确实很危险,也足以相信它是安全的。)


本质上,现在,人们仅在最忙的时候才使用智能助手来完成最简单的任务。而且,他们经常重复执行这些任务,每天早晨检查天气,或者每天使用几次音乐命令-意味着这些简单的任务在与语音助手的互动(以及与之相关的印象)中占很大比例。


低复杂性的常见任务

在其他地方,我们确定了智能代理的五个特征,这些特征为这种新的交互方式带来了希望。它们是:语音输入,自然语言,语音输出,智能解释和代理。我们的可用性研究表明,当今的语音助手离在这些方面做得体面的工作还很遥远。


最常见的辅助任务都使用语音输入,但是由于它们仅由一系列高度可预测的命令和步骤组成,因此它们很大程度上绕过了其他要求。


例如,当前的语音助手擅长告诉您当前位置的天气预报,这是大多数人每天都要检查的内容。但是,在此任务上的可预测性变化甚至稍差一些,例如“秋天伦敦的天气如何”或“星期五自由女神像的天气如何”在Siri和Echo上失败了。(获得指导确实包含多个步骤和丰富的信息,但是这项任务得益于数十年来在优化导航向导方面的投资。而且,获得指导仍然受到很大限制:例如,当今的助手无法在给定的时间开始指导或以考虑在拼车车道上行驶。)


任务所需的步骤数量是语音助手成功完成任务的可能性的主要决定因素。根据复杂程度,任务可以分为四类:


  • 简单的动作需要一步或简单的动作才能完成。例如,调高亮度,设置计时器。

  • 多步骤任务类似于网站或应用程序中的交互流程。他们需要经历几个阶段才能完成一个过程。示例包括致电优步或下订单(如果您已经知道要购买的商品)。

  • 多任务活动涉及使用多个活动和应用程序来实现一个目标。一个示例是为尚未阅读其电子邮件的人创建电话号码列表。

  • 研究活动需要汇集多种信息来源和分析选项。例如,根据一组标准寻找城市中最佳的酒店选择就是一项研究活动。

人们大多要求他们的代理人只一步一步地完成任务。我们有26%的参与者使用语音助手来完成多个步骤的任务,但这主要是获得指导。其他多步骤任务,或者将多个任务组合在一起或需要不限成员名额研究的更复杂的工作,已经很少见了。人们甚至没有尝试使用语音助手来满足这些需求。而且,没有关于使用智能助手进行研究活动的报道。

1574877936913_5.png

该图表显示了报告任务为单一操作(86%),多步(26%),多任务(1%)或研究(0%)的用户百分比

该图显示了报告各种复杂性的助理相关任务的用户百分比。大多数用户提到了单步任务。一些相关的更复杂的多步骤任务,没有人报告我们最高复杂度的任务。(数字总计超过100%,因为某些用户报告了不止一种类型的任务。)

任务所需的知识

智能助手的一个关键功能是他们能够推断用户目标并了解上下文的能力。这项活动需要有关世界的知识以及有关用户的知识。我们根据参与者需要的信息类型分析了参与者报告的任务。

1574877960238_4.png

该图表列出了执行需要不同类型信息的任务的用户百分比:Web 64%,当前位置45%,无31%,联系人22%,音乐22%,其他个人数据11%,过去历史记录1%

该图表显示了召回需要各种信息的任务的用户百分比。大多数任务涉及Web内容和一些基本个人信息(例如当前位置和联系人)。

大多数任务涉及可在Web上免费获得的内容。完成任务所需的下一个最常见的信息是用户的当前位置。其他类型的个人信息(联系人,日历)也很重要。大约31%的任务根本不需要任何信息。只有1%的任务涉及更复杂的知识类型,例如用户与系统的先前交互(例如,获取停车位,订购常用的洗衣粉或更改亚马逊订单)。


结论

智能助手的可用性挑战是真实而普遍的。用户并不会受到它们的影响- 通过将其使用限制为简单功能的子集来避免使用上的痛苦,这些功能受语言理解能力差,无法访问复杂的个性化信息或缺乏真正智能的影响最小。


这与早期Web的状态非常相似:2000年,使用新网站的成功率为 61%,而2010年为78%。这是一个快速的进步,与其他人类努力领域相比。尽管如此,在2000年,人们尝试网络上的新内容时仍然会失败39%。结果,用户将大部分时间都花在设计高于平均水平的熟悉的网站上,与在开放式网络上冒险相比,他们获得成功的机会要高得多。2000年的整个网络非常糟糕,但是每个用户实际体验到的Web用户体验要好得多,因为在新站点上尝试执行的任何给定用户任务的百分比都非常低。可用性低导致人们停留在已知的草皮上,很少流浪。


目前,能够“免提”使用设备的好处超过了可用性差的烦恼。即使是几乎无法使用的基于语音的助手,其速度仍可能比驾车时停下来或用手洗食物要快得多,以便使用触摸屏。但是,随着这些代理的发展,可用性将逐渐成为一种竞争优势-尤其是在助手与设备无关的情况下(您已经可以在iPhone上使用Google Assistant)。正如2007年推出iPhone时所看到的,如果有选择的话,人们会蜂拥至解决可用性问题的系统。


平庸而又受欢迎的助手的一大风险是,他们会塑造人们的思维模式和期望。现在,人们正在学习“智能”助手实际上并不那么聪明,他们可能会基于这些形成性的经验来对未来的期望和使用。如果助理确实变得更聪明,更有能力,那么这些以前的用户体验很可能会阻止人们尝试使用高级功能。


责任编辑:网络UESJ网:   UE视界网,未经授权不得转载
关键词 >> 人机交互,UE设计

还可以输入0个字

(审核后展示)
打开目录