UE设计中未经审查的用户测试:如何以及为什么要进行测试

UE视界网    ()  ()

2019-11-16 23:57:34

运行未经审核的可用性测试的6个步骤是:定义研究目标,选择测试软件,编写任务描述,进行测试,招募参与者并分析结果。


许多UX团队依靠远程可用性测试来有效地从用户那里获得设计反馈。有两种类型的远程用户测试:


  • 适度的远程测试涉及研究人员通过远程屏幕共享软件与参与者会面,该软件使研究人员可以提供说明,实时观察用户与设计的交互,并针对该参与者的会话提出后续问题。

  • 无节制的远程测试不需要研究人员参加每个测试环节。取而代之的是,软件应用程序向用户提供指令,记录他们的行为并可能向他们询问预定的后续问题。

无节制的测试是否适合您的项目?

无节制的研究不包括研究者与研究参与者之间的任何直接相互作用,这既是他们的最大利益,也是他们最大的缺点。


由于无需与每个参与者安排单独的会议,因此,未经审核的测试通常比经过审核的研究要快得多。在短短几个小时内就有可能启动研究并获得结果。未经审查的研究还使您可以同时收集数十个甚至数百个用户的反馈。对于国际学习,您不必为了适应用户所在的时区而在不敬虔的时间起床。


但是,未经审核的可用性测试存在重要限制:


  • 没有主持人来解释和帮助参与者从原型的错误或局限中恢复过来,很难进行早期原型测试。

  • 在没有主持人的情况下,参与者往往在参与依赖想象力,决策或情感反应的任务中参与度较低,行为不太现实。

为了更好地理解第二个限制,例如考虑一下购物与购买之间的区别。购物可以包括许多不同类型的研究和比较-没有单一的“正确”方式来做到这一点。为了现实购物,参与者必须首先想象自己需要该产品,然后注意细节并进行比较。假装的参与者购物且动机不强的人通常只会看一些产品,然后迅速选择看似合理的产品。但是,在现实生活中,将自己的钱花在他们实际需要的产品上的消费者的行为截然不同。当然,经过主持的研究也不是完全现实的,但是由于参与者意识到主持人正在观察他们,因此他们会受到社会激励,以充分参与这项任务。因此,这种社会压力弥补了适度学习中缺乏个人动机的问题,甚至在面对面学习中更是如此。


未经审查的研究最适合评估实时网站和应用程序或功能强大的原型。它们适合于研究不需要参与者有太多想象力或情感的活动。


与温和的研究相比,无节制的研究甚至需要更加细致的计划,因为您不能依靠人类的判断来即时调整研究程序。对于未经审查的可用性研究,您需要执行以下所有步骤:

1573919691604_0.png

非节制的用户测试的6个步骤的列表:定义学习目标,选择测试软件,编写任务和问题,试点测试,招募参与者并分析结果。


1.确定学习目标和参加者招募标准

选择软件不应成为无节制研究的第一步。在决定使用哪种测试软件之前,您应该清楚地了解希望通过研究完成的工作。然后,您可以选择一种工具,该工具具有最适合您的研究目标的功能,而不是将研究限制在特定工具的技术约束之内。明确阐明的学习目标使您能够确定测试软件的必备要求。


1573919727490_0.png

每个研究的目标各不相同,而非常适合一项研究的工具可能对另一项研究根本无效。为了做出良好的工具选择,了解研究目标至关重要。


在此阶段,您还需要考虑要包括在研究中的参与者的类型。他们的人口统计应该是什么?他们需要放在哪里?他们会是您系统的新用户还是专家?他们会与您的目标受众中的特定角色或用户组匹配吗?这些问题通常取决于您的学习目标,也可以为您选择工具提供帮助。


2.选择测试软件

对于未经审查的研究,管理测试的软件对于获得有用的结果绝对至关重要。该软件必须  指导参与者完成整个会话并记录发生的情况。它还可以控制研究参与者的选择。


幸运的是,有许多不同的非调节测试服务可用,并且在不同的价格点具有不同的功能组合。众多选择意味着您现在可以在选择适合您项目需求的工具时变得更加关键。(许多未经审查的测试工具的功能和价格经常变化,因此请确保在研究时将其与您的需求进行比较。)


绝对值得您花时间进行彻底的调查和试验测试工具,因为由于启动研究后发现的技术限制,将研究迁移到其他系统并不有趣!(它们都没有试图集成由两个不同工具收集的数据。)


3.编写任务说明和后续问题

许多未经审核的测试服务都包含带有通用示例任务的研究模板。不要盲目地复制它们。您赋予参与者在您的站点或应用程序上执行的任务应高度适合您的情况。诸如“该站点的目的是什么”之类的通用任务不太可能为您提供深入的见识:要真正评估系统的可用性,您需要编写自己的任务。


根据我们  培训其他公司运行自己的远程可用性测试的经验,编写  任务是大多数研究人员无法  从研究中获得所需结果的地方。


要为无节制的研究编写好的任务说明,请首先阐明您希望用户完成的任务(例如:使用帮助部分来回答问题,升级帐户或保存文章以供以后阅读)。然后,描述与是具体的,现实的和可执行的指令目标 - 不包括暗示,使任务太容易了。根据您要进行定性研究还是定量研究,您将需要不同类型的任务说明。


在无节制的研究中,要让参与者进行的活动   比主持会议的  任务要更加仔细地编写。如果参与者不理解说明,则无法要求澄清;如果他们做错了事,您也不能要求他们再试一次。如果用户误解了您的指令并执行了错误的任务,则将浪费您的测试时间。未经审核的任务说明还应明确告知用户何时应停止;请记住,主持人不会在那里要求他们转移到其他任务。


您还应该精心计划任何后续问题。这些可能包括定量问题,参与者在其中对活动的主观难度或满意度进行评分。或者,您可以提出开放性问题,以提示用户描述体验的特定部分。仔细选择问题的表达方式;诸如“您将如何形容这个品牌?”之类的宽泛措词可能会导致未经审核的参与者谈论他们过去的经历,而不是他们刚刚使用的系统。


4.试验测试

试点测试是您在实际研究开始之前进行的一次试验,目的是发现研究设计或程序中的任何问题。试行测试对所有用户研究都是一个好主意,但对非审查性研究尤其重要,因为在研究运行时将没有主持人来解决问题。即使是最全面的试点测试也无法涵盖所有内容,但是您通常可以通过以下方法检测并解决问题:


  • 由于措辞含糊,人们误解的任务说明

  • 丢失或顺序错误的任务(尤其是在具有许多任务的复杂研究中)

  • 缺少研究所需功能或内容的原型

  • 不兼容性或技术限制会阻止您的测试软件捕获要记录的数据,尤其是在您尝试测试Intranet或本机移动应用程序时(如果测试软件通过Web浏览器扩展名记录数据,则浏览器或网站限制可能会阻止它捕获整个页面或网站,或导致难以分析的低质量记录。如果您是第一次使用测试服务,请在设置之前进行快速测试,以确保记录过程顺利进行。任务。)

您可以像参加研究者一样亲自进行研究,从而发现其中的一些问题,但是在您让真正的参加者使用自己的设备之前,其他问题不会变得明显。确保分析您的试验研究中收集的数据!


5.招募参加者

如果人们与您的目标受众不匹配,那么观看人们使用您的系统是没有意义的。通过筛选问题或招募自己的参与者,确保对谁参加测试有一定的控制权。


某些工具仅向来自其面板的参与者提供未经审核的用户测试,而其他工具将为您提供URL,以分发给您  自己的测试人员池。


使用提供的参与者面板既快速又容易(特别是如果您的产品与广大消费者相关的话)。小组参与者也熟悉研究软件,并且只要有时间就可以参加您的测试。几乎每个小组都包括一些基本的人口统计过滤,但是如果您使用参与者的行为问题而不是年龄或性别来筛查参与者,则大多数研究会获得更好的结果。如果您要测试的体验仅与满足特定条件(例如定期开车或网上购物)的人有关,请确保使用允许您编写自己的自定义筛选问题的工具。


使用小组成员的不利之处在于,许多研究如此频繁地进行,以至于他们学会了专注于设计的某些方面并寻找需要批评的东西。为了补偿可能的“专业测试人员”,请招募更多的参与者,并从似乎没有诚实参与活动的人员中排除数据。


在线意味着您可以像在街道另一侧的人一样轻松地测试地球另一侧的用户。现在,许多无节制的测试服务都有专门小组,其中包括来自世界各地的参与者。如果您的站点面向  国际客户,那么进行无限制的测试是到达各种各样的位置的好方法。请记住,如果您招募参与者以其他语言完成测试,则还需要精通该语言的研究人员或翻译人员来解释结果。


综上所述:


  • B2B网站,以精英或富裕客户为目标的网站以及其他目标受众较窄的服务通常无法使用面板,必须自己招募测试参与者。

  • B2C网站和其他面向广泛受众的服务通常通过使用面板来获得更快,更便宜的结果。

  • 您不一定总是需要最大的专家组,但是如果您需要来自特定地区的用户,则某些专家组可能需要很长时间才能完成学习。(如果您确实需要特定的受众,请事先与测试服务或小组经理讨论您的要求,如果他们不确定是否可以这样做,请考虑使用其他服务。)

6.分析结果


无节制的研究可以快速积累很多数据,因此您需要一种组织化的分析方法,才能将这些数据转化为有关设计的可行见解。


如果您收集定性数据,例如参与者行为和评论的视频和音频记录,则需要查看每个会话记录。用户的口头和书面评论可能会误导您,因此您必须注意他们的行为,才能了解什么有效或无效。在主持的研究中,您可以与参加者一起进行活动,但在非主持的研究中,您需要随后能够观看录音。


屏幕录像很有用,但是在没有音频记录的情况下,很容易错过  为什么会发生某些行为。如果屏幕上什么都没有发生,是因为参与者正在阅读,还是她在考虑下一步单击哪里?参与者表达自己的行为的录音   非常重要。(录制参与者的网络摄像头以捕捉他们的面部表情也很不错,但不是必须的。招募拥有网络摄像头并愿意录制的参与者可能会更加困难,因此将其作为次要条件。)


在每个记录中,您将要确定问题,问题以及对设计的正面和负面反应。如果您只需要查看几条记录,则此过程可能会相对较快,但是对于有数十名参与者的大型研究,视频分析变得非常耗时。如果您希望分析大型研究(或进行多个不同的小型研究),请寻找一种非调节性的测试工具,该工具可提供强大的视频分析功能,尤其是:


  • 观看时使用带时间戳记的笔记标记视频

  • 汇总,导出,共享和可视化您添加到录音中的笔记

  • 制作短片或突出记录重要时刻

当然,即使此功能不是内置于未经审核的测试工具中的,您也可以做笔记和视频剪辑,但是包含这些功能的未经审核的测试服务不一定比缺少这些功能的准系统工具花费更多。如果您要分析几个小时以上的录音,那么值得花一点钱来购买一个可以加速数据分析的工具。


对于非常大的定性研究,请考虑可以收集一些定量指标或提供自动转录的工具。这些功能并不需要消除对录音的仔细检查,但是通过将您的注意力转移到可能很重要的特定录音上(例如用户满意度较低的录音或使用特定关键字作为录音的录音),它们肯定可以加快流程。提到)。


如果您的研究主要是定量的,则您的分析将大为不同。学习工具会自动收集成功率,任务时间和主观评分等指标。但是,要确保您的结论正确无误,您需要查看数据并:


  • 通过识别并排除不正确的值来清理数据。例如,如果几个任务时间比其他任务短或长得多,请调查原因,并在分析中排除异常值(如果由于参与者未完全完成任务或执行错误任务而导致值不准确)。

  • 执行统计测试以评估结果的重要性(尤其是当您的目标是比较多个设计或任务时)。

  • 生成数据可视化以帮助将您的发现传达给其他人。

一些未经审核的测试工具可以自动排除异常数据点,并且许多工具具有内置的数据可视化图表。但是,由于千篇一律的图表并不总是显示出最重要的结果,因此,如果您打算进行定量分析,请确保您的工具具有导出数据的功能,以便您可以使用Excel或专用统计软件执行自己的分析。


责任编辑:网络UESJ网:   UE视界网,未经授权不得转载
关键词 >> UE设计

还可以输入0个字

(审核后展示)
打开目录