UE设计中个性化建议:用户的期望和假设
用户喜欢个性化的内容建议,并愿意在接受一些不正确的建议的同时放弃一些隐私以获取质量建议。
20年前,雅各布·尼尔森(Jakob Nielsen)认为,个性化被高估了,主要是因为技术还不够先进,无法为用户关心的内容提供良好的预测。快进到今天,并且(如他所预言的)个性化已成为网络上的一种增长趋势。个性化的个性化,而不是基于角色的个性化,是指剪裁内容和功能,以特定的用户,根据收集到的关于该用户的偏好和行为数据的做法。
尽管个性化用户界面可以包括从命令快捷方式到配色方案的任何内容,但是个性化个性化的一种特别有用的形式是在网站和移动应用程序上使用推荐。推荐产品或内容项在电子商务网站,社交媒体,新闻网站以及流视频或音乐服务上特别常见,但也可以在其他类型的网站上找到。因此,尽管YouTube之类的服务可以提供数百万个视频,但根据该用户收集的数据,当访问该网站的首页或观看视频后,任何给定的用户只会看到少数推荐的视频和频道。
个性化推荐可以基于机器学习或其他人工智能技术,来自用户的明确定制指令或两者的某种组合。
为了深入了解用户对网站上提供的多种个性化推荐类型的期望和心理模型,我们与美国各地的8名参与者进行了远程审核的可用性研究。在每次会议中,参与者都在2至3个拥有帐户的网站上完成了主持人分配的任务,并在访谈中回答了与建议有关的问题。
我们的研究参与者对网站通常跟踪其浏览模式,购买历史和其他数据源以呈现个性化建议的事实感到非常满意。总体而言,这些建议受到赞赏,并被认为有助于缩小站点上的可用选项。为了获得这种好处,用户愿意牺牲一些隐私。他们希望对他们的许多行为进行跟踪和分析。
通过推荐策划
在我们所有的研究参与者中,对建议的反应都是积极的。根据他们的兴趣精心挑选的建议项目帮助他们避免了选择过多和“过筛”,从而更快地找到了感兴趣的项目。
“ [推荐很不错,因为它们没有],使您在实际找到所需的东西之前先装载了很多产品。它们显示您可能真正感兴趣的事物,然后您只需在其中进行选择即可。我认为这很好。”
“我一直都在使用丝芙兰。我使用该应用程序,移动网站和计算机网站。我觉得,就像Google会审视自己所看到的一切,然后为我自定义广告一样,我认为如果丝芙兰做到这一点真的很棒。...这样对我来说将是个性化的,这真是太棒了。这样可以节省大量的滚动。”
“我真的很欣赏它可以让我发现自己喜欢的事物之外的其他事物的方式,而我可能不会自己发现这些事物。……我并不总是有耐心去听一堆我不确定自己会喜欢的东西,仔细地筛选并找到我会喜欢的东西。因此,如果Spotify可以为我做到这一点,那就太好了。这就是为什么我也第一次尝试Stitch Fix。我有点喜欢购物,但是我不喜欢,“哦,我需要一条黑色的裤子,所以我将整理成千上万的黑色裤子,尝试找到适合我的一条。” 当我可以回答一些问题,然后让Stitch Fix变得像“这些很好的裤子时,您可能会喜欢它们,它们在您身上会看起来不错”。这需要做一些移开视线的工作,并为您提供“您可能会喜欢的东西,试一试。””
就像来自一位熟识您的朋友的个人推荐一样,这些个性化建议比一般的推广内容更加权衡并被认为更相关。当给予一项开放式任务来浏览他们感兴趣的内容时,参与者会偏向于这些推荐的项目(当他们可以找到它们时)。
“我认为,对我而言,首选产品与我喜欢的事物类型有更多的相关性,在这里流行才是其他所有人所喜欢的。……可能流行的东西对我来说并不是很吸引人。这就是为什么我通常从我的首选开始。”
对数据收集和隐私的期望
当被问及使用什么信息来生成推荐时,人们的想法就相当合理。以下是提到的可能的数据类型,这些参与者对列出的首位最有信心:
历史记录-过去的购买(在电子商务网站上)或消费的内容(例如观看的视频,在内容服务上播放的歌曲)
用户输入的个人资料数据,包括年龄,性别和位置等人口统计信息,以及兴趣类别或特定于网站上下文的其他信息
等级
保存或“收藏”的物品
浏览行为
搜索历史记录
“我真的不知道如何选择其中一些。它中的大多数似乎都是正确的,所以我想这将取决于我的购物习惯:我点击的东西,我喜欢的东西和我购买的东西。”
尽管有几个用户赞赏他们无需进行购买即可从个性化推荐中受益,但大多数用户希望他们的直接活动(例如过去的购买,已保存的商品或输入的个人资料信息)比简单的浏览更为重要。他们认为并非所有单击的内容都与其相关,并且不希望该浏览活动歪曲将来的建议。
“有时候我点击某个东西是因为我认为它会很棒,然后我阅读了评论或……就像我看着的那个闪闪发光的面具一样,我对我的“推荐给你的东西”毫无兴趣。但是,我添加到“收藏夹” 列表中的东西,过去购买的品牌,我绝对希望在“推荐给您”中看到更多这些品牌和那些类型的产品。”
用户认为一些建议不仅基于他们的直接或间接活动,而且还基于识别相似用户或与他们感兴趣的项目相似的算法。
“他们也许有某种算法,例如'如果你喜欢这件黑白格子的纽扣衬衫,那么你就会想要其他黑白格子的东西或其他纽扣衬衫',就像那样。”
“显然,他们有一些基于大量不同数据的算法。我假设它是基于我个人对Netflix的使用以及我一直在观看的内容。而且,可能是非个人的,意思是基于我的年龄,性别等。”
我们的研究中没有一个用户过分担心隐私(也许部分是由于我们测试的网站的无害性质),尽管一些用户认为“其他人”可能会感到担心。对于这些参与者来说,跟踪其网站使用情况被视为现状,而仅仅是使用Internet和生活在现代世界中的副产品。获得量身定制的内容带来的好处胜过任何隐私问题。
“我知道很多人反对[跟踪],但这是一种美容产品,所以我不在乎。”
“ 我已经辞职了,因为我不认为我会在不久的将来停止使用Internet。我就像,嗯。”
“这让我有些困扰,但是我知道这就是世界上的事情,它们不会改变。…这只是您对世界技术以及其他所有事物的期望。但这并没有像某些人那样困扰我。”
“我认为这很酷。我的意思是,如果公司或某事试图赶上下一步,有些人可能会感到害怕。但是我的意思是,他们总是通过Pew的研究和类似的东西来做到这一点。我认为这很好,这表明该公司正在努力提供最好的服务。”
判断通用内容还是个性化内容
随着个性化内容的日益普及,人们如何确定某项内容是否适合他们?毫不奇怪,我们的研究参与者主要依靠明确的标题(例如,推荐给您, 因为您观看了)。除了这些明显的指标之外,还可以使用间接线索(例如,所建议的项目的整体受欢迎程度或对促销的潜在商业兴趣)来确定该项目是否为个性化推荐。
亚马逊主页部分的屏幕截图
Amazon.com:使用“您”一词的标题是个性化内容的清晰标记。
服务的结构在用户是否希望为其量身定制内容方面起着重要作用。Hello Fresh餐点服务的用户不相信每次装运的餐点选项都是他自己的,即使他将某些食谱标记为有趣的,因为该公司将不得不做太多的工作才能为每个客户提供个性化的食谱。
浏览Netflix的用户质疑在首页顶部横幅区域中推广的节目是否对他个人化。经过深思熟虑,他确定Netflix有明确的商业理由来推广该节目,因此该内容很可能会呈现给所有用户。
“当我进入主屏幕时出现的第一件事是橙色是新黑色。我不确定每个人是否都一样。…也许新赛季刚到,这就是为什么它来了,每个人都看到了吗?或者,也许是因为我在他们试图说“你为什么不看更多的东西?”之前就已经看过它了?…我猜每个人都可能看到它,因为它可能是一个新的季节发布。观看第6季现在说。因此,我确定Netflix正在努力推动自己的原创节目。”
Netflix主页的屏幕截图(已登录)
Netflix:一位用户不确定在顶部横幅区域中显示的节目是通用促销还是个性化内容。他认为,最近发布的新赛季有足够的商业理由,因此可以保证它是通用促销活动。
在感知一段内容的普及也被用来作为判断内容是否是个性化的一个线索。我们的参与者倾向于假设向所有人展示了时尚或谈论话题的物品;相反,利基或不太主流的内容更有可能被判断为特定于个人,因为内容显然与用户的过去行为相关。例如,Eventbrite用户不确定网站上显示的食物和饮料事件是否是个性化的:尽管她经常参加此类事件,但她认为其他所有人也是如此。
“也许,再次,根据我的搜索和东西,这就是他们认为我会发现最有趣的东西,或者,'我们可以根据您的历史告诉您您对此最感兴趣。” 但是我也认为这是人们发现有趣的普遍现象。”
同样,Hulu用户不确定自己在首页上看到的医疗剧是很多人喜欢的热门节目还是根据自己帐户的过往行为制作的个性化内容(他提到母亲有时会在帐户上观看这些节目)当她来拜访时)。相反,他认为所展示的幻想剧很可能是个性化的,因为他认为这些剧不那么受欢迎。
“我确信这些类别在某种程度上是自定义的。我认为电视幻想剧对于大多数人来说不是很普遍,而且这些节目都不是我现在听到的人们正在谈论的节目。因此,我确信这些与我一直在看的电影有关。”
Hulu页面部分的屏幕截图
葫芦:我们的研究参与者认为,根据他的个人兴趣来显示网站上的电视幻想剧,因为他认为大多数人都对此类节目不感兴趣。
精度取决于活动水平,受技术限制
我们研究中的用户非常宽容错过该建议的建议。网站的许多新用户或不常使用的用户评论说,在没有足够数据的情况下,他们并不希望该网站对自己的兴趣做出准确的预测。我们的参与者承认,当多个人共享一个帐户时,推荐系统通常很容易歪斜,因为系统需要容纳多个竞争的数据源。
“我也意识到,如果我注册(参加某个活动)却不参加,或者如果我不经常使用该网站,那么他们就没有很多数据可以解决。”
“一旦您开始看更多电影,我认为推荐的建议对您会更好。这种类型的东西一旦您使用得越来越多就会变得更好。它会从您的工作中学习,然后显示您可能更感兴趣的事物。”
“这个Hulu帐户说明我和我的配偶都使用了某些节目,“ Top Picks for Me”对我来说可能不那么具体。…很多这样的节目,我不会很快就点击。”
此外,用户期望推荐系统不完美,并且偶尔会出错。电脑不是读者的介意,而且预计不会很快出现。
“我还知道这不是一个完美的系统,因此我对此的期望有所降低。即使我的Spotify帐户只是我的帐户,我也不会期望自己会喜欢它为我挑选的每一首歌曲。有时它不知道为什么,有时由于与之相关的个人记忆而喜欢一首歌,而Spotify永远也不会理解。
不好的建议很容易忽略
用户并不介意无趣的建议,而只是继续浏览他们关心的项目。即使在提示您调查是否存在隐藏或消除不良建议的方法时,许多人仍表示他们不会考虑这样做。对于我们测试的大多数服务,针对不理想的建议提供反馈的交互成本过高,因此不值得-忽略一个糟糕的建议并继续滚动比寻找如何标记该建议要花费更少的工作。无关紧要。
“这不是真正让我感到生气或感觉像的东西,'哦,Eventbrite并不真正了解我。' …… 这就是我要滚动过去的那种类型。”
Eventbrite主页的屏幕截图
Eventbrite:用户认为不受欢迎的推荐事件是无礼的,并且容易被忽略。她不想花力气向网站介绍自己的喜好。
使用频率不会影响用户对无趣的建议的容忍度。人们期望随着个人的推荐会随着时间的流逝不断改善,因为他们继续将数据输入到推荐系统中,但是他们仍然很容忍不好的建议。
但是,对于那些主要提供个性化内容或实物商品的服务,人们愿意甚至驱使与系统进行交互,以帮助该服务更好地了解他们。这是因为不良推荐的成本(例如,运回一箱不需要的物品)比培训推荐系统的交互成本高得多。
“ 在[Amazon上]主页的上下文中,我[关心[良好的推荐]]比[关注来自诸如Spotify或Stitch Fix的质量推荐]少。因为从某种意义上来说,借助Spotify或Stitch Fix,我得到了这些东西。我在管理自己是否喜欢所获得的东西方面投入了多少精力,这决定了我所获得的东西会变得多么好。而对于Amazon,它不会自动将第一页上的内容发送给我,这只是寻找我想要的东西的起点。”
StitchFix帐户页面上的评级工具屏幕截图
当个性化的准确性很重要时(例如,为您提供您认为会满意的物品运送服务),用户愿意花费精力与网站进行交互,以帮助其了解自己的偏好。在Stitch Fix上,用户喜欢“告诉我们有关您的款式” 功能,他们可以通过拇指向上或向下滑动项目来改进以后的服装发货。
这一发现对推荐引擎的选择有影响。假设您正在运行的流媒体视频网站的页面布局仅允许向每个用户显示两部推荐的电影。您可以在两种推荐算法之间进行选择:算法A选择两部电影(在您测试的用户中平均),两部电影观看完电影后,其观众满意度在0-100范围内得分均为80。相比之下,算法B选择两部平均得分分别为90和50的电影。因此,在情况A中,用户对推荐电影的平均满意度为80,而在情况B中,平均用户满意度仅为70。但是,算法B更好选择是因为用户不会介意一些不好的建议(在这里,他们只获得50分的电影),但对最终实际观看的一个建议(90分而不是80分)会更满意。
与用户体验的大多数其他方面一样,用户对您网站的期望也取决于他们对其他网站的体验。因此,如果或当主要站点提高其推荐的精度时,用户对不良推荐的容忍度可能会下降。
结论
跟踪网站使用情况以呈现个性化内容并不被视为对许多用户的侵犯隐私,至少对于用户选择创建和维护个人帐户的服务而言。
相反,个性化(例如个性化的推荐)被视为一种功能,这表明网站试图通过帮助他们缩小要考虑的选项总数来更好地为他们的用户服务。可怜的建议很容易被忽略,或者,当获得好建议的好处是足够强大,用户可以甚至愿意与现场要微调未来的建议进一步参与。
显然,个性化不再被高估。
还可以输入0个字