ChatGPT及其超越:个性化UX/UI设计的下一代浪潮

Illustration by Joana Ricardo

在数字设计领域中,生成式人工智能作为一种变革性力量出现,有望彻底改变UX/UI设计师打造卓越用户体验的方式。这一令人瞩目的工具具备自主内容生成的能力,承诺自动化重复任务,促进创造性的共同创造,并解锁个性化、适应性和动态演化的用户界面。随着生成式人工智能的不断发展,它对UX/UI设计的影响有望超越界限,深刻地塑造数字互动的未来。

AI对UI模式的影响

在不断发展的UX/UI设计领域中,人工智能(AI)的融合带来了许多挑战和机遇。本文不是关于AI取代设计工具的论述,而是探索AI对UX/UI设计产生的重大影响。作为设计师,我们的任务是发掘有效的策略,利用AI的潜力来打造引人入胜且以用户为中心的数字体验。

Jacob Nielsen的预言性愿景预见到人工智能将在很大程度上塑造用户界面。这种即将到来的转变促使对几十年来支撑设计的UI范例进行全面重新评估。

了解这些范例的演化提供了宝贵的见解。让我们重新审视历史的进展。尼尔森的一句话强调了一个关键的转变:“用户界面将比以往任何时候都更加充满人工智能”。这种构造性的变化本质上改变了UX专业人员的角色。要全面理解这种转变,追踪用户界面范例的发展轨迹是至关重要的。

第一个范式可以追溯到批处理时代。电脑接收规范,经过长时间的处理后产生结果。

Image via effectrode

第二范式,即今天所主宰的范式,主要围绕命令式交互展开。用户发起动作,操作输出,迭代地朝向期望的结果驾驭。

Photo by freestocks on Unsplash

然而,人工智能的出现引入了一种超越简单指令式互动的范式。进入第三范式:基于意图和结果的互动。这种范式通过当代人工智能驱动工具得到体现,尤其在图像生成中表现得更为明显。考虑一下由人工智能驱动的图像创作过程,其中DALL-E启发的设计理念占据主导地位。这种方法将命令驱动的结构转变为更具对话性的接口。这种新接口思维的一个重要特征是在输入的核心引入一个提示。这其中蕴含着转变——用户角色的变化。

用户不再逐步指导,而是表达所需的结果。这标志着意图导向的结果规范的出现 - 第三个用户界面范式。

探索第三范式

为了深入探讨我们当前领域中的第三范式,让我们来看一个典型的例子:ChatGPT。随着ChatGPT的公开发布,内容生成和互动的新时代已经出现。虽然聊天机器人和数字助手的概念并不新鲜,但ChatGPT之所以与众不同的地方在于它能够向用户提供更个性化、更高质量的回应。这种卓越的能力已经促使许多平台抓住机会,整合生成式人工智能功能。

然而,这些应用中存在的一个普遍问题在于所采用的输入方法有缺陷。正如我们之前讨论过的,第三范式强调意图和预期结果。然而,当前应用主要使用聊天框方法与人工智能系统进行交互。以Bunq应用最近推出的Finn功能为例,它是一款银行应用中的人工智能助手。虽然Finn声称可以帮助识别消费模式和预算,但它似乎受到了聊天框交互方法的限制。

Finn promotionl material from Bunq.

例如,该功能可以通过将财务预测直接集成到应用程序中,而不仅仅依靠用户的查询来增强用户体验。聊天机器人设计通过限制自身于特定的交互方式,限制了生成式人工智能模型在提升应用程序个别方面的潜力。

另一个说明性的例子涉及在媒体中使用生成性人工智能。人工智能模型已被利用来创建图像和视频,揭示了意图和生成结果之间的摩擦。通过对这些模型进行实验,突显了上下文线索和知识在我们日常生活中的重要性。

例如,当我询问微软必应搜索生成一家以星战为灵感的咖啡馆图片时,最初的结果没有达到我的期望。

Initial Results from first prompt

随着更多的迭代和上下文信息,人工智能最终产生了更符合我的偏好的结果。以下是一些示例,更接近我最初给出的提示的内容。

Final results gathered from multiple prompt iterations

以我的观点来看,这个场景是聊天框交互方式的约束和生成式人工智能设计领域内当前的第三个困境的一个明显例子。生成的第一组图像是对我提供的提示的一个好结果,但它没有考虑到我的个人知识和偏好。

作为用户,我对人工智能将使用的工具集以及对我当前偏好和需求的理解一无所知。今天,我可能需要一种复古氛围,但在一年之后,我的偏好可能会改变并变得更新。这就造成了这样一种情况:随着我的知识和偏好的改变,但我最初的查询仍然相同,只是期望的结果不同。由于输入方式会引发用户对所希望得到的结果的期待,这种交互最终可能导致感觉来自所进行的交互的失望。

一种缓解AI对用户知识集理解问题的方法是允许用户向AI提供自定义数据,以便它们能够适应用户的偏好。OpenAI最近为ChatGPT添加了自定义数据集,这样它就可以在自定义数据集上具有基本的理解水平,但它仍受限于提供的理解水平。这也带来了与AI所训练数据集中的偏好相关的问题,为某些数据创建了偏好。在下一部分中,我们将讨论一些可以帮助挑战这一范式的方法。

重新思考人工智能交互

Adobe一直在探索各种方法来帮助设计师在Creative Cloud应用中生成内容。在Photoshop中,他们的方法是在文本输入框之前增加一层互动,允许用户选择特定区域,并指示AI在这些范围内生成内容,同时考虑现有的图像内容并根据提供的提示进行调整。

Adobe photoshop showcasing the generative fill feature. Image form Adobe

此选择菜单有两个目的:它可以将AI的注意力集中在图像的特定部分,提供更多上下文信息,并引导用户实现更具体的结果。

这些努力呼应着我们过去所遇到的类似人工智能整合的挑战。让我们想起了谷歌Lens,这是一个能够在现实世界中识别物体和文字的人工智能工具。在关于基于上下文的界面和人工智能的一次引人入胜的演讲中,Adrian Zumbrunnen谈到了在相机扫描和处理周围环境时如何保持用户参与的困难。他解释说,缺乏视觉反馈会让用户感到反应迟钝和困惑。

Visual lookup feature showing the white dots around objects being scanned. image from Google

尊布伦的解决方案是引入一个动画,将人工智能的物体识别过程可视化,让用户清楚地了解幕后发生的事情。这种视觉反馈促进了用户的参与,并鼓励他们更积极地与人工智能工具进行互动。我们可以尝试通过一些我们学到的教训来填补界面上人工智能的背景,以提供更多的上下文信息。这个例子凸显了在设计人工智能界面时考虑输入方式和用户意图的重要性。

我们可以从Spark AI中获得灵感,它使用户可以启动AI来协助撰写电子邮件。虽然实施仍然鼓励迭代方法并引入了一些不确定性,但它通过提供校对选项、回复长度和语调来部分解决了这个问题。这些明确定义的上下文要点有助于用户更加清晰地预测结果。

Spark AI feature list, Image via Spark

Google Duet AI(谷歌二重奏AI)是最近推出的,它为文字处理应用程序提供了类似的功能。然而,它仍然面临理解上下文细微差别的挑战。例如,当选择“使文本听起来更随意”的选项时,个人用户对“随意”可能会有不同的解释。这种缺乏共同理解会限制这些功能的实用性。一个潜在的解决方案是为每个选项提供更明确的描述,澄清它们的预期效果和可能的结果范围。

一个更有雄心壮志的方法是引入人工智能决策过程的视觉表达。观察人工智能“运作”(以可视化方式呈现)可以增强理解能力,并让用户更加感到对人工智能行动的控制感。在提供提示后展示图像生成或文本创作的动画可以有效传达人工智能的工作方式,并培养对其能力的信任感。

正如Zumbrunnen的研究所示,没有适当的动画,自动化和人工智能可能被感知为反应迟钝。他的研究表明,用户通常更喜欢动画而不是即时结果,因为它们提供了对底层过程的一瞥。

当前的人工智能实现在这方面往往存在问题,因为人工智能的决策过程通常涉及多个步骤。当用户无法理解这些决策以及如何影响它们时,互动就成了一个猜测游戏。缺乏透明度可能导致用户体验中的失望和不确定性。

Apple Visual lookup feature showing contextual information form the images. Image via Apple

Apple对人工智能整合的方法提供了宝贵的经验教训。他们的照片应用程序定期更新,添加了识别植物和洗衣指导等有用功能。Apple将这一功能称为“视觉查找”,它能够无缝地识别照片中的特定物体,如动物、植物和地标,并提供相关的背景信息。

与当前依赖聊天框的人工智能互动相反,视觉查询直接集成到照片应用程序中,无需明确的用户输入。人工智能的发现结果将在应用程序的“信息”部分展示,并附有对识别出的对象及其重要性的清晰解释。这种方法使用户能够轻松理解人工智能是如何得出结论的,并培养对其能力的信任。

结论

搭建用户与人工智能之间的桥梁需要多管齐下的方法,结合清晰的输入方式、人工智能过程的可视化呈现以及与现有工作流程的无缝集成。通过采用这些策略,我们可以创建更直观、更吸引人并更具响应能力的人工智能界面,从而提升整体用户体验。

2024-01-20 04:24:56 AI中文站翻译自原文