
多年來,用戶體驗團隊一直依賴用戶旅程地圖(一種標準的設計思維工具)來可視化和傳達用戶的意圖、行為和流程。我們繪制了用戶在各個界面步驟中的目標和情感,追蹤了從發現到轉化或任務完成的路徑。這些地圖假設用戶旅程的進展基本呈線性:一系列可見的屏幕、結構化的任務以及用戶做出的深思熟慮的選擇。
但在人工智能驅動的系統中,這些假設開始瓦解。步驟變得不可見。目標在過程中不斷演變。系統不再等待命令——它會推斷、提出建議,甚至采取行動。隨著人工智能承擔起更多責任,我們熟悉的用戶流程架構開始瓦解。我們曾經稱之為“旅程”的東西開始變得更像一場對話,或者更準確地說,一場談判。
傳統的旅程地圖假設流程固定——逐步完成的任務、靜態屏幕和清晰的用戶意圖。但在由人工智能驅動的體驗中,例如 ChatGPT、Google Gemini 或 GitHub Copilot:座席會主動完成任務(有時是隱形的),并且控制權會來回傳遞。考慮以下人工智能操作:
- 寫作助手會在您輸入時完成您的句子。
- 設計工具根據定義不明確的指令應用更改。
- 瀏覽器助手可以總結網頁、建議下一步行動并跨域采取行動。
在每種情況下,系統都會參與意義建構和決策。這些體驗構成了一個相互影響的循環。針對這種新現實進行設計需要新的框架——用戶體驗模型,它超越了用戶逐步完成任務的模式,而是考慮了人機之間動態的、共享的控制。
隨著人工智能系統功能日益強大,我們作為體驗設計師的工作也發生了變化。這不僅僅關乎流程、組件或優化。這意味著我們需要根據控制感知用戶體驗的原則進行設計:
- 意圖框架:如何建議行動?幫助用戶設定模糊的目標。
- 清晰地預覽AI計劃: AI正在做什么?為什么?在行動之前展示系統將做什么
- 可操控性:我可以改變路徑嗎?讓用戶在任務中調整AI行為。
- 可逆性:我可以撤銷剛剛發生的事情嗎?提供清晰的撤銷和覆蓋選項。
- 透明度和一致性:這個系統會尊重我的時間、我的目標和我的監督嗎?分享系統推理。
這關乎塑造人與自主運作系統之間的關系。這種關系只有在清晰易懂、可操控且以人為本的基礎上才能有效運作。
管理控制平衡

在 Y Combinator 的 AI 創業學校的演講“軟件正在(再次)改變”中,特斯拉前 AI 主管、應用 AI 領域最具影響力的人物之一 Andrej Karpathy 將軟件設計的這種轉變描述為從確定性、代碼驅動系統向新范式的過渡:界面是自然語言,程序就是提示本身。
正如 Karpathy 所說,“你的提示現在是編寫 LLM 的程序。”但與命令或表單輸入不同,提示會啟動一個概率性的解釋過程,其中模型推斷意圖和上下文,而不是執行固定的操作。

Karpathy 提出了“自主性滑塊”的概念——一種交互范圍,從完全用戶控制到完全 AI 自主。它并非簡單的開關,而是一個動態、流暢的尺度,會在整個會話過程中不斷變化。有時由用戶主導,有時由 AI 模型提出建議或采取行動。通常情況下,它們會反復切換角色。這是一種時時刻刻的控制權權衡。
Karpathy 闡述了人類與人工智能之間互動的兩種基本模式:
1. 人機交互(指令模式)
- 人類給出詳細、明確的命令
- AI 模型根據這些指令執行
- 思考:快速工程、表單填寫、手動配置
- 用戶體驗重點:輸入清晰度和腳手架、結構化指導
2. 模型即駕駛員(自動駕駛模式)
- 人類給出了一個高層次的目標
- 該模型計劃、決定、迭代和選擇
- 思考:“寫一份簡介草稿”、“為我開發一個應用程序”、“我還缺少什么?”
- 用戶體驗重點:可解釋性、監督和覆蓋控制、信任信號
這兩種模式存在于動態張力之中,而非二元對立。用戶和AI代理流暢地來回切換控制權。Karpathy的框架向我們展示了真正的用戶體驗挑戰并非對話與界面的對立,而是為共同代理而設計。
你肯定不想只用文本與操作系統(LLM)對話。文本閱讀、解讀和理解起來非常困難……圖形用戶界面 (GUI) 可以幫助人類審核這些易出錯的系統的工作,并提高運行速度。—— Andrej Karpathy,《軟件正在(再次)改變》
看完 Karpathy 的演講后,我一直在思考“自主滑塊”——用戶選擇將多少控制權交給 AI 的想法。但這并不總是指完全自主,比如 AI 編寫代碼和提交拉取請求。有時,它涉及一些更微妙的事情:你給系統多大的空間來解讀你的意圖。
我從Adobe Firefly測試版就開始用了,主要用來構思視覺概念和探索風格方向。Firefly 的滑塊控件并非虛構的,而是內置在界面中的。

Firefly 為我提供了調節控制的工具,而不僅僅是提交輸入。提示字段并非整個界面,它只是更大控制界面的一部分。它周圍有一些滑塊——例如“視覺強度”和“風格強度”——它們充當實時刻度盤,用于控制我賦予模型的自主權。當我降低強度時,我在發出信號:緊跟提示,保持文字表達。當我提高強度時,我在邀請讀者進行解讀,讓模型自由發揮創意。
實際上,我選擇賦予AI多少自主權。這關乎塑造作者身份的平衡。系統成為了合作者,而滑塊則成為一種看得見摸得著的管理合作關系的方式。
用戶體驗也在再次發生變化
交互的未來不僅僅是引導用戶順利地從A點到達B點,更是設計人與模型之間的關系。這種轉變需要一種全新的用戶體驗思維,將人機交互狀態視為核心設計維度,而非邊緣情況。這種變化已引起廣泛關注。業內的用戶體驗領導者正在提出以人為本的全新方法,利用智能系統進行設計,并圍繞智能系統進行設計。
在 UX Matters 的文章《超越炒作:以人為本的 AI 走向現實》中,設計加速器 Punchcut 的聯合創始人 Ken Olewiler 對當前的 AI 格局提出了尖銳的批評,警告稱不應在缺乏實際用戶價值的情況下倉促采用生成式 AI。盡管許多組織正在進行試驗,但他指出,很少有組織能夠從概念驗證階段邁向可衡量的投資回報率——他將這一差距歸因于炒作驅動的決策和缺乏以人為本的框架。
避免試圖在客戶生命周期的每個階段都全面集成人工智能自動化。要更有選擇性,在人工智能能夠帶來最大價值的地方進行集成。提供能夠實現協作式用戶控制的人工智能功能,為用戶保留有意義的自主權。——Punchcut 聯合創始人 Ken Olewiler
Olewiler 呼吁重新思考自主性。盡管人工智能領域的主流敘事傾向于推崇完全自動化,但他團隊的用戶研究發現,用戶更喜歡共享控制。他建議創建自主性地圖,以可視化的方式展現人機交互在整個體驗中的轉換點——類似于服務藍圖等系統設計工具,但更側重于控制。這些地圖可以幫助團隊在設計時實現協同自主,而不是交接或黑箱自動化。
BCG 的 Matt Scharpnick 的文章“生成式人工智能的用戶體驗設計:平衡用戶控制和自動化”呼應了 Olewiler 強調的平衡用戶代理和人工智能自動化,強調了用戶體驗需要在靈感和精確之間找到平衡。
用模型引導用戶得出精確結果可能會令人沮喪。我們仍處于 GenAI 的早期階段,還有很大的創新空間——尤其是在設計允許用戶精準輸入偏好的界面方面。—— BCG 副總監 Matt Scharpnick
Scharpnick 認為,生成式用戶體驗的未來在于設計出一種界面,讓用戶能夠精準地“操控”他們想要的價值和控制,同時又不扼殺生成式模型的創造潛力。這與 Olewiler 對自主地圖和共享能動性的呼吁相呼應,凸顯了用戶體驗的更廣泛轉變:我們必須設計出既能激發驚喜,又能支持專業級精準度的系統。
繪制控制流:我們可以從 OESD 中學到什么
操作員事件序列圖 (OESD)是一種形式化模型,用于直觀地展現控制權在人類操作員和自動化系統之間隨時間推移的切換。OESD 是在航空航天、自動駕駛汽車和工業機器人等安全關鍵領域開發的,它可以幫助工程師定義每個操作的負責人、觸發控制權交接的因素以及系統在出現問題時如何響應。
這些圖表通常包含兩條或多條“泳道”——一條供人使用,一條供機器使用——并繪制出一系列動作、決策和交接點。它們不僅旨在捕捉行為,還旨在在復雜、高風險的環境中強制執行明確的責任制和可恢復性。
OESD示例:
在自動駕駛汽車的遠程操作中,研究人員使用 OESD 來模擬遠程人類何時應該介入——從被動監控到主動駕駛——這取決于車輛的信心和環境。

在農業機器人領域,OESD 幫助研究人員編排共享控制任務,例如讓人類標記要收獲的水果,而機器人負責物理切割。

這些模型為我們提供了一種語言,將控制描述為人與系統之間的時間序列。它們已被證明在需要明確權限和故障保護的領域非常有效。作為用戶體驗設計師,我們可以在面對新挑戰時改進控制序列圖:設計不僅要考慮控制權的交接,還要考慮人與人工智能系統之間流暢的協同作用。作為用戶體驗設計師,我們可以在面臨新挑戰時改進控制序列圖:不僅要設計控制交接,還要設計人與人工智能系統之間的流暢協作。
從旅程地圖到控制地圖
人工智能系統正在改變數字交互的結構。傳統軟件需要等待用戶輸入,而現代人工智能工具則能夠推斷、建議并采取行動。這徹底改變了用戶體驗或產品的控制方式,并挑戰了當代用戶體驗方法中的許多假設。
在用戶體驗旅程圖中,核心問題是:
“用戶想要做什么?”
對于控制映射人工智能系統,核心問題變成:
“此刻誰在掌控局勢?局勢將如何轉變?”
設計師需要更好的方法來追蹤控制權是如何發起、共享和交還的——不僅關注用戶看到什么或做了什么,還要關注人類和人工智能系統之間如何實時協商代理。
我們可以將類似 OESD 的思維方式應用于更廣泛的 AI 用戶體驗。用戶-AI 控制映射可能更多地關乎一種思維模式,而非靜態圖表——設計一個既能行動又能傾聽的系統。關鍵考慮因素:
- 誰在控制——用戶、AI 或兩者
- 控制權何時以及為何發生轉移——作為時刻或循環
- 界面如何支持這些轉換——遵循控制感知用戶體驗原則所需的可供性
為了評估這些動力是否有效,我們需要新的指標——能夠捕捉合作質量而不僅僅是完成度的指標。

轉彎效率和意圖準確度等質量指標不僅僅是診斷依據,更是在人工智能設計中實現信任、協調和控制的一種方式。其目標是確保清晰性、適應性和以人為本的成果,即使控制權隨時都在轉移。
環境人工智能系統提高了風險
環境智能 (AmI) 指的是配備嵌入式傳感器的環境,這些傳感器能夠主動且不引人注目地為用戶提供支持——適應環境、識別行為模式,并在無需明確指令的情況下預測需求。這一愿景涵蓋了從調節燈光的智能房間到能夠理解語音提示的語音助手,以及如今嵌入在我們數字產品中的環境人工智能服務。
- 無需提示即可閱讀上下文
- 提出行動而不是等待
- 自主行動,然后退卻
環境人工智能為數字體驗設計開辟了新領域。
在2025 年 Google I/O 開發者大會上,環境 AI 的轉型以 Project Astra 的形式展現。該項目的多模態助手被嵌入到配備攝像頭和音頻輸入的智能手機中。Google 的 AI 助手將實時感知環境、識別物體并解讀口語。它代表著我們邁向情境感知、具身化 AI 的未來:這些系統無需等待提示,而是主動觀察、解讀并提供幫助,并嵌入到我們現有的空間和工具中。
值得注意的是,谷歌宣布Gemini 將直接集成到 Chrome 瀏覽器中,這意味著谷歌正在將 AI 從一項獨立的功能轉變為一個無處不在的層。從這個意義上講,瀏覽器曾經只是網站的被動容器,如今卻成為了一個主動的協作者:讀取上下文、建議操作并跨領域解釋任務。AI 助手無需等待用戶打開——它就在那里,感知用戶的實時上下文并隨時準備參與。
谷歌的立場越來越明確:擁有跨域 AI 層。這不是一個小眾的邊緣案例,而是一個主流的競爭態勢,因為 Chrome 不僅僅是一個瀏覽器。它是全球用戶的默認界面,控制著超過 60% 的瀏覽器市場。它的優勢——“護城河”——不僅在于模型性能,還在于跨標簽、應用和會話的上下文連續性。瀏覽器向對話式發展的這種演變,為在自己的平臺內構建 AI 助手的產品和用戶體驗團隊提出了一系列緊迫的問題。如果 Gemini 已經存在于 Chrome 中,那么特定領域的助手還會扮演什么角色?用戶會更喜歡針對單個品牌或任務量身定制的網站嵌入式 AI 代理嗎?或者,主流的網絡模式是否會為Gemini 而構建——確保兼容性、清晰度和信任度,而 AI 已經在瀏覽器級別與用戶并肩作戰?

這不僅僅是一種新的交互模式,更是一種新的存在模式,人工智能系統將占據用戶數字環境的整個界面。這種演變不僅重塑了交互模式,也重塑了我們對數字產品的期望。它重新提出了一些遠遠超出技術用戶體驗范疇的根本性問題。正是在這里,像喬納森·艾維這樣一位蘋果最具標志性產品背后的極具影響力的設計師,也加入了討論。
在Stripe Sessions 2025上,Jony Ive 罕見地就設計工藝以及我們作為創造者的責任進行了一次對話。他強調,偉大的產品并非僅僅基于新穎性或巧妙性——它們源于深切的關懷、清晰的意圖和克制。Ive 強調,我們有責任創造出一種不需要更多關注,而是回饋部分關注的技術。他呼吁產品能夠認識到用戶“能夠感知關懷”——這種理念與將 AI 設計為一種新型協作者而非生產力工具的理念相呼應。
未來的工作:精心設計人工智能系統
在人工智能驅動的體驗世界中,用戶和模型共同創造成果。正如喬納森·艾維提醒我們的那樣,我們需要從根本上建立信任和關懷,而不僅僅是停留在表面。這些體驗的成功將不再取決于系統的速度或智能程度,而更多地取決于它如何有效地共享控制權。隨著人工智能工具的演進,控制設計將成為信任設計。
信任并非通過隱藏復雜性來贏得,而是通過使復雜性易于駕馭而建立。行動的系統也必須解釋。提出建議的系統必須接受批評。記憶的系統必須披露記憶的內容及其原因。
動態控制設計意味著將界面視為一種關系,而不是一種工具。人際關系需要清晰的思路、積極的響應以及說“不”的能力。我們構建的系統將越來越多地為我們采取行動。問題在于,我們設計這些系統時,是否做到了在行動的同時認真傾聽。