a16z「2026 年 AI Agent 三大猜測」:輸入框的消失,代理使用優先,語音代理的崛起
a16z 預測,AI 正從被動工具進化為主動代理。
撰文:龍玥
來源:Wallstreetcn
在知名風險投資機構 Andreessen Horowitz(a16z)於近期舉辦的「2026 創想」(Big Ideas for 2026)線上研討會中,其合夥人團隊描繪了一幅 AI 技術演進的清晰藍圖:人工智慧正從一個等待指令的聊天工具,進化為一個能夠主動執行任務的「代理」(Agent)。
同時,他們提出了重塑行業的「三大猜測」:用戶介面的互動將從「提示」轉向「執行」,產品設計將從「以人為本」轉向「代理優先」,而語音代理將從技術展示走向規模化部署。
猜測一:輸入框的消失。
a16z AI 應用投資團隊合夥人 Marc Andrusko 大膽預測,「到 2026 年,作為 AI 應用主要用戶介面的輸入框將會消亡。」他認為,下一代 AI 應用將不再需要用戶繁瑣地輸入指令,而是透過觀察用戶行為,主動介入並提供待審核的行動方案。
這一轉變的背後,是 AI 商業價值的巨大躍遷。Andrusko 指出,「我們過去關注的是每年三四千億美元的全球軟體支出,而現在我們興奮的是僅美國就存在的 13 萬億美元勞動力支出。這使得軟體的市場機會擴大了約 30 倍。」
他將未來的 AI 代理比作最頂尖的「S 級員工」:「最高主動性的員工會識別問題、診斷問題根源、實施解決方案,最後才來告訴你:『請批准我找到的這個方案。』這就是 AI 應用的未來。」


猜測二:「代理使用優先」與機器可讀性。
a16z 成長型投資合夥人 Stephanie Zhang 提出了一個顛覆性的設計邏輯:軟體將不再為人類的眼睛設計。她指出:「對人類消費重要的事情,對智能體消費來說可能不再重要。新的優化方向不是視覺層級,而是機器可讀性(Machine Legibility)。」
在 Stephanie 看來,過去我們為了人類注意力而優化的「5W1H」原則或精美的 UI 介面,在智能體時代將面臨重構。她預測:「我們可能會看到大量針對智能體興趣而生成的超個性化、高頻內容,這就像是智能體時代的關鍵詞堆砌。」
這一轉變將深刻影響從內容創作到軟體設計的方方面面。

猜測三:語音代理的崛起。
與此同時,a16z AI 應用投資團隊合夥人 Olivia Moore 觀察到,「AI 語音代理正開始佔據一席之地。」她表示,語音代理已從科幻小說般的概念,演變為真實企業正在大規模採購和部署的系統。尤其在醫療保健、銀行金融和招聘等領域,語音代理因其高可靠性、強合規性以及解決人力短缺問題的能力而備受青睞。
她分享了一個有趣的發現:「在銀行和金融服務領域,語音 AI 實際上表現得更好,因為人類非常擅長違反合規規定,而語音 AI 每次都能精準執行。」
Moore 強調,「AI 不會搶走你的工作,但一個使用 AI 的人會。」這預示著傳統呼叫中心和 BPO 行業將面臨深刻變革,而能夠利用 AI 技術提供更低價格或更大處理量的服務商將獲得競爭優勢。

此次線上研討會核心要點:
- UI 的終結: 提示詞框(Prompt Box)作為主要互動介面的時代即將終結,AI 將從「被動回應」轉向「主動觀察與干預」。
- 30 倍的市場增量: AI 的目標市場正從 4000 億美元的軟體支出轉向 13 萬億美元的勞動力支出,商業邏輯發生根本性躍遷。
- S 級員工模型: 理想的 AI 應當像高主動性員工:發現問題、診斷原因、提供方案並執行,僅在最後一步留給人類確認。
- 機器可讀性(Machine Legibility): 軟體設計目標正從「人類優先」轉向「智能體優先」,視覺層級的 UI 將不再是核心。
- 內容創作的異化: 品牌競爭將從吸引人類注意力轉向「生成引擎優化」(GEO),甚至可能出現大量針對 AI 抓取而生成的「高頻內容」。
- 語音 AI 的合規優勢: 在金融等高門檻行業,語音 AI 表現優於人類,因其能 100% 遵守合規要求且軌跡可追蹤。
- 醫療與政務的切入: 語音代理正在解決醫療行業高流動率難題,並有望在未來解決 911 報警及 DMV(車管所)等公共服務痛點。
- 語音 AI 產業化: 語音 AI 正發展為一個完整的產業而非單一市場,價值鏈的每一層都將出現贏家,從底層模型到平台級應用均存在巨大機遇。
- 從工具到「AI 員工」: AI 不再是簡單的輔助工具,而是能夠獨立處理完整業務閉環的數位員工。
a16z AI 團隊研討會全文實錄(由 AI 工具翻譯):
導播 00:00 歡迎來到「2026 年大構想」。我們將聽到 Marc Andrusko 探討 AI 用戶介面的演變,以及我們與智能系統互動方式的根本性改變。Stephanie Zhang 將討論為代理而非人類進行設計的意義,這一轉變正在重塑產品開發。Olivia Moore 將分享她對 AI 語音代理的興起及其在我們日常生活中日益增長的作用的看法。這些不僅僅是預測,它們是來自那些直接與構建未來世界的創始人和公司合作的人們的洞見。
Marc Andrusko 00:31 我是 Marc Andrusko,我們 AI 應用投資團隊的合夥人。我對 2026 年的大構想是,輸入框作為 AI 應用主要用戶介面的消亡。下一波應用將需要少得多的提示。它們會觀察你在做什麼,並主動介入,提供行動方案供你審查。
Marc Andrusko 00:49 我們正在進攻的機會,過去是全球每年三到四千億美元的軟體支出。現在我們感到興奮的是,僅在美國就存在 13 萬億美元的勞動力支出。這使得軟體的市場機會或潛在市場總額(TAM)擴大了約 30 倍。如果你從這裡出發,然後思考,好吧,如果我們所有人都希望這個軟體為我們工作,理想情況下,它的工作能力至少要和人類相當,甚至更強,對吧?所以我喜歡思考,嗯,最優秀的員工是怎麼做的?最優秀的人類員工是怎麼做的?我最近一直在討論一個在 Twitter 上流傳的圖表。它是一個關於五種員工類型的金字塔,以及那些最具能動性的員工為何是最好的。如果你從金字塔的底層開始,那裡的人是發現一個問題,然後來找你尋求幫助,問該怎麼做。這是能動性最低的員工。
但如果你去到 S 級,也就是你能擁有的能動性最高的員工,他們會發現一個問題,進行必要的研究來診斷問題來源,研究多種可能的解決方案,實施其中一個,然後讓你隨時了解情況,或者在最後一刻來找你說,「請批准我找到的這個解決方案」。我認為這就是未來 AI 應用的樣子。而且我認為這是每個人都想要的。這是我們所有人都在努力的方向。所以我非常有信心我們差不多就要實現了。我認為大語言模型(LLM)持續變得更好、更快、更便宜,而且我認為在某種程度上,用戶行為仍然需要在最後環節有人類參與來批准事情,尤其是在高風險的場景下。但我認為模型完全有能力達到一個可以代表你提出非常聰明的建議的程度,而你基本上只需要點擊確認。
Marc Andrusko 02:27 如你們所知,我非常著迷於 AI 原生 CRM 的概念。我認為這是一個完美的例子,展示了這些主動型應用可能的樣子。在今天的世界裡,一個銷售人員可能會打開他們的 CRM,瀏覽所有開放的機會,查看當天的日曆,然後思考,好吧,我現在可以採取什麼行動來對我的銷售漏斗和成交能力產生最大影響。而對於未來的 CRM,你的 AI 代理或 AI CRM 應該能為你持續不斷地做所有這些事情,不僅識別你渠道中最明顯的機會,還會翻閱你過去兩年的郵件,挖掘出,你知道,這曾是一個有潛力的線索,但你讓它沉寂了。或許我們應該給他們發這封郵件,把他們重新拉回你的流程中,對吧?所以我認為,在起草郵件、整理日曆、回顧舊的通話記錄等方面,機會是無窮無盡的。
Marc Andrusko 03:22 普通用戶仍然會想要那最後一英里的批准。幾乎 100% 的情況下,他們會希望「人在回路」中的人類部分成為最終的決策者。這很好。
Marc Andrusko 03:33 我認為這是它自然演變的方式。我可以想像一個世界,在這個世界裡,高級用戶(power user)會投入大量額外精力來訓練他們使用的任何 AI 應用,使其盡可能多地了解他們的行為和工作方式。這些應用將利用更大的上下文窗口,利用已融入許多大語言模型的記憶功能,從而使高級用戶能夠真正信任該應用完成 99.9% 甚至 100% 的工作。他們會為那些無需人類批准就能完成的任務數量而自豪。
Stephanie Zhang 04:09 嗨,我叫 Stephanie Zhang,是 a16z 成長型投資團隊的投資合夥人。我對 2026 年的大構想是:為代理而創造,而非為人類。我對 2026 年感到非常興奮的一件事是,人們必須開始改變他們創造的方式。這涵蓋了從內容創作到應用設計的方方面面。人們開始透過代理作為中介來與網路或應用程式等系統互動。對人類消費重要的東西,對代理消費而言重要性將不一樣。
Stephanie Zhang 04:41 我上高中的時候,上過新聞課。在新聞課上,我們學到了在新聞文章的首段以 5W 和 1H(何人、何時、何地、何事、何因、如何)開頭的重要性,以及在特寫報導中以一個引子開頭。為什麼?為了吸引人類的注意力,人類可能會錯過深埋在 H5 頁的有深度、有見地的陳述,但代理不會。
Stephanie Zhang 05:02 多年來,我們為可預測的人類行為進行優化。你想成為 Google 返回的首批搜尋結果之一嗎?你想成為 Amazon 上列出的首批商品之一。這種優化不僅適用於網路,也適用於我們設計軟體。應用是為人類的眼睛和點擊而設計的。設計師為良好的用戶介面(UI)和直觀的流程進行優化。但隨著代理使用量的增長,視覺設計對於整體理解的重要性將降低。以前,在發生事故時,工程師會進入他們的 Grafana 儀表盤,試圖拼湊出發生了什麼。現在,AI SRE(網站可靠性工程師)會接收遙測數據。它們會分析這些數據,並直接在 Slack 中報告假設和洞察,供人類閱讀。
以前,銷售團隊必須點擊並瀏覽 Salesforce 等 CRM 來收集資訊。現在,代理會獲取這些數據並為他們總結洞察。我們不再是為人類設計,而是為代理設計。新的優化標準不是視覺層次,而是機器可讀性。這將改變我們創造的方式以及我們使用的工具。代理在尋找什麼,這是一個我們不知道答案的問題。但我們所知道的是,代理在閱讀一篇文章的所有文本方面做得比人類好得多,而人類可能只會讀前幾段。市面上有很多工具,不同的組織用它們來確保當消費者提示 ChatGPT,詢問最好的公司信用卡或最好的鞋子時,它們能夠出現。所以市面上有很多我們稱之為 SEO(註:應為 SEO 或類似概念,此處為音譯)的工具,人們正在使用,但每個人都在問一個問題:AI 代理想看什麼?
Stephanie Zhang 06:43 我喜歡這個問題,關於人類何時可能完全退出循環。我們已經看到在某些情況下這正在發生。我們的投資組合公司 Dekagon 已經在為他們的許多客戶自主回答問題。但在其他情況下,如安全運營或事故解決,我們通常會看到更多的人在回路中,AI 代理首先嘗試找出問題所在,進行分析,並向人類提供不同的潛在情況。這些往往是責任更大、分析更複雜的案例,我們看到人類會留在循環中。而且在模型和技術達到極高準確性之前,他們可能會在循環中停留更長時間。
Stephanie Zhang 07:33 我不知道代理是否會看 Instagram Reels。這真的很有趣,至少在技術方面,優化機器可讀性、優化洞察力、優化相關性真的非常重要,尤其與過去相比,過去更注重用華而不實的方式吸引人們、抓住注意力。我們已經看到的是大量、超個性化內容的案例,也許你不是創作一篇極其相關、極具洞察力的文章,而是創作大量低品質內容,但針對你認為代理可能想看的不同東西。這幾乎相當於代理時代的關鍵詞,內容創作的成本趨近於零,創作大量內容變得非常容易。這就是為了試圖吸引代理注意力而產生大量內容的潛在風險。
Olivia Moore 08:48 我是 Olivia Moore,我們 AI 應用投資團隊的合夥人。我對 2026 年的大構想是,AI 語音代理將開始佔據一席之地。在 2025 年,我們看到語音代理從看似科幻的東西,突破成為真實企業正在大規模採購和部署的系統。我很高興看到語音代理平台擴展,跨平台和模式工作,以處理完整的任務,讓我們更接近真正的 AI 員工願景。我們已經看到幾乎每個垂直領域都有企業客戶在測試語音代理,如果不是已經以相當大的規模部署它們的話。
Olivia Moore 09:25 醫療保健可能是這裡最大的一個。我們看到語音代理出現在醫療保健堆疊的幾乎每個部分,包括給保險公司、藥局、供應商的電話,也包括可能更令人驚訝的面向患者的電話。這可能是像日程安排和提醒這類基本功能,但也包括更敏感的電話,如術後隨訪電話,甚至精神科的初診接待電話,都由語音 AI 處理。老實說,我認為這裡的一個主要驅動因素是目前醫療保健行業的高人員流動率和招聘困難,這使得能夠以一定可靠性執行任務的語音代理成為一個相當不錯的解決方案。另一個類似的類別是銀行和金融服務。你可能會認為那裡有太多的合規和監管,語音 AI 還無法在那裡運作。但事實證明,這是一個語音 AI 實際表現更優的領域,因為人類非常擅長違反合規和規定,而語音 AI 每次都能做到。而且重要的是,你可以追蹤語音 AI 隨時間的表現。最後,我想說另一個語音技術取得突破的領域是招聘。這涵蓋了從零售一線工作到入門級工程職位,甚至中級顧問職位。透過語音 AI,你可以為候選人創造一種體驗,他們可以在任何適合他們的時間立即進行面試,然後他們會被送到其餘的人工招聘流程中。
Olivia Moore 10:46 隨著底層模型變得越來越好,我們今年在準確性和延遲方面看到了巨大的改進。實際上,在某些情況下,我聽說有語音代理公司會故意減慢他們的代理速度或引入背景噪音,使其聽起來更像人類。當談到 BPO(業務流程外包)和呼叫中心時,我認為其中一些將會經歷一個較平緩的過渡,而另一些在面對來自 AI,特別是語音 AI 的威脅時,可能會面臨一個更陡峭的懸崖。有點像人們說的,AI 不會搶走你的工作,一個使用 AI 的人會。
Olivia Moore 11:16 我們看到的是,許多最終客戶可能仍然只想購買解決方案,而不是購買他們必須自己實施的技術。因此,在近期到中期,他們可能仍會使用呼叫中心或 BPO。但他們可能會選擇一個能提供更低價格或能處理更多業務量的,因為它利用了 AI。有趣的是,在一些地區,按永久僱員計算,人類實際上仍然比頂級的語音 AI 便宜。所以,隨著模型變得更好,那裡的成本是否會下降,以及那些市場的呼叫中心是否會面臨比現在更大的威脅,這將是很有趣的看點。
Olivia Moore 11:50 AI 在多語言對話和重口音方面實際上非常出色。很多時候,我在開會時可能會有一個詞或短語沒聽清,然後我會查看我的(Granola)會議記錄,它記錄得非常完美。所以我認為這是大多數 ASR 或語音轉文本供應商能做到的一個很好的例子。
Olivia Moore 12:08 現在有幾個用例我希望明年能看到更多,任何與政府相關的。我們是 Prepared 911 的投資者,如果你能處理 911 電話——他們處理的是非緊急電話——但如果你能用語音 AI 處理那個,你應該也能處理 DMV(車管所)的電話和任何其他與政府相關的電話,這些電話現在對消費者來說非常令人沮喪,對電話另一端的員工來說也同樣令人沮喪。
Olivia Moore 12:32 我也很想看到更多消費級語音 AI。到目前為止,它主要是 B2B(企業對企業)的,因為用成本低得多的 AI 來替代或補充電話上的人類是如此顯而易見。在消費級語音領域,我感到興奮的一個類別是圍繞更廣泛的健康和保健。我們已經看到語音伴侶在輔助生活設施、養老院中興起,既作為居民的伴侶,也能隨著時間推移追蹤不同的健康指標。我們將語音 AI 視為一個產業而非一個市場,在我們看來,這意味著在整個技術堆疊的每一層都會有贏家。如果你對語音 AI 感興趣,或者想在語音 AI 領域創業,我建議你去看看那些模型。有很多很棒的平台,比如 11 Labs,你可以在那裡測試創建自己的聲音和創建自己的語音代理。你會對什麼是可能的以及未來會發生什麼有一個很好的了解。
免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。
您也可能喜歡
2025 TGE 年度報告:118 個項目超過 8 成破發,FDV 越高跌幅越慘

Atlaspad 與 Helix Labs 合作,將加密貨幣 Launchpad 與跨鏈流動質押連結:成為 DeFi 流動性的入口
比特幣算力下滑,礦工壓力加劇:VanEck數據
Pump.fun 訴訟案年度回顧:1.5 萬條聊天記錄背後的真相拼圖

