未來的人類(或是人工智能)在書寫 AI 時代的媒體發展史的時候,除了 OpenAI、Google、Meta 這些巨頭,應該也不會漏掉一家名叫 Perplexity 的初創公司。
Perplexity 是一家創立於2022年的人工智能初創公司,公司最主要的產品是一款「答案引擎」(Answer engine),用創始人 Aravind Srinivas 自己的話來說,這個產品像是「ChatGPT和維基百科生了個孩子」。用戶可以在 Perplexity 的網頁內輸入問題,Perplexity 會和搜索引擎類似,在開放互聯網上搜索可能包含答案的頁面,但比 Google 等傳統的搜索引擎更進一步,Perplexity 會將網站上的內容通過大語言模型總結和整理,直接在其用戶界面內呈現給用戶,用戶不需要點擊任何鏈接,就可以獲得一個相對全面的總結。
從商業上來說,Perplexity目前來看是很成功的——在產品發布一年多的時間裏,積累了超過1000萬月活用戶、2000萬年度經常性收入(Annual Recurring Revenue);Perplexity 的投資人包括英偉達(輝達)、Jeff Bezos 等機構和個人,在獲得軟銀願景基金2的投資後,它的估值達到30億美金;它也深受用戶喜愛,英偉達的 CEO 黃仁勳稱他每天都會使用該產品,Shopify 的 CEO 說 Perplexity 已經取代了他對 Google 的使用。
但該公司的商業模式卻被指責為是「吸血鬼」、「竊賊」。
《福布斯》最近指出,他們發表的一篇關於 Google 前首席執行官的無人機公司的調查報道被 Perplexity 推出的 Pages 新功能剽竊,還被Perplexity做成了播客。之後,《連線》雜誌還發現 Perplexity 的爬蟲在抓取網站內容時會無視網站 robots.txt 的協議,這也就意味着,哪怕網站在 robots.txt 中明確表明拒絕 Perplexity 的爬蟲,還是有可能被抓取內容。robots.txt 本身儘管不像用戶條款那樣具有法律效力,卻是開放互聯網信任的基礎。(更諷刺的是,Perplexity 甚至被指出對《連線》雜誌一篇指控 Perplexity 進行剽竊的文章本身進行了剽竊。)
關於 Perplexity 的行為到底屬於剽竊還是所謂的「合理引用」(fair use),法律上還沒有定論。但從媒體出版商的角度來看,以 Perplexity 為代表的新興 AI 產品本身就是有「原罪」的,這個原罪就在於,它們破壞了以 Google 為代表的傳統的搜索引擎和出版商之間長期以來默認的價值交換模式,打破了平台和內容出版商之間的本身就已經相當稀薄的信任。
科技巨頭們「神仙打架」,內容出版商成為犧牲品
在過去數十年的時間裏,Google 在全世界大部分地區都扮演着「互聯網門戶」的角色,用 Google 自己的話來說,他們是在「整合全球信息」。當用戶想要找到某個問題的答案時,只需要在 Google 的對話框裏輸入問題,就會得到一個頁面,頁面上顯示了十個可能包含問題答案的藍色鏈接。這個模式很長的時間內創造了一個對用戶、Google 以及開放互聯網上的內容出版商來說「三贏」的局面:Google 可以在搜索結果中插入廣告鏈接,通過鏈接點擊向廣告主收費,以此建立起了全世界利潤最為豐厚的網絡廣告生意;而內容出版商如果在 Google 的搜索結果上排名靠前,就可以保證有足夠多的用戶點擊鏈接訪問自己的網站,就可以在網站上通過廣告、訂閱或是為電商網站導流賺取佣金等方式來盈利;用戶可以通過最便捷的方式搜索到全互聯網上最佳的內容。
當然,這一模式並非完美。經過「搜索引擎優化」(SEO)行業數十年如一日的鑽研,如何能在 Google 的搜索結果中排名靠前已經是一個「公開的秘密」。
開放互聯網上的投機者們會通過各種各樣的手段讓自己的網頁在搜索結果中排名更靠上一點。這些投機者不僅僅有來自全世界各地生產低質內容甚至假新聞的「內容農場」,也包括了各大媒體巨頭。
前文提到的《福布斯》就是最典型的例子——這家老牌媒體的核心產業早已不僅僅是它旗下老牌雜誌和富豪排行榜,還有龐大的搜索流量和電商生意。憑藉着高價值的 Forbes.com 的域名,福布斯可以讓更多自己網站的內容出現在搜索結果中排名較高的位置,而這些內容中大部分並非自己的記者所寫的新聞報道,更多是第三方撰稿人發布的博客、產品評測和推薦(無論是電視機、自行車還是床墊)甚至是節日折扣碼。
也正是靠這些為傳統記者所不齒的內容,福布斯養活了自己的記者團隊,甚至成為了媒體行業的標杆(被認為成功帶領《紐約時報》完成數字化轉型的 CEO Meredith Kopit Levien 就來自福布斯)。
而 Google 為了避免自己的搜索結果被低質量內容充斥,被迫不斷調整自己的算法。此外,Google 也為了不斷擴大自己的利潤,讓搜索結果頁面中廣告佔的空間越來越大。多方角力的情況下,曾經「三贏」的局面變成了惡性循環:Google 不斷調整結果,卻依然避免不了搜索結果越來越糟糕的局面;內容出版商為了迎合 Google 的算法改動疲於奔命,越來越多的網站變得千篇一律卻依然無法避免流量下滑,只能在網頁上插入更多的廣告,讓網站體驗變得更加糟糕;搜索結果變得越來越糟糕,用戶想找到自己想要的真實內容也變得越來越難。
而 Perplexity 的產品似乎為用戶提供了一個更好的答案——用戶可以直接在一個聊天界面中得到答案(這個答案偶爾會是所謂的「幻覺」,但大部分情況下是相對可靠的,這也是 Perplexity 和其它大語言模型產品相比的最大賣點),而不再需要進入一個又一個的網站,在大量的圖片廣告、自動播放視頻中尋找自己想要的答案。但對於互聯網上的內容出版商來說,如果這種模式成了未來人機交互的最主流模式,對他們現有的商業模式將是毀滅性的打擊——如果不再有人點擊進入內容出版商自己的網站中,那麼他們還如何在網站上通過廣告、訂閱或是通過電商佣金賺錢呢?
對此,科技網站 The Verge 的主編 Nilay Patel 創造了一個叫「Google Zero」的名詞,即 Google 在未來向用戶提供的不再是通往第三方網站的鏈接,而是用戶想要的回答直接在搜索界面提供給用戶,這樣的話,大批 Google 用戶獲得答案的終點,將是在 Google 站內,而非第三方網站,如此一來,未來 Google 為開放互聯網上的內容出版商輸送的流量,將會降至零。
這樣的未來,正在迅速變成現實。
2024年5月14日,Google 正式宣布會面向全美用戶推出自己的「答案引擎」,即 AI Overviews 功能,並在未來向全球更多國家和用戶推出這個功能。儘管 Google CEO Sundar Pichai 在採訪中宣稱內部數據顯示這一改動會增加用戶點擊網站的次數,但他並沒有提供細節,這樣的宣稱並沒有辦法讓人信服,也是反直覺的。代表了美國數千家出版商的非營利組織新聞/媒體聯盟(News/Media Alliance)的總裁 Danielle Coffey 直截了當地表示,這一改動將會給出版商的流量帶來「災難性的影響」,將導致出版商獲得的流量進一步減少。他還攻擊 Google 濫用自己在市場上的壟斷地位,利用出版商的內容推出了一個直接與出版商生意競爭的產品,呼籲美國聯邦貿易委員會和司法部對其展開反壟斷調查。
Google 的這個新產品一經推出就頻頻鬧笑話:如果你詢問如何防止奶酪從披薩上掉下來,它會推薦你使用膠水;它還會告訴你地質學家推薦你每天吃一塊石頭;當被問及美國有幾位穆斯林總統時,它會回答美國有一位穆斯林總統——奧巴馬……Google 對於新功能「翻車」的回應是,大部分的例子都來源於極少有人搜索的問題或是諷刺性內容,公司會對不符合政策的內容進行刪除,並改進產品。
對 Google 來說,這一改變某種程度上也是不得已而為之。如果未來由 Google 一家公司決定,那他們肯定是希望未來像過去的十多年一樣一成不變——搜索引擎廣告生意對 Google 來說可以說是「躺着賺錢」的生意,為公司提供了一年數千億美元的營收和數百億美元的利潤,佔了 Google 母公司 Alphabet 營收的一半以上。而 ChatGPT 和 Perplexity 為代表的新的交互模式的出現,可能會讓 Google 陷入「創新者的窘境」(The innovator's dilemma):儘管目前生成式 AI 技術依然不如 Google 搜索準確或全面,也面臨着商業模式上的巨大不確定性,但假以時日,隨着技術的發展和產品的進步,可能會顛覆搜索引擎現有的商業模式,動搖 Google 在廣告市場上的份額。
也正因為如此,Google 這隻「800磅重的大猩猩」也不得不跟着市場一起起舞,倉促上馬還沒有成熟的產品,而依賴於 Google 的出版商們,就成了科技巨頭們「神仙打架」的犧牲品。
OpenAI的「新瓶裝舊酒」
而另一邊,這一切的」始作俑者」 OpenAI 倒試圖扮演「白衣騎士」。在過去的一年中,OpenAI 先後和美聯社、Axel Springer(美國的Politico、Business Insider、德國的《圖片報》等媒體的母公司)、新聞集團(美國《華爾街日報》、《紐約郵報》、英國《泰晤士報》、《太陽報》的母公司)、Dotdash Meredith(美國《人物》雜誌和數十個垂直互聯網出版商的母公司)、《金融時報》、《時代週刊》等全球新老媒體機構簽下協議,將其內容授權給 OpenAI 使用。
據報道,前文提到的新聞/媒體聯盟也在和 OpenAI 談判,制定適合其成員的協議。根據哥倫比亞大學新聞學院陶數字新聞中心研究主任 Pete Brown 的統計,這些內容授權協議的總金額高達3.5億美元。
對此,科技媒體 The Information 的創始人 Jessica Lessin 在《大西洋月刊》上發文指責這些同意與 OpenAI 或其它科技巨頭達成協議的媒體公司是在重蹈之前和科技巨頭們與虎謀皮的覆轍。
她寫道:「願意屈服(於OpenAI等公司)的出版商不僅沒有捍衛自己的知識產權,還在用自己辛苦贏得的信譽換取那些同時低估他們價值並明顯意圖取代他們的公司提供的一點現金。」(刊登這篇文章的《大西洋月刊》在文章發布5天后也宣布與 OpenAI 達成合作協議。)
在 Lessin 看來,內容出版商應該堅決地拒絕和 OpenAI 這樣侵犯自己知識產權的機構合作,甚至通過打官司來維護自己的權益。
在理想環境下,如果所有出版商能夠聯合起來,集體和 OpenAI 等科技巨頭談判,甚至發起訴訟,的確能取得集體利益的最大化。但高度競爭和碎片化的媒體環境讓這樣的集體行動變成了不可能——在2023年媒體大亨 Barry Diller 就試圖聯合新聞集團、Axel Springer 等其它出版商聯合應對人工智能巨頭的威脅,但這個聯盟還未形成就土崩瓦解,新聞集團、Axel Springer 以及 Diller 所控制的 IAC 旗下的 Dotdash Meredith 先後與 OpenAI 達成協議。
要對 OpenAI 提起訴訟同樣代價高昂,版權官司通常曠日持久,而且耗費高昂,至今法律界對大語言模型利用出版商的內容訓練模型是屬於侵權還是「合理利用」並無定論,訴訟最後最後可能會落得一場空。媒體行業僅有的幾家決定起訴 OpenAI 的包括了相對財大氣粗的《紐約時報》,截止到2024年5月,公司已經耗費了100萬美金(《紐約時報》在訴訟中也提到雙方曾經進行了談判試圖達成協議,這一訴訟因此也被認為是《紐約時報》的談判策略)。
因此,大部分出版商的決策者從更現實的角度出發,做出了短期內對自己最有利的選擇——既然對方已經用了我們的數據進行訓練,木已成舟,那在人工智能還沒有對自己的生意產生實質性影響之前,先從對方那邊拿到一些補償總比什麼都沒有來得好。儘管 OpenAI 和大部分出版商的協議並不透明,協議的細節我們不得而知,但根據公開信息,我們可以判斷大部分協議還是「新瓶裝舊酒」——除了加上了「AI」的名號之外,主要框架和媒體傳統的授權協議並無二致。媒體通過簽署協議,將內容授權給 OpenAI 使用,OpenAI 在未來的3-5年為其支付一筆授權費,通常為數百萬美元的現金。這也是為什麼傳統上就做着內容授權生意的新聞通訊社美聯社是最早和 OpenAI 達成協議的新聞機構之一。
Business Insider 的媒體專欄作家 Peter Kafka 指出,OpenAI 或是其它科技公司與內容出版商達成的協議並沒有要求他們製作任何專屬或是獨家內容,更不需要改變其運營模式,這和之前媒體出版商與 Facebook 在2016年前後達成的視頻內容協議並不同——2016年前後,Facebook 向全球數百家媒體提供了豐厚的資金,要求他們為 Facebook 製作定製內容,掀起了一波「轉向視頻」(Pivot to video)的潮流,但 Facebook 在幾年後大幅削減預算,泡沫破裂,導致衆多媒體裁員甚至關門。
對於內容出版商來說,將內容授權給 OpenAI 使用,和授權給 Yahoo 這樣的內容聚合網站進行分發差別並不大。和 OpenAI 的協議,某種程度上可以看成是一年數百萬美元的「淨利潤」,公司並不需要做多少,就可以在自己的財務報表上添加數百萬美金利潤。
當然,這也是個陷阱,Netflix 曾經也為好萊塢巨頭們設下過類似的陷阱。在 Netflix 大舉進軍流媒體之際,它為好萊塢的巨頭們提供了相當豐厚的協議,購買其內容的流媒體版權,索尼、迪士尼、NBCUniversal 等公司爭先恐後將自己最熱門的內容授權給 Netflix。Netflix 用自己競爭對手的內容建立起了龐大的內容庫,吸引了數以億計的訂閱用戶,也削弱了好萊塢巨頭們建立自己流媒體的決心——既然有人願意免費為我們送錢,我們為什麼還要自己費時費力從頭開始呢?但天下沒有免費的午餐,當好萊塢巨頭們回過神來,為時已晚,Netflix 已經遙遙領先,建立了世界上最成功的流媒體帝國。迪士尼的 CEO Bob Iger 說:「有一天我醒來,突然意識到:『我們基本上是在向一個第三世界國家出售核武器技術,而現在他們正在用它來對付我們。』」
但在媒體生存環境日益艱難的當下,即便知道 OpenAI 的「橄欖枝」是一個陷阱,又有多少媒體的決策者可以拒絕這樣的誘惑,不往陷阱裏跳呢?
Napster的啓示
1999年6月,美國東北大學18歲的大一學生 Shawn Fanning 和19歲的 Sean Parker(後來成為Facebook的首任總裁)創立了點對點文件共享平台 Napster,允許用戶免費分享 MP3文件,這一服務一經推出就大受歡迎,最高用戶數達到7000萬,但也引發了整個唱片行業的震盪,顛覆了20世紀後期音樂行業依靠 CD 銷售賺取利潤的商業模式。Napster 很快被代表美國主要唱片公司的美國唱片業協會 (RIAA)告上法庭,指控其侵犯版權,最終在2001年7月被關閉。
Napster 雖然早夭,但它證明了數字音樂市場的潛力。蘋果在2001年推出了 iTunes 和 iPod,又在2003年推出了在線音樂商店 iTunes Store,讓用戶可以以每首歌0.99美元的價格合法購買和下載音樂。幾年之後,Daniel Ek 和 Martin Lorentzon 創立了音樂流媒體播放平台 Spotify,讓用戶可以無需下載保存到本地直接收聽音樂。
20多年過後,唱片行業沒有死。流媒體已經成了絕大多數用戶收聽音樂最主流的方式,但唱片公司從流媒體獲得的收入依然無法和 CD 銷售的最高點相比(以美國為例,根據RIAA的數據,美國2023年錄製音樂流媒體的收入約為130億美元,而 CD 銷售在1999年最高點達到240億美元),
各類獨立音樂製作人永遠會抱怨從 Spotify 和 Apple Music 等流媒體服務分到的收入無法養活自己。不過,現場體驗成了音樂行業更重要的一部分——Taylor Swift 成為全球最大的明星,在最新的全球巡演中賣出400多萬張門票,獲得超過10億美金的收入,即便 AI 能夠在幾秒鐘內生成成百上千首類似 Taylor Swift 曲風的歌,但 Taylor Swift 只有一個,演唱會現場的體驗註定是稀缺的。
Perplexity 對出版業可能也在扮演 Napster 對唱片行業扮演的角色,連篇累牘的負面報道和潛在的法律糾紛可能讓這家公司不一定會成為最後的贏家,但它代表的模式可能會對行業的未來產生深遠的影響。或許在不久的將來,內容出版商們經過整合,終於被迫聯合起來,能夠和 AI 大戰中存活的巨頭們(或許是 OpenAI,或許是微軟、Google 或 Meta,我們無法預測)談判,建立起新的平衡;也許有一天,整個行業會忘掉:通過 Google 搜索的流量來盈利的商業模式曾經支撐了大半個網絡出版業;也許又有一天,內容出版商們會找到另外一種(或者很多種)不需要依賴於大平台的盈利模式。
(小華,旅美媒體人,播客節目《美輪美換》主播)
SEO Specialist 颤颤发抖
好文,通俗易懂
這篇文章寫的不錯,讓digital media從業者感到前景堪憂帶來的壓力😂