未来的人类(或是人工智能)在书写 AI 时代的媒体发展史的时候,除了 OpenAI、Google、Meta 这些巨头,应该也不会漏掉一家名叫 Perplexity 的初创公司。
Perplexity 是一家创立于2022年的人工智能初创公司,公司最主要的产品是一款“答案引擎”(Answer engine),用创始人 Aravind Srinivas 自己的话来说,这个产品像是“ChatGPT和维基百科生了个孩子”。用户可以在 Perplexity 的网页内输入问题,Perplexity 会和搜索引擎类似,在开放互联网上搜索可能包含答案的页面,但比 Google 等传统的搜索引擎更进一步,Perplexity 会将网站上的内容通过大语言模型总结和整理,直接在其用户界面内呈现给用户,用户不需要点击任何链接,就可以获得一个相对全面的总结。
从商业上来说,Perplexity目前来看是很成功的——在产品发布一年多的时间里,积累了超过1000万月活用户、2000万年度经常性收入(Annual Recurring Revenue);Perplexity 的投资人包括英伟达、Jeff Bezos 等机构和个人,在获得软银愿景基金2的投资后,它的估值达到30亿美金;它也深受用户喜爱,英伟达的 CEO 黄仁勋称他每天都会使用该产品,Shopify 的 CEO 说 Perplexity 已经取代了他对 Google 的使用。
但该公司的商业模式却被指责为是“吸血鬼”、“窃贼”。
《福布斯》最近指出,他们发表的一篇关于 Google 前首席执行官的无人机公司的调查报道被 Perplexity 推出的 Pages 新功能剽窃,还被Perplexity做成了播客。之后,《连线》杂志还发现 Perplexity 的爬虫在抓取网站内容时会无视网站 robots.txt 的协议,这也就意味着,哪怕网站在 robots.txt 中明确表明拒绝 Perplexity 的爬虫,还是有可能被抓取内容。robots.txt 本身尽管不像用户条款那样具有法律效力,却是开放互联网信任的基础。(更讽刺的是,Perplexity 甚至被指出对《连线》杂志一篇指控 Perplexity 进行剽窃的文章本身进行了剽窃。)
关于 Perplexity 的行为到底属于剽窃还是所谓的“合理引用”(fair use),法律上还没有定论。但从媒体出版商的角度来看,以 Perplexity 为代表的新兴 AI 产品本身就是有“原罪”的,这个原罪就在于,它们破坏了以 Google 为代表的传统的搜索引擎和出版商之间长期以来默认的价值交换模式,打破了平台和内容出版商之间的本身就已经相当稀薄的信任。
科技巨头们“神仙打架”,内容出版商成为牺牲品
在过去数十年的时间里,Google 在全世界大部分地区都扮演着“互联网门户”的角色,用 Google 自己的话来说,他们是在“整合全球信息”。当用户想要找到某个问题的答案时,只需要在 Google 的对话框里输入问题,就会得到一个页面,页面上显示了十个可能包含问题答案的蓝色链接。这个模式很长的时间内创造了一个对用户、Google 以及开放互联网上的内容出版商来说“三赢”的局面:Google 可以在搜索结果中插入广告链接,通过链接点击向广告主收费,以此建立起了全世界利润最为丰厚的网络广告生意;而内容出版商如果在 Google 的搜索结果上排名靠前,就可以保证有足够多的用户点击链接访问自己的网站,就可以在网站上通过广告、订阅或是为电商网站导流赚取佣金等方式来盈利;用户可以通过最便捷的方式搜索到全互联网上最佳的内容。
当然,这一模式并非完美。经过“搜索引擎优化”(SEO)行业数十年如一日的钻研,如何能在 Google 的搜索结果中排名靠前已经是一个“公开的秘密”。
开放互联网上的投机者们会通过各种各样的手段让自己的网页在搜索结果中排名更靠上一点。这些投机者不仅仅有来自全世界各地生产低质内容甚至假新闻的“内容农场”,也包括了各大媒体巨头。
前文提到的《福布斯》就是最典型的例子——这家老牌媒体的核心产业早已不仅仅是它旗下老牌杂志和富豪排行榜,还有庞大的搜索流量和电商生意。凭借着高价值的 Forbes.com 的域名,福布斯可以让更多自己网站的内容出现在搜索结果中排名较高的位置,而这些内容中大部分并非自己的记者所写的新闻报道,更多是第三方撰稿人发布的博客、产品评测和推荐(无论是电视机、自行车还是床垫)甚至是节日折扣码。
也正是靠这些为传统记者所不齿的内容,福布斯养活了自己的记者团队,甚至成为了媒体行业的标杆(被认为成功带领《纽约时报》完成数字化转型的 CEO Meredith Kopit Levien 就来自福布斯)。
而 Google 为了避免自己的搜索结果被低质量内容充斥,被迫不断调整自己的算法。此外,Google 也为了不断扩大自己的利润,让搜索结果页面中广告占的空间越来越大。多方角力的情况下,曾经“三赢”的局面变成了恶性循环:Google 不断调整结果,却依然避免不了搜索结果越来越糟糕的局面;内容出版商为了迎合 Google 的算法改动疲于奔命,越来越多的网站变得千篇一律却依然无法避免流量下滑,只能在网页上插入更多的广告,让网站体验变得更加糟糕;搜索结果变得越来越糟糕,用户想找到自己想要的真实内容也变得越来越难。
而 Perplexity 的产品似乎为用户提供了一个更好的答案——用户可以直接在一个聊天界面中得到答案(这个答案偶尔会是所谓的“幻觉”,但大部分情况下是相对可靠的,这也是 Perplexity 和其它大语言模型产品相比的最大卖点),而不再需要进入一个又一个的网站,在大量的图片广告、自动播放视频中寻找自己想要的答案。但对于互联网上的内容出版商来说,如果这种模式成了未来人机交互的最主流模式,对他们现有的商业模式将是毁灭性的打击——如果不再有人点击进入内容出版商自己的网站中,那么他们还如何在网站上通过广告、订阅或是通过电商佣金赚钱呢?
对此,科技网站 The Verge 的主编 Nilay Patel 创造了一个叫“Google Zero”的名词,即 Google 在未来向用户提供的不再是通往第三方网站的链接,而是用户想要的回答直接在搜索界面提供给用户,这样的话,大批 Google 用户获得答案的终点,将是在 Google 站内,而非第三方网站,如此一来,未来 Google 为开放互联网上的内容出版商输送的流量,将会降至零。
这样的未来,正在迅速变成现实。
2024年5月14日,Google 正式宣布会面向全美用户推出自己的“答案引擎”,即 AI Overviews 功能,并在未来向全球更多国家和用户推出这个功能。尽管 Google CEO Sundar Pichai 在采访中宣称内部数据显示这一改动会增加用户点击网站的次数,但他并没有提供细节,这样的宣称并没有办法让人信服,也是反直觉的。代表了美国数千家出版商的非营利组织新闻/媒体联盟(News/Media Alliance)的总裁 Danielle Coffey 直截了当地表示,这一改动将会给出版商的流量带来“灾难性的影响”,将导致出版商获得的流量进一步减少。他还攻击 Google 滥用自己在市场上的垄断地位,利用出版商的内容推出了一个直接与出版商生意竞争的产品,呼吁美国联邦贸易委员会和司法部对其展开反垄断调查。
Google 的这个新产品一经推出就频频闹笑话:如果你询问如何防止奶酪从披萨上掉下来,它会推荐你使用胶水;它还会告诉你地质学家推荐你每天吃一块石头;当被问及美国有几位穆斯林总统时,它会回答美国有一位穆斯林总统——奥巴马……Google 对于新功能“翻车”的回应是,大部分的例子都来源于极少有人搜索的问题或是讽刺性内容,公司会对不符合政策的内容进行删除,并改进产品。
对 Google 来说,这一改变某种程度上也是不得已而为之。如果未来由 Google 一家公司决定,那他们肯定是希望未来像过去的十多年一样一成不变——搜索引擎广告生意对 Google 来说可以说是“躺着赚钱”的生意,为公司提供了一年数千亿美元的营收和数百亿美元的利润,占了 Google 母公司 Alphabet 营收的一半以上。而 ChatGPT 和 Perplexity 为代表的新的交互模式的出现,可能会让 Google 陷入“创新者的窘境”(The innovator’s dilemma):尽管目前生成式 AI 技术依然不如 Google 搜索准确或全面,也面临着商业模式上的巨大不确定性,但假以时日,随着技术的发展和产品的进步,可能会颠覆搜索引擎现有的商业模式,动摇 Google 在广告市场上的份额。
也正因为如此,Google 这只“800磅重的大猩猩”也不得不跟着市场一起起舞,仓促上马还没有成熟的产品,而依赖于 Google 的出版商们,就成了科技巨头们“神仙打架”的牺牲品。
OpenAI的“新瓶装旧酒”
而另一边,这一切的”始作俑者” OpenAI 倒试图扮演“白衣骑士”。在过去的一年中,OpenAI 先后和美联社、Axel Springer(美国的Politico、Business Insider、德国的《图片报》等媒体的母公司)、新闻集团(美国《华尔街日报》、《纽约邮报》、英国《泰晤士报》、《太阳报》的母公司)、Dotdash Meredith(美国《人物》杂志和数十个垂直互联网出版商的母公司)、《金融时报》、《时代周刊》等全球新老媒体机构签下协议,将其内容授权给 OpenAI 使用。
据报道,前文提到的新闻/媒体联盟也在和 OpenAI 谈判,制定适合其成员的协议。根据哥伦比亚大学新闻学院陶数字新闻中心研究主任 Pete Brown 的统计,这些内容授权协议的总金额高达3.5亿美元。
对此,科技媒体 The Information 的创始人 Jessica Lessin 在《大西洋月刊》上发文指责这些同意与 OpenAI 或其它科技巨头达成协议的媒体公司是在重蹈之前和科技巨头们与虎谋皮的覆辙。
她写道:“愿意屈服(于OpenAI等公司)的出版商不仅没有捍卫自己的知识产权,还在用自己辛苦赢得的信誉换取那些同时低估他们价值并明显意图取代他们的公司提供的一点现金。”(刊登这篇文章的《大西洋月刊》在文章发布5天后也宣布与 OpenAI 达成合作协议。)
在 Lessin 看来,内容出版商应该坚决地拒绝和 OpenAI 这样侵犯自己知识产权的机构合作,甚至通过打官司来维护自己的权益。
在理想环境下,如果所有出版商能够联合起来,集体和 OpenAI 等科技巨头谈判,甚至发起诉讼,的确能取得集体利益的最大化。但高度竞争和碎片化的媒体环境让这样的集体行动变成了不可能——在2023年媒体大亨 Barry Diller 就试图联合新闻集团、Axel Springer 等其它出版商联合应对人工智能巨头的威胁,但这个联盟还未形成就土崩瓦解,新闻集团、Axel Springer 以及 Diller 所控制的 IAC 旗下的 Dotdash Meredith 先后与 OpenAI 达成协议。
要对 OpenAI 提起诉讼同样代价高昂,版权官司通常旷日持久,而且耗费高昂,至今法律界对大语言模型利用出版商的内容训练模型是属于侵权还是“合理利用”并无定论,诉讼最后最后可能会落得一场空。媒体行业仅有的几家决定起诉 OpenAI 的包括了相对财大气粗的《纽约时报》,截止到2024年5月,公司已经耗费了100万美金(《纽约时报》在诉讼中也提到双方曾经进行了谈判试图达成协议,这一诉讼因此也被认为是《纽约时报》的谈判策略)。
因此,大部分出版商的决策者从更现实的角度出发,做出了短期内对自己最有利的选择——既然对方已经用了我们的数据进行训练,木已成舟,那在人工智能还没有对自己的生意产生实质性影响之前,先从对方那边拿到一些补偿总比什么都没有来得好。尽管 OpenAI 和大部分出版商的协议并不透明,协议的细节我们不得而知,但根据公开信息,我们可以判断大部分协议还是“新瓶装旧酒”——除了加上了“AI”的名号之外,主要框架和媒体传统的授权协议并无二致。媒体通过签署协议,将内容授权给 OpenAI 使用,OpenAI 在未来的3-5年为其支付一笔授权费,通常为数百万美元的现金。这也是为什么传统上就做着内容授权生意的新闻通讯社美联社是最早和 OpenAI 达成协议的新闻机构之一。
Business Insider 的媒体专栏作家 Peter Kafka 指出,OpenAI 或是其它科技公司与内容出版商达成的协议并没有要求他们制作任何专属或是独家内容,更不需要改变其运营模式,这和之前媒体出版商与 Facebook 在2016年前后达成的视频内容协议并不同——2016年前后,Facebook 向全球数百家媒体提供了丰厚的资金,要求他们为 Facebook 制作定制内容,掀起了一波“转向视频”(Pivot to video)的潮流,但 Facebook 在几年后大幅削减预算,泡沫破裂,导致众多媒体裁员甚至关门。
对于内容出版商来说,将内容授权给 OpenAI 使用,和授权给 Yahoo 这样的内容聚合网站进行分发差别并不大。和 OpenAI 的协议,某种程度上可以看成是一年数百万美元的“净利润”,公司并不需要做多少,就可以在自己的财务报表上添加数百万美金利润。
当然,这也是个陷阱,Netflix 曾经也为好莱坞巨头们设下过类似的陷阱。在 Netflix 大举进军流媒体之际,它为好莱坞的巨头们提供了相当丰厚的协议,购买其内容的流媒体版权,索尼、迪士尼、NBCUniversal 等公司争先恐后将自己最热门的内容授权给 Netflix。Netflix 用自己竞争对手的内容建立起了庞大的内容库,吸引了数以亿计的订阅用户,也削弱了好莱坞巨头们建立自己流媒体的决心——既然有人愿意免费为我们送钱,我们为什么还要自己费时费力从头开始呢?但天下没有免费的午餐,当好莱坞巨头们回过神来,为时已晚,Netflix 已经遥遥领先,建立了世界上最成功的流媒体帝国。迪士尼的 CEO Bob Iger 说:“有一天我醒来,突然意识到:‘我们基本上是在向一个第三世界国家出售核武器技术,而现在他们正在用它来对付我们。’”
但在媒体生存环境日益艰难的当下,即便知道 OpenAI 的“橄榄枝”是一个陷阱,又有多少媒体的决策者可以拒绝这样的诱惑,不往陷阱里跳呢?
Napster的启示
1999年6月,美国东北大学18岁的大一学生 Shawn Fanning 和19岁的 Sean Parker(后来成为Facebook的首任总裁)创立了点对点文件共享平台 Napster,允许用户免费分享 MP3文件,这一服务一经推出就大受欢迎,最高用户数达到7000万,但也引发了整个唱片行业的震荡,颠覆了20世纪后期音乐行业依靠 CD 销售赚取利润的商业模式。Napster 很快被代表美国主要唱片公司的美国唱片业协会 (RIAA)告上法庭,指控其侵犯版权,最终在2001年7月被关闭。
Napster 虽然早夭,但它证明了数字音乐市场的潜力。苹果在2001年推出了 iTunes 和 iPod,又在2003年推出了在线音乐商店 iTunes Store,让用户可以以每首歌0.99美元的价格合法购买和下载音乐。几年之后,Daniel Ek 和 Martin Lorentzon 创立了音乐流媒体播放平台 Spotify,让用户可以无需下载保存到本地直接收听音乐。
20多年过后,唱片行业没有死。流媒体已经成了绝大多数用户收听音乐最主流的方式,但唱片公司从流媒体获得的收入依然无法和 CD 销售的最高点相比(以美国为例,根据RIAA的数据,美国2023年录制音乐流媒体的收入约为130亿美元,而 CD 销售在1999年最高点达到240亿美元),
各类独立音乐制作人永远会抱怨从 Spotify 和 Apple Music 等流媒体服务分到的收入无法养活自己。不过,现场体验成了音乐行业更重要的一部分——Taylor Swift 成为全球最大的明星,在最新的全球巡演中卖出400多万张门票,获得超过10亿美金的收入,即便 AI 能够在几秒钟内生成成百上千首类似 Taylor Swift 曲风的歌,但 Taylor Swift 只有一个,演唱会现场的体验注定是稀缺的。
Perplexity 对出版业可能也在扮演 Napster 对唱片行业扮演的角色,连篇累牍的负面报道和潜在的法律纠纷可能让这家公司不一定会成为最后的赢家,但它代表的模式可能会对行业的未来产生深远的影响。或许在不久的将来,内容出版商们经过整合,终于被迫联合起来,能够和 AI 大战中存活的巨头们(或许是 OpenAI,或许是微软、Google 或 Meta,我们无法预测)谈判,建立起新的平衡;也许有一天,整个行业会忘掉:通过 Google 搜索的流量来盈利的商业模式曾经支撑了大半个个网络出版业;也许又有一天,内容出版商们会找到另外一种(或者很多种)不需要依赖于大平台的盈利模式。
(小华,旅美媒体人,播客节目《美轮美换》主播)
SEO Specialist 颤颤发抖
好文,通俗易懂
這篇文章寫的不錯,讓digital media從業者感到前景堪憂帶來的壓力😂