SORA降臨:藝術又死了,事實再沉淪?21世紀的工業革命(又)要來了嗎?

「文轉片」AI 來了。我們問了紀錄片攝影師﹑事實查核員﹑藝術家:他們的未來是不是(又)被取消了?
AI Sora 生成的影片。圖:影片截圖
工具人 國際 人工智能 科技

「工具人」是端傳媒新開設的欄目。近年我們迎來了一波科技大爆發:人工智能﹑大數據和機械人似乎從科幻般的遙遠未來被拉到我們面前,眼看就要對我們的生活造成巨大影響。都說人類站到食物鏈頂層是因為懂得使用工具,但這些工具會如何倒過來模塑人類社會?欄目不定期刊出探討科技﹑社會與人文的深度報道,請點擊訂閱。

「太可怕了,完全是一場工業革命。」同事看到OpenAI發佈的Sora影片後這麼說。根據OpenAI發佈的示範,只需要給Sora一段2﹑30字的指令,它就可以生成一段長達一分鐘的影片,可以是寫實影片,可以是動畫,也可以是歷史片﹑黑白片﹑3D科幻片……在不久將來,所有人都可以(大概率是在付費的前提下)隨時隨地生成影片,即是說拍攝﹑繪畫﹑剪片製片的門檻將不再存在。

「工業革命」的說法或者沒有那麼誇張。相比起Midjourney等「文轉圖」工具,Sora再度跨過了另一個重要防線:要生成影片,即是AI工具必須對我們生活的物理世界有相當認識,或至少是有相當模擬的能力。當然,過去一﹑兩年,ChatGPT和Midjourney等工具都掀起過不少討論,「工業革命」的說法自然也不是第一次聽到。那麼,Sora是否將掀起另一次工業革命--如果是,被影響的又會是誰?我們問了人工智能工程師﹑藝術家﹑紀錄片攝影師﹑廣告人和事實查核專家:Sora降臨,到底我們的未來,會因此產生哪些變化?

Sora真的有那麼厲害嗎?/Lanston Chu;人工智能工程師

「一切都只是錢和時間的問題。」

周五上班,同事間都在討論當日發佈的Sora,我也忍不住去八卦了已公開的示範影片。第一印象:Sora非常厲害。如果不仔細看,有幾段片我都會以為是真實拍攝的。其實「文轉片」AI不是首次出現,例如去年推出的同類AI工具Pika。不過Pika做出來的影片只有幾秒,而且畫質明顯粗糙,跟Sora的示範影片不能同日而語。

當然,只要認真看一下影片,就會發覺Sora做出來的影片還是跟「真實」有一段距離。

在Sora發布的片段中,有一段展示了一隻海鷗飛過一根「自拍桿」的背後,在飛過之後海鷗便在畫面消失了。另一個例子是,一隻小狗從一個窗台走向另一個窗台,兩個窗台中間應該有窗阻擋,但是小狗視木窗為無物,輕鬆越過到達另一窗台。

AI Sora 生成的影片。圖:影片截圖
AI Sora 生成的影片。圖:影片截圖

這些美但不合邏輯的細節,其實有點像做夢:我們做夢時,負責處理邏輯和理性思考的大腦前額葉皮質的活動頻率遠低於清醒時,因此我們往往沒有足夠的處理能力去判斷所見畫面是否合邏輯,從而能夠接受這些畫面。

實際上,Sora官網的介紹文章也提到了模擬能力(simulation ability)的概念,根據他們的說法,三維畫面在鏡頭轉動時,大致上可以保持一致(即以合理的方式展示),但在對象持久性方面(如先前提到的海鷗例子),則是「時有時無」。至於對象之間與現實世界的互動(如前述的小狗爬窗示例),也是「時有時無」。至於「成功」的例子,OpenAI提供了一個男人咬漢堡包並在包上留下牙印的示例;另一個示例則是畫筆在畫布上畫畫時會留下筆跡。

這是合理的,因為Sora並沒有在真實世界中生活過,它學習的一切都是通過「屏幕」來學習的,就像一個從出生開始就被鎖在博物館裏的人,只能通過觀看博物館裏的照片來學習真實世界一樣。

儘管如此,針對以前大家提到的早期AI的弱點,Sora已經進行了一些改進。例如,早期的MidJourney存在典型的「手指問題」,但在Sora示範片段看起來,這個問題似乎已大致解決。然而,有一些方面確實需要時間來改進,例如片段中東京街頭的霓虹燈招牌全都是亂碼--那是因為Sora還不會寫字。包含文字的圖像與不包含文字的圖像的信息量不同。如果從人腦的角度來看,如果你眼前的畫面包含文字,你的大腦會激活額外的神經元,所以有文字和無文字的畫面在你大腦中的路徑是不同的。

當然,我認為這個問題幾年內可以解決:一切都只是錢和時間的問題。再者,其他大廠都已經在發展同類模型,競爭下自然會有精進。

這就是為甚麼,雖然AI工具並不「完美」,但這個不應該是我們看輕AI可塑性的理由。在可見將來,AI生成的影片永遠會有人類專家可以找到的漏洞。例如,一個植物學家看了一段沙漠短片,可能可以看出某棵樹屬於溫帶而不會出現在沙漠。廠方確實可以再投資加強AI,以欺騙過植物學家,但問題是是否值得投入一大筆錢去欺騙一小部分植物學家?赫拉利(Yuval Noah Harari)在《人類簡史》中提過,其中一種最難被AI取代的工作是考古學家,因為沒有人有意欲投入金錢去取代他們--這個原理跟AI有「缺點」的原因是一樣的。

這主要是成本效益問題,而不是AI能做到多強的問題。人類永遠會有他們自己的位置。

至於許多人擔心AI會取代人類,實際上AI也可以創造新的職位。以前漫畫家需要請助手來畫網格,現在有AI畫網格,助手就可以去構思故事成為漫畫家,原本的漫畫家就可以利用AI進一步精進自己成為漫畫大師。而且我不覺得人只想看AI製作的藝術品,我自己看過很多AI的畫也覺得審美疲勞。正如你可以以低價購買按摩機,但當你真的追求優質按摩時,你還是會找一個真人為你進行spa。

而且,Sora的作品再強,也不是真貨。許多研究表明,如果你使用AI生成的輸出作為訓練數據去訓練新的模型,久而久之這些模型會越來越退化。就拿熱帶草原出現溫帶樹的例子來說,人眼可能看不出有問題,但如果用這些圖像作為訓練數據,下一代的模型就會越練越笨。也就是說,假貨和真貨永遠有區別,真的東西永遠有價值,假的東西永遠不可能100%取代真的。人類攝影師用鏡頭實地拍攝的真實影像永遠有價值,Sora再強,仍然需要人類製作的作品來教育它,人類的價值永遠存在。起碼我是這樣相信的。

AI Sora 生成的影片。圖:影片截圖
AI Sora 生成的影片。圖:影片截圖

Sora出來了,信假新聞的人會不會更多?/鄭家榆;香港Factcheck Lab執行編輯

在進化的不止科技,還有人。

老實說,我對Sora沒有甚麼特別大的感覺。類似技術出來是遲早的事。

每當有這類人工智能技術出來,很多人的直覺反應就是:「以後做假新聞就更方便了」﹑「以後都很難分辨真假了」。我會覺得,影響不是沒有,但不如許多人想像的那麼可怕。以美國大選為例,只要有Sora的技術,的確很容易就可以製作幾百﹑幾千條拜登老人癡呆﹑失憶失言的影片。但我記得7﹑8年前,Deepfake(深偽技術)出來的時候,很多人擔憂這種能改頭換面的技術會影響選舉,結果也沒想像中的那麼嚴重。

事實上,要製造假新聞﹑假片,根本不必用上深偽﹑Sora這類的高端技術。2019年,佩洛西(Nancy Pelosi)在一個新聞發佈會演說的片段被惡搞,令她說話聽起來結結巴巴﹑含糊不清,散佈影片的人說她不是喝醉了就是嗑了藥。影片在各個社交平台被瘋傳,甚至連霍士電視台(Fox News)和特朗普的私人律師朱利亞尼也有轉發。但佩洛西這段片甚至沒有用上深偽技術,只是影片被調成75%速度慢放而已,但完全無礙願意相信的人去散佈﹑轉發它。

原因是甚麼?我個人的估計:最容易受這種假新聞影響的人,立場本來就很極端。假新聞傳播的重點在於需求,而不在於供應--而對於有固定需求的受眾,假新聞的質素其實並沒那麼重要。

社會對於新科技對新聞真相的影響,似乎一直都是有點過份誇大的。我們可以回到人相信假新聞的原因上:這是因為他們對某些事物有恐懼,或者特別想要一些特定的事物。例如白人可能恐懼非白人﹑新移民﹑罪犯等等。假新聞的傳播,一直都仰賴一個完整的敘事框架,能夠觸及特定目標群體的恐懼與慾望。技術的進步從來都不是重點。

再者,在美國的政治背景下,極化(polarization)已經達到了一個高峰,再多﹑做得再精細的假新聞是不是真的會影響中間派選民?起碼我不覺得會。以佩洛西的被慢放的片段為例,這樣的內容明顯是針對特定的目標群體,不太可能影響到持中立立場的選民。同時,即使是像特朗普這樣的人物,即使官司纏身醜聞不斷,但大量支持者還是在支持他第三次參選。當選民的立場已經固化,再「精進」假新聞技術來吸引他們就多此一舉了。

所以,我認為Sora在製造和傳播假信息上的影響,更多是提供了一個新的工具,而不是徹底改變遊戲規則。假新聞的成功並不僅僅依賴於技術的進步,而是需要有一個完整的敘事,針對性地觸及人們的恐懼和欲望,比如對黑人﹑新移民的偏見,或者對失業的恐懼。單一的短片或文章往往效果有限。

我常常強調的是,製造和傳播假新聞是兩個很不同的過程。在數字時代,每天有數以億計的消息在流通,讓一則消息病毒式傳播的因素不僅僅是它的內容有多麼引人注目,更重要的是人們為什麼會選擇分享它。再加上,雖然說出來有點難相信,但其實人是會進步的--例如在識別由AI生成的圖片方面,人們已經比起初熟練得多。在進化的不僅僅只有科技。

當然,有了像Sora這樣的技術,揭露﹑辨識假片肯定更加困難,尤其是對於資源有限的事實核查機構而言。但老實說,我並不認為揭露假新聞完全是事實查核機構的問題--更多是製造AI工具的科技大廠的問題。現在白宮發放的片段有新增加密簽名技術,幫助驗證內容的真實性;未來新聞攝影等領域也可能需要引入類似技術,以確保圖像真實。

AI Sora 生成的影片。圖:影片截圖
AI Sora 生成的影片。圖:影片截圖

Sora將如何改變藝術,以及藝術市場?/黃瓜;媒體藝術家

「Sora 攻破了最後一道防線——動態影像。」

我是媒體藝術家,computational artist。我的創作一直以來會關注並用上科技工具和產品,同時也關注技術科技哲學領域的研究和理論。我很珍惜做藝術家的身份和工作,另一方面,我白天在一家位於紐約的北美科技大廠工作,做工程師。這個公司和美國其他科技公司一樣,公司和同事都是科技中心主義。我的白天工作主要功能是賺錢,我很少和人說起它,因為我很不以此為傲,更認同自己是有批判性的藝術家。

我關注 AI 也有十年了,是從2014年開始一路追過來。昨天看到 Sora 的發布會,之前的很多質疑一下子都冒了上來。

首先他們的數據是哪來的? Sora 模型是大型語言模型餵養出來的。這些原始資料有多少是沒有版權的,沒有得到原創者同意的,有多少是知識共享的?Open AI 是這個產業中在版權和AI倫理方向最激進的企業,也是在侵權方面最糟糕的一家。 Open AI 從來不公布信息和資料具體的來源,你根本沒法知道它從互聯網上扒下來的原作是什麼、誰做的,也沒辦法通過逆向工程還原出原始的訓練集。整個行業沒有立法監督,在美國,大家都心照不宣,國家不會管控科技產業,也許以後有可能,畢竟現在歐盟已經樹立了類似 Digital Service Act 這樣的先例。但是,美國目前還是會為防止侵害創新(hinder innovation)不去管控整個行業。2023年 Stability AI,一家專註文本轉圖像的生成式 AI 產品 Stable Diffusion 的公司,被三位藝術家和Getty Image 訴訟侵權,審判過程中 Stability AI 需要處理很多問題和透露很多資料,也嚇到了其他公司。(編按:美國地方法官2023年駁回了藝術家對Stability AI的訴訟。)

藝術家和生成式 AI 的矛盾已經有些年頭了,Twiiter 上兩年前就有口水大戰。大多數藝術家不支持這種技術獲取原始訓練資料的方式,對於出產「作品」的著作權也有異議,但這些藝術家面對科技公司及其支持者有兩大弱點。一個是藝術家不會說科技產業的語言,他們的批判常常會被對方鑽空子撿漏,這樣後者就可以脫逃指責。譬如有藝術家批判大語言模型公司非法爬梳、存儲自己的作品,但科技公司說自己不存儲任何藝術作品,我們只有算法,就在語言上和概念上偷梁換柱,逃過去了。藝術家的另一個弱點是,很多人的生計受到生成式人工智能的威脅,所以他們的發言會被大眾認為是有偏見的,不夠公正中立。這也讓我覺得更有責任站出來,因為我有一份大廠的工程師工作,我會說專業術語,我的生存也沒有被 AI 威脅,I am part of the tech world。

我和很多藝術家看到發布會的視頻後,覺得很沮喪的和悲觀。Sora讓我們發現,生成式人工智能已經有能力建造自己的「世界」了,一個完全的模擬世界。我們人類在情感上其實是害怕生活在仿真、模擬的世界裡的,這也是為什麼很多人抵觸 VR。之前我們已經承認靜態影像是不可靠的了,我們不能完全相信它們,現在 Sora 攻破了最後一道防線——動態影像。

我們看到這次發布的視頻製作水平是很高的,技術上可以做到文字指令生成多種類型的視頻,比如廣告、時尚、歷史片什麼的。目前這些工作是由藝術家來完成的,很多藝術家需要接這類商業工作來維持生計,所以的確是受到了挑戰。

當然也會有藝術家和機構擁抱技術。這部分人數量上是很少的,他們生存的生態比較精英,一般叫做機構藝術家——被世界頂級美術館、研究院這些精英機構支持的藝術家。他們和一些美術館從業人員不一定真的很有激情要擁抱技術,但科技產業會獎勵他們。像韓國現代汽車、谷歌這些巨型公司,都會給一些經濟資源去刺激美術館使用技術。這與其說是為了藝術和創作,不如說是為了企業發展本身。藝術家熱衷用新技術,不乏有人是真感興趣,但也有很多人覺得做做也不錯,又有曝光,又可能有科技產業的經濟回報。

但更多的藝術家,廣義的藝術家——包括視覺設計、3D建模,或者在文化娛樂公司工作的設計師、音樂人,他們都是藝術家——這些人不在藝術行業中最頂尖的行列,會有機會丟掉自己的工作。

AI Sora 生成的影片。圖:影片截圖
AI Sora 生成的影片。圖:影片截圖

Sora 這樣的產品對藝術更大的影響不止於失業。十年前,資深藝術評論家 Jerry Saltz 就批判藝術界充斥著大量平庸作品,藝術家像工蜂一樣畫出千篇一律看上去像藝術的畫,無論是主題、立意還是完成水平都很平庸空洞。這些作品是為了追求炫耀的一級、二級藝術市場而生,它們沒有批判、沒有指向、沒有內核,是「像比特幣一樣為貿易而生的」。

十年後,這個判斷仍然準確。藝術品、視覺消耗品的同質性高到令人驚訝,藝術市場和藝術平台都受到算法驅動,越平庸的賣得越好,賣得越好的作品越能被看到,惡性循環。觀眾因此能看到的東西越來越單一。我接受本科教育的時候被要求看各種各樣的不同的作品,培養作為設計師的敏感和品味。現在這種可能性沒有了,大眾看到的東西裏沒有新的,也沒有邊緣的。

我相信 Sora 會繼續得到改進,因為它目前看來很難直接投入大範圍被創意產業化應用。但是改進它之後,又會怎麼樣呢?現在 AI 生成的圖像已經比比皆是,你看到的東西相似性越來越高。好多海報、題圖、頭像都是 AI 生成的,包括某些新聞媒體的圖片插畫,我看到這些圖像後,腦子會直接忽略掉它們。它們實在太predicatable了,太油膩了。可是它們的量也太大了,佔領了很多數字地盤,不過這個佔領是虛空的,不實在的。越來越多的東西是被「空」(void)佔據了。短視頻也好、新聞故事也好,AI 製作的東西是最純粹的殺時間工具,即看即忘。最近有研究者指出,一些大語言 AI 現在被餵養的原始資料本身就是 AI 生成的,剛才這種平庸的循環利用更嚴重了,行內說法是 AI 中毒。大量的「空」也稀釋了為數不多的好東西,那些創作者認真投入製作出來的東西,已經需要觀眾大浪淘沙才有機會看到了。

雖然科技產業總是在說新,但這個「新」是需要小心審視的。我在 Midjourney 的 discord 看用戶寫 prompt,我發現大家寫的東西如果說是新,也是一種追求衝擊的新——「給我畫個外星上的兔子」。這不是創新,也不是創造。隨著 MidJourney、很快 Sora 這些工具的普及,有更多人去玩,去創作——我最近在想,消費和創作的界線已經沒有了。以前我們崇尚創作,創作者在創作的過程本身裏就可以享受到很多益處和靈光。比如說,你做一個 3D 模型,創作的過程是 thinking by hands,過程中你有很多機會發現新的東西、新的可能,可以和自己對話、和搭檔對話,現在這種辯證關係沒有了。自動化之前,我的創作過程是很有成就感的,現在慢慢消失了。

AI Sora 生成的影片。圖:影片截圖
AI Sora 生成的影片。圖:影片截圖

我記得第一次用CoPilot寫代碼的時候——CoPilot是微軟推出的大語言模型產品,它被內置在微軟的一些編程工具裡,比如 visual studio,可以幫助程序員提高寫碼速度,據說是25%到30%的提升。方法是機器根據你寫出的一部分代碼,推測並完成接下來的代碼。

我那天完成工作後和同事說,感覺自己被利用了。我是很喜歡寫代碼的,享受那種學習、探索的過程。但和CoPilot一起,(當它靈光的時候)我好像只是個按鍵盤的人(key presser)。創作本身消失了,根本上我們平常說的能動性喪失了。

現在有一些藝術家說不用太沮喪,因為目前的 AI 產品做得並不怎麼好,不會有很多人願意用。但在新自由主義經濟下,我們其實對好的要求很低,很多人願意犧牲掉這個好來換取方便。我自己也不例外,我會用好幾個小時和不同的 AI 模型說話,但回頭看八成時間裡,我都在和 AI 說:你這個搞錯了、那個做的不對、你應該用另一種方法做。有時候我想,如果自己直接寫代碼,而不是用它們寫,效率和成就感都會更高,但為了方便,看上去方便,我沒有那樣做。

最近我總在想 Mark Fisher 所說的 「未來已經被取消了」(The future is canceled)。福山說蘇聯解體後,資本主義系統取得徹底勝利,歷史終結了;Fisher 也說未來沒有了,資本主義內部再也沒有動力去在文化上產生新東西了,現在系統就是不斷為了短期得逐利把舊的東西拿出來修飾一下擺弄。社會沒有前進的動力了。這和生成式人工智能的邏輯一脈相承,文化不再進化,而是原地打轉。很多朋友互相半開玩笑說:「你能相信2004年是20年前嗎?」大家都感覺到一種停滯感,現在是虛空的、靜止的,人們很難相信甚至期待未來。

作為藝術家的我生活在很批判的思維裡,這種批判性在我白天工作的地方是缺失的。科技公司裏根本沒有關於文化的討論。有時候我覺得公司同事很像 NPC,只是去攻克一個個的技術問題然後拿薪水。程序員的工資高得荒謬,也許這已經足夠推動我的同事去好好工作、感受幸福,而不需要去想一些更加對於現今系統批判性的事情

科技產業自我選擇了一群奇怪的人,在我有限的個人經歷來看,大多數程序員是工具理性很強的群體,大家不太考慮 why,只是想 how: 怎麼樣減少程序加載的時間,怎麼樣降低組件發熱的速度。我前段時間發現我們公司的工作平台上居然有個讀書小組,我很興奮加入,結果是一些程序員週末一起讀機械學習實務的論文。程序員很少擔心我剛才說的事情,對他們來說最重要的是工作穩定、升職加薪、刷 leatcode 找工作跳槽,這以外的事情一概不 care。

曾經大家以為硅谷可以跳出來這個工具理性怪圈,追求精神性,spirituality 運動也好,吃蘑菇也好,讓程序員跳脫出來,不要淪為實驗室裏在旋轉輪上徒勞奔跑的小白鼠。現在發現,這一切都沒有用,小白鼠們做了運動、冥想、吃了蘑菇後,還是被關在實驗室裡,但是可能跑旋轉輪的效率更高了。

AI Sora 生成的影片。圖:影片截圖
AI Sora 生成的影片。圖:影片截圖

Sora出來了,「真實紀錄」還有甚麼價值?/Stanley Leung;紀錄片攝影師

「AI會模糊化真實性,堅守真實的責任,或多或少落在了創作者身上。」

關於Sora,我不算後知後覺。早在那支影片剛出來的時候,我就在Instagram上刷到,轉眼就把它忘了,因為我沒什麼感覺。

大家對生成式人工智慧(Generative AI)的討論不是一直都有嗎?當AI能生成文字、文字再生成照片、圖畫,一些人就會跑出來說 「哎呀,那些動畫師要失業了、哎呀,攝影師又會受到威脅了。」那麼Sora的出現,只是把這種討論延伸到影片類而已。

我記得讀書的時候,老師講過每當一個新的Technology出現,然後大家就會呼天搶地,覺得:哇,不行了,某些東西會被取代,或者某些工種就會消失。但大家會發現,其實這些擔憂並沒有發生過 。像是印刷機出現之後,人們說所有抄寫員會失業。但沒有啊,他們只不過去學一個新的技巧、用一個印刷機去做原本的東西。那麼到了現在,有生成式人工智慧的出現,人們又落回這個循環的討論。

如果我們放遠一點看,它其實也只是一個新的工具,可以容許創作者做一些之前科技不容許你做到的事,方便同時節省成本。不過在我看來,這個工具也有可能限制了創作者的想像力: 你寫一個prompt (提示)給AI以後,生成的影像是你無法控制的。為什麼要這樣拍?鏡頭可不可以低一點? 高一點? 我控制不了。那也當然,Sora會不斷演變、變得更好,難保三五七年後真的可以控制到這些技術類的東西。

至於真確性,那是一個我覺得比較有意義的話題。你想一想, 當你可以將任何東西生成出來,意味着你也可以將假的東西混在真的東西裡面,在這個已經假資訊泛濫的世界裡面,假消息傳遞只會更加加劇。

但作為紀錄片攝影師,我拍的東西,都必須是真的發生過。沒錯,紀錄片攝影師不可以使用AI。AI是會模糊化真實性的,而讀者和觀眾在接受資訊時確實是很被動的,你不會期望每個人都會看到每宗新聞或者帖文,都會去思考真偽。那堅守真實的責任,或多或少落在了創作者身上。 如果你是在述說一件真的東西,那你就要給一些真的東西大眾看,連創作者都不去堅守這件事,那內容真實性也就變得沒意義了 。

當然同一時間,在未來我可以預視到各種由AI生成、吸人眼球的影片在網絡上廣傳,但也許這樣會令我更加看到自己在做的事的價值——紀錄片的核心都是探討一些事實存在發生過的事,而在Sora還沒出現之前,攝影師好像還可以覺得紀錄的真實性是理所當然,但當現在真實性變得模糊脆弱的時候,我們去堅守這個真實性就顯得更加珍貴:我拍的東西,它一定是真的。誰知道?自己知道。

AI Sora 生成的影片。圖:影片截圖
AI Sora 生成的影片。圖:影片截圖

Sora已經能快速製片,廣告人要失業了嗎?Lin;商業廣告攝影師

「如果客戶資金有限,我不用飛到日本拍攝,用Sora都可以有日本的背景了。」

記得一年多以前,AI 工具完全改變了我從事廣告業六年以來的工作模式。商業攝影師的工作內容主要是為客戶的產品拍硬照,廣告會落到巴士、地鐵等等地方。我們需要搭建一些場景或道具,但很多時候拍攝完畢東西都要丟掉 ,其實是很不環保的。

不過在 AI 出現後,我們可以利用它快速搭建背景。第一,它是虛擬,所以環保;第二,基本上,它都可以把我們心目中想像的畫面具體成像,加快了我們跟客戶的溝通,節省了好多時間和人力物力。在市場經濟環境不太好的當下,AI的出現讓廣告行業多了一個可能性。它是一個工具,我們着眼的是怎樣好好利用它,把它變成工作能用上的扳手和錘子。

說實話,我是有被Sora震驚到的。在Sora出現之前,我也有看過Runway-Ai 等其他AI短片生成的平台,但生成出來的影片人像不清𥇦、畫質也不細緻。據我所知,行內已有商業廣告短片有使用到AI video,但在20、30秒的廣告中,AI 影片可能只佔到一秒左右。原因可以理解,就是因為畫面不夠細緻。雖說AI可以作廣告的噱頭之一。

現在Sora新出的示範片段,其實是一個超級大的躍進。人像還有輕微缺陷,但是已經比起Runway-Ai 精緻太多。況且那都只是時間問題,可能到它正式推出的時候,這些差距都已經調整好了。它會不會顛覆世界、顛覆廣告業?我覺得有可能,如果客戶的資金有限,我不用飛到日本拍攝,用Sora都可以有日本的背景了。

不過,它會不會顛覆香港廣告業?那就未必。大家都知道香港用戶用不了OpenAI,Sora推出以後香港用不用得到呢?我不太樂觀。

在AI工具出現以後,我也有留意到不少行業將被取代的說法。我自己覺得可以分兩個層面來講:第一個層面, 其實AI的應用層面是很廣的,它可以取代很多人為的工種,特別是像IT、會計等講求精確度的行業。而在創意工業,當客戶按兩下滑鼠、打一段字都可以有圖有畫出來,AI固然也有可能取代平面設計的工作。但換個角度看,新的「prompt designer」行業也在冒起。他們負責的就是研究怎樣寫一個準繩的prompt,讓客戶得到他們想要的成像。所以隨著時代的進步,與其說「取代」,那不如說「轉型」。

第二,我不覺得AI可以完全取代人的創意思維。因為AI的生成方法,是靠着我們給它餵食的參考圖、寫不同的prompt,讓它不斷去學習生成。簡單一點來講,就是A加B等於C。去年,我們公司為客戶製作了兩份使用到AI生成圖片的廣告。我也觀察到,市面已經有廣告完全使用AI生成圖像,但質量還是很粗糙,而且AI 還是存在偏見,像是華人男生就一定是小眼睛。可是在廣告行業,我們還是要講品牌的branding,如果你想效果感染力強一點,就不能夠直接用AI,一定要加很多東西、再修修改改。

當然,它以後能否跳出這個模式,我不敢說。AI 不像人,沒有惰性,它無時無刻都在學習。當越多人用它的時候,它就一起共生成長。但像我所說,因為香港用不了,於是現在在我們這行,AI取代真人的情況還沒發生。我感覺,相比起AI在台灣環境不斷成長,香港廣告業裡AI的使用和發展還是相對落後。我還在期待OpenAI 開放給香港人使用的一天。

讀者評論 8

會員專屬評論功能升級中,稍後上線。加入會員可閱讀全站內容,享受更多會員福利。
  1. 然後各大學急著趕上車,開課程,一群學生沒頭沒腦的套用軟件做應用,也不知道後頭的數學模型是什麼。不思考的人類用著不思考的模型,平庸的迭代…

  2. 平庸的是這個被資本主義建構的世界。這些模型就是挺平庸的。記得聽過一個物理學者演講如何透過機器學習預測平面上Ga-Si兩種原子不同的排列方式對能階的影響,餵給的資料是來自已知的理論計算結果,做出來的結果,就是用大腦隨便想也知道的結果。階露了新規律嗎?沒有。蛋白質折疊的預測,能幫助我們理解預測摺疊的機制?大概也沒有。雖然有90%的正確率。這個與,例如說用程式輔助數學四色問題的證明,有明顯的不同。AI總結先前的思考成果,但不會思考。給模型餵食海量社會學文獻,數學文獻,再給他一些問題,他也能無法寫得出一篇新論文。模型製造的那些影片圖畫能表現什麼情境說什麼故事?這其實是高級的剽竊。最重視智慧財產權的美國,幹起剽竊全世界的勾當。

  3. @EricChan 為端提供內容的人自有圈子,估計裡面有不少 80-00 後的、遍佈各地的知識分子,自然不缺有資格接受訪問的人。
    一方面我覺得這代表了端的內容質量有一定保證;另一方面,會不會長期觀察下來,某些議題的受訪者原來是傳媒之友(真。私人朋友),反而限制了受訪者履歷和觀點的幅度。

  4. 短短幾日就能找找到這些受訪者的確厲害,而且受訪者在行業中角色各異,對於AI與自身行業的關係也有一定理解就更是難得。

  5. 创造过程变得微不足道,选择过程成为重中之重。

  6. 大概率是中國用語,換成高機率會比較恰當。
    端很多文章的品質都很高,但經常越寫越多導致看不完,就棄追了,例如這篇就是。
    這篇很需要AI做個摘要

  7. 我覺得跟服裝行業不同🤔。服裝行業的機械化並沒有讓消費者能全程主導服裝的設計與製作,但SORA等AI影片製作,剪輯工具真的可以。

  8. 以後的攝影剪輯行業,會不會如同工業革命時期的服裝行業,先從“手工”比不上“機械工”的痛苦時期過度,最終演化成手工(攝影剪輯)變高端化和深度客製化呢。