SORA降临:艺术又死了,事实再沉沦?21世纪的工业革命(又)要来了吗?

“文转片”AI 来了。我们问了纪录片摄影师﹑事实查核员﹑艺术家:他们的未来是不是(又)被取消了?
AI Sora 生成的影片。图:影片截图
工具人 国际 人工智能 科技

“工具人”是端传媒新开设的栏目。近年我们迎来了一波科技大爆发:人工智能﹑大数据和机械人似乎从科幻般的遥远未来被拉到我们面前,眼看就要对我们的生活造成巨大影响。都说人类站到食物链顶层是因为懂得使用工具,但这些工具会如何倒过来模塑人类社会?栏目不定期刊出探讨科技﹑社会与人文的深度报道,请点击订阅。

“太可怕了,完全是一场工业革命。”同事看到OpenAI发布的Sora影片后这么说。根据OpenAI发布的示范,只需要给Sora一段2﹑30字的指令,它就可以生成一段长达一分钟的影片,可以是写实影片,可以是动画,也可以是历史片﹑黑白片﹑3D科幻片……在不久将来,所有人都可以(大概率是在付费的前提下)随时随地生成影片,即是说拍摄﹑绘画﹑剪片制片的门槛将不再存在。

“工业革命”的说法或者没有那么夸张。相比起Midjourney等“文转图”工具,Sora再度跨过了另一个重要防线:要生成影片,即是AI工具必须对我们生活的物理世界有相当认识,或至少是有相当模拟的能力。当然,过去一﹑两年,ChatGPT和Midjourney等工具都掀起过不少讨论,“工业革命”的说法自然也不是第一次听到。那么,Sora是否将掀起另一次工业革命--如果是,被影响的又会是谁?我们问了人工智能工程师﹑艺术家﹑纪录片摄影师﹑广告人和事实查核专家:Sora降临,到底我们的未来,会因此产生哪些变化?

Sora真的有那么厉害吗?/Lanston Chu;人工智能工程师

“一切都只是钱和时间的问题。”

周五上班,同事间都在讨论当日发布的Sora,我也忍不住去八卦了已公开的示范影片。第一印象:Sora非常厉害。如果不仔细看,有几段片我都会以为是真实拍摄的。其实“文转片”AI不是首次出现,例如去年推出的同类AI工具Pika。不过Pika做出来的影片只有几秒,而且画质明显粗糙,跟Sora的示范影片不能同日而语。

当然,只要认真看一下影片,就会发觉Sora做出来的影片还是跟“真实”有一段距离。

在Sora发布的片段中,有一段展示了一只海鸥飞过一根“自拍杆”的背后,在飞过之后海鸥便在画面消失了。另一个例子是,一只小狗从一个窗台走向另一个窗台,两个窗台中间应该有窗阻挡,但是小狗视木窗为无物,轻松越过到达另一窗台。

AI Sora 生成的影片。图:影片截图
AI Sora 生成的影片。图:影片截图

这些美但不合逻辑的细节,其实有点像做梦:我们做梦时,负责处理逻辑和理性思考的大脑前额叶皮质的活动频率远低于清醒时,因此我们往往没有足够的处理能力去判断所见画面是否合逻辑,从而能够接受这些画面。

实际上,Sora官网的介绍文章也提到了模拟能力(simulation ability)的概念,根据他们的说法,三维画面在镜头转动时,大致上可以保持一致(即以合理的方式展示),但在对象持久性方面(如先前提到的海鸥例子),则是“时有时无”。至于对象之间与现实世界的互动(如前述的小狗爬窗示例),也是“时有时无”。至于“成功”的例子,OpenAI提供了一个男人咬汉堡包并在包上留下牙印的示例;另一个示例则是画笔在画布上画画时会留下笔迹。

这是合理的,因为Sora并没有在真实世界中生活过,它学习的一切都是通过“屏幕”来学习的,就像一个从出生开始就被锁在博物馆里的人,只能通过观看博物馆里的照片来学习真实世界一样。

尽管如此,针对以前大家提到的早期AI的弱点,Sora已经进行了一些改进。例如,早期的MidJourney存在典型的“手指问题”,但在Sora示范片段看起来,这个问题似乎已大致解决。然而,有一些方面确实需要时间来改进,例如片段中东京街头的霓虹灯招牌全都是乱码--那是因为Sora还不会写字。包含文字的图像与不包含文字的图像的信息量不同。如果从人脑的角度来看,如果你眼前的画面包含文字,你的大脑会激活额外的神经元,所以有文字和无文字的画面在你大脑中的路径是不同的。

当然,我认为这个问题几年内可以解决:一切都只是钱和时间的问题。再者,其他大厂都已经在发展同类模型,竞争下自然会有精进。

这就是为甚么,虽然AI工具并不“完美”,但这个不应该是我们看轻AI可塑性的理由。在可见将来,AI生成的影片永远会有人类专家可以找到的漏洞。例如,一个植物学家看了一段沙漠短片,可能可以看出某棵树属于温带而不会出现在沙漠。厂方确实可以再投资加强AI,以欺骗过植物学家,但问题是是否值得投入一大笔钱去欺骗一小部分植物学家?赫拉利(Yuval Noah Harari)在《人类简史》中提过,其中一种最难被AI取代的工作是考古学家,因为没有人有意欲投入金钱去取代他们--这个原理跟AI有“缺点”的原因是一样的。

这主要是成本效益问题,而不是AI能做到多强的问题。人类永远会有他们自己的位置。

至于许多人担心AI会取代人类,实际上AI也可以创造新的职位。以前漫画家需要请助手来画网格,现在有AI画网格,助手就可以去构思故事成为漫画家,原本的漫画家就可以利用AI进一步精进自己成为漫画大师。而且我不觉得人只想看AI制作的艺术品,我自己看过很多AI的画也觉得审美疲劳。正如你可以以低价购买按摩机,但当你真的追求优质按摩时,你还是会找一个真人为你进行spa。

而且,Sora的作品再强,也不是真货。许多研究表明,如果你使用AI生成的输出作为训练数据去训练新的模型,久而久之这些模型会越来越退化。就拿热带草原出现温带树的例子来说,人眼可能看不出有问题,但如果用这些图像作为训练数据,下一代的模型就会越练越笨。也就是说,假货和真货永远有区别,真的东西永远有价值,假的东西永远不可能100%取代真的。人类摄影师用镜头实地拍摄的真实影像永远有价值,Sora再强,仍然需要人类制作的作品来教育它,人类的价值永远存在。起码我是这样相信的。

AI Sora 生成的影片。图:影片截图
AI Sora 生成的影片。图:影片截图

Sora出来了,信假新闻的人会不会更多?/郑家榆;香港Factcheck Lab执行编辑

在进化的不止科技,还有人。

老实说,我对Sora没有甚么特别大的感觉。类似技术出来是迟早的事。

每当有这类人工智能技术出来,很多人的直觉反应就是:“以后做假新闻就更方便了”﹑“以后都很难分辨真假了”。我会觉得,影响不是没有,但不如许多人想像的那么可怕。以美国大选为例,只要有Sora的技术,的确很容易就可以制作几百﹑几千条拜登老人痴呆﹑失忆失言的影片。但我记得7﹑8年前,Deepfake(深伪技术)出来的时候,很多人担忧这种能改头换面的技术会影响选举,结果也没想像中的那么严重。

事实上,要制造假新闻﹑假片,根本不必用上深伪﹑Sora这类的高端技术。2019年,佩洛西(Nancy Pelosi)在一个新闻发布会演说的片段被恶搞,令她说话听起来结结巴巴﹑含糊不清,散布影片的人说她不是喝醉了就是嗑了药。影片在各个社交平台被疯传,甚至连霍士电视台(Fox News)和特朗普的私人律师朱利亚尼也有转发。但佩洛西这段片甚至没有用上深伪技术,只是影片被调成75%速度慢放而已,但完全无碍愿意相信的人去散布﹑转发它。

原因是甚么?我个人的估计:最容易受这种假新闻影响的人,立场本来就很极端。假新闻传播的重点在于需求,而不在于供应--而对于有固定需求的受众,假新闻的质素其实并没那么重要。

社会对于新科技对新闻真相的影响,似乎一直都是有点过份夸大的。我们可以回到人相信假新闻的原因上:这是因为他们对某些事物有恐惧,或者特别想要一些特定的事物。例如白人可能恐惧非白人﹑新移民﹑罪犯等等。假新闻的传播,一直都仰赖一个完整的叙事框架,能够触及特定目标群体的恐惧与欲望。技术的进步从来都不是重点。

再者,在美国的政治背景下,极化(polarization)已经达到了一个高峰,再多﹑做得再精细的假新闻是不是真的会影响中间派选民?起码我不觉得会。以佩洛西的被慢放的片段为例,这样的内容明显是针对特定的目标群体,不太可能影响到持中立立场的选民。同时,即使是像特朗普这样的人物,即使官司缠身丑闻不断,但大量支持者还是在支持他第三次参选。当选民的立场已经固化,再“精进”假新闻技术来吸引他们就多此一举了。

所以,我认为Sora在制造和传播假信息上的影响,更多是提供了一个新的工具,而不是彻底改变游戏规则。假新闻的成功并不仅仅依赖于技术的进步,而是需要有一个完整的叙事,针对性地触及人们的恐惧和欲望,比如对黑人﹑新移民的偏见,或者对失业的恐惧。单一的短片或文章往往效果有限。

我常常强调的是,制造和传播假新闻是两个很不同的过程。在数字时代,每天有数以亿计的消息在流通,让一则消息病毒式传播的因素不仅仅是它的内容有多么引人注目,更重要的是人们为什么会选择分享它。再加上,虽然说出来有点难相信,但其实人是会进步的--例如在识别由AI生成的图片方面,人们已经比起初熟练得多。在进化的不仅仅只有科技。

当然,有了像Sora这样的技术,揭露﹑辨识假片肯定更加困难,尤其是对于资源有限的事实核查机构而言。但老实说,我并不认为揭露假新闻完全是事实查核机构的问题--更多是制造AI工具的科技大厂的问题。现在白宫发放的片段有新增加密签名技术,帮助验证内容的真实性;未来新闻摄影等领域也可能需要引入类似技术,以确保图像真实。

AI Sora 生成的影片。图:影片截图
AI Sora 生成的影片。图:影片截图

Sora将如何改变艺术,以及艺术市场?/黄瓜;媒体艺术家

“Sora 攻破了最后一道防线——动态影像。”

我是媒体艺术家,computational artist。我的创作一直以来会关注并用上科技工具和产品,同时也关注技术科技哲学领域的研究和理论。我很珍惜做艺术家的身份和工作,另一方面,我白天在一家位于纽约的北美科技大厂工作,做工程师。这个公司和美国其他科技公司一样,公司和同事都是科技中心主义。我的白天工作主要功能是赚钱,我很少和人说起它,因为我很不以此为傲,更认同自己是有批判性的艺术家。

我关注 AI 也有十年了,是从2014年开始一路追过来。昨天看到 Sora 的发布会,之前的很多质疑一下子都冒了上来。

首先他们的数据是哪来的? Sora 模型是大型语言模型喂养出来的。这些原始资料有多少是没有版权的,没有得到原创者同意的,有多少是知识共享的?Open AI 是这个产业中在版权和AI伦理方向最激进的企业,也是在侵权方面最糟糕的一家。 Open AI 从来不公布信息和资料具体的来源,你根本没法知道它从互联网上扒下来的原作是什么、谁做的,也没办法通过逆向工程还原出原始的训练集。整个行业没有立法监督,在美国,大家都心照不宣,国家不会管控科技产业,也许以后有可能,毕竟现在欧盟已经树立了类似 Digital Service Act 这样的先例。但是,美国目前还是会为防止侵害创新(hinder innovation)不去管控整个行业。2023年 Stability AI,一家专注文本转图像的生成式 AI 产品 Stable Diffusion 的公司,被三位艺术家和Getty Image 诉讼侵权,审判过程中 Stability AI 需要处理很多问题和透露很多资料,也吓到了其他公司。(编按:美国地方法官2023年驳回了艺术家对Stability AI的诉讼。)

艺术家和生成式 AI 的矛盾已经有些年头了,Twiiter 上两年前就有口水大战。大多数艺术家不支持这种技术获取原始训练资料的方式,对于出产“作品”的著作权也有异议,但这些艺术家面对科技公司及其支持者有两大弱点。一个是艺术家不会说科技产业的语言,他们的批判常常会被对方钻空子捡漏,这样后者就可以脱逃指责。譬如有艺术家批判大语言模型公司非法爬梳、存储自己的作品,但科技公司说自己不存储任何艺术作品,我们只有算法,就在语言上和概念上偷梁换柱,逃过去了。艺术家的另一个弱点是,很多人的生计受到生成式人工智能的威胁,所以他们的发言会被大众认为是有偏见的,不够公正中立。这也让我觉得更有责任站出来,因为我有一份大厂的工程师工作,我会说专业术语,我的生存也没有被 AI 威胁,I am part of the tech world。

我和很多艺术家看到发布会的视频后,觉得很沮丧的和悲观。Sora让我们发现,生成式人工智能已经有能力建造自己的“世界”了,一个完全的模拟世界。我们人类在情感上其实是害怕生活在仿真、模拟的世界里的,这也是为什么很多人抵触 VR。之前我们已经承认静态影像是不可靠的了,我们不能完全相信它们,现在 Sora 攻破了最后一道防线——动态影像。

我们看到这次发布的视频制作水平是很高的,技术上可以做到文字指令生成多种类型的视频,比如广告、时尚、历史片什么的。目前这些工作是由艺术家来完成的,很多艺术家需要接这类商业工作来维持生计,所以的确是受到了挑战。

当然也会有艺术家和机构拥抱技术。这部分人数量上是很少的,他们生存的生态比较精英,一般叫做机构艺术家——被世界顶级美术馆、研究院这些精英机构支持的艺术家。他们和一些美术馆从业人员不一定真的很有激情要拥抱技术,但科技产业会奖励他们。像韩国现代汽车、谷歌这些巨型公司,都会给一些经济资源去刺激美术馆使用技术。这与其说是为了艺术和创作,不如说是为了企业发展本身。艺术家热衷用新技术,不乏有人是真感兴趣,但也有很多人觉得做做也不错,又有曝光,又可能有科技产业的经济回报。

但更多的艺术家,广义的艺术家——包括视觉设计、3D建模,或者在文化娱乐公司工作的设计师、音乐人,他们都是艺术家——这些人不在艺术行业中最顶尖的行列,会有机会丢掉自己的工作。

AI Sora 生成的影片。图:影片截图
AI Sora 生成的影片。图:影片截图

Sora 这样的产品对艺术更大的影响不止于失业。十年前,资深艺术评论家 Jerry Saltz 就批判艺术界充斥著大量平庸作品,艺术家像工蜂一样画出千篇一律看上去像艺术的画,无论是主题、立意还是完成水平都很平庸空洞。这些作品是为了追求炫耀的一级、二级艺术市场而生,它们没有批判、没有指向、没有内核,是“像比特币一样为贸易而生的”。

十年后,这个判断仍然准确。艺术品、视觉消耗品的同质性高到令人惊讶,艺术市场和艺术平台都受到算法驱动,越平庸的卖得越好,卖得越好的作品越能被看到,恶性循环。观众因此能看到的东西越来越单一。我接受本科教育的时候被要求看各种各样的不同的作品,培养作为设计师的敏感和品味。现在这种可能性没有了,大众看到的东西里没有新的,也没有边缘的。

我相信 Sora 会继续得到改进,因为它目前看来很难直接投入大范围被创意产业化应用。但是改进它之后,又会怎么样呢?现在 AI 生成的图像已经比比皆是,你看到的东西相似性越来越高。好多海报、题图、头像都是 AI 生成的,包括某些新闻媒体的图片插画,我看到这些图像后,脑子会直接忽略掉它们。它们实在太predicatable了,太油腻了。可是它们的量也太大了,占领了很多数字地盘,不过这个占领是虚空的,不实在的。越来越多的东西是被“空”(void)占据了。短视频也好、新闻故事也好,AI 制作的东西是最纯粹的杀时间工具,即看即忘。最近有研究者指出,一些大语言 AI 现在被喂养的原始资料本身就是 AI 生成的,刚才这种平庸的循环利用更严重了,行内说法是 AI 中毒。大量的“空”也稀释了为数不多的好东西,那些创作者认真投入制作出来的东西,已经需要观众大浪淘沙才有机会看到了。

虽然科技产业总是在说新,但这个“新”是需要小心审视的。我在 Midjourney 的 discord 看用户写 prompt,我发现大家写的东西如果说是新,也是一种追求冲击的新——“给我画个外星上的兔子”。这不是创新,也不是创造。随著 MidJourney、很快 Sora 这些工具的普及,有更多人去玩,去创作——我最近在想,消费和创作的界线已经没有了。以前我们崇尚创作,创作者在创作的过程本身里就可以享受到很多益处和灵光。比如说,你做一个 3D 模型,创作的过程是 thinking by hands,过程中你有很多机会发现新的东西、新的可能,可以和自己对话、和搭档对话,现在这种辩证关系没有了。自动化之前,我的创作过程是很有成就感的,现在慢慢消失了。

AI Sora 生成的影片。图:影片截图
AI Sora 生成的影片。图:影片截图

我记得第一次用CoPilot写代码的时候——CoPilot是微软推出的大语言模型产品,它被内置在微软的一些编程工具里,比如 visual studio,可以帮助程序员提高写码速度,据说是25%到30%的提升。方法是机器根据你写出的一部分代码,推测并完成接下来的代码。

我那天完成工作后和同事说,感觉自己被利用了。我是很喜欢写代码的,享受那种学习、探索的过程。但和CoPilot一起,(当它灵光的时候)我好像只是个按键盘的人(key presser)。创作本身消失了,根本上我们平常说的能动性丧失了。

现在有一些艺术家说不用太沮丧,因为目前的 AI 产品做得并不怎么好,不会有很多人愿意用。但在新自由主义经济下,我们其实对好的要求很低,很多人愿意牺牲掉这个好来换取方便。我自己也不例外,我会用好几个小时和不同的 AI 模型说话,但回头看八成时间里,我都在和 AI 说:你这个搞错了、那个做的不对、你应该用另一种方法做。有时候我想,如果自己直接写代码,而不是用它们写,效率和成就感都会更高,但为了方便,看上去方便,我没有那样做。

最近我总在想 Mark Fisher 所说的 “未来已经被取消了”(The future is canceled)。福山说苏联解体后,资本主义系统取得彻底胜利,历史终结了;Fisher 也说未来没有了,资本主义内部再也没有动力去在文化上产生新东西了,现在系统就是不断为了短期得逐利把旧的东西拿出来修饰一下摆弄。社会没有前进的动力了。这和生成式人工智能的逻辑一脉相承,文化不再进化,而是原地打转。很多朋友互相半开玩笑说:“你能相信2004年是20年前吗?”大家都感觉到一种停滞感,现在是虚空的、静止的,人们很难相信甚至期待未来。

作为艺术家的我生活在很批判的思维里,这种批判性在我白天工作的地方是缺失的。科技公司里根本没有关于文化的讨论。有时候我觉得公司同事很像 NPC,只是去攻克一个个的技术问题然后拿薪水。程序员的工资高得荒谬,也许这已经足够推动我的同事去好好工作、感受幸福,而不需要去想一些更加对于现今系统批判性的事情

科技产业自我选择了一群奇怪的人,在我有限的个人经历来看,大多数程序员是工具理性很强的群体,大家不太考虑 why,只是想 how: 怎么样减少程序加载的时间,怎么样降低组件发热的速度。我前段时间发现我们公司的工作平台上居然有个读书小组,我很兴奋加入,结果是一些程序员周末一起读机械学习实务的论文。程序员很少担心我刚才说的事情,对他们来说最重要的是工作稳定、升职加薪、刷 leatcode 找工作跳槽,这以外的事情一概不 care。

曾经大家以为硅谷可以跳出来这个工具理性怪圈,追求精神性,spirituality 运动也好,吃蘑菇也好,让程序员跳脱出来,不要沦为实验室里在旋转轮上徒劳奔跑的小白鼠。现在发现,这一切都没有用,小白鼠们做了运动、冥想、吃了蘑菇后,还是被关在实验室里,但是可能跑旋转轮的效率更高了。

AI Sora 生成的影片。图:影片截图
AI Sora 生成的影片。图:影片截图

Sora出来了,“真实纪录”还有甚么价值?/Stanley Leung;纪录片摄影师

“AI会模糊化真实性,坚守真实的责任,或多或少落在了创作者身上。”

关于Sora,我不算后知后觉。早在那支影片刚出来的时候,我就在Instagram上刷到,转眼就把它忘了,因为我没什么感觉。

大家对生成式人工智慧(Generative AI)的讨论不是一直都有吗?当AI能生成文字、文字再生成照片、图画,一些人就会跑出来说 “哎呀,那些动画师要失业了、哎呀,摄影师又会受到威胁了。”那么Sora的出现,只是把这种讨论延伸到影片类而已。

我记得读书的时候,老师讲过每当一个新的Technology出现,然后大家就会呼天抢地,觉得:哇,不行了,某些东西会被取代,或者某些工种就会消失。但大家会发现,其实这些担忧并没有发生过 。像是印刷机出现之后,人们说所有抄写员会失业。但没有啊,他们只不过去学一个新的技巧、用一个印刷机去做原本的东西。那么到了现在,有生成式人工智慧的出现,人们又落回这个循环的讨论。

如果我们放远一点看,它其实也只是一个新的工具,可以容许创作者做一些之前科技不容许你做到的事,方便同时节省成本。不过在我看来,这个工具也有可能限制了创作者的想像力: 你写一个prompt (提示)给AI以后,生成的影像是你无法控制的。为什么要这样拍?镜头可不可以低一点? 高一点? 我控制不了。那也当然,Sora会不断演变、变得更好,难保三五七年后真的可以控制到这些技术类的东西。

至于真确性,那是一个我觉得比较有意义的话题。你想一想, 当你可以将任何东西生成出来,意味着你也可以将假的东西混在真的东西里面,在这个已经假资讯泛滥的世界里面,假消息传递只会更加加剧。

但作为纪录片摄影师,我拍的东西,都必须是真的发生过。没错,纪录片摄影师不可以使用AI。AI是会模糊化真实性的,而读者和观众在接受资讯时确实是很被动的,你不会期望每个人都会看到每宗新闻或者帖文,都会去思考真伪。那坚守真实的责任,或多或少落在了创作者身上。 如果你是在述说一件真的东西,那你就要给一些真的东西大众看,连创作者都不去坚守这件事,那内容真实性也就变得没意义了 。

当然同一时间,在未来我可以预视到各种由AI生成、吸人眼球的影片在网络上广传,但也许这样会令我更加看到自己在做的事的价值——纪录片的核心都是探讨一些事实存在发生过的事,而在Sora还没出现之前,摄影师好像还可以觉得纪录的真实性是理所当然,但当现在真实性变得模糊脆弱的时候,我们去坚守这个真实性就显得更加珍贵:我拍的东西,它一定是真的。谁知道?自己知道。

AI Sora 生成的影片。图:影片截图
AI Sora 生成的影片。图:影片截图

Sora已经能快速制片,广告人要失业了吗?Lin;商业广告摄影师

“如果客户资金有限,我不用飞到日本拍摄,用Sora都可以有日本的背景了。”

记得一年多以前,AI 工具完全改变了我从事广告业六年以来的工作模式。商业摄影师的工作内容主要是为客户的产品拍硬照,广告会落到巴士、地铁等等地方。我们需要搭建一些场景或道具,但很多时候拍摄完毕东西都要丢掉 ,其实是很不环保的。

不过在 AI 出现后,我们可以利用它快速搭建背景。第一,它是虚拟,所以环保;第二,基本上,它都可以把我们心目中想像的画面具体成像,加快了我们跟客户的沟通,节省了好多时间和人力物力。在市场经济环境不太好的当下,AI的出现让广告行业多了一个可能性。它是一个工具,我们着眼的是怎样好好利用它,把它变成工作能用上的扳手和锤子。

说实话,我是有被Sora震惊到的。在Sora出现之前,我也有看过Runway-Ai 等其他AI短片生成的平台,但生成出来的影片人像不清𥇦、画质也不细致。据我所知,行内已有商业广告短片有使用到AI video,但在20、30秒的广告中,AI 影片可能只占到一秒左右。原因可以理解,就是因为画面不够细致。虽说AI可以作广告的噱头之一。

现在Sora新出的示范片段,其实是一个超级大的跃进。人像还有轻微缺陷,但是已经比起Runway-Ai 精致太多。况且那都只是时间问题,可能到它正式推出的时候,这些差距都已经调整好了。它会不会颠覆世界、颠覆广告业?我觉得有可能,如果客户的资金有限,我不用飞到日本拍摄,用Sora都可以有日本的背景了。

不过,它会不会颠覆香港广告业?那就未必。大家都知道香港用户用不了OpenAI,Sora推出以后香港用不用得到呢?我不太乐观。

在AI工具出现以后,我也有留意到不少行业将被取代的说法。我自己觉得可以分两个层面来讲:第一个层面, 其实AI的应用层面是很广的,它可以取代很多人为的工种,特别是像IT、会计等讲求精确度的行业。而在创意工业,当客户按两下滑鼠、打一段字都可以有图有画出来,AI固然也有可能取代平面设计的工作。但换个角度看,新的“prompt designer”行业也在冒起。他们负责的就是研究怎样写一个准绳的prompt,让客户得到他们想要的成像。所以随著时代的进步,与其说“取代”,那不如说“转型”。

第二,我不觉得AI可以完全取代人的创意思维。因为AI的生成方法,是靠着我们给它喂食的参考图、写不同的prompt,让它不断去学习生成。简单一点来讲,就是A加B等于C。去年,我们公司为客户制作了两份使用到AI生成图片的广告。我也观察到,市面已经有广告完全使用AI生成图像,但质量还是很粗糙,而且AI 还是存在偏见,像是华人男生就一定是小眼睛。可是在广告行业,我们还是要讲品牌的branding,如果你想效果感染力强一点,就不能够直接用AI,一定要加很多东西、再修修改改。

当然,它以后能否跳出这个模式,我不敢说。AI 不像人,没有惰性,它无时无刻都在学习。当越多人用它的时候,它就一起共生成长。但像我所说,因为香港用不了,于是现在在我们这行,AI取代真人的情况还没发生。我感觉,相比起AI在台湾环境不断成长,香港广告业里AI的使用和发展还是相对落后。我还在期待OpenAI 开放给香港人使用的一天。

读者评论 8

会员专属评论功能升级中,稍后上线。加入会员可阅读全站内容,享受更多会员福利。
  1. 然後各大學急著趕上車,開課程,一群學生沒頭沒腦的套用軟件做應用,也不知道後頭的數學模型是什麼。不思考的人類用著不思考的模型,平庸的迭代…

  2. 平庸的是這個被資本主義建構的世界。這些模型就是挺平庸的。記得聽過一個物理學者演講如何透過機器學習預測平面上Ga-Si兩種原子不同的排列方式對能階的影響,餵給的資料是來自已知的理論計算結果,做出來的結果,就是用大腦隨便想也知道的結果。階露了新規律嗎?沒有。蛋白質折疊的預測,能幫助我們理解預測摺疊的機制?大概也沒有。雖然有90%的正確率。這個與,例如說用程式輔助數學四色問題的證明,有明顯的不同。AI總結先前的思考成果,但不會思考。給模型餵食海量社會學文獻,數學文獻,再給他一些問題,他也能無法寫得出一篇新論文。模型製造的那些影片圖畫能表現什麼情境說什麼故事?這其實是高級的剽竊。最重視智慧財產權的美國,幹起剽竊全世界的勾當。

  3. @EricChan 為端提供內容的人自有圈子,估計裡面有不少 80-00 後的、遍佈各地的知識分子,自然不缺有資格接受訪問的人。
    一方面我覺得這代表了端的內容質量有一定保證;另一方面,會不會長期觀察下來,某些議題的受訪者原來是傳媒之友(真。私人朋友),反而限制了受訪者履歷和觀點的幅度。

  4. 短短幾日就能找找到這些受訪者的確厲害,而且受訪者在行業中角色各異,對於AI與自身行業的關係也有一定理解就更是難得。

  5. 创造过程变得微不足道,选择过程成为重中之重。

  6. 大概率是中國用語,換成高機率會比較恰當。
    端很多文章的品質都很高,但經常越寫越多導致看不完,就棄追了,例如這篇就是。
    這篇很需要AI做個摘要

  7. 我覺得跟服裝行業不同🤔。服裝行業的機械化並沒有讓消費者能全程主導服裝的設計與製作,但SORA等AI影片製作,剪輯工具真的可以。

  8. 以後的攝影剪輯行業,會不會如同工業革命時期的服裝行業,先從“手工”比不上“機械工”的痛苦時期過度,最終演化成手工(攝影剪輯)變高端化和深度客製化呢。