00:59

根据OpenAI官网,Sora能够生成具有多个角色、特定类型的运动以及主体和背景的准确细节的复杂场景。Sora不仅了解用户在提示中提出的要求,还了解这些东西在物理世界中的存在方式。

00:08

无人机拍摄的海浪拍打大苏尔加雷角海滩崎岖悬崖的景象。(00:08)

00:08

提示词:穿过东京郊区的地铁窗外倒影(00:08)

00:17

需要注意的是,目前Sora属于半成品,OpenAI称,它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系的具体实例。例如,一个人可能咬了一口饼干,但之后饼干可能没有咬痕。还可能会混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。

00:19

Sora生成的错误案例(00:19)

与GPT模型类似,Sora使用Transformer架构。Sora建立在过去对DALL·E和GPT模型的研究之上。它使用DALL·E3的重述技术,该技术涉及为视觉训练数据生成高度描述性的标题。因此,该模型能够更精准遵循生成用户的文本指令。

OpenAI表示,Sora是能够理解和模拟现实世界的模型基础,相信这一功能将成为实现AGI(通用人工智能)的重要里程碑。

X平台网友截图

X平台网友截图

Gracey认为,以后或许不再需要一个由100-200名艺术家组成的团队来用3年时间完成动画长片,但他也提醒,AI工具是根据现实生活中艺术家的作品进行训练,而不给予他们补偿,这是一个大问题。“当它剥夺了其他人的创造力、工作、想法和执行力,而不给予他们应有的荣誉和经济报酬时,那就不好了。”

需要指出的是,实现AGI的背后需要大量的算力来支持,也就是足够多的GPU(图形处理芯片),目前英伟达是全球生产GPU的霸主,但芯片市场一直面临供不应求的局面。也正是因此大模型的算力需求,OpenAI首席执行官山姆·奥特曼(SamAltman)正试图筹集万亿美元来重塑全球半导体产业。

就在一周前,据外媒报道,奥特曼正与包括阿联酋政府在内的投资者洽谈,希望筹集到数万亿美元的资金来提高全球芯片制造能力,为其AI研发提供充足动力,有知情人士称,该项目可能需要5-7万亿美元。

7万亿美元是什么概念?

英伟达CEO黄仁勋12日曾在公开场合有些讽刺地回应称,“(7万亿美元)显然能买下所有的GPU……如果你认为计算机无法发展得更快,可能会得出这样的结论:我们需要14颗行星、3个星系和4个太阳来为这一切提供燃料。但是,计算机架构其实在不断地进步。”

外媒援引知情人士的话称,奥特曼正在建议OpenAI、投资者、芯片制造商和能源供应商之间建立合作,将共同出资建造芯片工厂。最近数周时间,奥特曼已经与多位人士进行了会谈,包括软银和台积电等,甚至包括阿联酋的谢赫·塔农·本·扎耶德·阿勒纳哈扬(SheikhTahnounbinZayedAlNahyan),他是阿联酋总统的兄弟,也是阿布扎比多个主权财富基金的主席。

按照奥特曼的想法,未来数年内要建立数十家芯片代工工厂,建造所需的资金由中东投资者提供,而台积电来制造和运营这些工厂。