声明:本文来自于微信公众号AI新榜,作者:石濑 阿虎,授权站长之家转载发布。
好消息:Sora终于来了!
坏消息:哪轮得到我们啊
今天凌晨,传闻中OpenAI最大的期货Sora正式登场。据OpenAI介绍,Sora支持用户生成最高1080p、最长20秒、多种尺寸比例的视频。
用户可以使用文本、图像和视频三种方式提示Sora生成视频,并利用混合、重剪、融合和风格预设等功能对视频进行编辑修改。
照道理来说,ChatGPT Plus/Pro用户可以在所有ChatGPT可用的地方访问Sora。
那么,用Sora生成视频要花多少钱?我们先来浅算一笔账。
每月20美元的Plus用户,一个月会有1000积分,而尊贵的200美元Pro用户会有10000积分。
根据生成视频时长不同,所需积分也不同。生成20秒的480p视频最多需要150个积分,720p则需要540个积分,如果是20秒1080p高分辨率视频所需积分将高达2000个。
所以,假设你是氪金Pro玩家(200美元/月,折合人民币1460元),可以最多优先生成500个视频(5秒480p Square格式),500个低分辨率视频之后,需要额外花时间排队等候生成。
再进一步,如果我们选择生成20秒1080p高分辨率(2000积分/个)的视频,那么5个视频之后,OpenAI就会将你打入“轻松模式(relaxed video)”,成为生成等候区的一员。
这意味着,虽然依然具备生成视频的资格,但只能遥遥无期排队等待,至少现阶段,如果要第一时间获得5个20秒1080p高清视频,要花上1460元。(当然,如果你是拥有无限法力和无穷积分的超创,可以忽略以上计算)
当然,这还只是生成视频需要的积分,如果对视频内容不满意,进一步利用新功能进行编辑,也得额外扣积分。
更戏剧性的是,Sora一经上线,网站就崩溃了。Sam Altman在X平台上紧急宣布停止Sora新用户注册,并表示Sora的生成速度会变慢。(Sam:这钱你们先别花。)
这意味着,生成5秒的视频或许得等上几小时,并且大多数玩家还用不上。
网友们直接在Sam评论区吵翻了,纷纷质疑他对实际需求的预判不够准确。
过去这一年的AI视频赛道上,产品一个接一个出现,都叫嚣着要“赶超Sora”,仅国内,就有可灵、海螺、PixVerse、混元、Vidu等近20个AI视频工具。
10个月后,姗姗来迟的Sora究竟效果如何?值得我们等待吗?“AI新榜”梳理了Sora炸裂登场这一夜的重要信息,并找到Sora首位合作的华人艺术家Junie聊了聊她的抢先使用体验,也围观了她的最新Sora生成视频。没玩上Sora的玩家们可以先靠这篇文章解解馋。
Sora上线即王炸?五大功能全盘点
从期货到上线,在官方演示中,Sora相比2月份发布时多了许多功能。
除了可以一键生成最长20秒的1080p视频,支持横屏16:9、竖屏9:16和正方形1:1等多种常见比例,还可以对视频进行Remix(视频重绘)、Recut(修剪/扩展视频)、Loop(循环剪辑)、Blend(视频内容混合)。
甚至包括社区共享和风格预设在内的一些细节功能,这次也一并放送了。
风格预设功能
此外,Sora还上线了Storyboard(故事版)功能,类似市面上其他AI视频工具提供的工作台式的交互方式,为用户提供一个方便处理复杂工作流的界面。
故事版功能
可以说,这是Sora的最大亮点之一。相比别的AI工具,它的故事版功能是以时间轴为主要交互逻辑,与大家熟悉的非线性视频编辑软件Adobe Premiere很像。
为了方便理解,下面我们就按照具体的使用流程来盘盘Sora。
Sora拥有独立域名(https://sora.com/),目前无法在ChatGPT直接使用Sora。
进入后首先映入眼帘的是社区共享界面,展示了其他用户生成的精选视频案例。点击一下,你还可以查看生成视频的提示词、详细工作流等信息,并支持用户在此基础上对原视频进行二次编辑处理。
点击进入左侧菜单栏的“Library-All videos”,可以在界面下方找到一个重要的交互窗口,搞懂这个窗口,上手Sora就不难了。
在这里,你不仅可以通过输入提示词一键生成相关视频,还可以上传图片或视频,并结合提示词进行创作。
此外,视频的比例、时长、预设风格选择,以及一次性生成视频的数量等参数,也都是在这个界面中操作完成。
生成好视频以后,还可以对视频进行精细化编辑,Sora支持4种编辑方式:
1.Remix(视频重绘)
你可以通过自然语言与AI交互,替换、删除或重构视频中的元素,Sora提供了不同强度级别的Remix选项,从1级到8级,让用户可以控制重绘的程度。例如,你可以改变一扇门的外观,也可以改变门打开后呈现的世界。
2.Recut(修剪/扩展视频)
对视频片段进行精准裁剪并扩展。如果你只喜欢生成视频中的某一个画面,可以通过Recut功能选出需要的镜头,并延展镜头前后的空白时间、补全场景。
3.Loop(循环剪辑)
专门用于创建无缝循环的视频片段。用户可以自定义循环的起始点,并提供少帧和多帧两种处理模式,适用于相似度高和差异较大的片段,生成的视频可以头尾相接不断循环,适合生成动态背景或视觉效果。
4.Blend(视频内容混合)
融合两个不同的视频场景。用户可以调节融合比例和方式,选择需要保留的关键元素,系统会自动处理场景之间的过渡效果。例如,你可以将雪花飘落的视频和花朵飘落的视频混合在一起,实现从雪花到花瓣的自然过渡。
Storyboard(故事版)功能则是对现有的AI视频工作流进行了一次升级迭代,也是Sora发布后网友讨论最多的功能之一。
这个功能支持用户在时间轴上创建和调整不同的动作序列,类似传统影视中的分镜头脚本,用户可以在Storyboard中添加多个“故事卡”,每张卡片代表一个视频帧或场景描述。
例如,你可以先设定一个场景描述“一只美丽的白鹤站在小溪中,尾巴是黄色的”,接下来在时间轴上添加另一张卡片,描述动作“鹤将头探入水中并捉出一条鱼”,Sora会在这两张卡片之间生成流畅的过渡画面,从而形成一个完整的故事。
不过,故事版功能的现场演示有些翻车。描述白鹤从水中捉出一条鱼在最终的画面呈现里并不明显,但整体动作基本上是遵循提示词要求的。
尝鲜版Sora:起了个大早,赶了个晚集?
不知道大家还记不记得今年2月Sora Demo发布时,网友们的惊艳程度:
“现实已经不存在了”
“这一定是电影制作的未来”
“我们进入了一个全新的时代”
......
在此之后的3个月内,至少有20万篇以“Sora”“国产Sora”等为关键词的内容霸占了我们的屏幕。以至于很长一段时间内,Sora的主要作用就是出现在AI媒体的标题里用于烘托它的竞品。
图片来源:新榜声量通;对比时间段:2024.2.16-2024.5.16
如今,“饼王”Sora终于面世出炉,一口气放出的功能也足够有诚意。很多超级创作者第一时间在X平台分享了他们的使用体验。
比如,知名博主“Nick”放出了自己用Sora生成的视频作品,虽然Sora某些特定的视觉特效没有完全表现出来,但整体的效果和镜头转换是“清晰且干净”的。
X平台博主“PJ Ace”怒花200美元体验后表示:“Sora有时候生成的效果惊人,但完全可以在其他(AI视频工具)获得更好的体验。”
他甚至直言,“可灵、MiniMax和Runway没有什么可担心的”。
创作者“EHuangLu”将Sora和腾讯混元视频进行了对比,认为“OpenAI一直在骗我们”。
国内AI博主“歸藏”也在使用后发表评价:“Sora是一个偏科非常严重的模型,整体不如 Runway、可灵及海螺,不值得花200美元尝试。”
虽然目前面向公众开放的这版Sora,相比年初仅部分AI创作者和艺术家能用的内测版,在功能和UI界面交互上完善了很多。
但对大多数创作者来说,Sora这版号称“速度更快”的模型带来的惊艳程度已不及2月初登场时那么震撼,至少,它的模型效果并没有在一众AI视频工具中脱颖而出。
以文本和图片生成视频的基础功能为例,国内的快手可灵、海螺、即梦、混元都可以生成效果不错的视频。在角色一致性上,多家都可以借助首尾帧、运动笔刷功能进行画面微调。
“AI新榜”对热门的AI视频工具均进行过测评,可以说,在各家视频生成领域能力基本持平的情况下,普通玩家很难凭简单的实测、抽卡,感受出谁家的模型能力更好。
有创作者表示,一些做了Lora的开源模型可能会比性能最好的生成模型表现更好。
Junie对“AI新榜”透露,OpenAI今天凌晨发布的Sora是Turbo版,并不是今年2月预告的Sora v1,也并非传闻中的Sora v2。Turbo版是OpenAI面向大众推出的“尝鲜版”,在生成速度上更快,但生成效果还有待优化。
“故事版的时间线功能在v1版本,甚至可以细化到通过设定对应的帧数控制画面,类似Stable Diffusion Deforum插件实现的效果。”Junie补充道。
这或许也是为什么大家测试Sora后,普遍认为没有想象中那么惊艳。
另外,对于部分用户而言,他们或许更期待Sora是一个单点表现出色(比如生成效果、物理理解)的AI产品工具,而不仅仅是一个功能全面但平平无奇的通用型产品。
但Sora确实是OpenAI久违的、实实在在的新产品。
不止一位Sora合作艺术家提到,OpenAI更像在努力做好一款“媲美ChatGPT”的全新AI产品,试图建立起自己的产品壁垒。
Junie认为,Sora重塑了她的创作流程。她只要有一个初始的想法,Sora就可以提供很多天马行空的创意,给她提供不同的可能性。这和Midjourney、Runway图片到视频的创作逻辑都不同。
在她看来,Sora此次上线的诸多功能在很大程度上是令人惊喜的,如Storyboard、Blend和Remix都整合进了产品中,“这些功能Comfyui可能有,但并不是普通人可以使用的。”
此外,Sora上线后备受部分玩家诟病的“运动真实性”,作为超创的Junie也有着不同的体验,“我在内测的时候生成了一个很真实的小狗翻身视频,当时挺惊艳我的,所以就目前来看,我是觉得Sora在运动真实性上是超越竞争对手的。”
当然,Junie在采访中也不止一次向我们强调:这只是她的个人使用体验。
对于普通用户而言,Sora或许没有做到“最好用”,但对于专业艺术家来说,Sora让设计/影视行业回归到了创意的本质。
产品团队对于Sora的定位也很明确,“这并非一个自动生成完整电影的AI,而是为创作者提供新型创意的辅助工具”。
Sam Altman直接表示,“Sora是视频领域的GPT-1”。现在来看,尝鲜版的Sora不会是那个“改变游戏规则”的AI产品,但现象级的Killer App已经有了雏形。
ChatGPT源码推荐:小狐狸ChatGPT付费创作系统完全开源源码