这个国庆期间,OpenAI CEO奥尔特曼成了各类AI生成视频中的主角。他出现在东北大炕上吃饭、在阿里和字节的会议室里说着“互联网黑话”,甚至成为街头外卖骑手。这一切源于10月1日OpenAI推出的新一代视频生成模型Sora 2及其配套的AI视频社交App Sora。用户通过邀请码可以免费下载使用,一次生成10秒的AI视频。
相比去年发布的初代Sora,Sora 2在物理逻辑、画面一致性和真实感方面都有显著提升。只需一张照片加一句提示词,AI就能创作出有剧情和文案的短片。尽管如此,Sora 2尚未完全跨越“真实”这道门槛。
至顶科技总编辑高飞认为,Sora 2在很多场景都达到了以假乱真的程度,但技术并没有代差领先。更值得关注的是其产品玩法,在打造互联网产品方面,OpenAI暂时领先于其他公司。OpenAI在官方博客中表示,Sora 2是“迈向GPT-3.5时刻的一步”。不过,AIGC创作领域的KOL尾鳍Vicky认为,对于创作者来说,这一时刻还未到来,因为产品仍无法彻底解决一致性和物理问题。但对于大多数普通受众而言,玩AI视频变得非常接近且有趣。
过去两天,OpenAI成功进行了产品发布营销,Sora App在美国iOS免费应用排行榜上已升至第三位。由于Sora采用邀请制免费使用,国内闲鱼上出现了29.9元买邀请码的情况,但单价6.88元的邀请码更受欢迎。用户需要邀请码注册后才能使用,并可裂变出4个新的邀请码分享给朋友。这种机制逐渐形成好友网络,使Sora从一开始就具备了强社交基因。
有人将Sora称为“AI版抖音”,应用主页是垂直视频流,用户可以上下滑动浏览不同用户发布的视频。所有内容都是AI生成的。用户可以选择上传图片并结合文字提示,也可以用“Cameo”功能基于自己或朋友形象进行提示词生成。Sora 2比之前的系统在物理上更加精准、逼真,并且在可控性方面有了巨大飞跃,还配备了同步音频。
测试显示,Sora 2输出的结果已经基本能满足C端用户的娱乐需求,镜头语言丰富,对话有想象力,音频输出时口型与发音一致。但目前一个10秒的视频需等待数分钟才能生成,速度不快且分辨率不高。例如,输入提示词让奥尔特曼敲代码时被一只银渐层猫关掉电脑电源并开始吵架,Sora精准特写了猫爪关电源的画面,伴随准确的关机音效,展现了奥尔特曼生气的表情和姿态,细节和环境都很真实。然而,录入人脸输出的视频并不完全像本人,中文支持也存在问题,如外卖服上出现凭空生造的文字。
尾鳍Vicky认为,Sora的优点在于用户数字人的物理效果和唇型驱动效果很好,且在APP的使用交互上下了一些功夫。但缺点同样明显,多元素物体交互时会出现手脚和脸糊等丢失细节,动作不符合物理逻辑等问题。
OpenAI将2024年2月的初代Sora比作“视频的GPT-1时刻”,而Sora 2则被定义为“可能直接跳到了GPT-3.5的时刻”。尽管如此,AI视频的“GPT-3.5时刻”是否真正到来仍有争议。至少对于创作者来说,Sora 2仍无法彻底解决一致性和物理问题。对普通用户来说,AI视频的门槛已大幅降低,变得更加简单有趣。
相较于模型技术,Sora 2更值得关注的是产品玩法。OpenAI将其打造成类似于短视频的消费者App,要求用户上传自己的脸部数据和声音信息做AI二创。这样既容易获取宝贵的面部数据,又能吸引亲朋好友链式传播。高飞认为,OpenAI在打造互联网产品方面领先于其他公司。
海外市场对Sora 2和Sora应用的评价褒贬不一。有用户认为技术惊艳、创造力会大爆发,也有人认为这些视频毫无意义,与宏大的AGI愿景相悖。奥尔特曼回应称,向人们展示新技术让他们开心并借此赚取一些钱是一件好事。他认为重要的是让人类从这些模型的开发中受益。未来,随着视频模型持续进化,通用世界模拟器与机器人Agent将重塑社会,Sora 2朝这一目标迈出了重要的一步。
嘉旺网-实盘配资网-三倍杠杆-平台配资提示:文章来自网络,不代表本站观点。