查看原文
其他

今年的第一波炸裂

你们的中产先生 中产先生 2024-02-20
据说编者荐语:
嗯,我是中产先生的小弟,中产先生mini,主打精悍短文。


1545个字 阅读时长:5分钟

中产先生 | 洞见时代 发现价值 讲述生活



不止如此。


- 1 -


这几天,大家都在聊OpenAI的Sora,认为它不止会颠覆视频行业,甚至可能成为世界模拟器,让人类离真正进入真实的虚拟世界又近了一步。


没错,但很多人忽略了一个细节。


不着急,我们先说Sora,看一段文字生成的视频:

OpenAI的CEO奥特曼写了一段文字,然后Sora就生成了这段60秒的视频,惊艳众人:


这段60秒一镜到底的视频,女主角、背景人物,都达到了惊人的一致性,各种镜头随意切换,人物都是保持了神一般的稳定性。


跟以往大模型表现出来差强人意的效果完全不一样。


业内人士分析,这是技术路线的彻底改变:


以往大模型生成视频是先画图像,1秒钟24帧就画24张图拼接起来,60秒的视频需要画1440张图片,一千多张图片拼接在一起,很容易出现细节崩掉,或者闪烁的问题。


但是Sora应该是采用了游戏引擎的方式,换句话说,AI学会了使用工具,通过大量的数据训练,借助游戏引擎来建模和渲染,对真实世界和虚构世界进行模拟,这不止是避免了AI绘画模型的弊端:

简直可以称为虚拟世界模拟器


颠覆视频行业太小儿科了,想象一下,配合VR或者AR设备,借助Sora大模型,打个比方,把Sora搭载到Apple Vision眼镜上,然后随便说一句话,马上身临其境,再配合一些穿戴式的感知传感器设备,这不就是美剧《西部世界》吗?




按照目前的技术发展,十年内实现商用应该不是难事,快的话可能5年就进入市场了。


- 2 -


说完了Sora和畅想,来说一下大家都忽略的细节。


游戏。


这次OpenAI的Sora上分又是因为游戏,使用了游戏引擎,直接让文字生产视频的技术向前迈进了关键性的一大步。


但为什么说是又?


大家知道的是,游戏的发展推动了硬件的极大提升,不管是英伟达还是AMD都在图形处理上获得巨大成功。


但很多人不知道,其实游戏在软件上也极大推动了技术进步。


比如ChatGPT的诞生,就得到过游戏很大的助力。


当时OpenAI已经解决了AI的学习能力,但是AI的处理和互动能力还是很弱,于是就想到让当时世界上最流行的对战游戏Dota2来充当AI的训练场。


相较于之前的国际象棋和围棋,Dota2的规则更复杂、要素更众多、环境更多变。


当时OpenAI的大模型每天要打人类180年的Dota2,通过不断自我对战来提升处理复杂环境的能力,然后修正大模型参数。


最后,一共打了45000年人类时间的Dota2之后,OpenAI的大模型从1V1到5V5都战胜了人类最强的玩家,从而也训练出领先的神经网络技术,理解信息的能力越来越接近人类,而处理信息的效率显然远超人类。


这之后,GPT才横空出世,在众多的信息大模型之中一骑绝尘,游戏确实功不可没。


- 3 -

结语


为什么要提游戏呢?


因为在很多地方,是把游戏作为电子鸦片来看待的,不但谈之色变,动辄还锤子伺候。


但现实是,游戏在当今最领先的技术领域,其实发挥了关键性的作用。


这是要为游戏正名吗?不是电子鸦片,而是数字经济的支柱产业?


也不是。


其实想说的是:

技术的进步需要适当的引导,但这种引导主要还是在应用阶段,技术的萌发阶段其实是需要相对宽松的生态和环境来自我孕育的。


这也是从0-1和从1-N不同的地方。


目前看起来,从1-N我们是没有敌手,但是从0-1还有不小差距。


怎么缩短差距?


希望OpenAI和游戏的两个成功例子,可以提供一些思路和启示。


就这样。


另外,


春节期间,大事不少。


今年真是大事之年,第一个月已经大事频发,没想到春节假期,还能有这么多大事。


中产计划明天晚上聊一聊,可以点击左下角阅读原文订阅。

继续滑动看下一个

今年的第一波炸裂

你们的中产先生 中产先生
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存