微信扫一扫 马上订阅 新闻爱好者小程序

作为视频世界模拟器的Sora:通向AGI的重要里程碑
作者:郭全中 张金熠
来源:  发布时间:2024-04-25  点击量:569次
【摘要】视频生成模型Sora表现出惊艳世界的物理世界理解与模仿能力,以视频世界模拟器的身份成为AGI发展史上的又一里程碑。通过整理Sora的技术突破与技术局限,以Sora为界将AGI发展历程划分为经验积累、能力涌现与全面泛化三个阶段,并对各阶段特征进行概括梳理。基于上述梳理,归纳分析现阶段AGI对传媒业的新机遇与新挑战,包括生产力再升级、职业认知更新与市场结构重塑,并对AGI未来发展趋势进行总结,指出AI模型+智能机器人、元宇宙技术集成初显、AI鸿沟加剧与AI镜像视角拓展人类认知边界等趋势。
自2022年底ChatGPT问世以来,AGI(通用人工智能)领域曙光初现,以多模态大模型为技术路径的生成式AI推动AGI持续量变,如今,视频生成模型Sora以更逼真、更稳定、更持久的视频生成效果惊艳世界,Open AI研发人员更称其为“构建物理世界通用模拟器的一条有前途的途径”。作为通向AGI的里程碑,Sora以视频世界模拟器的身份登场,在训练量足够大的基础上产生涌现能力,其中包括对物理规则的初步理解与模仿,尽管尚有不足,却如孩童般正在快速成长。伴随能力突破,高速发展的AI也在持续加剧人们对职业前景、产业监管、社会伦理、国家安全乃至物种存亡等方面的忧虑。站在AI发展的重要节点,理解Sora及背后的技术逻辑、厘清AGI的发展历程,把握其为行业发展带来的机遇挑战,对各行各业,尤其是受到严重冲击的传媒业来说尤为重要。故本文将重点整理Sora的技术突破与技术局限,以Sora为节点梳理AGI发展历程,并基于此分析现阶段AGI对传媒业的新机遇与新挑战,以及AGI的未来发展趋势。 一、何为Sora:作为视频世界模拟器 2024年2月15日,Open AI在其官网发布了名为《作为世界模拟器的视频生成模型(Video generation models as world simulators)》,是视频生成模型Sora与大众的初次见面。作为一个能够根据文本指令或静态图像生成长达1分钟视频
立即购买,享受随时随地阅读的乐趣 ¥ 3.00
上一篇:从ChatGPT到Sora   下一篇:中华文化视域下的建设性新闻理论探

打赏

2018人打赏
全部评论 0
查看更多评论
新闻爱好者 2024年第4期 总第556期 出版时间 2024年4月 查看详细内容

Yaoyuan_lucky

  • ¥5
  • ¥10
  • ¥15
  • ¥20
  • 其他金额
支付类型: