作为视频世界模拟器的Sora：通向AGI的重要里程碑-新闻爱好者

作为视频世界模拟器的Sora：通向AGI的重要里程碑

作者：郭全中张金熠

来源：　发布时间：2024-04-25　点击量：569次

收藏
微信版

【摘要】视频生成模型Sora表现出惊艳世界的物理世界理解与模仿能力，以视频世界模拟器的身份成为AGI发展史上的又一里程碑。通过整理Sora的技术突破与技术局限，以Sora为界将AGI发展历程划分为经验积累、能力涌现与全面泛化三个阶段，并对各阶段特征进行概括梳理。基于上述梳理，归纳分析现阶段AGI对传媒业的新机遇与新挑战，包括生产力再升级、职业认知更新与市场结构重塑，并对AGI未来发展趋势进行总结，指出AI模型+智能机器人、元宇宙技术集成初显、AI鸿沟加剧与AI镜像视角拓展人类认知边界等趋势。

自2022年底ChatGPT问世以来，AGI（通用人工智能）领域曙光初现，以多模态大模型为技术路径的生成式AI推动AGI持续量变，如今，视频生成模型Sora以更逼真、更稳定、更持久的视频生成效果惊艳世界，Open AI研发人员更称其为“构建物理世界通用模拟器的一条有前途的途径”。作为通向AGI的里程碑，Sora以视频世界模拟器的身份登场，在训练量足够大的基础上产生涌现能力，其中包括对物理规则的初步理解与模仿，尽管尚有不足，却如孩童般正在快速成长。伴随能力突破，高速发展的AI也在持续加剧人们对职业前景、产业监管、社会伦理、国家安全乃至物种存亡等方面的忧虑。站在AI发展的重要节点，理解Sora及背后的技术逻辑、厘清AGI的发展历程，把握其为行业发展带来的机遇挑战，对各行各业，尤其是受到严重冲击的传媒业来说尤为重要。故本文将重点整理Sora的技术突破与技术局限，以Sora为节点梳理AGI发展历程，并基于此分析现阶段AGI对传媒业的新机遇与新挑战，以及AGI的未来发展趋势。一、何为Sora：作为视频世界模拟器 2024年2月15日，Open AI在其官网发布了名为《作为世界模拟器的视频生成模型（Video generation models as world simulators）》，是视频生成模型Sora与大众的初次见面。作为一个能够根据文本指令或静态图像生成长达1分钟视频

立即购买，享受随时随地阅读的乐趣￥ 3.00

上一篇：从ChatGPT到Sora 下一篇：中华文化视域下的建设性新闻理论探