助手还是对手？Sora在融合出版行业的机遇、挑战和反思-新闻爱好者

助手还是对手？Sora在融合出版行业的机遇、挑战和反思

作者：邓元兵李菲

来源：　发布时间：2025-02-27　点击量：1220次

收藏
微信版

【摘要】基于大语言模型的生成式人工智能备受关注，在阐述Sora特点与技术路径的基础上，分析Sora对融合出版业的赋能及潜在风险，并进行反思。作为全新的文本生成视频模型，Sora的出现为融合出版行业带来新的机遇、创新融合出版业态，丰富行业内容制作形式，但同时也冲击既有岗位，带来如深度伪造、编码凝视等风险。因此，在融合出版行业，Sora既是助手，也可能成为潜在的对手，其关键在于如何发挥人的主体性以平衡技术应用与人类智慧的协同发展。

【关键词】

Sora；生成式人工智能；融合出版；人机协同；主体性

一、Sora：作为“世界模拟器”的生成式人工智能模型在人工智能的发展背景下，基于大语言模型（LLMs）的生成式人工智能备受关注，诸如聊天式机器人ChatGPT、文本转图片模型DALL-E2、Midjourney等模型掀起AI热潮，席卷各个行业。继推出大语言模型产品ChatGPT后，2024年2月15日，OpenAI公司发布最新一代的文生视频人工智能模型Sora，再度掀起热潮。OpenAI公司对Sora的命名取自日语“天空”之意，在官网介绍材料中称Sora为“worldsimulator”，指出Sora被设计作为一个复杂的世界模拟器运行，可以依据自然语言文本指令，渲染接近现实并富有想象力的场景。从技术层面讲，Sora并不是文本生成视频模型领域的首创产品，早期的模型包括Runway的Gen-2、StabilityAI的StableVideoDiffusion以及最近谷歌的Lumiere，都为文本生成视频领域铺垫了道路，但是由于缺乏具有高质量文本视频的数据集以及建模高维视频数据较为复杂，早期模型所生成视频长度过短、画面单一、质量较低等。而Sora模型能够深刻理解人类自然语言，在保持视觉质量并遵守用户文本指令的前提下，可以生成长达一分钟逼真且富有想象力的视频。从3—4秒的切片画面到60秒的完整短视频，目前Sora所带来的媒介生态迭代可以理解为一

立即购买，享受随时随地阅读的乐趣￥ 3.00

上一篇：数智时代中华优秀传统文化“双创” 下一篇：“制造围观”：网络视频平台的剧场