弥合版权“二象性”:作为“非版权敏感信息”的媒体预测性数据
来源:
发布时间:2025-03-27
点击量:875次
- 收藏
-
微信版
【摘要】生成式人工智能使内容生成范式由推导向预测跃迁,媒体产生的预测性数据带来新的版权归属问题。媒体预测性数据既非传统的版权数据,也不是非版权数据,这类数据处于版权数据和非版权数据的模糊地带,面临版权数据去版权化和非版权数据版权化的“二象性”实践困境。一方面,预测生成的内容不具有可识别的版权使用痕迹,版权可见性被预测过程遮蔽,导致版权数据的去版权化。另一方面,非版权数据经预测后,能够精准模仿媒体的风格和模式,导致非版权数据的版权化。弥合版权“二象性”实践困境,需要将媒体预测性数据作为一种“非版权敏感信息”理解,并在法律和伦理层面给予特殊对待。
- 【关键词】
- 生成式人工智能;媒体预测性数据;非版权敏感信息;媒体版权
基于深度学习技术(DeepLearning)的生成式人工智能实现文本、图像、音频、视频等全媒体数据的自主生成。生成式人工智能(ArtificialIntelligenceGeneratedContent,缩写为AIGC)的核心在于对人类行为和思维的模仿和预测,根据用户行为和内容数据预测分析(PredictiveAnalysis)并生成符合目标群体或个人兴趣的内容和产品。不同于前人工智能时代机器学习(MachineLearning)和人类内容创作中的模仿或复用,AIGC中的深度学习技术使机器内容模仿能力从推导跃向预测。在AIGC训练数据集中,用于训练模型的媒体内容数据并非是从有限内容案例简单仿制原创的推导性数据,而是在包含大量语言和内容案例中进行横向和纵向比较,以精准生成指定作品的预测性数据。
媒体预测性数据面临版权实践的“二象性”困境:一方面,通过预测性数据生成的数字内容不具有可识别的版权使用痕迹,版权可见性被预测过程遮蔽,导致“版权数据的去版权化”;另一方面,不属于传统版权保护范畴的非版权数据(如风格数据和行为数据),在经由AIGC模型预测后,精准模仿媒体的风格和模式,导致“非版权数据的版权化”。关于媒体预测性数据的实践困境被学界忽略,如何使媒体预测性数据的版权实践既保护媒体行业竞争力又尊重生成式人工智能开发主体利益,已成为构建AIGC媒体版权框架的关键问题。媒
上一篇:新闻叙事经济转型及版权反营销
下一篇:ChatGPT生成文字内容的可版权性研究
2018人打赏
会员登陆
热门排行
查看更多评论