AI向善：AI大模型价值观对齐的内容与实践-新闻爱好者

AI向善：AI大模型价值观对齐的内容与实践

作者：郭全中张金熠

来源：　发布时间：2023-12-12　点击量：691次

收藏
微信版

【摘要】价值观对齐关系着AI大模型是否能真正为人类服务，甚至关乎着意识形态安全乃至国家政治安全。从意义、准则、路径、困境四个维度对AI大模型价值观对齐进行全面剖析，认为安全问题与应用保障是AI大模型价值观对齐的驱动力量，原生价值观、目标价值观、普适价值观是AI大模型价值观对齐的价值选择，尤其强调国内AI大模型应以社会主义核心价值观为对齐目标。价值观对齐的主要实践路径包括非递归监督与可扩展监督两条，并对国内外常见的四种价值观对齐范式进行简要介绍，总结出对齐税、价值观以及对齐效果评估方面的对齐困境。

以生成式AI模型ChatGPT问世为标志，AI模型进入多模态大模型时代。伴随着智能驾驶、语音识别、推荐算法、智能绘画等AI技术与日常生活场景相结合，AI系统及其设计者带来的潜在风险更加复杂且不可预知。大模型的特点包括扩展定理与涌现能力，其中涌现能力是指当模型规模超过某个阈值后才能被观测到的能力。[1]目前，大模型涌现能力的根源尚不可知，直接影响着大模型的可解释性，也将间接影响大模型的监控与能力控制，加剧伦理隐患，甚至或将AI推向不可知、不可控的技术黑洞。这正是安全问题始终占据AI领域关键议题的原因之一。从技术伦理学的发轫到人工智能伦理研究的不断推进，再到如今AI大模型的出现为AI安全领域带来新的挑战，确保人工智能系统的目标和行为与人类的意图和价值观相一致的AI对齐成为当前AI安全的核心议题。OpenAI首席技术官Mira〓Murati曾表示，“人工智能系统正在成为日常生活的一部分。关键是确保这些机器符合人类的意图和价值观”。而价值观对齐作为AI对齐的重要组成部分，是保障AI价值观安全的重要手段，甚至关乎着意识形态安全乃至国家政治安全，具有十分重要的研究意义。所谓价值观对齐，是指确保AI模型的价值观与人类价值观相一致。但为何对齐？向谁对齐？如何对齐？为何难对齐？都是AI大模型价值观对齐亟待探讨的问题。一、为何对齐：AI大模型

立即购买，享受随时随地阅读的乐趣￥ 3.00

上一篇：调查研究观的新闻实践与当代价值下一篇：公共传播与社会治理互动机制构建：