AI向善:AI大模型价值观对齐的内容与实践
来源:
发布时间:2023-12-12
点击量:691次
- 收藏
-
微信版
【摘要】价值观对齐关系着AI大模型是否能真正为人类服务,甚至关乎着意识形态安全乃至国家政治安全。从意义、准则、路径、困境四个维度对AI大模型价值观对齐进行全面剖析,认为安全问题与应用保障是AI大模型价值观对齐的驱动力量,原生价值观、目标价值观、普适价值观是AI大模型价值观对齐的价值选择,尤其强调国内AI大模型应以社会主义核心价值观为对齐目标。价值观对齐的主要实践路径包括非递归监督与可扩展监督两条,并对国内外常见的四种价值观对齐范式进行简要介绍,总结出对齐税、价值观以及对齐效果评估方面的对齐困境。
以生成式AI模型ChatGPT问世为标志,AI模型进入多模态大模型时代。伴随着智能驾驶、语音识别、推荐算法、智能绘画等AI技术与日常生活场景相结合,AI系统及其设计者带来的潜在风险更加复杂且不可预知。大模型的特点包括扩展定理与涌现能力,其中涌现能力是指当模型规模超过某个阈值后才能被观测到的能力。[1]目前,大模型涌现能力的根源尚不可知,直接影响着大模型的可解释性,也将间接影响大模型的监控与能力控制,加剧伦理隐患,甚至或将AI推向不可知、不可控的技术黑洞。这正是安全问题始终占据AI领域关键议题的原因之一。
从技术伦理学的发轫到人工智能伦理研究的不断推进,再到如今AI大模型的出现为AI安全领域带来新的挑战,确保人工智能系统的目标和行为与人类的意图和价值观相一致的AI对齐成为当前AI安全的核心议题。OpenAI首席技术官Mira〓Murati曾表示,“人工智能系统正在成为日常生活的一部分。关键是确保这些机器符合人类的意图和价值观”。而价值观对齐作为AI对齐的重要组成部分,是保障AI价值观安全的重要手段,甚至关乎着意识形态安全乃至国家政治安全,具有十分重要的研究意义。所谓价值观对齐,是指确保AI模型的价值观与人类价值观相一致。但为何对齐?向谁对齐?如何对齐?为何难对齐?都是AI大模型价值观对齐亟待探讨的问题。
一、为何对齐:AI大模型
上一篇:调查研究观的新闻实践与当代价值
下一篇:公共传播与社会治理互动机制构建:
2018人打赏
会员登陆
热门排行
查看更多评论