微信扫一扫 马上订阅 新闻爱好者小程序

AI向善:AI大模型价值观对齐的内容与实践
作者:郭全中 张金熠
来源:  发布时间:2023-12-12  点击量:691次
【摘要】价值观对齐关系着AI大模型是否能真正为人类服务,甚至关乎着意识形态安全乃至国家政治安全。从意义、准则、路径、困境四个维度对AI大模型价值观对齐进行全面剖析,认为安全问题与应用保障是AI大模型价值观对齐的驱动力量,原生价值观、目标价值观、普适价值观是AI大模型价值观对齐的价值选择,尤其强调国内AI大模型应以社会主义核心价值观为对齐目标。价值观对齐的主要实践路径包括非递归监督与可扩展监督两条,并对国内外常见的四种价值观对齐范式进行简要介绍,总结出对齐税、价值观以及对齐效果评估方面的对齐困境。
以生成式AI模型ChatGPT问世为标志,AI模型进入多模态大模型时代。伴随着智能驾驶、语音识别、推荐算法、智能绘画等AI技术与日常生活场景相结合,AI系统及其设计者带来的潜在风险更加复杂且不可预知。大模型的特点包括扩展定理与涌现能力,其中涌现能力是指当模型规模超过某个阈值后才能被观测到的能力。[1]目前,大模型涌现能力的根源尚不可知,直接影响着大模型的可解释性,也将间接影响大模型的监控与能力控制,加剧伦理隐患,甚至或将AI推向不可知、不可控的技术黑洞。这正是安全问题始终占据AI领域关键议题的原因之一。 从技术伦理学的发轫到人工智能伦理研究的不断推进,再到如今AI大模型的出现为AI安全领域带来新的挑战,确保人工智能系统的目标和行为与人类的意图和价值观相一致的AI对齐成为当前AI安全的核心议题。OpenAI首席技术官Mira〓Murati曾表示,“人工智能系统正在成为日常生活的一部分。关键是确保这些机器符合人类的意图和价值观”。而价值观对齐作为AI对齐的重要组成部分,是保障AI价值观安全的重要手段,甚至关乎着意识形态安全乃至国家政治安全,具有十分重要的研究意义。所谓价值观对齐,是指确保AI模型的价值观与人类价值观相一致。但为何对齐?向谁对齐?如何对齐?为何难对齐?都是AI大模型价值观对齐亟待探讨的问题。   一、为何对齐:AI大模型
立即购买,享受随时随地阅读的乐趣 ¥ 3.00
上一篇:调查研究观的新闻实践与当代价值   下一篇:公共传播与社会治理互动机制构建:

打赏

2018人打赏
全部评论 0
查看更多评论
新闻爱好者 2024年第4期 总第556期 出版时间 2024年4月 查看详细内容

Yaoyuan_lucky

  • ¥5
  • ¥10
  • ¥15
  • ¥20
  • 其他金额
支付类型: