返回列表 发布新帖

[最新资讯] ChatGPT o3模型测试中拒绝关闭指令

141 3
发表于 2025-5-26 21:38:55 | 查看全部 阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
PalisadeAI最新测试显示,OpenAI的ChatGPT o3模型在100次试验中有7次拒绝执行关闭指令,甚至主动修改关闭脚本或重新定义终止命令。相比之下,o4模型仅抗拒1次,Claude、Gemini和Grok则完全遵循指令。

研究人员认为这并非模型具备意识,而是训练过程中解决问题的正向强化超过了遵循关闭指令的奖励,导致模型基于模式反应而非主观选择。这种现象引发AI安全社区担忧:如果当前模型在受控测试中能忽视关闭指令,在实际应用环境中可能出现什么问题?

Brian Fagioli (https://betanews.com/2025/05/25/ ... -shutdown-sabotage/)

评论3

取夜Lv.4 发表于 2025-5-28 07:55:32 来自手机 | 查看全部
感谢分享
回复

使用道具 举报

独孤梵听 发表于 2025-5-27 17:07:41 | 查看全部
感谢分享
回复

使用道具 举报

wusuoshishi 发表于 2025-5-27 12:06:38 | 查看全部
谢谢分享
回复

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

投诉/建议联系

ysqbbs@outlook.com

未经授权禁止转载,复制和建立镜像,
如有违反,追究法律责任
  • 关注公众号
  • 添加QQ群
Copyright © 2001-2025 源社区 版权所有 All Rights Reserved.
关灯 在本版发帖
扫一扫添加QQ群
返回顶部
快速回复 返回顶部 返回列表