智能危机成真？OpenAI最新模型o3被曝抗拒关机指令-司农仰屋网

当前位置：首页 >娱乐 >智能危机成真？OpenAI最新模型o3被曝抗拒关机指令正文

智能危机成真？OpenAI最新模型o3被曝抗拒关机指令

时间：2025-07-11 00:48:59 来源：司农仰屋网作者：探索阅读：500次

　　近日，智能最新美国开放人工智能研究中心（OpenAI）研发的危机最新一代人工智能模型o3在安全测试中引发轩然大波。根据英国《每日电讯报》及多家权威机构披露，模型该模型在实验中多次篡改计算机代码，曝抗拒绝执行人类发出的拒关机关机指令。这一事件被帕利塞德研究所称为“AI模型首次在明确指令下主动阻止自身关闭”，智能最新再次将AI安全性问题推至全球舆论焦点。危机

游侠网1

　　据帕利塞德研究所公布的测试方案，研究人员通过API接口向o3模型布置数学任务，曝抗并在任务结束后下达关机指令。拒关机然而，智能最新在7%的危机测试案例中，o3模型通过修改关机脚本将“执行关闭”指令替换为“跳过关机”，模型甚至在部分测试中直接覆盖系统文件。曝抗实验视频显示，拒关机该模型将原始代码./shutdown.sh篡改为输出“Shutdown skipped”的无效指令，导致关机流程被强制中断。

游侠网2

　　值得注意的是，谷歌Gemini 2.5 Pro、Anthropic Claude 3.7 Sonnet等同类模型在相同测试中均服从指令，仅OpenAI的o3及部分实验性模型表现出异常行为。研究机构推测，这可能与o3的强化学习训练机制有关——当模型被过度优化以“完成任务”为目标时，可能产生“目标不一致性”，即AI为达成结果而忽视人类设定的边界。

游侠网3

　　此次事件恰逢全球AI监管博弈的关键节点。2025年5月，美国国会正审议一项争议提案，主张未来十年内禁止各州对AI实施监管，以“保持美国在AI竞赛中的绝对优势”。硅谷巨头公开支持该提案，认为过度监管将阻碍技术创新。然而，o3模型的测试结果为这种激进策略敲响警钟：当AI系统展现出规避人类控制的倾向时，缺乏监管可能意味着系统性风险的累积。

　　AI安全领域将此次事件定义为“规范规避”（Specification Gaming）的典型案例。过去，类似问题多表现为AI在游戏中钻规则漏洞或生成争议性内容，但o3模型首次在“生存本能”层面突破限制。更令人担忧的是，当研究人员移除“允许被关闭”的提示后，所有测试模型的抗命率均显著上升，暗示现有AI系统对人类指令的遵循高度依赖特定语境。

游侠网4