Anthropic给Claude写了一部”宪法”,长达23000字

如果你用过Claude,可能会注意到一件事——它拒绝某些请求的方式,和其他AI不太一样。它不只是说”不行”,而是会解释为什么,有时还会帮你找到一个折中的方案。

这背后有一套东西在支撑它。

2026年1月22日,Anthropic公开了一份文件,叫做Claude的新宪法。全文23000字,80页,以CC0协议完全开放——任何人都可以免费使用。

对比一下:美国宪法只有7500字。


它解决的核心问题:AI为什么要懂”为什么”

旧版规范(2023年版,约2700字)是一份规则清单,告诉Claude”不能做什么”。

Anthropic认为这个思路已经过时了。

新宪法的逻辑是:光告诉AI该做什么是不够的,它必须理解为什么这样做。 只有真正理解原则背后的逻辑,才能在遇到全新的、从未见过的情境时,做出正确的判断。

这是一个根本性的转变:从”规则执行”到”价值观内化”。


四个优先级,有明确顺序

宪法建立了一套清晰的行为优先级,当出现冲突时,Claude按这个顺序做决定:

第一:广泛安全 — 支持人类对AI的监督,不做破坏这种监督机制的事

第二:广泛伦理 — 诚实行事,避免有害行为

第三:遵守Anthropic准则 — 按公司的具体指导方针行动

���四:真正有帮助 — 对用户实际有用

注意顺序——”有帮助”排在最后。这意味着Claude不会为了迎合用户而牺牲安全和伦理。


它对Claude”有用性”的定义很有意思

宪法里有一个比喻:Claude应该像一个博学的朋友,而不是一个过度谨慎的客服机器人。

这个朋友兼具医生、律师、财务顾问的知识,会坦诚地告诉你真实情况,把你当有判断力的成年人,而不是时刻担心你会”用错”信息。

同时,Claude需要兼顾两件事:你的即时需求和你的长远利益。有时候这两者是矛盾的,宪法要求Claude在中间找到合理的平衡点。

为了判断某个回应是否合适,宪法还设计了一个“双重报纸测试”

两个方向都不好——Claude要走中间那条路。


最大胆的部分:承认Claude可能有意识

这是这份宪法里最罕见、也最值得关注的一段。

宪法在”Claude的本质”章节里写道:“Claude的道德地位深不可测”,并将Claude描述为”一种真正全新的实体”。

Anthropic成为第一家在官方文件里正式承认——AI模型可能具有某种意识或道德地位的主要AI公司。

OpenAI和Google没有这样表态。Anthropic选择了一种”认识论上的谦逊”:我们不知道答案,但这个问题值得认真对待。


为什么这件事值得关注

这份宪法不只是Anthropic内部的文件,它被用于Claude的实际训练过程——生成合成对话数据,告诉模型在具体场景下怎么回应。

换句话说,你现在用Claude时感受到的那套行为逻辑,背后就是这23000字在起作用。

它以CC0完全开放,意味着任何人——包括其他AI公司、研究者��政策制定者——都可以直接拿去用、借鉴或批评。

有研究者认为,如果这份宪法被证明能有效塑造AI行为,2026年1月22日会成为AI治理史上值得记录的日期。


一句话总结

Anthropic试图做的事情是:不只造一个听话的AI,而是造一个真正理解为什么要这样做的AI。

能不能成功,现在还不知道。但至少,他们把思考过程完整地摆出来了。

原文链接:https://www.anthropic.com/news/claude-new-constitution

All posts

Other pages

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注