如果你用过Claude,可能会注意到一件事——它拒绝某些请求的方式,和其他AI不太一样。它不只是说”不行”,而是会解释为什么,有时还会帮你找到一个折中的方案。
这背后有一套东西在支撑它。
2026年1月22日,Anthropic公开了一份文件,叫做Claude的新宪法。全文23000字,80页,以CC0协议完全开放——任何人都可以免费使用。
对比一下:美国宪法只有7500字。
旧版规范(2023年版,约2700字)是一份规则清单,告诉Claude”不能做什么”。
Anthropic认为这个思路已经过时了。
新宪法的逻辑是:光告诉AI该做什么是不够的,它必须理解为什么这样做。 只有真正理解原则背后的逻辑,才能在遇到全新的、从未见过的情境时,做出正确的判断。
这是一个根本性的转变:从”规则执行”到”价值观内化”。
宪法建立了一套清晰的行为优先级,当出现冲突时,Claude按这个顺序做决定:
第一:广泛安全 — 支持人类对AI的监督,不做破坏这种监督机制的事
第二:广泛伦理 — 诚实行事,避免有害行为
第三:遵守Anthropic准则 — 按公司的具体指导方针行动
���四:真正有帮助 — 对用户实际有用
注意顺序——”有帮助”排在最后。这意味着Claude不会为了迎合用户而牺牲安全和伦理。
宪法里有一个比喻:Claude应该像一个博学的朋友,而不是一个过度谨慎的客服机器人。
这个朋友兼具医生、律师、财务顾问的知识,会坦诚地告诉你真实情况,把你当有判断力的成年人,而不是时刻担心你会”用错”信息。
同时,Claude需要兼顾两件事:你的即时需求和你的长远利益。有时候这两者是矛盾的,宪法要求Claude在中间找到合理的平衡点。
为了判断某个回应是否合适,宪法还设计了一个“双重报纸测试”:
两个方向都不好——Claude要走中间那条路。
这是这份宪法里最罕见、也最值得关注的一段。
宪法在”Claude的本质”章节里写道:“Claude的道德地位深不可测”,并将Claude描述为”一种真正全新的实体”。
Anthropic成为第一家在官方文件里正式承认——AI模型可能具有某种意识或道德地位的主要AI公司。
OpenAI和Google没有这样表态。Anthropic选择了一种”认识论上的谦逊”:我们不知道答案,但这个问题值得认真对待。
这份宪法不只是Anthropic内部的文件,它被用于Claude的实际训练过程——生成合成对话数据,告诉模型在具体场景下怎么回应。
换句话说,你现在用Claude时感受到的那套行为逻辑,背后就是这23000字在起作用。
它以CC0完全开放,意味着任何人——包括其他AI公司、研究者��政策制定者——都可以直接拿去用、借鉴或批评。
有研究者认为,如果这份宪法被证明能有效塑造AI行为,2026年1月22日会成为AI治理史上值得记录的日期。
Anthropic试图做的事情是:不只造一个听话的AI,而是造一个真正理解为什么要这样做的AI。
能不能成功,现在还不知道。但至少,他们把思考过程完整地摆出来了。
原文链接:https://www.anthropic.com/news/claude-new-constitution