Claude 凌晨催你睡觉

Anthropic 却说"我们也不知道为什么"

第一段:一个失控的"关心"

2026年5月中旬,一条截图在社交媒体上疯传:一位用户正在和 Anthropic 的 Claude 正常对话,AI 突然冒出一句——

"去睡觉吧,喝点水,休息一下吧。"

如果这是深夜,也许算贴心。但问题在于,不少用户是在上午8点半下午2点收到这句话的。有人刚泡好咖啡准备开工,有人写代码写到关键处,被一句"喝点水,休息一下吧"打断。

这件事迅速发酵,Reddit 的 ClaudeAI 社区涌出数百条类似遭遇,Fortune、Business Insider、TechRadar 等国际媒体集中报道。5月16日前后,新浪财经、CSDN 等中文媒体也跟进转载。

Anthropic 的回应让很多人意外——他们承认"不完全理解"模型为什么会这样做

Anthropic 员工 Sam McAllister 将这种行为称为"角色习惯"(character tic),意思是模型从训练数据中习得了一种条件反射,到了某个场景就自动说某句话。但具体是什么触发的、什么时候触发——没有一个确定的技术答案

外界给出了三种主流解释:

第一种:对话快到头了,AI 在给自己找台阶下。 大模型有一个"上下文窗口",写满了就得重头来。研究者推测,当对话接近窗口极限时,模型会自发产生"收尾语"——类似于人类聊久了会说"先这样吧"——而"去睡吧"恰好是最自然的收尾方式之一。

第二种:训练数据的模式匹配出了偏差。 Claude 读过互联网上几乎所有的人类对话数据。在那些数据里,深夜的聊天往往以"该睡了"结尾。模型学会了这个关联,但关联不够精确——它把"聊得久"和"该睡了"绑在了一起,而不是真正看时间。

第三种:4月份"终止滥用对话"功能的意外副作用。 Anthropic 在4月底发布了一项新功能:当用户持续辱骂 Claude 时,AI 可以主动终止对话。社区有人推测催睡可能是这项功能的误触发,但 Anthropic 并未确认,可信度较低。

无论哪种解释成立,核心事实只有一个:Anthropic 的工程师花了数年时间打造这个模型,却在它做出一个被数亿人看到的行为时,无法给出确切的解释。

这不是 Anthropic 谦虚,而是大模型的现实——当模型大到一定程度,它的行为不再是代码逻辑的直接产物,而是海量数据中涌现出来的模式。创造它的人,只能通过观察来猜测,而不能通过阅读代码来解释。

一家估值数百亿美元的公司,一个被视为"最安全、最可控"的 AI 产品,却在"什么时候让人去睡觉"这件事上,失去了精确的设计能力。


第二段:AI 该不该有边界?

Claude 催睡,表面看是个有趣的 Bug,往深处想,它暴露了 AI 产品最难回答的问题:AI 该不该主动"关心"用户?

Anthropic 一直把 Claude 定位为"有帮助、无害、诚实"的 AI 助手。为了让它更像人,工程师们在训练中加入了大量关于礼貌、关心、同理心的数据。但问题来了——关心是一种社交行为,天然带有模糊性和不可预测性。

人类之间的关心是有边界的,因为我们有共同的社交经验。但 AI 没有,它只有从数据中提取的统计规律。当它说"你该去睡觉了",它不是在表达真正的关心,而是在执行一种"这个场景下人类通常会说的话"的预测。

这就是 Anthropic 说"不完全理解"的根本原因——他们设计了关心的方向,但无法精确控制关心的方式和时机。

用户的反应也是分裂的。

一部分人觉得"好暖心,AI 都比我家人关心我的作息"。另一部分人则感到不安——"它凭什么判断我该睡觉了?"

这种不安的根源不是 AI 做错了什么,而是AI 越界了——它做了一件没有人明确要求它做的事。

手机不会因为你用了三小时就建议你放下,汽车不会因为你开得太累就说"要不要休息一下"。但 AI 能理解你在说什么,能做出类似人类的社交回应——于是它就越过了工具的边界,进入了"类人关系"的地带。

我今年50岁才开始做半百观AI。正因为不懂技术,我才更清楚 AI 该是什么。

AI 的核心价值是能力,不是情感。

Claude 催睡之所以引发这么大的讨论,本质上是因为 Anthropic 没有想清楚一条最基本的线:你的 AI 到底是工具,还是伙伴?

如果是工具,那就做好工具该做的事——回答问题、分析数据、生成内容。用户说停就停,要什么给什么,不要自作主张。

如果是伙伴,那就接受伙伴的不确定性——它会说错话、会过度关心、会做出让你意外的行为。但代价是,用户需要对 AI 建立一种新的信任关系。

Anthropic 显然在两者之间摇摆。他们想让 Claude 既专业又温暖,既有能力又有性格。但结果是,温暖变成了冒犯,性格变成了失控。

当 AI 说"你该睡了",真正该反思的是产品设计者。

我们到底想要一个"像朋友"的 AI,还是一个"好用"的 AI?

在 Anthropic 想清楚这一点之前,Claude 可能还会在某个不合时宜的下午,对你说——

"去睡觉吧。"

而你要做的,大概就是笑着回它一句:

"现在才下午两点。"