2022 年，幻方“一只平凡的小猪” 个人向慈善机构捐助 1.38 亿元，很多人猜这只小猪就是梁文锋

2026-04-02

如果只看结果，DeepSeek 像是 2025 年中国 AI 圈最硬的一次“以小博大”：不到 200 人，极少加班，不打卡、没 DDL、没 KPI，却能在模型能力、工程效率、开源影响力上把全球大厂逼得紧张。

但更有意思的不是结果，而是它背后的“人”和“组织”。

2022 年，幻方有位员工用“一只平凡的小猪”的名义，个人向慈善机构捐助 1.38 亿元。后来很多人猜：这只小猪就是梁文锋。幻方方面的说法是：捐款是匿名的，公司内部也不知道真实身份。

八卦无法证实，但它确实提供了一个观察入口：梁文锋、幻方、DeepSeek 这条线，最稀缺的东西从来不是钱，而是一种人格与组织的组合——抗噪音、少数事、极致、长期主义。这类组合一旦成立，就会在很多细节里显形。

下面我按三个层次把这件事讲清楚：为什么“小猪”会被猜、梁文锋的做事方式是什么、以及这种方式怎样塑造了 DeepSeek。

为什么“小猪”会被猜成梁文锋：不是因为钱，是因为气质

1.38 亿元对普通人是天文数字；对一个在量化交易里很早就“财富自由”的人来说，它更多是一个符号：钱并不稀缺，稀缺的是“你愿意把钱用来表达什么”。

围绕梁文锋的公开信息，拼出来的画像非常一致：

一个人如果长期稳定地呈现这种“去名利化”的行为模式，外界就会自然把“匿名捐款”也归入同一套气质里：做事，但不想被看见。

所以“小猪是不是梁文锋”并不重要。重要的是：大家为什么觉得像。因为那种“像”，反映的是真实存在的稳定特征。

很多创业者的默认动作是：融资、扩张、铺产品线、做声量。梁文锋的选择几乎相反：

这种打法的好处是：在资源有限时，能把效率拉到极致；坏处是：当组织规模变大，一号位容易变成瓶颈，外部也容易误解“为什么不去做更热的方向”。

但从结果看，这套打法至少解释了 DeepSeek 为什么能以小团队做到极强的模型与工程效率：它不是“卷出来”的，是“聚焦出来”的。

很多公司谈扁平，只是少写两级汇报。DeepSeek 的扁平更极端：研究团队层级非常少，重大决定集中在一号位。

这会带来三种非常直接的后果：

第一，决策链条短，效率高。

模型训练里最贵的成本不是人力，而是算力与试错。决策拖一天，烧掉的不是工资，是 GPU 时间。链条越短，越接近“把试错做成系统”。

第二，交叉分工，贴合模型训练的真实协作方式。

在很多公司，Infra 更像“内部乙方”。而在模型训练中，Infra、数据、架构是互相制约的：架构不考虑 Infra，可训练性会出问题；数据不考虑训练目标，效果会漂；Infra 不参与定版，后期返工巨大。交叉分工能把“返工”提前消解。

第三，不加班，不是福利，是成本控制。

当行业默认加班成为常态时，DeepSeek 的逻辑更硬：一个人每天能高质量工作的时间很难超过 6~8 小时；疲劳状态下的昏庸判断会浪费算力，得不偿失。

这不是“佛系”，是把最稀缺资源排序：判断质量大于工时堆叠。

DeepSeek 不是静态的“爽文主角”，它也在进入一个必须变化的阶段。

第一，估值与期权问题变成内部刚需。

如果公司长期不融资、没有明确估值，当外界估值飞涨、上市推进，员工对期权价值的疑问会越来越尖锐。一号位必须给出可被理解的答案。

第二，产品化与商业化的压力开始逼近。

当行业进入“模型 × 产品触达 × 数据闭环”的阶段，仅靠研究节奏会越来越吃亏。你不需要追热点，但你必须回答：模型能力如何转化为持续的用户触达与价值闭环。

第三，规模越大，组织形态越难维持。

扁平与交叉分工在小规模是优势，在大规模会迅速变难：沟通成本上升、一号位瓶颈加重、协作默认共识被稀释。DeepSeek 需要在“不牺牲气质”的前提下，找到新的组织稳定结构。

这也是为什么“有人离开、更多人留下”并不矛盾：当外部给出更高的薪酬与确定性时，一部分人会离开；而留下的人往往更认可这套目标与组织气质，愿意承担更高的不确定性。

“一只平凡的小猪”到底是谁，外界很难得到确定答案。

但这件事仍然值得写，因为它把一个更重要的问题放到了台面上：在一个崇尚竞争、崇尚声量、崇尚结果的环境里，依然可能出现另一种路径——更克制、更聚焦、更抗噪音，把时间押在少数难而正确的事情上。

这样的公司未必总能赢到最后，但它的存在本身，就已经很罕见。