2025年初,一家中国AI公司用560万美元的训练成本做出了一款大模型,引发全球关注。美国风投家马克·安德森评价其为“斯普特尼克时刻”。彼时,它的创始人频频婉拒来自互联网巨头和顶级风投的投资邀约。一位接近该公司的人士透露,创始人的逻辑很直白:“投资机构都要对出资人负责,都得赚钱,所以谈不到一块去。”
这家公司叫DeepSeek,创始人叫梁文锋。在过去一年半里,它几乎成了中国AI圈“技术理想主义”的代名词——不融资、不上市、不追风口,靠母公司幻方量化的利润供养,专心搞AGI研究。
时间拉回到2026年4月。DeepSeek正在寻求以不低于100亿美元的估值,进行成立以来的首次外部股权融资,计划筹集至少3亿美元。消息传出后,市场反应复杂。一家长期“不差钱”的公司突然向资本开口,背后的原因是什么?

团队瘦身与人才流失
DeepSeek是一家以“小团队”著称的公司,总人数不到200人,其中核心研究团队约100余人。团队构成高度年轻化——本科和硕士学历占比超过七成,30岁以下成员超过七成,且几乎不进行社会招聘,以应届生和实习生留任为主。
在这种人员结构下,核心研发人员的权重被放大到较高的程度。过去半年里,5名核心成员先后离开,他们所负责的方向横跨基座模型架构、推理算法、文字识别和多模态交互等关键领域。对一家仅有小几十人基座模型团队的公司而言,任何一个核心岗位的空缺,都可能对相应的技术迭代节奏产生直接影响。
这些离职成员的去向,折射出当前AI人才市场的竞争格局。互联网大厂和头部初创公司正在以更具吸引力的薪酬包和更明确的职业发展通道招揽顶尖AI人才。DeepSeek面临的不是个别员工的流动,而是整个行业人才定价体系的结构性冲击。

薪酬结构的深层博弈
人才为什么会流动?账面上的数字提供了一个观察窗口。
据多位业内人士透露,DeepSeek的绝对薪资在同业中并非处于低位,但部分竞争对手给出的现金薪酬往往能达到其两到三倍,个别核心岗位的总包报价甚至达到八位数级别。
但更大的差异不在现金部分,而在于长期激励的可兑现性。DeepSeek自2023年后未再进行外部融资,员工持有的期权缺乏市场化估值作为参照。没有明确的估值锚、没有上市时间表、没有期权变现渠道——对员工而言,期权的账面价值与实际可预期的财富之间存在较大鸿沟。
与之形成对比的是,部分竞争对手拥有成熟的股权激励体系:或已上市,有明确的股价参照和行权通道;或虽未上市,但存在定期的期权回购机制,为员工提供了清晰的退出预期。当一个年轻的研究员面对两种不同的薪酬结构时,选择的天平倾向于哪一边,答案往往不言自明。

融资的核心目标:为期权“定价”
本轮融资消息传出后,多位投资界人士给出了相似的判断:这轮融资的优先级目标并非补充运营资金,而是为员工期权建立一个市场化的估值锚点。
在非上市公司的股权激励体系中,期权的价值需要依赖外部融资的估值来确认。引入外部资本后,融资价格可以作为期权定价的市场参照。据公开报道,DeepSeek计划融资约3亿美元,对应估值不低于100亿美元。这个交易量足以产生一个有法律效力和市场参照意义的价格锚点,从而为全体员工持有的期权提供一套可量化的价值坐标。
从这个角度看,这轮融资更像是一次制度性的补课。当企业从依赖内部供血转向参与外部资本市场竞争,薪酬体系的可预期性和可兑现性便成为留住核心人才的关键基础设施。

V4延迟与技术路线选择
DeepSeek-V4的发布时间已历经多次调整,从2026年2月推到3月,再推到4月窗口。据公开信息,距上一次重大版本更新已过去约15个月。同期,全球范围内头部厂商的模型迭代节奏维持在较高频率。
延迟的背景与技术路线选择密切相关。V4版本优先适配国产新一代AI芯片,目标是从底层代码完成从CUDA到国产计算框架的全面迁移。这一过程涉及大量的精度对齐和底层代码调整工作,研发耗时较长。在国内AI产业链加速自主化的背景下,DeepSeek将相当一部分技术资源投入到国产算力适配中,这既是战略选择,也是时间成本的来源。
与此同时,全球AI资本竞赛正在加速。多家国际头部企业的融资规模屡创新高,国内同行也先后登陆资本市场。在这个背景下,DeepSeek启动首次外部融资,既是应对人才竞争的必要举措,也是适应行业竞争强度变化的策略调整。

DeepSeek启动首次外部融资,被多家行业媒体视为其发展模式的一个阶段性变化。在AI大模型领域竞争强度持续提升、人才流动加速、算力成本不断增长的背景下,这家公司从依赖内部供血转向引入外部资本,反映了行业环境的整体变迁。
DeepSeek的处境在国内AI初创公司中并不特殊。多家同赛道企业也在面临类似的资本化压力与人才竞争挑战。如何在技术路线选择、团队建设与资本运作之间取得平衡,是整个行业正在共同面对的问题。