DeepSeek：黑天鹅降临硅谷

2025-01-27 21:08

imToken - 全球领先的去中心化钱包

推荐下载 领取价值高达 6,0000 元的数字货币盲盒，享受 20%手续费减免。提供安全、可信赖的非托管钱包服务！

立即下载 APP推荐

作者：teafox；来源：茶狐看世界

这是一个信息爆炸的时代，也是一个信息严重污染的时代。所以，我对任何信息都不会轻信，尤其是面对重大利好，更加「存疑」。对我来说，排除信息污染的最好办法，就是交叉对比，正反面都看。

过去48小时内，我几乎都泡在X上，浏览各种关于Deep Seek的消息，在英语世界，基本上是压倒性正面评价，这时候，我就特别想看看负面的评论，找了一圈，的确有。

主要分为两类：

一类，为了反而反，尤其是一些海外的反中人士，任何关于中国的新闻，他们都会给出负面的评价，这类信息简直就是垃圾。但看看也好，至少可以知道垃圾是什么样子。

另一类，是业内人士的负面评价，其中第一个，也是最鹰派的声音，居然来自一个华裔业内人士——Alexandr Wang。

首先，此人的名字有点奇怪，第一次看到，我以为是CNBC拼错了，一般情况下，Alexander是英语中最常见的拼写形式，也是国际通用的版本。而Alexandr，则是某些东欧语言（如俄语、捷克语等）的拼写形式。一个美国华裔，居然用东欧的名字，有点蹊跷。但我定睛一看，确实是Alexandr。

其次，这位王先生，不仅名字奇怪，更有着与众不同的背景。他出生于1997年，是Scale AI的创始人兼CEO。24岁时，Alexandr Wang成为了世界上最年轻的「白手起家」的亿万富翁。根据福布斯的说法，截至2024年7月，他的身价为20亿美元。

他是中国移民的儿子，父母都在洛斯阿拉莫斯国家实验室（Los Alamos National Laboratory）担任物理学家，核武器就诞生在这个实验室。中国人能在这种单位工作，非常罕见。

Alexandr 从小就对数学和计算机编程充满热情。他在2013年获得了美国队的数学奥林匹克资格。在十几岁时，他就在美版知乎Quora担任软件程序员。随后，他在麻省理工学院学习计算机科学，但中途退学，创办了Scale AI，成了硅谷的AI神童。

Alexandr说：Deep Seek至少有5万张英伟达H100显卡，只不过因为制裁的原因，不方便说而已。事后，我看了好几遍CNBC电视台的采访，他的原话是as my understanding，也就是「按照我的理解」，而没有任何实锤的证据。

根据Deep Seek的说法，训练模型只用了2048张H800显卡，也就是H100的阉割版，价格也只有H100（3万美刀）的三分之一。正因为用了低配的硬件，才体现了Deep Seek的创新价值。

那么，为啥Alexandr Wang要慌呢？

我不是什么AI专家，但根据我这几天索阅读的大量信息理解，Deep Seek可能是一只巨型的黑天鹅，她正在硅谷的上空游荡。

1/ 目前，训练顶级AI大模型的成本极其高昂。OpenAI等巨头，需要拥有数万个H100显卡的大型数据中心。每块最低3万美元，总价就要十几亿美元，而且耗电量惊人，需要一整座发电厂提供电力。他们仅在训练模型上，就要花费数亿美元。

2/ DeepSeek突然出现并说：「哈哈，如果我们花 500 万美元做这件事会怎么样？」他们不只是说说而已，而是真的做到了。DeepSeek的模型在许多任务上，甚至击败了 GPT-4 和 Claude。硅谷的人工智能世界，瞬间就懵了，AI天才Alexandr Wang语无伦次了。

3/ DeepSeek怎么做到的？他们从头开始重新思考一切。传统AI就像是把每个数字都写成 32 位小数。而DeepSeek 说：「如果我们只使用8位小数呢？」结果，它仍然足够准确！瞬间，所需内存就减少了75%。

4/ 然后是他们的「多标记」系统。普通人工智能的阅读方式就像一年级学生一样：「鹅......鹅......鹅......曲......项......向......天......歌」，逐字阅读。但DeepSeek一次读完整段话。速度快2倍，准确率高90%，当你处理数十亿个单词时，这一点很重要。

5/ 但真正聪明的是：他们建立了一个「专家系统」，而没有使用一个试图了解一切的大型人工智能（比如让一个人同时成为医生、律师、工程师、木匠），只在需要时才激活特定专家，节省了大量参数。

6/ 而传统模型呢？所有1.8万亿参数始终处于活动状态。与此同时，DeepSeek总共6710亿个参数，一次只激活370亿。这就像拥有一支庞大的团队，但只召集每个任务真正需要的专家。

7/ 结果令人震惊，训练成本：数亿美元 → 500万美元；所需GPU：100000 → 2000 ；API 成本：便宜 95%；可以在普通游戏显卡上运行，而不是数据中心硬件。

8/ 最疯狂的部分——DeepSeek是开源的（完全免费）。任何人都可以使用，代码是公开的。技术论文解释了一切，这不是魔术，只是令人难以置信的巧妙工程。现在x最流行的一个梗，Open AI →Closed AI（闭源AI），取而代之的是DeepSeek，才是真正的Open AI （开源AI）。

9/ 为什么DeepSeek很重要？因为它打破了「只有大型科技公司才能涉足人工智能」的神话。你不再需要价值数十亿美元的数据中心，几个好的游戏显卡，就可以做到这一点。

10/ 对英伟达来说，这很可怕。他们的整个商业模式都建立在利润率高达90%的昂贵显卡的基础上，比如售价高达三四万美元的H100，奇货可居，有钱都买不到。如果每个人都能突然用普通的游戏显卡做AI……那么，你就知道问题所在了。

11/ 关键在于：DeepSeek 的团队不到200人，但Meta的团队仅薪酬就超过了DeepSeek 的整个训练预算……而Meta的模型却不如DeepSeek。

12/ 这是一个经典的颠覆故事：既有者优化现有流程，而颠覆者重新思考根本方法。

13/ DeepSeek就像一次地震，余震太大：人工智能开发变得更加容易，竞争加剧，大型科技公司的「护城河」看起来更像水沟，硬件要求（和成本）大幅下降

14/ 当然，OpenAI 等巨头不会坐以待毙。但一切都要颠覆，再也不是大力出奇迹的模式了。

DeepSeek这只黑天鹅，煽动翅膀，整个硅谷都会被波及，效应可以总结为以下几点。

AI初创企业危机：DeepSeek的高性能可能导致大量购买英伟达显卡的AI初创企业破产，释放大量二手GPU。对Scale AI的CEO兼创始人Alexandr Wang来说，这是攸关生死的存亡之争，口出恶言，也可以理解。

数据中心业务受挫：大型数据中心运营商，其租用英伟达显卡的商业模式将受到冲击。

科技巨头减缓采购：科技巨头们可能因库存积压，减少对英伟达显卡的采购。

英伟达前景堪忧：上述因素叠加，可能导致英伟达的业务全面下滑。

X上，有一个金融大V说了一句：deepseek better not be the real deal...（deepseek 最好不是真的......）然后配了一张让人不寒而栗的图。

75年高点：图表显示，美国股市位于75年来的最高点。

Magnificent 7：这个词指的是目前美国股市中表现最好的七家科技巨头公司，它们在很大程度上推动了美国股市的上涨。

两次泡沫：分别是上世纪60年代的Nifty 50泡沫和90年代的互联网泡沫。这两次泡沫都导致了股市崩盘，这一次，deepseek来了...美股会崩吗？

最后，我们在看一看，DeepSeek团队刚在康奈尔发表的论文，其中每一个作者都值得我们铭记，大部分都是30岁以下的年轻人，来自国内的顶尖大学，有的还在读博士，其中，无人具有海外的学术背景。这再次表明中国在大学教育质量上已经赶上美国，并且未来几十年中国在STEM毕业生方面将占据绝对的数量优势。

正如DeepSeek创始人梁文锋所说：我们的价值在于团队，通过这个过程不断成长和积累专业知识。建立一个能够持续创新的团队，才是我们真正的护城河。

imToken - 全球领先的去中心化钱包

推荐下载 领取价值高达 6,0000 元的数字货币盲盒，享受 20%手续费减免。提供安全、可信赖的非托管钱包服务！

立即下载 APP推荐

标签：黑天鹅降临硅谷(117) DeepSeek(12735)

DeepSeek：黑天鹅降临硅谷

Hyperliquid联创：透明交易并非缺点，而是

华源信息申请全量资产数字化信用估值交

BTC大会｜Michael Saylor演讲：21把密钥解锁