福布斯封面:豪赌比特币
458 2025-02-01
结论:
影响非常大,而且是全方位的,不是阴谋论
DS提供的是一个新方法,对传统模型的影响也会非常大,文末有解释
华为升腾服务上线了,意义重大,国产大模型真正可以落地
个人判断,会加剧对抗,人工智能法案很有意思
垄断就是落后的开始,竞争才是创新的源头
DeepSeek的推出,为什么会有如此大的影响?春节假期这几天,刷屏的文章基本都是deepseek的,但是大多数的讨论都是局限在技术上,随着微软,NV,AMD这些企业的行动,我想关于DeepSeek的质疑(技术&成本)差不多可以停下来了,估计谁也没想到会这么快........我还记得周一的中午写了一个关于deepseek的文章,文章下面还有人阴阳什么DS囤了很多卡。几天时间,美国的AI巨头基本论证了DS技术和成本的可信性。
其实这个东西,上周末我在研究DS的时候就已经意识到了。DS不是一天出来的,他这次是把代码给开源了,而且也有论文告诉大家,这东西是怎么实现的,大家都可以拿去复现的——也的确有团队复现了这个东西。除了媒体传播过程中的夸大之外,我相信原始论文里的东西是严谨的——现在的问题就是:DS到底会产生什么样的影响?
结论:这不是简单的技术之争,这也是一个阳谋,其本质关乎:AI技术到底是应该用来获取垄断收益的工具,还是应该是造福全球发展的公共品?
DS这次出现,是一个关于AI的发展方向的分歧,是不是力大可以出奇迹?Scaling Law在过去两年,是一些人的坚持,但是现在来看,这个看法应该基本是一个错误的看法。其实,在一个快速变革,快速发展的行业中,哪里有什么Law可以让人遵守呢?
新的方法,可以用更低的成本实现更好的效果,无非就是这个方法论的极限在哪里了。我相信的是,这个事情刚刚开始.......
美国人发展AI,尤其是从NV芯片的出口管控和OpenAI变CloseAI来看,这不是一个简单的技术或者产品,美国人将AI视作影响国运的基数和产品。其最根本目的只有一个:垄断全球AI的技术,从全球继续获得垄断利润。
以前,中国的制造业不行的时候,美国不就是这么赚钱的?芯片不是这么赚钱的?现在无非是想在AI上再复制一次罢了。这次之所以影响大,是因为AI一旦真的能产业化落地,其产值想象空间将会是巨大的,可能是几万亿甚至十万亿美金的体量。
问题核心是两个层面的问题:1. AI芯片公司可能面临非常大的风险;2. AI不太可能实现垄断了——AI平权才会极大的促进全球经济的发展。
所以这事儿到了今天这个地步 ,根本不是中美之争的问题了。这是赤裸裸的阳谋:告诉美国人,AI的方向,你们走错了。美国的企业,接下来肯定也是跟进的,毕竟能力摆在那里,资源摆在那里,但是最终的结果可能就是,不跟是死,跟了,你也赚不到钱.....NV这些企业的高估值,可能也是很大的问题。
OpenAI的逻辑可能也会发生很大的变化,openAI从open变close,本来想靠垄断,来赚一笔大的,结果最终在开闭之间选择了封闭,这可能会被证明,是一个重大的错误。这个东西和msft的操作系统完全不是一个逻辑,这个生态很短,更多的是以服务的形式提供的,这种情况下,选择封闭,构建自己生态的逻辑就是错误的。
我想,大家在争论cuda,还是ptx的时候,有一个声音被大家忽视了:DeepSeek到底能不能在升腾上运行?
还在写这个文章的时候,官方的消息出来了:https://mp.weixin.qq.com/s/sl_N-kjouq8NRK3kcdsaaQ。
这可是节后的财富密码,能懂就懂了~不懂,也没办法了~
在上面这个链接的文章里,提供了基于华为升腾服务器的AI服务——这证明了很多东西,是很多东西。要知道5年前推出的910,已经升级到了910C。如果不出大的意外,这次芯片应该是基本管够的。芯片的良率估计也会有所提升——这都是估计,因为真正的良率数据,是绝对保密的,大家也都是猜测,没有人能拿到生产线的真实数据。能拿到数据的人,绝对也不敢出来乱说。
芯片的需求来自两块,一个是训练,一个是推理。
DS的出现,首先打破的是对训练芯片的需求。其实客观来说,训练算力已经过剩了,现在来看,DS可能会加剧这种过剩。训练算力是过去两年AI的核心了,但是已经不再是一机难求了,大家可以看看AI服务器的小时租金,做这个生意的知道这东西相比于高点下滑了多少。而且AI这个东西,在美国,门槛太高了,基本只有几个巨头在玩了。现在如果告诉你训练一个模型,算力需求要减少90%,不知道存量的算力供应过剩问题如何解决。
大家基本都认可训练的需求见顶,但是未来更大的空间来自推理的需求。我想这个问题也不大,但是在GPU和ASIC路线的争论,已经有一段时间了,大厂自研,博通,都是这个逻辑。但是问题是,现在华为的910也出来参与了战局。你要知道一点,用户的逻辑就是便宜好用,不关心背后的底层技术。如果DS的模型能力和华为的芯片可以支撑起这个应用的时候,人们肯定是要问问:NV到底还能值多少钱?
推理需求,对于大厂来说,走自研asic的路线,可能是更好的选择,在这种情况下,推理芯片是难以被垄断的。国内的几家企业,也都有这个能力,现在无非就是产能问题——这个问题的解决,可能只是时间问题。
如果大模型私有化部署的门槛被大幅度的降低了,面相C端的云服务成本大幅下降了,很显然,会加速AI的落地,这是毋庸置疑的。但是需求爆发的同时,供给多元化也非常多,而且很多产品更有性价比。你要知道,美国刚刚针对AI的算力,把不同的国家分成了三六九等.......这简直就是扯淡。如果这是国防军工层面的事情还可以理解,这明明只是一门生意,当这门生意本身无法构建壁垒,而需要通过行政命令的方式来构建壁垒,那么这个壁垒必然会脆弱无比。
我们前面说过一个问题,就是美国的成功是建立在对全球征收铸币税的基础之上的——简单来说,全球都需要用美元,所以美国可以通过美元将危机转嫁。这是最高效的殖民模式了......
美国向全球征税是依赖高科技吗?美国有一批公司,meta,google,msft,amazon这些,都是通过在互联网上提供服务来进行全球征税的,但是这种征税权,不是建立在严格意义上的商业标准之上的。
也就是说,美国的这些公司,并不是依赖自己的技术实力来获得全球竞争力的。比如我们说一个非常典型的例子,meta的壁垒到底是什么?如果将meta和国内的wechat这些工具比较,你会发现,meta可能没有存在的必要。但是中国的这些对应服务,在中国这个市场上卷成了这个样子,但是我们很难在欧美推行这类软件和服务,或者说在美国弄了一个tiktok,也被人家弄的要生要死的。
如果这么看,我们有理由怀疑:即便是美国的AI革命成功了,并且也被美国垄断了,但是美国能通过AI革命向全球征收更重的“AI税”吗?
明明可以抢的,现在非要和你做生意,何必这么麻烦呢?更何况,现在以AI和半导体芯片为代表的,全球征税工具,现在被一步步的拆除了,你让美国接下来到底通过什么产业基础,进行全球征税呢?美元已经无法锚定资源了,美元事实上是锚定在中国的制造业身上了。美元向全球输出(美国形成赤子),相当大比例是依靠对中国的逆差,也就是制造业商品——这是美元从美国流出到其他国家的重要手段;然后服务业创造的利润回流和资本账户的顺差,是美元回流的重要途径。
美国是无法实现有效的货物贸易的逆差缩小的——如果美元流向全球的路径被斩断了,其它国家失去了获取美元的途径之后,很容易找到替代物;另外就是美元回流的途径,核心就是科技(美国的高科技服务业创造了巨量的海外利润)+金融(美股+美债),如果科技这条路被斩断,那就有意思了......这么看,你就能理解在这个美元的全球循环中,中国制造的商品其实是美元真正的基础,中美之间是不可能决裂的,一个工业生产国,在分家的过程中是不会吃亏的。相反,科技霸权的确是美国实现美元健康回流的关键手段,但是这条腿可能很快会被砍掉,只剩金融的美国,估计也不会持续太久了。这个美元循环,可以在美国的国际收支平衡表上得到数字印证,可以持续跟踪,而且这是一个会计恒等式——等科技这个路径被弄死了之后,才是最有意思——美国只有美债一条回流美元的途径,最终会失去货币信用的。
这两年中美之间存在大量的对抗,但是现在看来,过去5年的贸易战,让中国的顺差扩大了将近一倍,现在接近万亿美元的顺差,是人类有史以来单个国家最大的顺差了。对美国高科技行业的挑战,随着科技展的展开,现在来看,美国的各种动作基本是基于防守的(芯片,ai都是类似的),但是中国都是进攻的——虽然这个进攻的过程,有点惨烈,有点上甘岭的味道。但是现在看来,攻下来,应该只是时间问题了。美国并没有在科技战中表现的咄咄逼人,进攻的锋芒少了很多!
我们首先要强调,AI是一个强大的工具的,但是未必是赚钱的工具。下一个这样的项目,应该就是musk的星链了。我曾经算过一笔账,中国的星链建成之后,极大概率是模仿当下的GPS和北斗,直接免费,或者收取一个极低的费用,甚至是在不同的国家,收取不同的费用。最后赚钱,是依赖终端设备的生产和一些to B的服务来赚钱,而C端直接免费——因为这个产业杠杆太高了。
我们来看看美国人的游戏,就清楚这里面的一些问题了。
我们也都知道微软是OpenAI最大的股东,差不多50%的持股比例吧。我们先假设,如果要做AI方面的研究,如果微软放在公司内部做,可能每年要新增的亏损可能高达百亿美金。
其实OpenAI没有大家想的那么NB,成立以来,一直到2023年之前,也就融资了不到10亿美金。在2023年春节前后的那个gpt3到来之前,没投入太多的钱。但是2023年的AI风口来了,融了100亿美金,然后去年66亿美金,现在计划400亿美金。所以,如果真的看数据,OpenAI也就是这两年进入了拐点,然后给华尔街的叙事是:AI的壁垒核心就是资本和硬件——但是这话听起来,有点别扭。
对微软来说,如果将100亿美金的钱,投给OpenAI,那么还能从其他投资者那里再拿到不小的一笔钱。然后OpenAI的这些钱当中,相当大比例的资金,都用于租赁微软的云计算资源——这在会计上形成了微软的收入和利润。而且OpenAI烧算力这个模式,短期对微软是利好,但是长期落地来看,这对微软来说,是不好的——提供服务的成本始终下不来。这也是为啥在技术开发阶段,微软和OpenAI关系还不错,但是到了要服务落地阶段,二者发生了一些冲突。
OpenAI必须讲资本开支的故事,否则你的融资和估值都上不来啊,所以出现了一个Scaling Law的叙事,这个叙事其实前面就已经出现了崩塌的迹象,只是大家都不关注。我曾经在公众号上写过一个文章,就是大模型的门槛被急速拉升之后,很多小团队退出了大模型训练这个环节,因为需要的资本开支,根本就不是一个创业型团队能支撑的起的。美国那几个大模型,背后基本都是产业巨头的支持。这就导致了一个问题,英伟达的卡的潜在需求,在北美地区,可能上限也就是小几百万张的规模,就差不多了,平均每个巨头每年采购50-100万张卡(这些卡已经非常多了)。生态和客户的单一性,导致NV其实已经出现了问题了。
现在是第二次冲击——如果算法提升可以在很大程度上提升效率,降低成本,而且关键是,中国的AI芯片在今天(物理意义上的今天)已经被证明了,可以非常好的运行deepseek,这个时候,英伟达的核心竞争力是什么呢?在当下,训练算力基本已经过剩(甚至是基于deepseek的方法,可能严重过剩)的当下,而推理芯片,又注定是百花齐放的时候........
至于这里面的明白人,NV,他永远不可能站出来说,Scaling Law不成立,这是人家活着的根本啊。
所以你会发现,这个资本游戏非常有意思:NV实打实的赚了钱;OpenAI获得了估值和源源不断的融资叙事;微软不但提升了收入,增加了会计利润,手上还拿到了一个估值千亿美金的企业50%的股权,获得了AI技术。那么问题来了,这里面受损的是谁?当你不知道牌桌上谁是sb的时候,你最好怀疑一下自己.....
其实,大家可以很容易的发现,deepseek出现之后,不管媒体怎么争论,什么美国gov要调查,威胁国家安全之类的........美国的大企业,在我们的春节假期期间,用了几天时间,几乎是集体上线了Deepseek服务——这只是一个模型而已,而且是一个开源模型,这根本就没有任何所谓的国家安全问题,因为你可以不用啊.....所以我说这是一个阳谋,而且是无解的阳谋。难道这些部署deepseek服务的大型科技企业,不知道降低成本吗?
我们做一个总结,DeepSeek事件的影响:
a.利空英伟达——现在持仓nv的人,也别在这里争了,真正nb的是,过去英伟达做多的钱你赚到了,未来nv做空的钱你也能赚到,反正都是美金,为啥要区分出来个优劣呢?
b. DeepSeek提供的是一套方法,而不是一个具体的产品,未来沿着这条路来看,还可能有大量的提升空间(一个技术细节,我不是很清楚,其实由于通信和内存的限制,现在nv的卡的算力闲置其实非常明显,算力的利用率可能不到20%,大部分时间周期基本都用来数据的存和传了(AI就三块,数据的存,算,传),这次DS针对的就是这个,当年H100阉割到800的时候,其实主要的闲置就是内存访问速度这块,结果无心插柳....也就是说这个方法得到推广,那么现在的算力利用率会得到非常大的提升,会加速对卡的需求的解体——毕竟对NV来说,算力浪费也可以赚钱啊)。
c.证明了低端硬件,也可以落地高性能的模型。未来市场上会出现大量的竞品,华为升腾910c,寒武纪,燧原等等,这些产品的落地会加速,所以,利好........我就不说了,过两天开直播聊聊这个事情
d.美国的反映可能有两种:1.加大科技封锁力度,但是基本没用——ds这次的成功,从技术上来说,就是因为美国限制导致的,那个算法的细节之处就是解决了数据的存传问题;2.中美缓和的开始,美国要从实力的角度,真的坐下来好好谈谈了。
e.现在的供应链上的投资机会,会发生非常大的变化......很多东西的逻辑,要改变了。这里不多说了