为何本轮比特币牛市也如此艰难?还有机
162 2025-02-05
来源:FT中文网
一年之前的国内春节假期期间,OpenAI在当地时间2024年2月15日发布了文生视频大模型Sora,在几段sora生成的视频中,丝滑的运镜和几可乱真的呈现效果,让当时仍处于模仿和跟随阶段的国产大模型界陷入巨大的震惊和悲观情绪中。一时之间“投降论”甚嚣尘上,投资人和大厂们纷纷出来劝说创业者们放弃幻想,转攻应用,大模型创业是“死路一条”。
谁又能想到,在短短一年之后的这个春节,大家讨论的是一款名叫DeepSeek国产大模型。除了科技圈的讨论和刷屏之外,其应用开始深入千家万户,有更多的普通人开始使用DeepSeek定制减肥食谱、编辑节日祝福、写藏头诗,甚至算命。
到现在为止,DeepSeek一共推出了三代模型。去年5月,幻方量化旗下的DeepSeek发布了DeepSeek-V2,能力号称对标GPT-4,价格却仅为GPT-4的近1%,低廉的价格引发了国产大模型长达一整年的价格战;到了12月,DeepSeek发布了新大模型DeepSeek-V3,将训练成本降到几百万美元,被誉为“价格屠夫”;而这次发布的DeepSeek-R1,直接对标OpenAI o1.其中“深度思考”和“联网搜索”功能的上线,让DeepSeek成功登顶中美两区免费榜第一。
可以看出,DeepSeek推出的三代模型技术演进的节奏很明确,V2将价格打了下来,但是性能方面似乎优势还不太明显;V3在成本超低的前提下,性能逐渐跟了上来;直到R1,在价格依然低廉的基础上性能对齐了国际上最先进的大模型,真正达到了破圈的效果。而在节奏明确的同时,其技术更新用时也越来越少,V2发布后到V3用了大半年,但V3到R1,中间只隔了短短一个月。
我曾经在今年年初的展望中提到DeepSeek这个去年五月才崭露头角的初创公司。当时我曾预测,DeepSeek一定会成为新的一年大模型市场的破局者。其低廉的成本和价格证明国产大模型在算力和芯片受限的基础上并不是无路可走。而其以创业公司的身份“单挑”一众财大气粗的大厂,更是驳斥了之前的AI“投降论”,给了其他创业者们继续在大模型领域深耕的信心。
但是更重要的是DeepSeek除了价格低廉又完全开源开放,这打破了科技和资本巨头们在模型训练中的马太效应。这本来是最近两年里围绕人工智能的深层忧虑之一:芯片越来越贵,训练成本越来越高,全球几个大模型逐渐变得封闭甚至“寡头化”,算力和数据越来越掌握在少数几个公司手里,AI的入场券越来越贵,绝大多数人在这场AI技术革命中有可能只能做个旁观者。
前不久特朗普上台之后宣布的Stargate(星际之门)计划的实施会更加强化这个效果。这个雄心勃勃的AI基建计划规模高达5000亿美元,由软银、甲骨文和OpenAI主导。美国政府做靠山,大公司主导,然后巨额资金入场……很明显,这个项目的最终目的就是要靠资本、芯片和算力的军备竞赛,让美国在这场AI技术革命中永远独占鳌头。
DeepSeek的出现,最起码消解了星际之门计划给中国AI界带来的焦虑。当资本和算力的叠加不再是技术进步的唯一途径,这对创业者和开发者们意味着什么,科技圈的每个人应该都能预知到。
也正因为这一点,DeepSeek现如今在舆论场中被誉为“国运级别的创新”。且不说将“国运”跟一家创业公司挂钩到底是不是捧杀,在见过华为和TikTok的过往之后,将一家公司提上政治高度,架在大国博弈的前线,对悲观情绪刚刚有所逆转的中国科技界没有任何好处。
既然DeepSeek用开源将AI入场券“平民化”,那么未来在AI成本迅速降低的基础上,AI在各行业的应用和创新会进一步爆发。当下的讨论和思考更应该回归到市场和技术本身的意义:如何营造一个良好的市场环境,让技术革新能得到正向反馈;创业者和普通人又如何用AI改变自己周围的世界。