![]() |
当前位置: 主页 > 新闻动态 > 行业新闻 > |
直到中国科技公司深度求索发布了推理模型DeepSeek-R1,用不到GPT二十分之一的成本,获得了和OpenAI的顶尖推理模型o1相当的能力。
DeepSeek的影响很快扩散到大洋彼岸。
1月27日,美国科技股遭遇“黑色风暴”,费城半导体指数(SOX)狂泻9.2%,创下2020年3月以来的最大单日跌幅。英伟达股价重挫近17%,市值一夜之间蒸发近6000亿美元,创下美股历史上最大的单日市值缩水规模。博通、台积电、ASML、Google和微软等科技巨头也未能幸免,股价分别下跌17.4%、13%、7%、4%和2.14% 。
与此同时,欧洲科技股市场同样哀鸿遍野,各类科技股惨遭抛售。
引发全球资本市场“强烈地震”的幕后主角——DeepSeek,不是任何发力大模型的大厂,或者创业明星,而是一家此前名声不显的小型科技初创公司。它由幻方量化创始人梁文锋一手创办,成立仅一年多。
最能唤醒读者记忆的,可能是去年8月,DeepSeek率先宣布其API价格大幅下调,输入费用调整为0.1元/百万tokens,输出费用为2元/百万tokens,随后各家大厂纷纷跟进。大模型价格战也就此打响。
实际上,DeepSeek的创始人梁文锋或许是最早把目光投向AI的那批人。不仅仅是他创立了量化基金,更有意思的例证是,在算力紧缺的2023年,国内只有五家公司拥有万块规模的显卡,前四位是阿里巴巴、腾讯、百度和字节跳动,剩下的那个就是幻方量化。
开源、创新、成本。在硅谷,DeepSeek被称作“来自东方的神秘力量”。他们一面跟随,推出类似的推理模型,一面攻击,要求对其进行封杀甚至算力封锁。
1月28日,DeepSeek曾连续发布两条公告称,DeepSeek线上服务受到大规模恶意攻击。
客观来讲,从产品实际表现来看,DeepSeek目前只是跻身行业第一梯队,尚未实现对市面上现有产品的全面超越,也并非在技术底层实现了范式创新。
但DeepSeek确实为全球AI行业的长期发展探索出了新的模式,也让长期被硅谷霸占话语权的AI行业出现了一些不一样的声音。正如AI领域泰斗吴恩达所言:“DeepSeek的创新表明,中美在生成式AI领域的差距正在迅速缩小,在某些领域中国已现领先迹象。”