黑料不打烊吃瓜爆料A黑料不打烊吃瓜爆料I颠覆者:DeepSeek的过去、现在与未来_ZAKER新闻
A黑料不打烊吃瓜爆料I颠覆者:DeepSeek的过去、现在与未来_ZAKER新闻
针对近期京津冀地区暴雨洪涝灾害,应急管理部会同国家粮食和储备局向灾区紧急调拨2万件中央救灾物资,支持地方妥善保障受灾群众基本生活。
文 | 窄播,作者 | 余智敏2025 年开年,AI 行业迎来了一场出乎意料的「地震」——国内的 DeepSeek 以颠覆性姿态炸裂出圈,短短数日登顶全球应用下载榜榜首,日活用户迅速突破 1500 万。中美科技界对 DeepSeek 进行了激烈的争论,观点交锋,有人高度认可,有人冷嘲热讽,更有人陷入恐慌。Anthropic CEO 达里奥 · 阿莫迪万字长文呼吁进一步加强对华的芯片封锁;OpenAI CEO 山姆 · 奥特曼罕见认错,并且承认 OpenAI 的领先性被削弱。不仅是科技行业,美国总统特朗普也指出 DeepSeek 给美国敲响了警钟。DeepSeek 到底做了什么?为何会引发全球性的轰动?DeepSeek 的出现,打破了哪些行业共识?如何理解 DeepSeek 带来的机会以及未来的挑战?本文将会逐个探讨这些问题。DeepSeek 做了什么?DeepSeek 引发 AI 行业地震的前提包含三个基础事实:模型能力追平行业领先水平;在算法和工程上有核心创新;产品引发全球关注。第一,模型能力上,R1 追平行业领先水平。关于年初发布的 DeepSeek R1 模型能力,相信大家已经看到足够多的信息,或者也自己体验过了,测评层面,DeepSeek R1 在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。对于大语言模型,逻辑能力和语文能力是最直观可以感受到的。Claude 3.5 Sonnet 去年发布之后,这两项能力是非常突出的,个人体感是比 GPT 还优秀,尤其是语文能力,最近半年多最主要使用的也是 Claude。如今的 DeepSeek R1 在逻辑和语文能力上也是非常突出,结合外显的思考过程,给用户的冲击非常强烈。小红书上出现了大量 DeepSeek 的「锐评帖」、「情感贴」,因其详实全面的思考过程,被网友戏称为「最内耗的 AI」。并且,DeepSeek 针对法律、市场营销等专业领域的问题,也能给出全面、有洞察,甚至是让从业人员「不寒而栗」的回答。总的来说,目前 DeepSeek R1 在基础能力上,明确地属于第一梯队。第二,核心创新上,V3 在算法和工程上围绕 MoE 进行了大胆尝试。关于 DeepSeek 模型的争议有很多,R1 虽然效果很亮眼,有很好地运用了强化学习的范式,但是这个算是在行业中已经被运用的方法,DeepSeek 进行了很好的实践,更像是对 OpenAI 的 o1 进行复现,有不同的地方是,DeepSeek 把思考的过程给用户呈现了。DeepSeek 在算法和工程方面最具创新性的突破在于 MoE(混合专家模型)的规模化应用。从 V2 开始,DeepSeek 将专家数量从传统的 8 或 16 个扩展到 160 个;到 V3 时期,更是突破性地达到 256 个专家数量,实现了 671B 参数量下仅需激活 37B 参数的高效运算。MoE 模型的效率优势正源于其选择性激活机制。与传统模型(如 Llama)需要激活全部网络权重不同,MoE 通过对计算网络进行「分类」,只激活相关专家进行运算,显著降低计算成本。类似分成 8 个专家,运算的时候激活 1 个,这样运算量就只有八分之一,剩下的 7 个专家都是和输入八竿子打不着的部分,没必要进行运算。那如果 MoE 这么高效,为什么此前行业没有大规模运用呢?MoE 模型此前未被广泛应用的主要障碍是训练难度大,容易出现信息分类不当。DeepSeek V3 通过创新性的算法和工程优化,成功突破这一限制,在保证模型效果的同时,实现了仅需激活 5% 参数的高效运算,开创了大规模 MoE 的先河。第三,产品表现上,引发全球轰动,日活迅速超 1500 万。模型能力、技术创新引发全球性讨论的同时,DeepSeek 的 APP 也陆续在全球 100 多个国家登顶下载榜榜首,日活很快超过了 1500 万。硅谷一线风投 a16z 的创始人 Marc Andreessen 也转发了相关的对比数据,显示 DeepSeek 日活已经达到了 ChatGPT 的 23%。实际上公司因为遭受了不明原因的大规模攻击,不得不暂停了海外新用户的注册,不然这个增长势头可能会更猛烈。DeepSeek 为什么能引发全球轰动?列完这三个基础的事实,不知道大家有没有发现,DeepSeek 产品表现上只是追赶到第一梯队,并不是超越当前市面上的产品,也不是底层的范式创新。要说模型能力,其实 Anthropic 的 Claude 3.5 Sonnet 真的也很能打,都半年多了,但是看数据就知道和 ChatGPT 的声量(日活)是完全没法比的,除了 AI 的从业者,外部的讨论微乎其微。相较而言,DeepSeek 的新模型发布之所以能在 AI 领域掀起惊涛骇浪,是因为有三点远超大家预期。第一个远超预期的点是 DeepSeek R1 做到了又好又便宜。在模型效果追平第一梯队的情况下,DeepSeek 的训练成本不到 600 万美金,而 Meta 开源的 Llama3-405B 训练成本超 6000 万美元,DeepSeek 用不到 Meta 十分之一的训练成本,实现了更好的模型表现。在推理的 API 定价的层面,与能力相当的 OpenAI o1 模型进行对比,DeepSeek 的定价约为 o1 的三十分之一。参考 DeepSeek 去年推出的 V2 模型,如果效果不好,但是便宜,不会引起这么大轰动;参考 Anthropic 的 Claude 3.5 Sonnet,如果效果好,但是不便宜,也不会有这么大的轰动。如果要给好和便宜排个序,肯定是便宜更超预期。因为好的层面,已经有 GPT 和 Claude,其他的也在追赶。好到追平第一梯队,不能说太超预期。但是在好的基础上,还便宜这个点,是全世界没有其他团队做到的。因此给了业界极大的冲击。至于团队是如何做到如此大幅度的降成本,重要原因是刚才提到的算法和工程的创新,MoE 大胆地拓到了 256 个,实际运行只需要激活 5% 左右的参数,极大地提升了运算的效率。第二个远超预期的点是 DeepSeek 做到了完全开源。第一梯队的模型 GPT 和 Claude 都是闭源的,开源的 Llama 效果要比 GPT 和 Claude 逊色一些。现在 DeepSeek 在比肩第一梯队的情况下,还做到了开源,而且是在论文中公布了详实的模型细节。OpenAI 没能做到的 Open 和开源,反而让来自中国的 DeepSeek 做到了。第三个远超预期的点是 DeepSeek 的成果由中国团队做出。一直以来都被认为是追赶者的中国公司,第一次在 AI 行业中站上世界舞台的中心,给到全球一个又好又便宜,还开源的大模型。而且 DeepSeek 的核心研究员都是中国本土培养的博士,没有海外留学的背景。DeepSeek 打破了哪些共识?DeepSeek 打破的第一个共识是:美国引领一切。AI 科技领域,美国长期以来都是创新的引领者,中国企业往往扮演跟随者的角色,更擅长技术的应用场景拓展。现在竟然有中国的团队,在 AI 技术领域,做出了像消费电子般的中国「智造」模型,又好又便宜,在一定程度上打破了技术创新只能在美国出现的刻板印象。图灵奖得主 LeCun 也借此痛批硅谷傲慢病:患有这种病症的人认为自己所在的小圈子垄断了好想法,甚至认为其圈子以外的所有创新都是通过「作弊手段」得来的。第二个被打破的共识是:资金密集投入,大力出奇迹,垄断市场就能获得超额收益。DeepSeek 的全球热议还带来了美股的惊天震动,英伟达单日大跌近 17%,市值蒸发 5950 亿美元,近 6000 亿美元,相当于人民币 4.3 万亿,创美股单日跌幅最高记录。二级市场短期是情绪的体现,大家恐慌性地抛售,原因不仅是因为 DeepSeek 训练成本下降,带来了芯片算力需求可能会下降的恐慌,也源自传统的美国科技资本逻辑受到的冲击。传统逻辑是:在行业中进行密集的资金投入,寡头的几家企业获得垄断性的资金优势,进而大力出奇迹,带来技术成果后获得垄断市场的主导地位。简单来说,就是大资金、大投入、长周期带来超额回报。从互联网时代开始,到移动互联网已经多次印证了这个逻辑。在 AI 的时代,由于算力成本高昂,这个逻辑更是被放大。像是最近公布的有特朗普站台的「星际之门」(Stargate)计划,由 OpenAI、孙正义(SoftBank 软银掌门人)以及中东基金共同推动,宣称要在 4 年内投入 5000 亿美元,打造「全球算力中心」,想要依靠大规模投入建立算力优势。DeepSeek 的出现,给这个资本逻辑一记重拳——在 AI 领域大资金、大投入并不意味着一劳永逸。实现领先有可能根本不需要这么大资金的投入,抑或是这么大资金的投入之后,即使是闭源,也无法保证垄断。假如基本的逻辑开始面临挑战,逐利的资本显然需要重新思考自己的投资思路。第三个被打破的共识是:闭源始终领先。关于 AI 开源闭源领先性的讨论,其实一直争论不断。DeepSeek R1 的出现,是一个巨大的变量。模型追上了闭源的 OpenAI 和 Anthropic,而且进行了开源,为整个 AI 行业注入新的动力。OpenAI CEO 山姆 · 奥特曼也罕见认错,认为 OpenAI 在是否开源上,站在了历史错误的一面。关于开源闭源之争,还有两点值得关注。AI 语言模型 VS 传统开源技术差异:- 技术同源而非分叉:对比 Android 与 iOS 的生态隔离,开源与闭源大模型均基于 Transformer 架构,差异是在数据、算法运用、工程等维度,并非是截然不同的技术路线。- 企业主导型开源:Meta、DeepSeek、OpenAI 等公司掌握开源与否的节奏,社区更多是参与者而非主导者,而传统 Linux 更像是社区驱动的模式。AI 多模态模型现状:- 图像生成:开源 stable diffusion 相关的生态繁荣,闭源的 midjourney 等企业也有很好的商业化。- 音乐生成:闭源的 Suno 相对领先。- 视频生成:闭源的 Runway、快手的可灵、生数科技的 vidu 等相对领先。我们在讨论 DeepSeek 开源的时候,语境都是 LLM 大语言模型。但是除了语言模型,AI 还有非常重要并行的领域是多模态模型。DeepSeek 也在近期发布了图像模型 Janus pro,但是效果一般。在多模态的领域,开源还有更长的路要走。未来展望:机会与挑战首先,DeepSeek 会给 AI 应用的发展带来长期利好。应用对基础服务的需求,从来都是「又好又快又便宜」。如果要排序,好>便宜>快。不好的东西可以不用,同样好用的产品,便宜当然是有优势,然后速度快,服务稳定。DeepSeek 当前的语言模型,做到了又好又便宜。对于现有的 AI 应用来说,已经接入语言模型的应用,可以替换成价格是三十分之一的 API,显著降低的成本,可以更好地探索 PMF(Product Market Fit),有更大的空间进行尝试。这个是第一步最直接的影响。关于能否因此出现新的 killer app,我的答案是:短期否定,长期肯定。短期来看,AI 的 killer app 需要的不只是 PMF,在 PMF 之前,还有技术。技术在细分场景是不是足够好用,是 killer app 的必要条件。而这个和模型的能力直接挂钩,最早就有提到这次的出圈,并不是模型能力的突破,所以短期这个必要条件没有变化。长期来看,会利好 AI 应用的发展。原因在于 DeepSeek 这次的开源,让行业最领先的水平平权了,会加速推动 AI 进化的速度,进而推动必要条件的成熟,带来新的应用机会。其次,推理芯片和云服务也有望受益。一方面,好用便宜,所以多用。会让推理的市场需求加速扩大,对应的推理芯片和配套的云服务市场也扩大。英伟达在训练芯片上的优势是更显著的,推理芯片层面相对而言,国内头部芯片代差会小一些。另一方面,亚马逊和微软都已经接入 DeepSeek,国内的百度云、腾讯云、阿里云也都已经接入。上文提到的 AI 应用企业,使用 API 的选择之一也是从云服务接入。当然,DeepSeek 在未来也会面临来自模型技术发展和地缘因素的双重挑战。虽然这次 DeepSeek 给 AI 行业带来一股强心剂,但是没有改变是当前模型发展的困境。对于语言模型,还有类似幻觉这样的问题难以解决,可能需要更底层的范式创新才能突破;对于多模态的模型,考验就更多,图片的指令遵循效果差,细节控制差。视频生成模型在过去半年,进展速度非常快,但是指令遵循、一致性等都还有很大空间,并且成本很高,非常需要像 DeepSeek V3 一样能把价格打下来的模型。同时,DeepSeek 的出现给了中国企业更大的信心去做创新性的尝试,也给美国敲响了警钟。可以预见的是,中美的科技冷战会进一步加剧。芯片的限制可能会进一步加强,中国企业的国际化也会面临比以往更大的压力。道路难免崎岖,前行必有曙光。在通往 AGI 的征程上,DeepSeek 的崛起不仅打破了闭源垄断的旧秩序,更以开源民主化的方式推动重构着 AI 领域的竞争规则。从「美国引领」到「中国创新」,从「资本密集」到「人人可及」,从「闭源垄断」到「开放共享」,这些根本性的改变,正在塑造 AI 发展的新秩序。koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:李秉贵
TOP1热点:“网红边角料零食”来袭!这也太权威了!!
“升级为国家植物园后,平台受到了更多关注。国家植物园的一个主要任务是植物的迁地保护,与普通植物园相比,植物物种收集要更丰富,因此引种保育这一块的工作量很大,要求也更高。”华南国家植物园园艺中心引种保育部副部长湛青青说,过去大家认为引种保育工作辛苦又不容易出科研成果,“以前缺少专业人才,现在植物园对引种保育的重视度大大提升,这对我们的工作是极大的促进。”。
提高网络综合治理效能,形成良好网络生态。强化网络平台主体责任,加强互联网行业自律,引导自媒体、互联网企业规范有序发展。积极引导广大网民自觉遵守法律和道德规范,做到依法上网、文明上网、安全上网。
TOP2热点:一个视频串讲「数学必修二」知识结构
上半年,太阳能电池、工业控制计算机及系统产量分别增长54.5%、34.1%。截至目前,各地建设数字化车间和智能工厂近8000个,智能制造新场景、新方案、新模式不断涌现,数字技术赋能效果明显。
TOP3热点:我好像又捡到了隐藏款的高智商小猫…草莓博览园
由韩国釜山63个市民团体组成的“反对福岛核污染水排海釜山运动本部”从6月1日至7月11日组织签名活动抗议排海计划,目前已征集到超过11万民众的签名。“反对福岛核污染水排海釜山运动本部”7月27日在日本东京首相官邸前举行记者会,表示坚决反对排海计划。市民团体还在东电公司门前举行抗议活动。
TOP4热点:动画师:差点肝没命,所以看谁都像垃圾…国精产品一品二品国精日本
污水处理站投入运营后,后寺村利用处理好的污水,种植水杉、荷花等植物,在村内建造了一处湿地公园,端午假期接待游客上万人次。
TOP5热点:为了横扫套圈摊,我们做了这个…CHINAGARY武警体育飞机
这部法律在立法目的中明确:“保障残疾人、老年人平等、充分、便捷地参与和融入社会生活,促进社会全体人员共享经济社会发展成果。”
夏日的夜晚,安徽省医药价格和集中采购中心一片寂静,唯独四楼的一间办公室还亮着灯。
TOP6热点:压力好大,想把车卖了出去散散心四川妇女BBBWBBBWM
近日,广州木本花卉专类植物展示园举行了“小小花匠”科普活动:小朋友们在实验室内观看科普动画片,参与为鲜花授粉的实验。他们积极回答科普工作人员提出的问题,课堂上充满欢声笑语。
华南国家植物园目前迁地保护了珍稀濒危植物643种和国家重点保护植物337种。
TOP7热点:蛋仔派对 | 在蛋仔乐园里演绎爆火哪吒!太好玩啦!【蛋仔必看系列】一面亲一面膜下的免费
“一方面,我国的高温水热型资源主要分布在滇西、藏南等地区,不属于电力主要消纳地,丰富的地热资源难以用于发电,造成资源损失。另一方面,国内仍缺乏明确的地热能上网电价扶持等政策,限制了地热能发电的发展。”南京天加能源科技有限公司执行总裁邓壮说,“作为国内较早涉足地热能发电领域的企业,我们已经拥有较为成熟的地热能发电技术和相关装备,在海外也布局了地热能发电项目。但受限于上网电价等扶持政策不明,国内地热能商业发电处于停滞状态,很多企业也仍在观望。”
TOP8热点:当普通班超越尖子班(超级无敌爽啊啊啊啊啊)管家婆一肖资料大全
盛夏7月,中国向世界亮出半年经济答卷――
上半年,太阳能电池、工业控制计算机及系统产量分别增长54.5%、34.1%。截至目前,各地建设数字化车间和智能工厂近8000个,智能制造新场景、新方案、新模式不断涌现,数字技术赋能效果明显。
TOP9热点:自制同人动画《2233娘之日常》第五话八重神子焯出白水来怎么办
坚持统筹发展和安全。习近平总书记指出:“网络安全和信息化是相辅相成的。安全是发展的前提,发展是安全的保障,安全和发展要同步推进。”网络安全和信息化是一体之两翼、驱动之双轮。统筹发展和安全,既是过去网信事业取得重大成就的重要保证,也是未来网信事业行稳致远的必然要求。这就要求我们正确处理好发展和安全的关系,坚持发展安全并重,做到协调一致、齐头并进,以安全保发展、以发展促安全,努力建久安之势、成长治之业。
污水处理站投入运营后,后寺村利用处理好的污水,种植水杉、荷花等植物,在村内建造了一处湿地公园,端午假期接待游客上万人次。
TOP10热点:燃烧主任的卡路里!海角社区最新 在线 观看
“企业是药品质量和供应的第一责任人,必须对产品质量负责。”蔡辉介绍,中选产品如检测出质量问题,便会被列入“违规名单”。同时医保部门会视情节轻重取消中选企业一定时间内参与集中采购活动的资格。