海角社区id:1120.7126“海角社区id:1120.7126算力崩塌”,是真是假_ZAKER新闻
“海角社区id:1120.7126算力崩塌”,是真是假_ZAKER新闻
据报道,以往解放军军机在西南空域飞,虽说进入台所谓“防空识别区”,毕竟与台岛仍有段距离;但台海则不同,台军机舰都得因应。今年台军编列的油料钱已创历史新高,但7月底就用光,可见海空军应处的压力。
文 | 巨潮 WAVE,作者 | 谢泽锋,编辑 | 杨旭然DeepSeek 的开发成本极低,开源、服务完全免费,这让山姆 · 奥特曼和其他 AI 人工智能的从业者 " 印象深刻 ",让世界首富马斯克破防,让瑞 · 达利欧对美股深感担忧。知名投资人 " 木头姐 " 凯茜 · 伍德甚至直言:DeepSeek 加剧了人工智能的成本崩溃。" 神秘的东方力量 " 让全世界为之侧目,也引发了中美 AI 领导地位更替的思考。不过,对于算力进行重新判断,可能仍然为时尚早。当前,我国 AI 算力部署占全球算力基础设施的 26%,名列世界第二。在 " 算力即国力 " 的思潮下,东数西算等数字基础设施工程正积极进行。DeepSeek 颠覆了固有的 " 大力出奇迹 " 的大模型性能提升路径,短期内对算力需求预期会出现大幅下降。但长期来看,算力部署仍然有大规模需求扩张作的基础。正在进行的超大规模算力投资,对于中国科技产业来说,仍是一笔巨大的财富。Deepseek 带来的对算力成本的大幅节省,与如今中国大规模投入的算力基础设施建设并不冲突。01 颠覆DeepSeek 的颠覆性创新,在于极致的效率革命。它仅用不到 OpenAI 十分之一的成本,就达到了后者最新大模型的性能。1 月 20 日,DeepSeek 正式发布 DeepSeek-R1 模型系列,大模型排行榜 Chatbot Arena 上,DeepSeek- R1 的基准测试排名已升至全类别第三,与 ChatGPT-4o 最新版并驾齐驱,并在风格控制类模型分类中与 OpenAI-o1 并列头名。R1 模型虽未公布训练成本,但据 DeepSeekV3 技术报告,V3 模型的训练总计只需要 278.8 万 GPU 小时,相当于在 2048 块 H800 ( 英伟达特供中国市场的低配版 GPU ) 集群上训练约 2 个月,合计成本仅 557.6 万美金。有传言,R1 模型的训练成本基本相当,但参数规模达到惊人的 6710 亿,这些数据都足够令外界震惊。作为对比,GPT-4o 模型的训练成本约为 1 亿美元,需要英伟达 GPU 量级在万块以上,且是比 H800 性能更强的 H100。同样是开源模式的 Meta Llama 3 系列模型,其训练需要多达 3930 万 H100 GPU 小时,DeepSeek 的训练成本约相当于 Llama 3 的 7%。也有 AI 大佬表示过,仅 DeepSeek-V3 级别的能力就需要接近 16000 颗 GPU 的集群。也就是说,这家中国初创 AI 公司仅用不到十分之一的成本,就达到了世界一流水平。这种颠覆性的成本优势,极有可能改变过往 " 高投入、高算力 " 的研发路径,市场对算力硬件需求持续高增长的预期或产生动摇。" 四两拨千斤 " 的能力源于其自研的 MLA 和 MOE 架构,为其自身的模型训练成本下降起到了关键作用。此外,R1 模型使用数据蒸馏技术(Distillation),通过一系列算法和策略,将原始复杂的数据进行去噪、降维、提炼,从而得到更为精炼、更为有用的数据,提升训练效率。模型蒸馏可以通过训练小型模型模仿大型模型,广泛应用于提高 AI 效率与降低成本。比喻来说,DeepSeek 相当于通过更高效的学习方法获得了优异分数,而 OpenAI 还在搞题海战术。关于 " 蒸馏技术 " 网络上出现了一些争议OpenAI 的训练非常依赖人工,其数据团队甚至分为不同水平的部门,大量数据标注还要转交给肯尼亚等廉价外包劳工,高维数据还需更高素质的专业人员进行标注,这些都是成本。近期 OpenAI 和一些舆论也在公开指责 DeepSeek 团队通过 " 模型蒸馏 " 技术 " 违规复制 " 其产品功能,但始终未提供具体证据。而且 " 数据越多性能越强 " 属于惯性固有思维,因为数据量越多,其中的干扰也将随之变大,在此之前,市场上已经有 " 人工智能变蠢了 " 的讨论出现。也就是说,如何对数据进行清洗和精炼,同样是提升模型能力的关键。通过创新训练方法,DeepSeek 改变了堆砌算力的共识。正如创始人梁文锋所说:" 我们想去验证一些猜想。"02 改写半导体领域普遍遵循摩尔定律,AGI 行业则是沿着 Scaling Law(模型规模定律)向前演进。Scaling Law 被业界认为是大模型训练的 " 第一性原理 ",模型性能与规模(参数量、数据大小、算力资源)呈正相关——参数越多、计算资源越大,模型的性能就越强。好比一个中学生,给他提供更丰富的学习资料、更长的学习时间和更好的学习环境,他的学习成绩普遍会更好。此次 AI 浪潮正是以 Scaling law 为底层逻辑的技术革命,但 DeepSeek 的出现打破了这一定律,或者至少让 Scaling law 的边际效益出现放缓的迹象。这带给业界的启示是,人工智能产业将不再一味追求大规模算力的投入,而是在模型架构和工程优化结合上进行突破。粗放式的疯狂投入发展阶段逐步退潮,AI 创新进入追求效率,追求模型架构设计、工程优化全新阶段。正如达摩院首席科学家赵德丽所认为的,大模型可以看成是知识的压缩,怎么利用知识产生更好的智能,就是基于基础模型的思维推理必然发展的方向。如微软 rStar-Math 无需蒸馏,用 60 块 A100 训练的 7B 模型在数学推理上可媲美 OpenAI-o1;上海 AI 实验室的书生 · 浦语 3.0,仅使用 4T 数据进行训练,综合性能超过了同量级的开源模型,而且训练成本降低了 75% 以上。DeepSeek 带来的 " 范式转移 ",不仅破除了科技大厂建立的技术领先壁垒,同时还打破了重资本比拼的游戏惯例。而且它不仅开源,而且还免费。作为回应,OpenAI 紧急上线新一代推理模型 o3 系列的 mini 版本,并且首次免费向用户开放其基础功能。奥特曼承认," 我个人认为,在(开闭源)这个问题上我们站在了历史的错误一方,需要找出一个不同的开源策略。"效率优化策略,无疑给互联网大厂们的超级愿景泼了一盆冷水。字节跳动 2024 年在 AI 赛道的资本开支就高达 800 亿元,接近 BAT 的总和;微软、谷歌、亚马逊、Meta、苹果五巨头合计资本开支 2253 亿美元,2025 年有望继续增长 19.6%。其中,单是微软就计划在 2025 财年砸下 800 亿美元,用于建设人工智能数据中心。就在 DeepSeek-R1 模型发布两天后,美国政府就联合 OpenAI、软银、甲骨文等启动 " 星际之门 " 项目,计划在未来四年内最高投资 5000 亿美元。孙正义还宣布要给 OpenAI 投资 250 亿美元,巨头们期望通过 " 军备竞赛 ",维持自身在 AI 领域的全球领导地位。此前,美国大厂为 GPT-5、Llama4 等下一代模型正使尽全力补充算力,奥特曼甚至一度去找到中东巨富,计划筹集 7 万亿美金建设一座超级数据中心和芯片制造厂。DeepSeek 的出现,改变了这种超大规模扩张算力的行业发展 " 固定路径 ",但同时也出现了一种应该彻底放弃算力建设的声音。03 过剩?国家算力战略部署的复杂性,显然会超过一般舆论讨论所得出的结论。尤其是,我国算力基础设施目前仍处于初步搭建阶段,还远未到过剩状态。一方面,随着访问量急速飙升,用户蜂拥而至,DeepSeek 深度思考和联网搜索功能也出现了宕机情况。DeepSeek 移动应用上线仅 18 天就迎来了 1600 万次下载,几乎是 ChatGPT 同期的两倍,更是成为全球 140 个市场中下载量最高的 APP。另一方面,需要注意的是,DeepSeek 目前仅支持文字问答、读图、读文档等功能,还未涉及图片、音频和视频生成领域,未来要想突破文本范畴,其对算力和前期训练成本的投入都将呈几何级飙升。对于其他追随 DeepSeek 的大模型公司来说情况也是类似,随着用户的增长和产品线的不断丰富,最终都需要不断扩张算力。目前国内各大投资机构都在 " 疯狂对接 "DeepSeek,显然是对此有非常清晰的判断。百度 CTO 王海峰就认为,规模定律(Scaling Law)仍然有效,更高质量更大规模的数据、更大的模型将会带来更强的能力。目前算力建设已成为国家级战略。2024 年《政府工作报告》中就明确提出,适度超前建设数字基础设施,加快形成全国一体化算力体系。根据《中国综合算力指数(2024 年)》报告,截至 2023 年末,我国算力基础设施规模占全球的 26%,名列第二,仅次于美国。工信部数据显示,截至 2024 年 9 月,我国算力总规模 246EFLOPS(每秒进行百亿亿次浮点运算的能力),在用算力中心机架总规模超过 830 万标准机架。此前,六部门联合印发《算力基础设施高质量发展行动计划》,其中指出到 2025 年,我国算力规模将达到 300EFLOPS,智能算力占比要达到 35%。" 东数西算 " 工程早在 2021 年 5 月就已启动,京津冀、长三角、粤港澳大湾区、成渝、贵州、内蒙古、甘肃、宁夏八大枢纽和 10 大集群雏形已现。国内已建、正在建设的智算中心超过 250 个,规划具有超万张 GPU 集群的智算中心已有十多个,国产芯片厂商也因此受到极大关注。华为昇腾 910B、寒武纪思元 590、百度昆仓芯 II-R200、海光信息深算二号,加上中芯国际,共同形成了对抗英伟达、AMD 的中国军团。这些大规模部署和研发投入,都具有历史性的战略意义,是人工智能时代的重要社会财富。04 写在最后用低成本开发出优质产品,是中国在资源匮乏的历史条件下,实现工业现代化的独特文化,而美国则擅长所谓的 " 范佛里特弹药量 ",倚仗超大规模投入获得超级领先地位。在当前的世界经济格局中,中国家电、光伏等制造业基本都是以高性价比策略取胜,DeepSeek 的成功,也是在另一个领域中体现出了中国智慧、巧思和韧性。中美 AI 拉锯的混战中,原先还处在追赶阶段的中国企业,突然以一种领先或颠覆者的身份出现,让全球科技界大为吃惊。但我们仍需要保持冷静和谦逊的心态。就像梁文锋所说的:在美国每天发生的大量创新里,这是非常普通的一个。他们之所以惊讶,是因为这是一个中国公司,以创新贡献者的身份,加入到他们的游戏里去。 也正因如此,算力基础设施仍是一种人工智能时代不可或缺的创新土壤、社会资源。koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:钱汉祥
TOP1热点:传奇投资人警告AI泡沫终将破裂
至于大众较为关心的安全问题,他虽然有一定担忧,但认为这是一个小概率事件,“在云南住了几年,真正被拐卖到缅甸的还是很少见,边境线不是那么好跨越的。”不过,他还是表示,在镇康期间会一直和朋友同行,确保不落单。。
会议强调,要深刻汲取李海涛涉嫌严重违纪违法案件教训,引为镜鉴、警钟长鸣。严守政治纪律和政治规矩,坚决做到“五个必须”、严防“七个有之”,始终做政治上的明白人。
TOP2热点:深圳一在售楼盘现假地铁站牌
9月16日深夜,封面新闻记者从广东茂名茂南区“出逃”暹罗鳄抓捕现场获悉,当夜有3条暹罗鳄被专业人员从养殖场外的水域中抓捕上岸。9月11日,茂南区一鳄鱼养殖场因洪水冲塌围墙造成部分鳄鱼“出逃”,经过连续6天的搜寻,截至16日24时,养殖场中原养殖的71条暹罗鳄已有69条被抓获,仅剩2条仍在搜寻。
TOP3热点:苹果手机用户使用免密支付遭盗刷沈阳老阿姨最后的巅峰
中央气象台预计,17日至20日,陕西南部、四川盆地、江汉、黄淮南部、江淮等地自西向东将有大到暴雨,其中陕西南部、四川东北部和南部、重庆北部、湖北西部和北部、河南南部、安徽中北部、江苏中北部等地部分地区有大暴雨,重庆北部局地有特大暴雨。上述地区累计降雨量40~80毫米,部分地区100~180毫米,重庆北部、河南东南部、安徽西部等局地250~300毫米。
TOP4热点:openai推出gpt-4.5刺激鲁
今年8月,辛敏超被开除党籍。通报显示,他贯彻执行国家、省委决策部署不力并造成不良影响,卖官鬻爵,搞迷信活动,在职务晋升、岗位调整、工程项目承揽、工程款结算和企业经营等方面为他人谋利。
TOP5热点:俄称「土耳其溪」基础设施遭乌军攻击美国
我也去核实了这个故事,查了英国的公开档案,他自称是其祖父的那个人确实存在,不过去世时间是1952年。我想如果只根据回忆确认家里人去世的时间,中间有一两年的差错也难免。一切看起来都很合理。而且他似乎真的对这些藏品一无所知,卖得都非常便宜。这也让我觉得(他)应该不是一个小偷,否则,他会了解这些藏品的价值,并试图以更高的价格出售。
TOP6热点:美国批准对以色列军售movavi
据杨应保介绍,目前马拉松赛事的报名工作正在有序进行中,现场的布置和各个部门的协调工作已经准备妥当。同时,当地政府也会安排足够的警力来确保赛事的安全。
他还表示,由于镇康属于边境城市,将会有一部分缅甸运动员来参加比赛,“他们通过正规渠道和口岸前来,并且通过相关的合法手续和资格审核,没有犯罪记录才能参赛。”
TOP7热点:快船vs湖人三十如狼四十如虎那五十呢
据中国台湾网9月19日报道 “单日新高!”“规模空前!”在台防务部门释出解放军单日“破百”架次军机巡台的消息后,台媒纷纷以这样的字眼形容解放军此次动作的“不寻常”。
TOP8热点:建议故意伤害刑责年龄降至12岁Давай中国
10,复兴门东北角的“筑梦未来”花坛顶高8.5米,以中国航天员、空间站为主景,寓意航天强国建设蓬勃发展,助力中国梦早日实现,全面推进中华民族伟大复兴,谱写新时代中国特色社会主义更加绚丽的华章。
TOP9热点:皇马vs马竞5060网
演习中方总导演李振彪介绍,此次联演紧贴灾害医学救援实际,突出两军联合,设置联合指挥、联合救援、联合伤病员医疗后送、联合传染病防控等多个科目,双方动用兵力700余人,动用包括运-20运输机、运-9医疗救护飞机、米-17直升机、消杀无人机、负压救护车、卫生防疫车、帐篷医院等各类装备设备1000多台套,采用空中、地面接力方式立体后送伤病员,有效提升中柬两军联合灾害医学救援能力。
TOP10热点:深圳一在售楼盘现假地铁站牌女朋友喊疼男生的心理活动知乎
“个人所得税法修订未出现在《规划》中,也意味着短期内相关税制和税率可能不会调整。”中央财经大学财政税务学院副教授孙鲲鹏向记者指出。长期来看,通过建立现代税收制度、增强个税调节收入分配作用仍是个人所得税改革的重要方向,在条件成熟时相关修法工作或将稳步推进。
2023年9月16日12时33分,辽宁省沈阳市沈北新区秋月湖街68号一库房发生火灾,库房起火后部分结构发生坍塌。截至目前暂未接到人员伤亡报告,消防和应急部门正在现场进行紧急处置。