社会要闻-"407宿舍(双/3/p)懒得取名字"-“算力崩塌”,是真是假_ZAKER新407宿舍(双/3/p)懒得取名字闻

407宿舍(双/3/p)懒得取名字“算力崩塌”,是真是假_ZAKER新407宿舍(双/3/p)懒得取名字闻

407宿舍(双/3/p)懒得取名字“算力崩塌”,是真是假_ZAKER新407宿舍(双/3/p)懒得取名字闻

“算力崩塌”,是真是假_ZAKER新407宿舍(双/3/p)懒得取名字闻

“我很荣幸能够访问北京大学,并且在这里与中国教育界同仁进行了富有成效的交流,勾勒出两国教育合作的未来图景。”希普金斯特别谈到了教育领域的数字化转型。他认为,这不仅意味着两国在科技硬件方面的不断提升,更意味着合作思维方式的不断转化。“过去新中在此方面有所成就,更会在未来的战略对接中续写成绩。”

文   | 巨潮 WAVE,作者 | 谢泽锋,编辑   | 杨旭然DeepSeek 的开发成本极低,开源、服务完全免费,这让山姆 · 奥特曼和其他 AI 人工智能的从业者 " 印象深刻 ",让世界首富马斯克破防,让瑞 · 达利欧对美股深感担忧。知名投资人 " 木头姐 " 凯茜 · 伍德甚至直言:DeepSeek 加剧了人工智能的成本崩溃。" 神秘的东方力量 " 让全世界为之侧目,也引发了中美 AI 领导地位更替的思考。不过,对于算力进行重新判断,可能仍然为时尚早。当前,我国 AI 算力部署占全球算力基础设施的 26%,名列世界第二。在 " 算力即国力 " 的思潮下,东数西算等数字基础设施工程正积极进行。DeepSeek 颠覆了固有的 " 大力出奇迹 " 的大模型性能提升路径,短期内对算力需求预期会出现大幅下降。但长期来看,算力部署仍然有大规模需求扩张作的基础。正在进行的超大规模算力投资,对于中国科技产业来说,仍是一笔巨大的财富。Deepseek 带来的对算力成本的大幅节省,与如今中国大规模投入的算力基础设施建设并不冲突。01 颠覆DeepSeek 的颠覆性创新,在于极致的效率革命。它仅用不到 OpenAI 十分之一的成本,就达到了后者最新大模型的性能。1 月 20 日,DeepSeek 正式发布 DeepSeek-R1 模型系列,大模型排行榜 Chatbot Arena 上,DeepSeek- R1 的基准测试排名已升至全类别第三,与 ChatGPT-4o 最新版并驾齐驱,并在风格控制类模型分类中与 OpenAI-o1 并列头名。R1 模型虽未公布训练成本,但据 DeepSeekV3 技术报告,V3 模型的训练总计只需要 278.8 万 GPU 小时,相当于在 2048 块 H800 ( 英伟达特供中国市场的低配版 GPU ) 集群上训练约 2 个月,合计成本仅 557.6 万美金。有传言,R1 模型的训练成本基本相当,但参数规模达到惊人的 6710 亿,这些数据都足够令外界震惊。作为对比,GPT-4o 模型的训练成本约为 1 亿美元,需要英伟达 GPU 量级在万块以上,且是比 H800 性能更强的 H100。同样是开源模式的 Meta Llama 3 系列模型,其训练需要多达 3930 万 H100 GPU 小时,DeepSeek 的训练成本约相当于 Llama 3 的 7%。也有 AI 大佬表示过,仅 DeepSeek-V3 级别的能力就需要接近 16000 颗 GPU 的集群。也就是说,这家中国初创 AI 公司仅用不到十分之一的成本,就达到了世界一流水平。这种颠覆性的成本优势,极有可能改变过往 " 高投入、高算力 " 的研发路径,市场对算力硬件需求持续高增长的预期或产生动摇。" 四两拨千斤 " 的能力源于其自研的 MLA 和 MOE 架构,为其自身的模型训练成本下降起到了关键作用。此外,R1 模型使用数据蒸馏技术(Distillation),通过一系列算法和策略,将原始复杂的数据进行去噪、降维、提炼,从而得到更为精炼、更为有用的数据,提升训练效率。模型蒸馏可以通过训练小型模型模仿大型模型,广泛应用于提高 AI 效率与降低成本。比喻来说,DeepSeek 相当于通过更高效的学习方法获得了优异分数,而 OpenAI 还在搞题海战术。关于 " 蒸馏技术 " 网络上出现了一些争议OpenAI 的训练非常依赖人工,其数据团队甚至分为不同水平的部门,大量数据标注还要转交给肯尼亚等廉价外包劳工,高维数据还需更高素质的专业人员进行标注,这些都是成本。近期 OpenAI 和一些舆论也在公开指责 DeepSeek 团队通过 " 模型蒸馏 " 技术 " 违规复制 " 其产品功能,但始终未提供具体证据。而且 " 数据越多性能越强 " 属于惯性固有思维,因为数据量越多,其中的干扰也将随之变大,在此之前,市场上已经有 " 人工智能变蠢了 " 的讨论出现。也就是说,如何对数据进行清洗和精炼,同样是提升模型能力的关键。通过创新训练方法,DeepSeek 改变了堆砌算力的共识。正如创始人梁文锋所说:" 我们想去验证一些猜想。"02 改写半导体领域普遍遵循摩尔定律,AGI 行业则是沿着 Scaling Law(模型规模定律)向前演进。Scaling Law 被业界认为是大模型训练的 " 第一性原理 ",模型性能与规模(参数量、数据大小、算力资源)呈正相关——参数越多、计算资源越大,模型的性能就越强。好比一个中学生,给他提供更丰富的学习资料、更长的学习时间和更好的学习环境,他的学习成绩普遍会更好。此次 AI 浪潮正是以 Scaling law 为底层逻辑的技术革命,但 DeepSeek 的出现打破了这一定律,或者至少让 Scaling law 的边际效益出现放缓的迹象。这带给业界的启示是,人工智能产业将不再一味追求大规模算力的投入,而是在模型架构和工程优化结合上进行突破。粗放式的疯狂投入发展阶段逐步退潮,AI 创新进入追求效率,追求模型架构设计、工程优化全新阶段。正如达摩院首席科学家赵德丽所认为的,大模型可以看成是知识的压缩,怎么利用知识产生更好的智能,就是基于基础模型的思维推理必然发展的方向。如微软 rStar-Math 无需蒸馏,用 60 块 A100 训练的 7B 模型在数学推理上可媲美 OpenAI-o1;上海 AI 实验室的书生 · 浦语 3.0,仅使用 4T 数据进行训练,综合性能超过了同量级的开源模型,而且训练成本降低了 75% 以上。‌DeepSeek 带来的 " 范式转移 ",不仅破除了科技大厂建立的技术领先壁垒,同时还打破了重资本比拼的游戏惯例。而且它不仅开源,而且还免费。作为回应,OpenAI 紧急上线新一代推理模型 o3 系列的 mini 版本,并且首次免费向用户开放其基础功能。奥特曼承认," 我个人认为,在(开闭源)这个问题上我们站在了历史的错误一方,需要找出一个不同的开源策略。"效率优化策略,无疑给互联网大厂们的超级愿景泼了一盆冷水。字节跳动 2024 年在 AI 赛道的资本开支就高达 800 亿元,接近 BAT 的总和;微软、谷歌、亚马逊、Meta、苹果五巨头合计资本开支 2253 亿美元,2025 年有望继续增长 19.6%。其中,单是微软就计划在 2025 财年砸下 800 亿美元,用于建设人工智能数据中心。就在 DeepSeek-R1 模型发布两天后,美国政府就联合 OpenAI、软银、甲骨文等启动 " 星际之门 " 项目,计划在未来四年内最高投资 5000 亿美元。孙正义还宣布要给 OpenAI 投资 250 亿美元,巨头们期望通过 " 军备竞赛 ",维持自身在 AI 领域的全球领导地位。此前,美国大厂为 GPT-5、Llama4 等下一代模型正使尽全力补充算力,奥特曼甚至一度去找到中东巨富,计划筹集 7 万亿美金建设一座超级数据中心和芯片制造厂。DeepSeek 的出现,改变了这种超大规模扩张算力的行业发展 " 固定路径 ",但同时也出现了一种应该彻底放弃算力建设的声音。03 过剩?国家算力战略部署的复杂性,显然会超过一般舆论讨论所得出的结论。尤其是,我国算力基础设施目前仍处于初步搭建阶段,还远未到过剩状态。一方面,随着访问量急速飙升,用户蜂拥而至,DeepSeek 深度思考和联网搜索功能也出现了宕机情况。DeepSeek 移动应用上线仅 18 天就迎来了 1600 万次下载,几乎是 ChatGPT 同期的两倍,更是成为全球 140 个市场中下载量最高的 APP。另一方面,需要注意的是,DeepSeek 目前仅支持文字问答、读图、读文档等功能,还未涉及图片、音频和视频生成领域,未来要想突破文本范畴,其对算力和前期训练成本的投入都将呈几何级飙升。对于其他追随 DeepSeek 的大模型公司来说情况也是类似,随着用户的增长和产品线的不断丰富,最终都需要不断扩张算力。目前国内各大投资机构都在 " 疯狂对接 "DeepSeek,显然是对此有非常清晰的判断。百度 CTO 王海峰就认为,规模定律(Scaling Law)仍然有效,更高质量更大规模的数据、更大的模型将会带来更强的能力。目前算力建设已成为国家级战略。2024 年《政府工作报告》中就明确提出,适度超前建设数字基础设施,加快形成全国一体化算力体系。根据《中国综合算力指数(2024 年)》报告,截至 2023 年末,我国算力基础设施规模占全球的 26%,名列第二,仅次于美国。工信部数据显示,截至 2024 年 9 月,我国算力总规模 246EFLOPS(每秒进行百亿亿次浮点运算的能力),在用算力中心机架总规模超过 830 万标准机架。此前,六部门联合印发《算力基础设施高质量发展行动计划》,其中指出到 2025 年,我国算力规模将达到 300EFLOPS,智能算力占比要达到 35%。" 东数西算 " 工程早在 2021 年 5 月就已启动,京津冀、长三角、粤港澳大湾区、成渝、贵州、内蒙古、甘肃、宁夏八大枢纽和 10 大集群雏形已现。国内已建、正在建设的智算中心超过 250 个,规划具有超万张 GPU 集群的智算中心已有十多个,国产芯片厂商也因此受到极大关注。华为昇腾 910B、寒武纪思元 590、百度昆仓芯 II-R200、海光信息深算二号,加上中芯国际,共同形成了对抗英伟达、AMD 的中国军团。这些大规模部署和研发投入,都具有历史性的战略意义,是人工智能时代的重要社会财富。04 写在最后用低成本开发出优质产品,是中国在资源匮乏的历史条件下,实现工业现代化的独特文化,而美国则擅长所谓的 " 范佛里特弹药量 ",倚仗超大规模投入获得超级领先地位。在当前的世界经济格局中,中国家电、光伏等制造业基本都是以高性价比策略取胜,DeepSeek 的成功,也是在另一个领域中体现出了中国智慧、巧思和韧性。中美 AI 拉锯的混战中,原先还处在追赶阶段的中国企业,突然以一种领先或颠覆者的身份出现,让全球科技界大为吃惊。但我们仍需要保持冷静和谦逊的心态。就像梁文锋所说的:在美国每天发生的大量创新里,这是非常普通的一个。他们之所以惊讶,是因为这是一个中国公司,以创新贡献者的身份,加入到他们的游戏里去。 也正因如此,算力基础设施仍是一种人工智能时代不可或缺的创新土壤、社会资源。

koa12jJid0DL9adK+CJ1DK2K393LKASDad

编辑:王德茂

TOP1热点:用格莱美慢镜头拍人间烟火劳动人民万岁

回望新时代十年,中国广大青年用行动践行“请党放心,强国有我”的青春誓言。在企业生产一线,青年工人苦练本领、精益求精,让“中国制造”成为享誉世界的名片;在田间地头,越来越多的“新农人”运用科技手段扎根沃土、精耕细作、电商运营,为乡村振兴贡献青春力量;在竞技场上,青年运动员刻苦训练、奋勇拼搏,让五星红旗高高飘扬。在各种急难险重任务面前,广大青年勇挑重担、冲锋在前,无论是西气东输、西电东送、南水北调、东数西算等国家重大工程现场,还是港珠澳大桥、北京大兴国际机场、“华龙一号”核电机组等标志性项目建设工地,“青年突击队”“青年攻坚组”的旗帜高高飘扬。。

铿锵锣鼓中,小青双剑齐舞,干净利落;许仙腾挪躲避,时而将长发甩成风火轮,时而“砰”的一声以背摔地,显露真功,赢得满场喝彩。而面如桃李的白素贞,一亮相、一开腔,便吸引了全场的目光。她的扮相柔中带刚,眼神明净如星,音色高亢而又婉转,就连老戏迷都连连叫好。

TOP2热点:蛋仔派对:为什么说春节期间一定要登录蛋仔,40款免费皮肤!

5、为外籍商贸人员来华办理口岸签证并提供换发多次签证便利。对来华商务洽谈、商贸交流、安装维修、参展参会、投资创业等的外国人,来不及在境外办理来华签证的,可凭企业邀请函件和证明材料申请办理口岸签证入境。因商贸业务需要多次往返的,入境后可以换发3年内多次入境有效商贸签证。

2019年1月,《国务院办公厅关于印发国家组织药品集中采购和使用试点方案的通知》出台,选择北京、天津、上海、重庆和沈阳、大连等11个城市(4+7),从通过质量和疗效一致性评价的仿制药对应的通用名药品中遴选试点品种,国家组织药品集中采购和使用试点。

TOP3热点:磨洋工教程我就在外面赠一赠

美国威尔明顿信托公司首席经济学家卢克・蒂利指出,虽然银行和投资者不太可能因为一家评级机构的行动而突然放弃将美国国债作为避险资产,但类似举动将逐步蚕食全球金融市场对美国政府信用的信心。

5、为外籍商贸人员来华办理口岸签证并提供换发多次签证便利。对来华商务洽谈、商贸交流、安装维修、参展参会、投资创业等的外国人,来不及在境外办理来华签证的,可凭企业邀请函件和证明材料申请办理口岸签证入境。因商贸业务需要多次往返的,入境后可以换发3年内多次入境有效商贸签证。

TOP4热点:在孩子面前生孩子.......大家都好chill中国新疆XXXXXL19D

今年3月,大连发布了《关于建立民营经济健康发展服务保障机制的实施意见》,从建立权益保护机制、政策服务机制、诉求办理机制等7个方面出台19项举措,持续优化民营经济发展环境。

美国国会预算办公室预计,2023年联邦政府利息支出将达到6630亿美元,2033年进一步飙升至1.4万亿美元,未来10年净利息总额高达10.6万亿美元。2007年至2020年期间,利息支出保持在美国国内生产总值(GDP)的1.5%左右;到2029年,利息支出将达到GDP的3.2%。

TOP5热点:【明日方舟新春会】Centuries商务旅行中绿子女老板帽02经典

青年演员勇挑大梁

回望新时代十年,中国广大青年用行动践行“请党放心,强国有我”的青春誓言。在企业生产一线,青年工人苦练本领、精益求精,让“中国制造”成为享誉世界的名片;在田间地头,越来越多的“新农人”运用科技手段扎根沃土、精耕细作、电商运营,为乡村振兴贡献青春力量;在竞技场上,青年运动员刻苦训练、奋勇拼搏,让五星红旗高高飘扬。在各种急难险重任务面前,广大青年勇挑重担、冲锋在前,无论是西气东输、西电东送、南水北调、东数西算等国家重大工程现场,还是港珠澳大桥、北京大兴国际机场、“华龙一号”核电机组等标志性项目建设工地,“青年突击队”“青年攻坚组”的旗帜高高飘扬。

TOP6热点:“我自有我去留无怕,同天地斗法”洛天依原创《金鳞甲》【歌行豫剧篇单曲】女人越喊男人越往里寨电视剧

综合来看,未来产业发展是一个需要长期探索创新的过程,是一个前沿技术突破进而加速产业化的过程。在这一过程中,要加大支持力度,提升政策精准性,统筹推进技术创新和产业培育,构建起支持未来产业发展的长效机制。不同于其他传统产业,未来产业的战略重要性与成长不确定性特征,决定其支持政策需要从选择重点支持转向更加突出厚植发展土壤、从依托特定企业转向更加突出鼓励多元试错、从重视技术集成转向更加突出强化原始创新、从简单给优惠支持转向更加突出应用场景与早期市场支持。

面对这样的情况,吉林农业大学的做法是:从源头抓起,把就业指导链条前置,运用课程设计帮助学生确定清晰合理的职业规划。

TOP7热点:这婚就非结不可吗?女人越喊男人越往里寨电视剧

新华社北京8月2日电(记者周圆、王聿昊)记者8月2日从应急管理部获悉,多方会商研判认为,8月份我国南北多地洪涝灾害风险较高;有2至3个台风登陆或明显影响我国;福建、湖北、重庆、四川等局地地质灾害风险高;西南和新疆等部分地区森林火险等级较高。

今年以来,哈尔滨市科技局在践行主题教育工作过程中,以哈尔滨市打造创新引领之都为主线,着力推动科技成果就地转化,为“向高新技术成果产业化要发展”书写生动注脚。

TOP8热点:上单不让你去,你去不去?Chinese男男Gay

当日下午的比赛中,邹敬园在吊环项目完成了以自己名字命名的“邹敬园十字”,得分14.933。此外他还在自己最擅长的双杠项目获得15.866的超高分。晚间,桥本大辉同样表现夺目,他不仅鞍马、单杠两个单项预赛得分第一,全能成绩也超过了中国队张博恒。

柳雅欣赛后非常感谢前来为运动员加油助威的观众,“成都的观众真的非常热情,本来我自己赛前还有一些紧张,但是一进赛场听到观众的欢呼声,紧张感全然消失。我在水里都能听见他们的欢呼声,非常感谢成都的观众。我心里就只有一个信念,拼尽全力游好这场比赛”。

TOP9热点:沙漠土壤化后的魔力 - 植物自由生长【00后上班整活系列】最好看免费观看高清视频了

2019年1月,《国务院办公厅关于印发国家组织药品集中采购和使用试点方案的通知》出台,选择北京、天津、上海、重庆和沈阳、大连等11个城市(4+7),从通过质量和疗效一致性评价的仿制药对应的通用名药品中遴选试点品种,国家组织药品集中采购和使用试点。

“我们这的青梨皮儿薄水多,一口咬下去就像在喝果汁。”吴堡县乡村振兴局副局长宋宏文介绍,吴堡示范基地的青梨,今年已经有很多果树挂果了。预计到盛果期,每亩地收入能达到3万元,计划于2026至2036年开始,按每年总产值12%的分红标淮向村集体进行分红。

TOP10热点:数列必做十题「上篇」铜铜铜铜铜铜铜铜铜好多水

不拒众流,方为江海。

8月4日14:00至15:00,“人民好医生”客户端将邀请中国中医科学院西苑医院肿瘤科主任医师许云,就中医治疗癌因性疲乏的问题进行科普分享,欢迎您收看!

发布于:射洪县

推荐阅读

为您推荐中
暂时没有更多内容了……