中国新疆XXXXXL19AI时代,服务器厂商能否打中国新疆XXXXXL19破薄利的命运?_ZAKER新闻
AI时代,服务器厂商能否打中国新疆XXXXXL19破薄利的命运?_ZAKER新闻
从2021年的67个、1.57万亿元到2022年的160个、2.04万亿元,再到2023年的248个、3.25万亿元……瞄准建设中的难点堵点,重大项目建设持续跑出“加速度”。今年上半年,重大项目已完成年度投资计划的54.6%,顺利实现“时间过半、任务过半”。
文 | 光锥智能,作者|刘俊宏,编辑|王一粟AI 大模型正在引发新一轮的 " 算力焦渴 "。近日,OpenAI 刚发布的 o1 大模型再次刷新了大模型能力的上限。对比上一次迭代的版本,o1 的推理能力全方位 " 吊打 " 了 GPT-4o。更优秀的能力,来自与 o1 将思维链引入进了推理过程。在 o1 对问题 " 一边拆解一边回答 " 的过程中," 环环相扣 " 的思维链让答案也变得更加 " 靠谱 "。思考模式的升级,也意味着更大的算力需求。由于模型原理是在 LLM 训练额外添加了 RL(强化学习)的 Post-Training(后训练),这意味着一次推理和训练所需的算力将再次增加。"AI 研究中遇到的最大困难就是缺少算力—— AI 本质就是暴力计算。" 华为副董事长、轮值董事长徐直军此前总结道。于是,近几年科技大厂对 AI 基础设不断加大投入,除了英伟达股价不断升高,卖 "AI 铲子 " 的 AI 服务器厂商们也在本季度迎来了翻倍的业绩增长。并且,随着 AI 算力下一步的需求增长和基础设施下放,服务器厂商们有望凭借 AI 赚得越来越多。厂商们业绩的 " 高歌猛进 ",是服务器与 AI 深度结合的结果。其中在 AI 训练环节,服务器大厂们纷纷采用不同方式加速整个 AI 训练过程,让异构计算的 AI 服务器,成为一台高效的 AI 训练任务 " 分发机 "。另一边,在解决算力硬件紧缺的问题中,AI 服务器厂商也结合大型服务器集群的运营经验,落地了各种让英伟达、AMD、华为昇腾、Intel 等厂商 GPU 混训大模型的平台。伴随着对 AI 从训练到硬件优化的深入理解,越来越了解 AI 的服务器厂商也在从原本卖硬件组装的身份,提升着在 AI 产业链的价值。其中,聚焦到智算中心建设层面,不少服务器厂商已经根据 AI 需求调整了 AI 服务器集群的硬件基础设施。并且,随着对国产算力芯片的深度结合,基于 AI 服务器厂商自己定制的解决方案正在广泛落地。另一边在软件层面,更懂 AI 的服务器厂商也在开始挖掘 AI 在基础设施中的生产力属性。伴随着服务器厂商推出的 AI 大模型、Agent,服务器厂商与 AI 应用客户业务的结合也愈发紧密,从而进一步获得更多软件层面的解决方案收入。毫无疑问,AI 时代的变革也改变了整个算力载体的行业逻辑。AI 服务器厂商们正在以各种方式为用户带来更密集、更高效的算力供应。在当下的 " 算力焦渴 " 时代,AI 服务器厂商正在成为愈发重要的 " 卖水人 "。AI 行业," 卖铲子 " 的先赚钱了AI 大厂们的加速投入,让 " 卖铲子 " 的 AI 服务器厂商开始赚钱了。根据 IT 桔子数据显示,截止到 9 月 1 日,AI 相关上市公司整体还是亏损居多。其中,15 家盈利的 AI 上市公司累计净利润为 27.8 亿元,亏损的 19 家累计净额为 62.4 亿元。AI 尚不能让行业实现整体盈利,一个原因是 AI 巨头们仍处于加速投入阶段。据统计,今年上半年,国内三家 AI 巨头(BAT)在 AI 基础设施上的资本支出总额高达 500 亿元人民币,比去年同期的 230 亿元人民币,增长了一倍多。全球范围,随着亚马逊在上季度增长了 18% 的固定资本开支,再次进入了资本扩张周期。微软、亚马逊、谷歌、Meta 等美股 "Mag7" 们,也达成了继续加码 AI 的共识。" 对 AI 投资不足的风险,远超投资过度风险。"谷歌母公司 Alphabet 首席执行官 Sundar Pichai 显然非常激进,并不认为目前是投资泡沫。而借着加大投入的风口,提供 AI 基础设施的 AI 服务器玩家们 " 大赚特赚 "。其中,全球老牌服务器厂商惠普和戴尔在 AI 时代迎来了 " 第二春 "。根据惠普最新披露的业绩(2024 三季度)显示,其服务器业务同比增长 35.1%。戴尔上季度财报显示(对应 2024 年 5 月— 2024 年 7 月),其服务器和网络业务营收同比增长 80%。同样在国内厂商中,联想在最新一季财报中提到,受 AI 需求增长,其基础设施方案业务集团季度收入首次突破 30 亿美元,同比增长 65%。浪潮的中报数据显示,公司实现归属于上市公司股东的净利润为 5.97 亿元,较去年同期增长 90.56%。神州数码这边,其归属于上市公司股东的净利润为 5.1 亿元,同比增长 17.5%,旗下神州鲲泰 AI 服务器实现收入 5.6 亿元,同比增长 273.3%。业绩超过 50% 以上的增长,是 AI 服务器大规模落地的结果。除了云厂商,运营商是 AI 服务器的主要需求方。自 2023 年开始,运营商们加大了对 AI 算力的布局。其中,电信和移动对 AI 服务器的需求增长了一倍以上。同时,基于智算中心的需求也在快速推动 AI 服务器落地。根据 Intel 旗下 AI 芯片公司 Habana 中国区负责人于明扬在 2024 全球 AI 芯片峰会上的分享,近三年来大约有 50 多个政府主导的智算中心陆续建成,目前还有 60 多个智算中心项目正在规划和建设。旺盛的 AI 服务器需求,改写了整个服务器行业的增长结构。根据 TrendForce 集邦咨询近期发布的一份报告显示,在今年大型 CSPs(云端服务供应商)对 AI 服务器的采购下,以产值估算,预计 2024 年 AI 服务器产值将达 1870 亿美元,成长率达 69%。作为对比,一般服务器的预计年出货量增长仅为 1.9%。未来,随着 CSP 逐步完成智算中心的建设,AI 服务器还将会随着更广泛的边缘计算需求,进一步加速增长。AI 服务器的销售环节,也将随着 CSP 大批量集中采购切换至企业边缘计算的小批量购买。换句话说,AI 服务器厂商的议价权和盈利能力,将随着采购模式的变化进一步提升。服务器厂商接下来还会靠 AI 赚的越来越多。如此趋势,跟 AI 服务器客户漫长的回本周期拉开了巨大差距。以算力租赁的商业模式作为参考,行业内早就合计出了一笔账。算上智算中心配套的设备(存储、网络),在不考虑算力价格每年下降的前提下,采用英伟达 H100 作为算力卡的投资回报周期长达 5 年,采用性价比最高的英伟达 4090 显卡,回报周期也在两年以上。如此一来,如何帮客户用好 AI 服务器,成了整个服务器行业最核心的竞争方向。加速、稳定,AI 服务器厂商各显神通" 大模型落地过程复杂,涉及分布式并行计算、算力调度、存储分配、大规模组网等多种先进技术和流程支持。" 对于 AI 服务器落地应用中需要解决的问题,新华三集团智慧计算产品线高级产品经理冯良磊曾总结道。上述难题,对应着 AI 服务器落地的两大类问题——算力优化和大规模使用。一位销售人员对光锥智能也介绍到," 常见的客户需求,其一是硬件指标,第二是 AI 训练的支持能力,最后还有大规模集群的能力。"其中,算力优化部分主要对应着 AI 服务器的异构计算问题。目前,行业提供的解决方案主要分为优化算力分配和异构芯片协作的两个大方向。由于 AI 服务器的运作模式不再是 CPU 独立处理任务,而是 CPU 与算力硬件(GPU、NPU、TPU 等)的协作。当前行业的主流解决模型,是用 CPU 把计算任务拆解到专用算力硬件。这种算力分配模式,与英伟达 CUDA 的基本原理相同。CPU 同时 " 带动 " 的算力硬件越多,整体算力就越大。异构计算算力分配原理对应到服务器硬件层面的改变,是 AI 服务器成了可以堆叠算力硬件的 " 积木 "。AI 服务器的体积开始 " 加大加粗 ",从通用服务器的 1U(服务器高度基本单位)升级至目前常见的 4U、7U。针对算力进一步优化,不少服务器厂商提出了自己的方案。例如新华三的傲飞算力平台支持对算力和显存按 1% 和 MB 的细粒度切分,并按需调度。联想的万全异构智算平台则是以知识库的形式,自动识别 AI 场景、算法和算力集群。客户只需输入场景和数据,即可自动加载最优算法,并调度最佳集群配置。在另一边的异构芯片协作上,主要解决的是不同算力硬件服务器之间的协同问题。由于英伟达 GPU 长时间将处于供不应求的状态,不少智算中心会选择将搭载了英伟达、AMD、华为昇腾、Intel 等厂商 GPU 混用,或多种 GPU 混训一个 AI 大模型。如此一来,整个 AI 训练环节就会出现通信效率、互联互通、协同调度等一系列问题。AI 服务器搭载不同厂商 AI 芯片占比 来源:TrendForce" 服务器集群训练 AI 的过程,可以简单理解成‘一轮一轮’的进行。一个任务先被拆解到所有算力硬件,结果汇总后再更新至下一轮计算。如果过程配合不好,比如有的 GPU 算的慢,或者通信不畅,相当于其他算力硬件要‘一起等’。轮数多了,整个 AI 训练时长就被极大拖延。" 对于异构算力硬件协作解决的实际问题,一位技术人员对光锥智能举了一个形象的例子来解释。目前,解决该问题的主流方案是利用云管系统(包括调度、PaaS 和 MaaS 平台)对整个 AI 训练(和神经网络)进行精细拆分。例如,新华三的方案是建设一套异构资源管理平台,通过开发统一的集合通信库实现对不同厂商 GPU 的纳管,从而屏蔽不同厂商之间的差异。百度百舸异构计算平台的多芯混合训练方案,是将各类芯片融合成一个大集群,再支持整个训练任务。大同小异的解决方案,其目标正如无问芯穹联合创始人兼 CEO 夏立雪总结," 打开水龙头前,我们不需要知道水是从哪条河里来的。"异构计算问题解决后,意味着智算集群可选择的硬件种类得以彻底解放。服务器、算力芯片、AI Infra 等厂商之间的配合,也有了协同效应,共同维护着 AI 服务器组建大规模算力集群的稳定性。参考 Meta 公司使用算力集群的经验,AI 大模型训练并非 " 一帆风顺 "。据统计,Meta 16K H100 集群的同步训练中,曾在 54 天内出现了 466 次作业异常。如何让服务器集群在出现问题后快速回到运行状态,主流的解决方案是在训练过程中加一道 " 防火墙 "。例如,联想的解决方案是 " 用魔法打败魔法 "。通过使用 AI 模型预测 AI 训练故障的方式,联想的解决方案能在断点前优化备份。超聚变和华为昇腾则采用了简单直接的对策。当检测到节点故障时,自动隔离故障节点后,从最近的 Checkpoint 点恢复训练。整体来看,AI 服务器厂商在了解 AI,实现算力优化和稳定性升级的过程中,提升自己的附加值。借助 AI 对行业的改造,AI 服务器的玩家们正在以垂直一体化的姿态,让服务器这个经典 ToB 行业焕发出新的价值。AI 让服务器厂商更有价值?复盘历史,服务器厂商们一直被 " 困在 " 微笑曲线的中间地带。第三次工业革命之后,随着服务器市场空间越来越大,一批又一批的服务器厂商诞生。在 PC 时代,Wintel 联盟的 X86 架构,催生了戴尔和惠普两家国际服务器巨头。在云计算时代,大量的数字化需求催生了浪潮、工业富联等一系列 OEM 厂商。然而,就在服务器厂商在每年几百、几千亿营收的华袍下,净利润率却常年为个位数。在浪潮开创的 JDM(联合设计制造)模式下,极致的生产制造带来的是净利率仅为 1-2 个点。" 微笑曲线形成的原因,并不是因为制造环节本身的问题。是不能掌握产业链核心技术和专利,只能标准化生产,无法具备不可替代性的结果。" 对于服务器厂商的困境,一位国泰君安电子分析师对光锥智能如此解释道。在 AI 时代,服务器厂商的价值正在随着 AI 重新定义算力应用而改变。对 AI 的垂直整合能力,成了当下服务器厂商角逐的中心。聚焦到硬件层面,不少服务器厂商已经深入到了智算中心的建设环节。例如针对 PUE(电源使用效率),新华三、浪潮、超聚变、联想等厂商纷纷推出了液冷整机柜的解决方案。其中,新华三除了推出了硅光交换机(CPO)来降低整个机房的能耗外,还对整个网络产品线都进行了 AI 优化。另一边,在突破英伟达算力芯片限制层面,神州数码、联想等厂商在积极推进国产算力芯片的落地,共同实现中国芯片产业弯道超车。在软件层面,服务器厂商还在积极挖掘 AI 的生产力属性,让业务不局限于卖硬件。最常见的,是服务器厂商推出的 AI 赋能平台。其中,神州数码在神州问学平台上就整合了模型算力管理、企业私域知识和 AI 应用工程模块。神州数码通过原生 AI 平台的方式,将 Agent 能力融入到服务器的使用环节,让用户的使用过程 " 越用越好用 "。神州数码副总裁李刚对此评价称," 我们需要有这样一个平台,用于内嵌企业被环境验证过的 Agent 知识框架,同时还可以不断地去积淀新的 Agent 框架,这个就是神州问学 AI 应用工程平台的价值所在。"新华三则是充分结合网络产品已有的优势,利用 AIGC 实现了通信领域的异常检测、趋势预测、故障诊断和智能调优。除了运维环节,新华三还发布了百业灵犀 AI 大模型,试图用通用大模型 " 带动 " 行业大模型的方式,进入到不同行业客户的业务环节,进而扩张原本 ToB 硬件的业务范围。" 通过不断的科技创新和持续的产品打磨,寻求 AI 潮流中的新突破,释放 AI 基础设施的新动能。"正如联想集团副总裁、中国基础设施业务群总经理陈振宽总结,服务器厂商正是在不断加深 AI 垂直一体化的进程中,收获了如今利润率大涨的成果。跳出制造的服务器厂商们,正在迎来属于自己的 AI 大时代。koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:钱运高
TOP1热点:特斯拉降价
(作者为巴西伯南布哥州联邦大学亚洲研究中心副研究员雷南·蒙特内格罗)。
(作者为巴西伯南布哥州联邦大学亚洲研究中心副研究员雷南·蒙特内格罗)
TOP2热点:春节假期长白山冰雪游火爆出圈
数字智能优化产业创新,助力经济数字化转型和高质量发展,提高我国数字经济治理体系和治理能力现代化水平。数字智能的运用有利于改善产业决策,促进数字经济和实体经济深度融合,完善数字经济治理体系。一方面,依托企业、实验室、新型智库三位一体的创新发展集群,数字智能推动实现产品研发、行业标准设定以及创新发展评估综合、立体化的成果产出,聚集政产学研多维度的创新要素。另一方面,以问题、需求导向,项目、产品驱动为抓手,协同融汇政、产、研、学、用、创多方主体,搭建科技成果转化、模式创新与集团发展战略适配桥梁,打通从人才聚集、技术聚集到产业化、标准化的完整链路,在各要素不断整合、流通中,面向社会需求,实现自主可控的原始创新供给。
TOP3热点:新加坡大满贯赛:王曼昱战蒯曼tobu7tobu8学生18
苏州恒诺世佳健康咨询管理有限公司发布广告,宣称“虾青素调理好抑郁症、高血压、腰间盘突出、荨麻疹、肾病”等疾病预防和治疗功能。2023年7月,江苏省太仓市市场监管局依法对当事人作出罚款31万元的行政处罚。
TOP4热点:48岁李峰博士春节遭遇意外离世中国人も日本人も漢字を
从2021年的67个、1.57万亿元到2022年的160个、2.04万亿元,再到2023年的248个、3.25万亿元……瞄准建设中的难点堵点,重大项目建设持续跑出“加速度”。今年上半年,重大项目已完成年度投资计划的54.6%,顺利实现“时间过半、任务过半”。
TOP5热点:村民收“红包” 3年分红超60万元打扑克摇床
《暂行规定》在企业实操上作了具体要求,企业在编制资产负债表时,应当根据重要性原则并结合本企业的实际情况,在“存货”项目下增设“其中:数据资源”项目,反映资产负债表日确认为存货的数据资源的期末账面价值;在“无形资产”项目下增设“其中:数据资源”项目,反映资产负债表日确认为无形资产的数据资源的期末账面价值;在“开发支出”项目下增设“其中:数据资源”项目,反映资产负债表日正在进行数据资源研究开发项目满足资本化条件的支出金额。
TOP6热点:《哪吒2》土拨鼠配音是导演饺子把八重神子焯出白水怎么办
今天,我国西南地区仍有较强降雨,特别是四川盆地局部雨势强劲;华北、华南降雨有所减弱。明天至28日,四川盆地、江汉、江淮、黄淮将迎来新一轮明显降雨过程,多地有大到暴雨,部分地区大暴雨。其中,明后天,强降雨主要出现在四川东部、陕西南部一带,26日夜间开始,湖北、河南、安徽、江苏降雨陆续增强。
TOP7热点:范丞丞穿的衣服引争议缅北恐怖视频
韩先生添加对方好友看到,其在朋友圈发布了大量接单广告:“代扣驾照分!需要的咨询”“大小车!摩托车!原件不超证!不高清的大量接单”“违章报价以当天报价为准,过期下单的作废”。其中一张配图为:一沓机动车行驶证和交通违章处理凭证摞在一起。
TOP8热点:男子补牙时种植钻头掉进嘴巴里一个好妈妈1 中字
也许是那个时候
TOP9热点:大盘主力资金净流出78.75亿元非洲14may18_XXXXXL56endian
龙南城区边上的鸦背和光围被打造成夜市;关西围景区内的田心围和圳下围被改造成民宿,满足游客就近住宿需求;位于龙南高铁站对面的栗园围是龙南最大的村围,保留有完整的村庄格局,将被打造成客家主题商业集市……
TOP10热点:“0息购车”成车企热门关键词Z0OZO0人善之交另类
发现更多的自然和生物资源,探索北极地区人地共存关系的机制,是北冰洋科考亟待拓宽的领域。北冰洋自成一个生态系统,但又与太平洋、大西洋、印度洋和南冰洋形成交流。在北冰洋的海冰生物群落中,包括浮游植物海冰硅藻类、浮游动物剑水蚤类、海冰细菌等,它们共同孕育了磷虾等丰富的甲壳类生物资源,后者又为极地海洋鱼类提供了大量的食物,进而为海洋哺乳动物海象、海豹、海狮和鲸鱼等提供了食物来源,甚至维持了数量庞大的迁徙鸟类。北冰洋的石油、天然气、矿产资源、森林资源(亚北极地区)以及丰富的渔业资源也有待深入探索。不过,北极探索并不局限于北冰洋,同时也包括极地探索。我国于2004年7月28日建立了首个北极科考站中国北极黄河站,开创了一个永久性的观测研究平台。当极地和北冰洋的探索结合起来,才会有全面的北极科考和探索,也才会获得更多的研究成果。