班主任让我C1节课怎么办下给英伟达的新年战书,“小”芯片公司们喜迎20班主任让我C1节课怎么办25年_ZAKER新闻
下给英伟达的新年战书,“小”芯片公司们喜迎20班主任让我C1节课怎么办25年_ZAKER新闻
稻城亚丁景区26日提示,省外低风险区人员入州后严格落实“3天3检”,最后1检保持在24小时内,核酸检测阴性证明未出前不外出,不聚集,不入园。
文 | 适道2025 年,有多少人想看英伟达楼塌了?醒醒,这不太现实。不过,2025 年的 AI 算力市场或将迎来转变。一方面,行业重点将从 " 训练模型 " 转向 " 模型推理 ",意味着对推理基础设施的需求呈现上升趋势。例如,无论是 OpenAI 的 o1 和 o3 模型,还是 Google 的 Gemini 2.0 Flash Thinking,均以更高强度的推理策略来提升训练后结果。另一方面,训练好的大模型需要通过 AI 推理才能落地到各类场景中,随着千行百业的深入采用,AI 工作负载格局将发生转变。例如,Open AI 创建 Sora 代表着 AI 训练,而用户让 Sora 生成一段视频则代表着一个推理工作负载。换句话说,大规模训练工作负载是 " 研发阶段 ",推理工作负载是 " 商业化阶段 ",你想在 AI 领域赚钱,就要扩大推理工作负载。巴克莱研报显示:目前,AI 推理计算需求将快速提升,预计其将占通用人工智能总计算需求的 70% 以上,推理计算的需求甚至可以超过训练计算需求,达到后者的 4.5 倍。2025 年,这些演变将为自身 " 推理 " 过硬的 " 小 " 芯片公司提供发育空间。这不,别人赶着新年送祝福,而 Groq、SambaNova、Positron AI 等专注于推理的初创公司则是向霸主英伟达纷纷亮出了虎牙。一次讲透推理芯片 & 训练芯片如果我们将 AI 训练比作 让模型 " 考驾照 ",那么推理就是让模型 " 上路 "。训练阶段,你要请 " 教练 "(优化算法)" 指导 "(反向传播和参数调整)模型;推理阶段," 驾驶员 "(模型)要基于自己学到的知识技能,灵活应对实际路况。因此,推理阶段只涉及前向传播,通常比训练阶段更高效。对应到芯片,训练芯片具备更高的计算能力,旨在支持训练过程中的大量计算和数据处理;推理芯片通常靠较少的计算能力完成工作。问题一:为什么不用传统 CPU 进行推理?答:牛也能当交通工具,但速度太慢。问题二:为什么不继续用 GPU 做推理任务?答:直升机也是通勤工具,但成本太高,而且你还得找停机坪。虽然 GPU 非常适合实现神经网络的训练工作,但它在延迟、功耗等方面表现不算最佳,留给竞争对手一些遐想空间。我们都知道,AI 推理要求模型在作答前先进行 " 思考 " —— " 思考 " 越多,答案越好。然而,模型的 " 思考 " 同时也伴随着时间的流逝,以及资金的消耗。因此," 小 " 芯片公司的主线任务则变成——优化 " 思考 " 所消耗的时间成本,或是资金成本中的任何一项,就能建立自身护城河。挑战者联盟都说了些啥?这次放话的挑战者分别是 Groq、SambaNova,以及 Positron AI。前二位的名声更大一些。先说 Groq,这家创企由前谷歌 TPU 核心团队的 "8 叛将 " 于 2016 年创办,平时喜欢在官博 " 喊麦 ",代表作为《Hey Zuck...》《Hey Sam...》《Hey Elon...》等等。当然,Groq 的实力还是不容小觑,其 AI 推理引擎 LPU 号称做到了 " 世界最快推理 ",不仅有超快的大模型速度演示,还有远低于 GPU 的 token 成本。2023 年 7 月,Groq 甩出了 LPU 的推理速度,运行 Meta 的 Llama 3 80 亿参数大模型,每秒超过 1250 个 token。2024 年 12 月,Groq 推出一款高性能计算芯片,名为 " 猛兽 "(Beast)。据称,这头 " 猛兽 " 在 AI 推理任务中的性能超越英伟达的某些主流 GPU;能够通过优化硬件设计,减少不必要的运算环节,大幅提升计算效率。也正是 2024 年 8 月,Groq 双喜临门,获得了 6.4 亿美元 D 轮融资,估值达 28 亿美元;其创始人 Jonathan Ross 请来杨立昆担任技术顾问。Groq 的 LPU(线性处理单元)不同于 GPU(图形处理单元),设计理念是解决传统架构中外部内存的瓶颈,通过将大量计算资源集中在片内共享内存中,实现数据流动的高效优化,避免外部内存的频繁调用。此外,LPU 支持多个张量流处理器的串联扩展,规避了传统 GPU 集群中因数据交换带来的性能损耗。对于 2025 年,Groq 首席布道官 Mark Heaps 喊话:"我希望客户能认识到与现有技术相比的新进展。许多人对我们说,我们喜欢你们的技术,但没人因为选择某家传统供应商而被解雇。如今,市场已经开始变化,人们意识到从传统供应商处获得芯片并不容易,而且性能也未必如 Groq 的技术那样出色。我希望更多人愿意尝试这些新技术。"不过,Groq 要解决的真正问题是客户总体成本。虽然创始人 Jonathan Ross 宣称:LPU 速度比英伟达 GPU 快 10 倍,但价格和耗电量都仅为后者的十分之一。但自称 "Groq 超级粉丝 " 的原阿里副总裁贾扬清对比了 LPU 和 H100,他的结论却是:用 Groq 的 LPU 反而使硬件成本和能耗成本大幅度上升,在运行 Llama2- 70b 模型时,305 张 Groq 才能等同于 8 张英伟达 H100。芯片专家姚金鑫也指出,Groq 架构建立在小内存(230MB)、大算力上。按照当前对大模型的推理部署,7B 模型大约需要 14G 以上的内存容量,为了部署一个 7B 的模型,大约需要 70 张左右。此前一位自称 Groq 员工的用户表示,Groq 致力于成为最快速的大规模模型硬件,并发誓三年内赶超英伟达。第二位成员是 SambaNova。SambaNova 的创立时间比 Groq 晚一年,如今却以 50 亿美元的估值身居 AI 芯片初创公司榜首。SambaNova RDU 既有 GPU 10 倍以上的片上分布 SRAM,也有适用于需要快速数据传输的大规模计算任务的 HBM。(Groq 则是摒弃了 HBM,仅依赖 SRAM 进行计算。)其架构可以自动做到极致的算子融合,达到 90% 以上的 HBM 利用率,使得 RDU 对 GPU 有了 2-4 倍的性能优势。值得一提,SambaNova 在业务模式上颇具野心。公司不单卖芯片,而是出售其定制的技术堆栈,从芯片到服务器系统,甚至包括部署大模型。联创 Rodrigo Liang 认为,大模型与生成式 AI 商业化的下一个战场是企业的私有数据,尤其是大企业。最终,企业内部不会运行一个 GPT-4 或谷歌 Gemini 那样的超大模型,而是根据不同数据子集创建 150 个独特的模型,聚合参数超过万亿。目前,SambaNova 已赢得不少大客户,包括世界排名前列的超算实验室,日本富岳、美国阿贡国家实验室、劳伦斯国家实验室,以及咨询公司埃森哲等。对于 2025 年,Liang 喊话:" 对于 SambaNova 来说,关键是推动从训练到推理的转变。行业正快速迈向实时应用,推理工作负载已成为 AI 需求的核心。我们的重心是确保技术能够帮助企业高效、可持续地扩展规模。"" 如果我有一根魔法棒,我会解决 AI 部署中的电力问题。如今,大多数市场仍在使用设计上不适合规模化推理的高耗能硬件,这种方式在经济上和环境上都不可持续。SambaNova 的架构已经证明有更好的解决方案。我们能耗仅为传统方案的十分之一,使企业能够在不突破预算或碳排放目标的情况下实现 AI 目标。我希望市场能更快地接受这种优先考虑效率和可持续性的技术。"第三位是 Positron AI。Positron 成立于 2023 年 4 月,名气相对较小。2023 年 12 月,Positron AI 推出了一款推理芯片,声称可以执行与英伟达 H100 相同的计算,但成本仅为五分之一。2024 年 10 月,Positron AI 还上榜了 The information 的《2024 全球 50 家最具潜力初创公司榜》。Positron CEO Thomas Sohmers 表示:2024 年,AI 计算开支的重心已经转向推理,预计这种趋势将沿着 " 指数增长曲线 " 继续扩大。对于 2025 年,Sohmers 喊话:" 我认为,如果我们能部署足够多的推理计算能力——从供应链角度看,我有信心能做到——那么通过提供更多专用于推理的计算资源,我们将能够推动‘链式思维’等能力的广泛采用。"据悉,Positron 的愿景是让人人负担得起 AI 推理。对此,Sohmers 的新年愿望是:" 我想做同样多的事情来鼓励使用这些新工具来帮助我的妈妈。我进入技术领域的部分原因是因为我希望看到这些工具帮助人们能够利用他们的时间做更多的事情——学习他们想要的一切,而不仅仅是他们从事的工作。我认为降低这些东西的成本将会促进这种扩散。"结语面对四面八方的挑战者,英伟达似乎无暇顾及。前几天,英伟达为推理大模型打造的 B300 系列出炉——高算力,相比 B200 在 FLOPS 上提高 50%;大显存,192GB 提升到 288GB,即提高了 50%。B300 将有效地提升大模型的推理性能:每个思维链的延迟更低;实现更长的思维链;降低推理成本;处理同一问题时,可以搜索更多样本,提高模型能力。根据半导体 " 牧本周期 " ——芯片类型有规律地在通用和定制之间不断交替——在某个特定时期内,通用结构最受欢迎,但到达一定阶段后,满足特定需求的专用结构会奋起直追。当前,英伟达所代表的通用结构时代正处于颠覆。更何况,英伟达早已全面开花。除了专为云计算、5G 电信、游戏、汽车等领域客户构建定制芯片。2025 年上半年,英伟达还将发布其最新一代人形机器人芯片 Jetson Thor。所以,最后还是那句话:不要想着干掉英伟达,而是去做英伟达之外的事。koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:马宏宇
TOP1热点:30 岁了还那么单纯是为什么?
9月27日,北京市疾控中心发布提醒:国庆假期,倡导市民朋友就地过节,减少出京。进返京人员需要持48小时内核酸阴性证明和“北京健康宝”绿码,严格遵守各项防疫规定。。
9月27日0—24时,全省新增本土无症状感染者转确诊病例1例(为省外协查途经人员点对点闭环管理),新增本土无症状感染者5例(平顶山市汝州市3例,开封市龙亭区1例,焦作市武陟县1例)。
TOP2热点:有哪些针对残疾人的经典设计?
根据国务院联防联控机制有关规定,经专家组综合评估研判,佳木斯市应对新型冠状病毒肺炎疫情工作领导小组指挥部决定,自2022年9月28日19时起,将原中风险区富锦市幸福社区时代鑫城小区升为高风险区。新增富锦市太东林场、富锦市二龙山镇太东村为中风险区,其他区域风险等级不变。
9月27日0—24时,全省新增本土无症状感染者转确诊病例1例(为省外协查途经人员点对点闭环管理),新增本土无症状感染者5例(平顶山市汝州市3例,开封市龙亭区1例,焦作市武陟县1例)。
TOP3热点:考研想要找目标院校的学长学姐请教,学长学姐喜欢什么样的沟通方式不会觉得被打扰?做AJ的视频大全电视剧
自2022年9月20日0时至9月27日24时,宁夏全区累计报告确诊病例15例,无症状感染者989例。6例无症状感染者符合解除隔离医学观察标准,于9月28日解除隔离医学观察措施出院,转为居家7天健康监测。
此外,内蒙古额济纳旗26日通告,今年各景区景点均不发售纸质门票,实行线上实名制售票,每日限量预定发售。游客须提前48小时预约景区景点电子门票等。
TOP4热点:地铁为什么不设计成同站台换乘?202.GGY.钙站
华山官网26日公告称,对外省游客或有旅居史人员必须查验3日内陕西省内医疗机构出具的2次及以上的核酸检测阴性证明,方可入园。华山官网强调,必须在陕西省内待满3天,且核酸检测正常,并于游玩日当日持24小时内核酸采样或核酸阴性证明进入景区。
TOP5热点:德国多党派就数千亿欧元支出计划达成一致,这意味着什么?上面一边亲下面一面膜直接看
9月27日0—24时,全省新增本土无症状感染者转确诊病例1例(为省外协查途经人员点对点闭环管理),新增本土无症状感染者5例(平顶山市汝州市3例,开封市龙亭区1例,焦作市武陟县1例)。
TOP6热点:有哪些建筑看上去让你觉得很吃惊?蜜桃文化传播有限公司招聘
9月28日0—24时,31个省(自治区、直辖市)和新疆生产建设兵团报告新增确诊病例170例。其中境外输入病例64例(广东21例,上海13例,福建10例,北京5例,山东5例,江苏4例,四川2例,天津1例,内蒙古1例,辽宁1例,河南1例),含14例由无症状感染者转为确诊病例(广东7例,北京2例,山东2例,江苏1例,河南1例,四川1例);本土病例106例(贵州38例,广东18例,天津13例,黑龙江9例,云南6例,四川5例,西藏5例,山西3例,山东2例,宁夏2例,内蒙古1例,江苏1例,浙江1例,河南1例,陕西1例),含14例由无症状感染者转为确诊病例(四川4例,贵州4例,广东3例,江苏1例,山东1例,河南1例)。无新增死亡病例。无新增疑似病例。
TOP7热点:许家印前妻与清盘方继续「拉扯」,意外曝光还有两名未成年子女,是否会对恒大分红和薪酬的追讨产生影响?FARMSKINS进不去
虽然国庆假期机票比中秋假期机票价格普涨,但跟往年国庆假期相比,今年国庆假期机票并不算贵。携程数据显示,从长线游来看,今年国庆机票人均单价同比去年下降5%,游客乘坐飞机的平均航班里程较去年减少3%,出行距离进一步缩短。
9月28日10时左右,陈某某到小区物业办公室办理业务后,出小区西门沿围墙散步至南门返回小区,再次到物业办公室办理业务,10:50返回家中,至13:30隔离管控未再外出。
TOP8热点:儿歌究竟在小朋友的成长中起到了什么作用?是小朋友的成长「必需品」吗?日韩砖码砖专码2023
根据《重大节假日免收小型客车通行费实施方案》安排,在春节、清明节、劳动节、国庆节四个国家法定节假日,7座及以下小型客车享受高速免费通行政策。
此外,内蒙古额济纳旗26日通告,今年各景区景点均不发售纸质门票,实行线上实名制售票,每日限量预定发售。游客须提前48小时预约景区景点电子门票等。
TOP9热点:东欧国家里为啥只有捷克成为了发达国家?上边一面亲下边一面膜的功效
9月27日21:46,到达合肥火车站,落地检后(核酸检测阴性),其儿子自驾接站,于22:30到达新站区绿都少荃府小区儿子家中,当天未外出。
9月28日晚,新站区在集中隔离点省外来肥密接人员核酸筛查中发现,陈某某(男,53岁)核酸检测初筛结果异常,立即转运至定点医院落实隔离医学观察。经市疾控中心复核确认阳性。
TOP10热点:你觉得汽车是安全第一,还是智能第一呢?人畜禽Croproation
稻城亚丁景区26日提示,省外低风险区人员入州后严格落实“3天3检”,最后1检保持在24小时内,核酸检测阴性证明未出前不外出,不聚集,不入园。