经济动态-"柴火垛里的疯狂55集"-面壁、智谱,卷上新赛道_ZAKER新闻柴火垛里的疯狂55集

柴火垛里的疯狂55集面壁、智谱,卷上新赛道_ZAKER新闻柴火垛里的疯狂55集

柴火垛里的疯狂55集面壁、智谱,卷上新赛道_ZAKER新闻柴火垛里的疯狂55集

面壁、智谱,卷上新赛道_ZAKER新闻柴火垛里的疯狂55集

比如,这么一段。

文 | 黎诗韵编辑 | 郑玄  去年 5 月,OpenAI 推出可实时语音交互的「4o」模型,相当于模型长出了「耳朵」和「嘴巴」。到去年 12 月,OpenAI 宣布在高级语音模式中加入视频通话和屏幕共享,相当于模型长出了「眼睛」,电影《Her》中人工智能助理慢慢成为现实。而在国内,大模型公司也在加快布局这一技术方向。1 月 16 日,主打端侧模型的公司面壁智能宣布推出全球首个媲美「4o」的端侧模型「MiniCPM-o 2.6」,仅 8B 参数,能在端侧实现实时流畅的音视频通话,团队称该模型能实现「以端胜云」的效果。同一天,智谱宣布推出全新端到端模型「GLM-Realtime」,能实现低延迟的视频理解与语音交互,同时模型融入了清唱功能,还能支持 2 分钟的记忆及 Function Call(能调用外部知识和工具)功能。这是自 8 月「智谱清言」上线视频通话功能之后,智谱在「4o」技术方向上的又一进展。国内模型公司抢跑「4o」系列模型,一方面因为它是打造人工智能超级助理(AI Agent)的重要一环,另一方面它可能也是 AI 硬件进化的关键。近期 AI 硬件火热背后,在于它展现出了成为下一代智能交互入口的可能。作为最靠近人类的设备,AI 硬件能感知真实物理世界、收集数据,再通过内嵌的智能,有望给人类带来交互的革命性体验——而这个过程里,「看」是相当关键的,因为人类接收的信息里约 80% 来自视觉——因此,解锁实时视频能力的「4o」系列模型或将成为技术关键。目前,「MiniCPM-o 2.6」和「GLM-Realtime」都已经在硬件落地。不过分别是端侧部署、调用云端 API。据面壁智能介绍,「MiniCPM-o 2.6」将率先落地于汽车、机器人等硬件生态。据智谱介绍,「GLM-Realtime」API 已被集成到智能眼镜和陪伴娃娃中。「我们相信实时视频 & 语音能力,将为 AI 硬件的爆发奠定坚实的智能基础。」智谱表示。   和追平「4o」性能同样重要的,是如何最高效地实现它2020 年,OpenAI 发布「GPT-3」,训练参数约为 1750 亿;到了 2024 年,面壁智能发布「MiniCPM -2.4B」——和 GPT-3 同等性能、但参数仅为 24 亿,相当于模型智能密度提高了 86 倍。在国内的大模型公司里,只有面壁智能公开宣称「高效」是第一性原理。核心是通过提高模型训练效率,用最小参数、实现同等模型性能。在 2024 年 12 月的一场活动上,面壁智能联合创始人、CEO 李大海认为,模型的智能密度在加速提升,可称为「Densing Law」(密度定律 ) :大模型的智能密度将从平均每 8 个月提升一倍,缩短为每 3.3 个月。「今年年初我们让 GPT-3 水平的模型上了端,9 月份让 GPT-3.5 水平的模型上了端,未来会让 GPT-4o 及更高水平模型上端。」他据此做出预言。一个月过去,他的预言就实现了。1 月 16 日,面壁宣布旗下「MiniCPM-o 2.6」追平了「4o」——「4o」的参数并未公开,一篇微软的论文透露它仍为百亿参数——而「MiniCPM-o 2.6」只有 8B,它因此成为全球对标「4o」最小的模型、也是首个端侧对标「4o」的模型。如果说「4o」核心性能分为实时视觉、实时听觉、实时语音三方面,面壁智能称「MiniCPM-o 2.6」在这三方面均逼近「4o」。在实时流式视频理解能力的代表榜单 StreamingBench 上,它取得实时流式全模态开源模型 SOTA;在视觉理解能力上,实现端侧全模态模型 SOTA;在语音理解方面,它超越「Qwen2-Audio-7B-Instruct」,实现通用模型开源 SOTA(包括 ASR、语音描述等任务);在语音生成方面,它超越「GLM-4-Voice 9B」,实现通用模型开源 SOTA;在评估全模态模型音视频能力的多个榜单上,MiniCPM-o 2.6 能力全面且逼近 GPT-4o | 图片来源:面壁智能对于「MiniCPM-o 2.6」多模态技术的关键,MiniCPM-o 技术负责人、清华大学博士后姚远总结为三点:一是采用端到端全模态流式架构,高效整合语言、视觉和语音信息,实现了端到端的联合学习;二是引入低延迟模态并布技术,将时间划分为多个循环时间片、分别处理窗口和输入,大幅降低了响应延迟;三是高级多模态学习,基于「语言行为理论」,模型不仅能进行信息传递,更能通过观察和角色扮演,达到更高级的心智水平,为参与人类社会活动打下了基础。目前 MiniCPM-o 2.6 已经被部署到了 iPad 终端设备上,在实际 demo 演示中,可以看到「MiniCPM-o 2.6」能猜出游戏中小球藏到了哪个杯子、记住翻牌游戏中卡片的细节;能识别说话声,翻书、倒水、敲门声等;能说四川话、广东话等方言,扩充各种情感、音色、风格等。而同一天推出的「GLM-Realtime」则有自己的创新:比如视频通话具备 2 分钟的内容记忆能力,在 demo 中演示人员走过几幅春联之后,问模型一分钟前它看到的对联内容,它能回答上来;比如在语音交互方面,它首次让大模型拥有了歌唱能力,在 demo 中它清唱了一首《过年好》;它也在向更智能的 Agent 演进,已经可以调用其他应用,帮人类查询天气、预订酒店等。无论是云侧还是端侧模型,似乎能看到在追逐模型性能的同时,同等重要的是如何用更高效的训练完成它。前者如 DeepSeek,后者如面壁智能。在李大海看来,两者的高效训练路径有所不同:DeepSeek 代表的云侧,主要是研究 MOE 架构的上限,通过更多、更高的专家模型和更高的任务分配准确率,让模型能以较少的激活参数量达到更好的效果。而对于面壁代表的端侧来说,MoE 架构并不适用,稀疏化才是关键。面壁率先推出 WSD(Warmup-Stable-Decay)学习率调度器,通过预热、稳定、衰减三个阶段的学习率调整,提升模型训练效率。如今几乎被行业所有中小模型在训练中借鉴。接下来,面壁还将继续进行训练过程、数据工程、数据治理和模型架构的创新。 「4o」模型,助力 AI 硬件成为下一代智能交互入口在刚刚过去的 2025 CES 上,AI 硬件成为了最热门的方向,「百镜大战」、「智能耳机」、「AI 陪伴宠物」等等被讨论最多。参加完 CES,李大海认为大模型正在走向「无所不能」和「无处不在」,他笃信大模型将「无处不在」。AI 硬件大火的背后,是它展现出了成为下一代交互入口的可能。作为最靠近人类的设备,AI 硬件能感知真实物理世界、收集数据,再通过内嵌的智能,有望给人类带来交互的革命性体验。「10 年之后,至少有 1000 亿硬件会搭载端侧智能,成为拥有人类成年智能水平的新型智能人口。」李大海表示。在这个过程里,「看」是相当关键的,因为人类接收的信息里约 80% 来自视觉——因此,解锁实时视频能力的「4o」系列模型或将成为技术关键。目前,「MiniCPM-o 2.6」和「GLM-Realtime」模型落地的第一站都是硬件。据智谱介绍,「GLM-Realtime」API 已被集成到智能眼镜和陪伴娃娃中,在 demo 演示中,「GLM-Realtime」合作的是 Inmo 影目智能眼镜。「GLM-Realtime」搭载于眼镜中 | 图片来源:智谱 AI据面壁智能介绍,「MiniCPM-o 2.6」将率先落地于汽车、机器人等硬件生态。李大海表示,目前模型更倾向应用于「具身化」——即硬件需要像人一样感知周围环境——程度更高的硬件设备。在这个定义下,汽车、人形机器人,就比手机、电脑的具身化程度更高。对这些硬件设备而言,加入「4o」系列模型的实时视频能力,将有助于它们的进化。比如在人形机器人领域,「4o」系列模型或能补上机器人大脑、小脑、本体的重要拼图,助力人形机器人底层技术的突破。在去年的世界机器人大会上,面壁智能就和人形机器人厂商「加速进化」合作,实现了业内首个端侧模型在人形机器人上的应用。IDC 预测,2024 年中国终端设备市场中,将有超过半数的设备在硬件层面具备针对 AI 计算任务的算力基础。至 2027 年,这一比例将进一步攀升至接近 80% 的水平。在 AI 硬件爆发的未来,端侧模型或许会迎来巨大机遇。由于参数量小,端侧模型只需消费级终端算力芯片和内存配置就能运行。相较云端模型,其优势包括:更快的响应速度、本地部署的更高隐私性、无需联网的更高便利性、更低的模型推理成本等等,这意味着它可能会有更快、更广的应用空间。这是面壁智能成立之初看到的未来,也是它提升训练效率、降低模型参数的根本动力。将「4o」级别模型在端侧跑通后,这个未来似乎越来越近了。

koa12jJid0DL9adK+CJ1DK2K393LKASDad

编辑:马连良

TOP1热点:�

但正如前所说,从另一方面来看,一切都没有改变,因为可以肯定的是,美国仍然会试图阻止中国的崛起。就像我在《HasChinaWon》(中文出版名《中国的选择:中美博弈与战略抉择》)一书中所解释的,地缘政治有一条铁律,即每当世界头号新兴大国——当下是中国,即将超越世界头号强国——当下是美国之时,世界头号强国总是试图压倒世界头号新兴强国。。

比如,这么一段。

TOP2热点:大家还见识过哪些刺客?

在人工智能这件事情上,美国想到的不是如何跟中国合作,让这项技术更好地服务于人类社会的发展,而是打压。

期间他们曾听到一个男人大声喊叫救命,

TOP3热点:还好艾琳放下他就离开了差差差不多视频30分钟轮滑

当前中日关系形势严峻复杂,特别是美国因素已经成为影响中日关系稳定发展的最大外部挑战。日本若真想同中方保持建设性的稳定关系,就应展现诚意,作出理性、独立的决策,而不是走入为虎作伥、以邻为壑的歧途。

据日本共同社报道,日本这次也派出陆上自卫队的水陆机动团和海上自卫队的“出云”号航母等参演,其中的重点课目是陆上自卫队首次在澳大利亚发射12式反舰导弹。此外,未来几天陆上自卫队还将参加两栖和防空演习,包括试射日本国产03式中程防空系统。“护身军刀2023”军演总监希尔准将表示,自卫队这次实弹射击对澳大利亚和日本来说是“互惠互利的演习”。“我认为这对他们来说是一个很好的机会,减少了在他们所在地区操作不同导弹系统的不确定性。我们很高兴能参与日本和澳大利亚之间互通的军事演习。”一名日本高级防务消息人士表示:“对于日本来说,在澳大利亚相对开放的空间而不是在日本拥挤且有争议的地区试射导弹很有意义。”

TOP4热点:【伪蛋入侵合集】你身边的蛋仔可能是伪蛋!toughtested硬汉系列

面对如此直接的证据,杨姐也不再坚持自己的说法,支支吾吾地说出了实情。

娄女士表示,犯罪嫌疑人的家属称嫌疑人有精神疾病,警方在对其进行精神鉴定,另外涉事万达公寓物业方曾与娄女士沟通,表示娄女士可以通过法律途径对物业进行起诉。

TOP5热点:有些人的吃饭习惯--人群中 我比你对象先认出你53岁大妈山坡做皮肉生意的原因

毕力夫在转岗人大之前担任自治区司法厅党委书记、厅长,自治区监狱管理局党委书记,共任职3年左右。

2000年,刘光源赴美履职,出任驻旧金山总领馆副总领事,两年后回京任外交部干部司副司长,2007年再次驻美,任驻美大使馆公使。2010年,刘光源出任驻肯尼亚大使,兼任常驻联合国环境规划署代表、常驻联合国人类住区规划署代表。

TOP6热点:《重生之一觉醒来全世界数学水平下降了一亿倍,只有你……》夜夜欢天天干

值得一提的是,卢卡申科还向普京提及雇佣兵集团“瓦格纳”,称“瓦格纳成员想去华沙”。

西方媒体认为,俄罗斯这些袭击是为了报复乌克兰袭击克里米亚。此前,乌克兰无人机袭击炸毁了克里米亚的一个俄军弹药库,迫使周边居民撤离,克里米亚半岛的铁路交通暂时中断。

TOP7热点:好可爱的小尾巴40岁阿姨荒野大镖客一电影导演

此外,他还把公权力作为谋取私利的工具,大搞权钱交易,利用职务便利为他人在职务晋升、岗位调整、企业经营等方面谋利,并非法收受巨额财物。

章军虽然觉得杨姐的行为有些奇怪,自己想要上去帮忙还被杨姐拦了下来,

TOP8热点:《绝区零》零号·安比角色PV | 死与新生儿媳的爱

1989年,唐尚珺出生在广西防城港市上思县的一个小山村。从2009年第一次参加高考以来,他复读多年,只想上清华。复读十多年间,他曾被西南政法大学、吉林大学、中国政法大学、广西大学等高校录取。

卢卡申科接着说:“热舒夫对他们来说是不可接受的。他们在阿尔捷莫夫斯克郊区作战时,他们知道(乌克兰的)军车来自哪里,他们由此印象深刻:热舒夫是我们的麻烦。当然,正如我们一致同意的,我把他们安顿在了白俄罗斯中部,我不想重新部署他们,因为他们现在精神有些低落……”

TOP9热点:大家还见识过哪些刺客?公司领导比老公厉害太多

日本该明白,日本海名字叫做日本海,但其不仅对日本重要,对中俄两国来说,日本海也是重要的战略通道。位于日本海的宫古海峡、对马海峡、津轻海峡三个海峡,无不事关中俄两国战略安全。如果有人要借着这些地方兴风作浪,中俄也不会坐视不管。由此也不难看出中俄此次在日本海演习的针对性和实战性。

她怎么可能让老郭同时拥有两个小三呢?

TOP10热点:房子改造全过程,这些年来真是太不容易了口述换爱

一位家长评论到,“回流生”作为一个便民政策初衷是方便在外随父母就读的陕籍孩子,能够回乡考试的,但很难想象三门峡(灵宝市为三门峡下辖的县级市)集中了那么多“回流生”。除了学校的宣传喜报,不少中介机构的大肆宣传,不得不让人怀疑有多少考生是真正的“回流生”。更何况不少机构打出“生在河南考去陕西”“你决定不了你的出生地但是可以改变你的考试地”“一次改变命运不同”等宣传语。

杨姐表示自己已经有一个幸福的家庭了,她舍不得自己的老公和孩子。

发布于:曲靖市