国产SUV精品一区二区6马斯克用国产SUV精品一区二区620万卡集群,做出了比DeepSeek还强的模型?_ZAKER新闻
马斯克用国产SUV精品一区二区620万卡集群,做出了比DeepSeek还强的模型?_ZAKER新闻
当地时间7月10日,荷兰首相吕特在国会不信任投票中宣布退出政坛,称自己“不再担任党魁”。此前,因执政联盟内部未能就移民政策达成一致,吕特宣布他领导的联合政府集体辞职。吕特公开表示,他不会谋求第五个任期,并将在11月大选后退出荷兰政坛。在此之前,他仍担任看守内阁首相。
今年才刚刚过去两个月, AI 模型竞技场的火热程度,堪比年底冲业绩。就在今天中午,马斯克预告的那个号称 " 地球上最聪明的人工智能 " Grok 3 ,终于来了。发布会还是马斯克惯有的风格,说好的十二点准时开始,结果还是晾了大家快二十分钟。一个小时的直播,马斯克携 xAI 天团( 四个人里就有两位华人 ),从各个方面介绍了 Grok 3 究竟有多厉害。一看纸面数据,又是吊打诸如谷歌、 OpenAI 和 DeepSeek 等一众明星公司的招牌模型。反正直播刚一结束, X 上就不淡定了,有人已经提前体验上了 Grok 3 , Andrej Karpathy 说它的推理能力跟 o1-pro 差不多,而且还要略优于 DeepSeek R1 和 Gemini 的推理模型。还有老哥用 AI 生成了一个奥特曼看到 Grok 3 发布后的视频。。。国内外关于 Grok 3 的报道也是满天飞, " 首个突破 1400 分(模型在 Imarena.ai 竞技场的得分 )的模型 " " 首个十万卡集群训练出来的模型 " 。。。各种 title 看着就唬人。而世超在第一时间,也观看了这场发布会,不能说炸裂,但至少从直播内容来看, Grok 3 确实又一次延续了AI 领域大力出奇迹的神话。目前, Grok 3 只对部分 X 的 Premium+ 会员开放,所以咱就简单从发布会的内容给大伙儿介绍,这个 Grok 3 究竟是啥水平。一上来,就拿 Grok 和 GPT 的模型迭代速度进行了对比。图上明明标着 Others ,但 GPT 是卷卷有爷名,针对性很强。而在模型性能方面, Grok 3 这次也是铁了心要跟其他模型争个高低。需要注意,根据官方的介绍,这次的 Grok 3 事实上是一个模型家族,大致可以分为非推理模型和推理模型两种。咱先来看非推理模型,也就是 Grok 3 和 Grok 3 mini 。还是熟悉的 Benchmark 基准测试, xAI 拉来了 Gemini 2.0 pro 、 DeepSeek V3 、 Claude 3.5 Sonnet 还有 GPT-4o 四个模型,跟自家孩子进行对比。在 AIME ’ 24 数学竞赛、 GPQA ( 研究生水平科学知识问答能力的基准测试 )和代码三项测试中, Grok 3 的成绩肉眼可见高出了其他模型一大截。Grok 3 mini 的水平虽然跟其他模型大差不差,但直播中也提到了, mini 版本可以通过牺牲一定程度的准确性,来换取更快速度的回答。另外,在 Chatbot Arena 的盲测中, Grok 3 代号叫 " 巧克力 " 的早期版本也登上了榜一,分数更是史无前例破了 1400 分。具体来看,巧克力在整体风格控制、编码、数学还有创意写作等多个方面,全都拿了第一。主要巧克力还只是早期版本的 Grok 3 ,今天的最新版 Grok 3 性能或许还会更强。。。再来看 Grok 3 的推理模型。推理模型大家应该不陌生,毕竟 OpenAI 的 o1 系列、 o3 mini 还有 DeepSeek R1 ,都已经杀红眼了,思维链也不是什么新鲜玩意儿。现在各家上新的模型里,如果不是推理模型,可能都不好意思拿出来。所以这次, Grok 3 Reasoning Beta 和 Grok 3 mini Reasoning 也代表 xAI 出战了。同样还是纸面实力,表面一看还是吊打的姿态。但有个需要注意的地方,这个测试中,加了 Test-Time Compute 。简单理解就是给了模型更多的时间去思考,同一个横坐标上颜色浅一点的部分,就是加时赛的成绩。可以看到,如果不算上加时赛, Grok 3 两个推理模型跟其他模型的差距,并没有那么大。一旦加了时长,这差距马上就体现出来了。换句话说, Grok 3 的推理模型思考的时间越久,表现越好。在现场,马斯克他们还展示了 Grok 3 推理模型,在 2025 年 AIME 数学竞赛上的测试结果。说实在的,如果不算上 Test-Time Compute ,好像还是 o3-mini ( high )的推理能力更强。。。为了证明自己不是说说而已,马斯克他们在现场直接进行了效果演示。让 Grok 3 生成 3D 动画代码,可以看到模型一步步的思考过程。但他们也提到,这个思考过程是被模糊处理过的,理由跟奥特曼的差不多,都说是为了防止模型被抄袭。另外,现场还让 Grok 3 生成一个,结合了俄罗斯方块和宝石迷阵两种游戏规则的新游戏。这很难不让人联想到,马斯克昨天实锤了 xAI 要成立一家 AI 游戏工作室的事情,如果 Grok 3 的游戏制作能力,真的跟现场演示的一样甚至更强,这对于整个游戏圈的影响都将是巨大的。而且根据马斯克的说法, Grok 3 在未来的两到三年内,还可能参与到特斯拉的生产还有火箭发射的过程当中。最后,就是基于 Grok 3 构建的 Agent , Deepsearch 。这玩意儿其实就是个智能搜索引擎,有点像 Perplexity 的 Deep Research 和 OpenAI 的 Deep Research 。当你问 Grok 3 下一次星舰发射是啥时候,左边会显示一个总体的进度条,右边则是展示浏览了哪些网页、对哪些信源进行了验证。。。最后得出了下一次发射的时间,是 2 月 24 日。当然了,这次 Grok 3 之所以看上去如此强大,抛不开马斯克老早就在念叨的,只花了 122 天就搭建起来的 10 万卡集群。在此之后,他们又花了 92 天扩展到了 20 万卡集群,一招大力出奇迹,在不到一年的时间里,供出了 Grok 3 。这段时间大家都在争论的技术路线问题,但 Grok 3 的出现似乎再一次证明了,算力的绝对力量。就是,把 20 万卡供出来的 Grok 3 和 DeepSeek 的模型放在一起比较,多少有点刻意了。。。除此之外,马斯克在前几天的迪拜峰会上也提到, Grok 3 经过了合成数据的训练,能够通过检查、验证信息来反思自己的错误。总而言之,这次的 Grok 3 的确算是拿出了点真家伙。不过世超也注意到,在 Grok3 抢先体验的用户分享当中,有不少跟宣传不符的实际测试案例。就比如这位老哥用同一组 prompt 测试了 Grok 3 、 o3 mini 还有 Claude 3.5 Sonnet ,结果 Grok 3 翻得有点彻底。。。在另外一组测试中, o3 mini 的表现也要优于 Grok 3 和 DeepSeek R1 。还有放大镜选手,直接指出了发布会演示的案例里,有明显错误。虽然世超这次没能实际上手测试,但从外部的一些实测案例来看, Grok 3 似乎也没有营销的这么神。而且这次 Grok 3 上线后,很多人的注意力都放在了模型是否开源上。根据马斯克的说法, xAI 一般是新模型发布后再开源旧模型,也就是说,就算开源也是老版的 Grok 2 。看样子,来自开源阵营的压力还是不够大,马斯克想狙的还是老对手奥特曼。就是不知道,已经在 X 上预告了的 GPT 4.5 ,能不能打一场翻身仗了,大家就等着看吧。koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:年广嗣
TOP1热点:焦虑的家长们为孤独症孩子“抢狗”
据新华社报道,印度政府20日宣布,为保障国内市场供应,印度将禁止除蒸谷米和印度香米外的大米出口,即日生效。此举引发市场对全球食品通胀进一步加剧的担忧。。
TOP2热点:医学生疑因数据被挪用烧炭身亡
研学旅行是指以中小学生为主体对象,以集体旅行生活为载体,以提升学生素质为教学目的,依托旅游吸引物等社会资源,进行体验式教育和研究性学习的一种教育旅游活动。随着研学热潮的出现,不少乱象也备受消费者诟病。
罗湖法院一审认为,上述《和解协议》签订时,依据的主合同事实及债权金额已发生重大改变,宝能集团请求解除《和解协议》有事实和法律依据。
TOP3热点:海底捞 被资本“遗忘”美国xaxwas9977777
研学游深度游成热门
TOP4热点:男子发奇怪消息 群友秒报警救回一命校霸犯错被学霸罚带钢笔去上课
全国各地近期持续高温,来自安徽的游客魏倩却在昆明感受到了难得的凉爽,“这里的温度太舒服了,和外地的炎热形成鲜明对比”。入夏以来,云南省平均气温仅22.9℃,“天气常如二三月”的春城昆明成了避暑胜地。
TOP5热点:医大研究生轻生校方是否担责用卫生纸制作一个假J
罗湖法院一审认为,上述《和解协议》签订时,依据的主合同事实及债权金额已发生重大改变,宝能集团请求解除《和解协议》有事实和法律依据。
普京强调,俄罗斯是负责任的粮食供应国,正尽最大努力避免粮食危机。他表示,俄在全球小麦市场上的份额为20%,而乌克兰的份额不足5%,俄有能力取代乌克兰向非洲最贫困的国家供应或捐赠粮食。
TOP6热点:俄乌冲突要迎来大结局了吗XXXXXL196-MAY18
届时,研究结果名单将在观点机构主办的博鳌房地产论坛的“影响力指数•2022博鳌风尚企业表现”发布仪式中重磅揭晓,近千名最具智慧的房地产各业态领域、金融业及商业精英将齐聚于此,见证行业荣耀与风采。
普京强调,俄罗斯是负责任的粮食供应国,正尽最大努力避免粮食危机。他表示,俄在全球小麦市场上的份额为20%,而乌克兰的份额不足5%,俄有能力取代乌克兰向非洲最贫困的国家供应或捐赠粮食。
TOP7热点:52岁女子抽血浆后脑梗死 血浆站回应中国新疆xxxxxl19学生申中国
据新华社报道,印度政府20日宣布,为保障国内市场供应,印度将禁止除蒸谷米和印度香米外的大米出口,即日生效。此举引发市场对全球食品通胀进一步加剧的担忧。
签署协议的目的是解决双方之间包括涉案《设备采购合同》在内三份采购合同项下拖欠货款的偿还问题,该协议明确约定分期偿还款项的金额、时间,宝能投资、姚振华对付款义务承担连带保证责任。
TOP8热点:李威涉杀人案从证人变被告MACBOOKPRO免费观看
研学游深度游成热门
“辛苦你们赶到玉溪采访我。”马静芬身型稍显佝偻,穿着素朴,一件碎花衬衫外面套着灰色马甲,黑色的发箍把银发梳得一丝不苟。这次采访10天前就已敲定时间,马静芬事先查看了采访提纲,并做了详细准备。
TOP9热点:纳斯达克中国金龙指数跌幅扩大至6%FuCK激情
褚马两人又将触角拓展到白酒、沃柑领域,褚家产业规模已蔚为壮观。褚时健2019年3月离世,外界曾一度担心继承人之争将影响褚橙等产业的经营。这种担心不无道理。家族企业传承向来复杂玄妙,欲理还休。
TOP10热点:盐城国际足球邀请赛3月开幕中国MACBOOKPRO高清
随着新疆旅游热度上升,为保障旅游业健康发展,新疆加大了旅游市场整治力度,严查不合理低价游、未经许可经营旅行社业务、擅自更改线路、强制购物等违法违规行为。有关部门加大了对酒店市场的联合监管力度,推动各地实行指导价和最高限价措施,坚决打击哄抬房价、不履行旅游合同等违规行为,着力推进“微笑新疆”行动,擦亮“新疆是个好地方”品牌。
至于吕特自己,未来在欧盟、北约机构里担任要职的大门是敞开的,欧盟和北约机构都欢迎西欧小国领导人“下野”后来布鲁塞尔“再就业”。或许过几年,吕特会摇身一变成为欧盟或北约机构领导人。