14may18_XXXXXL56endian49_全球焦点_马斯克用20万卡集14may18_XXXXXL56endian49群,做出了比DeepSeek还强的模型?_ZAKER新闻

14may18_XXXXXL56endian49马斯克用20万卡集14may18_XXXXXL56endian49群,做出了比DeepSeek还强的模型?_ZAKER新闻

14may18_XXXXXL56endian49马斯克用20万卡集14may18_XXXXXL56endian49群,做出了比DeepSeek还强的模型?_ZAKER新闻

马斯克用20万卡集14may18_XXXXXL56endian49群,做出了比DeepSeek还强的模型?_ZAKER新闻

目前来看,怡合达与米思米之间的差距依然存在。《每日经济新闻》记者获悉,米思米2022年财报显示,2022财年(2022.4.1~2023.3.31),集团实现净销售额为3731.51亿日元(折合人民币约189.69亿元,下同),同比增长1.9%,实现净利润342.82亿日元(约17.43亿元),同比下降8.7%。截至2022年3月,米思米在全球有33.48万家客户,其中日本国内12.98万家,海外20.5万家。

今年才刚刚过去两个月, AI 模型竞技场的火热程度,堪比年底冲业绩。就在今天中午,马斯克预告的那个号称 " 地球上最聪明的人工智能 " Grok 3 ,终于来了。发布会还是马斯克惯有的风格,说好的十二点准时开始,结果还是晾了大家快二十分钟。一个小时的直播,马斯克携 xAI 天团( 四个人里就有两位华人 ),从各个方面介绍了 Grok 3 究竟有多厉害。一看纸面数据,又是吊打诸如谷歌、 OpenAI 和 DeepSeek 等一众明星公司的招牌模型。反正直播刚一结束, X 上就不淡定了,有人已经提前体验上了 Grok 3 , Andrej Karpathy 说它的推理能力跟 o1-pro 差不多,而且还要略优于 DeepSeek R1 和 Gemini 的推理模型。还有老哥用 AI 生成了一个奥特曼看到 Grok 3 发布后的视频。。。国内外关于 Grok 3 的报道也是满天飞, " 首个突破 1400 分(模型在 Imarena.ai 竞技场的得分 )的模型 " " 首个十万卡集群训练出来的模型 " 。。。各种 title 看着就唬人。而世超在第一时间,也观看了这场发布会,不能说炸裂,但至少从直播内容来看, Grok 3 确实又一次延续了AI 领域大力出奇迹的神话。目前, Grok 3 只对部分 X 的 Premium+ 会员开放,所以咱就简单从发布会的内容给大伙儿介绍,这个 Grok 3 究竟是啥水平。一上来,就拿 Grok 和 GPT 的模型迭代速度进行了对比。图上明明标着 Others ,但 GPT 是卷卷有爷名,针对性很强。而在模型性能方面, Grok 3 这次也是铁了心要跟其他模型争个高低。需要注意,根据官方的介绍,这次的 Grok 3 事实上是一个模型家族,大致可以分为非推理模型和推理模型两种。咱先来看非推理模型,也就是 Grok 3 和 Grok 3 mini 。还是熟悉的 Benchmark 基准测试, xAI 拉来了 Gemini 2.0 pro 、 DeepSeek V3 、 Claude 3.5 Sonnet 还有 GPT-4o 四个模型,跟自家孩子进行对比。在 AIME ’ 24 数学竞赛、 GPQA ( 研究生水平科学知识问答能力的基准测试 )和代码三项测试中, Grok 3 的成绩肉眼可见高出了其他模型一大截。Grok 3 mini 的水平虽然跟其他模型大差不差,但直播中也提到了, mini 版本可以通过牺牲一定程度的准确性,来换取更快速度的回答。另外,在 Chatbot Arena 的盲测中, Grok 3 代号叫 " 巧克力 " 的早期版本也登上了榜一,分数更是史无前例破了 1400 分。具体来看,巧克力在整体风格控制、编码、数学还有创意写作等多个方面,全都拿了第一。主要巧克力还只是早期版本的 Grok 3 ,今天的最新版 Grok 3 性能或许还会更强。。。再来看 Grok 3 的推理模型。推理模型大家应该不陌生,毕竟 OpenAI 的 o1 系列、 o3 mini 还有 DeepSeek R1 ,都已经杀红眼了,思维链也不是什么新鲜玩意儿。现在各家上新的模型里,如果不是推理模型,可能都不好意思拿出来。所以这次, Grok 3 Reasoning Beta 和 Grok 3 mini Reasoning 也代表 xAI 出战了。同样还是纸面实力,表面一看还是吊打的姿态。但有个需要注意的地方,这个测试中,加了 Test-Time Compute 。简单理解就是给了模型更多的时间去思考,同一个横坐标上颜色浅一点的部分,就是加时赛的成绩。可以看到,如果不算上加时赛, Grok 3 两个推理模型跟其他模型的差距,并没有那么大。一旦加了时长,这差距马上就体现出来了。换句话说, Grok 3 的推理模型思考的时间越久,表现越好。在现场,马斯克他们还展示了 Grok 3 推理模型,在 2025 年 AIME 数学竞赛上的测试结果。说实在的,如果不算上 Test-Time Compute ,好像还是 o3-mini ( high )的推理能力更强。。。为了证明自己不是说说而已,马斯克他们在现场直接进行了效果演示。让 Grok 3 生成 3D 动画代码,可以看到模型一步步的思考过程。但他们也提到,这个思考过程是被模糊处理过的,理由跟奥特曼的差不多,都说是为了防止模型被抄袭。另外,现场还让 Grok 3 生成一个,结合了俄罗斯方块和宝石迷阵两种游戏规则的新游戏。这很难不让人联想到,马斯克昨天实锤了 xAI 要成立一家 AI 游戏工作室的事情,如果 Grok 3 的游戏制作能力,真的跟现场演示的一样甚至更强,这对于整个游戏圈的影响都将是巨大的。而且根据马斯克的说法, Grok 3 在未来的两到三年内,还可能参与到特斯拉的生产还有火箭发射的过程当中。最后,就是基于 Grok 3 构建的 Agent , Deepsearch 。这玩意儿其实就是个智能搜索引擎,有点像 Perplexity 的 Deep Research 和 OpenAI 的 Deep Research 。当你问 Grok 3 下一次星舰发射是啥时候,左边会显示一个总体的进度条,右边则是展示浏览了哪些网页、对哪些信源进行了验证。。。最后得出了下一次发射的时间,是 2 月 24 日。当然了,这次 Grok 3 之所以看上去如此强大,抛不开马斯克老早就在念叨的,只花了 122 天就搭建起来的 10 万卡集群。在此之后,他们又花了 92 天扩展到了 20 万卡集群,一招大力出奇迹,在不到一年的时间里,供出了 Grok 3 。这段时间大家都在争论的技术路线问题,但 Grok 3 的出现似乎再一次证明了,算力的绝对力量。就是,把 20 万卡供出来的 Grok 3 和 DeepSeek 的模型放在一起比较,多少有点刻意了。。。除此之外,马斯克在前几天的迪拜峰会上也提到, Grok 3 经过了合成数据的训练,能够通过检查、验证信息来反思自己的错误。总而言之,这次的 Grok 3 的确算是拿出了点真家伙。不过世超也注意到,在 Grok3 抢先体验的用户分享当中,有不少跟宣传不符的实际测试案例。就比如这位老哥用同一组 prompt 测试了 Grok 3 、 o3 mini 还有 Claude 3.5 Sonnet ,结果 Grok 3 翻得有点彻底。。。在另外一组测试中, o3 mini 的表现也要优于 Grok 3 和 DeepSeek R1 。还有放大镜选手,直接指出了发布会演示的案例里,有明显错误。虽然世超这次没能实际上手测试,但从外部的一些实测案例来看, Grok 3 似乎也没有营销的这么神。而且这次 Grok 3 上线后,很多人的注意力都放在了模型是否开源上。根据马斯克的说法, xAI 一般是新模型发布后再开源旧模型,也就是说,就算开源也是老版的 Grok 2 。看样子,来自开源阵营的压力还是不够大,马斯克想狙的还是老对手奥特曼。就是不知道,已经在 X 上预告了的 GPT 4.5 ,能不能打一场翻身仗了,大家就等着看吧。

koa12jJid0DL9adK+CJ1DK2K393LKASDad

编辑:汤念祖

TOP1热点:医生详解泻立停为何被禁售

千亿大案宣判,昔日“放牛娃”被判无期!他的公司被查封房产1056套,其中广州住宅108套、商铺858套。

“2020年,如果你不会玩德州扑克,简直都没法在创投圈混了。”谢忠至回忆,“从2015年左右,这些企业界和创投圈的大佬们,饭后娱乐不再是唱K、斗地主这些小儿科把戏。取而代之的是,德州扑克不知怎么就日渐风靡到几乎整个中国商业界了。”在创投圈,德州扑克也是不少年轻投资人混圈子的利器。

TOP2热点:叠词词在甲骨文里就有了

对于疫后复苏的进程,刘国强介绍,国际上疫情过后消费和经济恢复都需要时间,一般认为,恢复正常需要一年左右的时间,我国疫情平稳转段刚半年左右,经济循环和居民收入、消费等已出现积极好转。全球政治经济形势错综复杂,我国内在发展潜力较强,市场预期也总体平稳,有效应对了外部环境变化。

黄伟纶称,在国家的大力支持下,香港创科生态环境越见蓬勃。在刚刚公布的《2023年全球初创生态系统报告》中,香港在新兴初创生态系统排名中列全球第二、亚洲第一。“我们的初创企业从2015年到2022年间增加了超过一倍,由1500家增加到目前的约4000家。同一时期,更见证了十多家独角兽企业在香港诞生。”黄伟纶称。

TOP3热点:张若昀魏晨 已婚男人的自觉麻花传MD0174苏蜜清歌在线

金华银华进一步补充道,为确保资本充足情况始终符合监管要求,将采取如下措施:一是加强资本管理与监测;二是适时补充资本工具,如发行二级资本债券等,据悉,2023年二季度该行已补充二级资本工具3亿元;三是对资产结构优化,引导投向风险权重较低的资产等。

“2020年,如果你不会玩德州扑克,简直都没法在创投圈混了。”谢忠至回忆,“从2015年左右,这些企业界和创投圈的大佬们,饭后娱乐不再是唱K、斗地主这些小儿科把戏。取而代之的是,德州扑克不知怎么就日渐风靡到几乎整个中国商业界了。”在创投圈,德州扑克也是不少年轻投资人混圈子的利器。

TOP4热点:巴拿马外长称运河主权不容谈判高压监狱1高压法版免费

这场派对中的另一主角是珠江纯生,“敢创非凡”是它的全新理念,这一标签与珠江啤酒颇为契合。

一方面,将简化审批流程。建立保租房绿色审批通道,精简审批事项与环节,提高审批效率,项目审批手续原则上均在区行政主管部门办理。

TOP5热点:马龙最想对阵刘国梁14MAY18_XXXXXL放屁

责任编辑:凌辰

我还能举出更多例子,但重要的是,我们应该关注基金公司的回报能力,而不是它们的营销宣传。投资是与消费不同的,客户交付资金后,基金公司才开始提供产品的价值。相比之下,消费则在交付之时就会立即享受到产品价值。基金公司要持续为客户创造回报,而不是仅仅陪伴和自我标榜。投资者也应该不被名气和热闹所吸引,而是专注于资金的回报。毕竟,投资不是消费,付出钱不应该被认为是理所当然的。

TOP6热点:2025亚冬会国精产品一品二品国精日本

人民币VC再现全员募资

中新经纬注意到,前述可口可乐零度、百事无糖可乐等含有阿斯巴甜的产品,并未标注阿斯巴甜的含量。而据现行《GB2760-2014食品添加剂使用标准》,饮料中的阿斯巴甜最大使用量通常为0.6g/kg,即每千克产品最多只能使用600毫克阿斯巴甜。

TOP7热点:伊能静所乘航班共丢失13件行李中国人も日本人も汉字を

我还能举出更多例子,但重要的是,我们应该关注基金公司的回报能力,而不是它们的营销宣传。投资是与消费不同的,客户交付资金后,基金公司才开始提供产品的价值。相比之下,消费则在交付之时就会立即享受到产品价值。基金公司要持续为客户创造回报,而不是仅仅陪伴和自我标榜。投资者也应该不被名气和热闹所吸引,而是专注于资金的回报。毕竟,投资不是消费,付出钱不应该被认为是理所当然的。

另一方面,将提供土地支持政策。利用非居住存量建筑改建的项目,在用作保租房期间,不变更土地使用性质,不补缴土地价款;利用自有土地建设的项目,需按规定变更土地用途,可不补缴土地价款,原划拨土地可继续保留划拨方式。

TOP8热点:怀9胞胎女子丈夫回应最后两胎不保一杆长枪直入两扇门义勇

7月14日,欧洲央行隔夜公布了6月货币政策会议纪要。纪要显示,委员们普遍认为,目前还没有足够的证据来确认核心通胀已经出现拐点,货币政策还有更多工作要做。通胀方面,会议强调,除能源外,物价上涨的势头依然强劲。核心通胀十分顽固,并且继续高于预期,表明具有更强的持久性。另外,委员们普遍同意,工资压力日益成为通胀的重要来源。2023年第一季度,实际工资平均上涨了5.2%,协议工资上涨了4.3%。两者之间较大的差距,表明劳动力市场较为紧张。委员们担心,长期的工资压力会导致国内价格压力更加持久,特别是在经济增长疲软和企业持续维持定价能力的情况下,单位劳动力成本不断上升。委员们一致认为,有必要进一步提高利率来收紧货币政策。

集运指数(欧线)期货的推出,将填补市场空白,可为集运班轮公司、货主、货代等相关企业提供远期运费预测参考和运价风险管理工具,服务集运产业发展需求,提升经营主体的抗风险能力,有助于进一步丰富期货品种体系,提升期货市场服务实体经济的能力,同时,也是服务国家“海运强国”战略、服务上海国际金融中心和国际航运中心建设的重要举措。

TOP9热点:工资8000一年攒下72000日本最大但的人文体艺术

二是以产品账户为原点,实现资负闭环管理。在产品账户层面,将资产负债管理目标融入产品设计、资产配置、委托管理、产品结算、价值评估、绩效考核等整个保险公司的经营周期的各个环节,实现资产负债闭环管理。

“天无绝人之路,之前我也想过,我离开阿里还能干什么,但最后发现其实都能生活得挺好,总有适合你的事情去做。虽然我现在的编制工作一个月只有几千块钱,跟在阿里时完全没法儿比,但性价比比之前高多了,不用加班,还能有时间去探索更多副业可能。”阿宁说。

TOP10热点:王星终于与女友见面了国精产品网曝黑料在线观看

以往每年4月底绩效评完,阿里都会进行一轮洗牌优化,但从2022年开始,优化变成了心照不宣的裁员,连阿宁所在的集团核心部门也受到波及。此前大家以为裁员只会发生在本地生活、飞猪这样的环路公司,这一次约有20%的部门员工都受到影响。

曾刚认为,LPR随着市场变动而变动,加点是之前定好不动的,但实际上也没有反映市场真实资金供求状况,所以可以适度的通过自主协商,即通过市场供求机制关系去调整。这样在降低按揭贷款人实际还款成本的同时,按揭贷款利率也顺应整个利率变化趋势进行优化调整。

发布于:息县