孙尚香在房间里教刘禅作业李飞飞团队“50美元孙尚香在房间里教刘禅作业”复现DeepSeek R1真相:基座为阿里云Qwen模型_ZAKER新闻
李飞飞团队“50美元孙尚香在房间里教刘禅作业”复现DeepSeek R1真相:基座为阿里云Qwen模型_ZAKER新闻
“千万工程”实施之初,浙江按照每年2000个村、50万户左右的进度推进农村改厕;2018年起,浙江对全省5万座农村公厕进行改造提升;2020年,浙江启动农村公厕服务大提升行动——浙江的农村公厕逐步迈向便利化、智慧化、人性化、特色化、规范化……目前,浙江建有6.7万座农村公厕,平均每个行政村3座,全省农村无害化卫生厕所实现全覆盖。
《科创板日报》2 月 6 日讯 (记者 毛明江 黄心怡) 今日一则关于人工智能领域的新闻引发广泛关注。据报道,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到 50 美元的云计算费用,成功训练出了一个名为 s1 的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与 OpenAI 的 O1 和 DeepSeek 的 R1 等尖端推理模型不相上下。这一消息无疑在 AI 界投下了一颗重磅炸弹,真相究竟如何?《科创板日报》记者调查和采访业内人士后发现,s1 模型的训练并非从零开始,而是基于阿里云通义千问(Qwen)模型进行监督微调。这意味着,s1 模型的神奇 " 低成本 ",是建立在已具备强大能力的开源基础模型之上。▍通义模型的 " 基座 " 作用根据李飞飞等人的研究论文,s1 模型的训练仅使用了 1000 个样本数据。按照业内共识,这一数据量在 AI 训练中可谓微乎其微,通常不足以训练出一个具备推理能力的模型。青年 AI 科学家、上海交通大学人工智能学院谢伟迪副教授告诉《科创板日报》记者,如果仔细研究斯坦福 s1 的论文会发现,s1 模型的神奇是以通义千问模型为基座进行微调,这 1000 个样本训练的作用更像是 " 锦上添花 ",而非 " 从零开始"。国内某知名大模型公司 CEO 也向《科创板日报》记者表示:" 从论文原文来看,所谓用 50 美元训练出新的具有推理能力的模型,实际上只是用从谷歌模型中提炼出来的 1000 个样本,然后对通义千问模型进行监督微调。这种微调的成本确实很低,但明显是站在既有领先模型的‘肩上’才能做到。"### 斯坦福 s1 论文原文也注明模型是以阿里通义千问模型为基础微调谢伟迪指出,国内外还有其他团队也声称用极低的成本,训练出了具有推理能力的新模型。但一阅读其论文原文,就会发现它们无一例外都是基于通义模型作为基座进行的。### 国外多位人工智能研究者也指出,不少的 " 新 " 模型都是建立通义模型基础上"以通义千问模型作为基座,确实可以用很少的样本数据就达到产生新的推理模型的效果,但如果换成其他基座模型,新模型能力却没有任何的提升。所以,能力真正神奇的是 Qwen 模型,而不是 s1。 " 谢伟迪说。▍低成本训练大模型有局限,但也是方向尽管 s1 模型的低成本训练在某种程度上展示了 AI 训练的潜力,但其局限性也不容忽视。首先,这种低成本训练依赖于已有的强大基座模型,如阿里通义千问模型。如果没有这样的基座模型,低成本训练的效果将大打折扣。其次,1000 个样本数据的训练量在大多数情况下是不够的,尤其是在需要处理复杂任务的场景中。此外,低成本训练的成功也引发了对 AI 模型知识产权和伦理问题的讨论。如果越来越多的研究依赖于已有的基座模型进行微调,那么这些基座模型的开发者是否应该获得相应的回报?如何确保 AI 技术的公平使用和共享?这些问题都需要业界进一步探讨和解决。尽管 s1 模型的低成本训练引发了争议,但其背后的研究思路无疑为 AI 领域提供了新的思考方向。武汉人工智能学院一位资深研究人员向《科创板日报》记者表示,如何在保证模型性能的前提下,降低训练成本,是 AI 研究的一个重要课题。未来,随着技术的进步和算法的优化,或许我们真的能够看到更多低成本、高性能的 AI 模型问世。koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:王子久
TOP1热点:外交部回应特朗普对华继续加征50%关税言论:中国人不怕事,将奉陪到底
2022年,裴寨村党支部经过调研,计划在全村实施屋顶光伏项目,在村民房屋楼顶加装太阳能光伏发电板,每年向村民支付租金,年底对收益进行分红。。
TOP2热点:马斯克被曝直接呼吁特朗普撤销“对等关税”,美商界科技界也在组团游说
“农村改厕,这个事情是我一直关心的。我也是从农村出来的人啊,也知道农村上个厕所是真的不方便。”农村改厕,这件关系群众健康和生活文明的民生“小事”,一直是习近平总书记心中的“大事”。
TOP3热点:11岁男孩把100克金条吞入腹中,医生手术取出精产国品一二三产品区别视频
新疆塔城,夏日的萨尔布拉克草原天亮得早。晨光中,魏德友和老伴儿刘景好走向小院里的旗杆,准备升国旗。刘景好拽紧绳索,魏德友奋力挥动右臂,一面鲜艳的五星红旗便迎风展开。伴随着国歌声,五星红旗缓缓上升。女儿魏萍跟在身后,和父母一起行注目礼。
“中国石油天然气集团有限公司原党组副书记、副总经理徐文荣涉嫌严重违纪违法,目前正接受中央纪委国家监委纪律审查和监察调查。”
TOP4热点:二十届中央第五轮巡视对象公布亚洲一线产区二线产区分布图片
许正宇表示,美国的加息周期以及地缘政治风险影响,虽让香港经济受到牵连,但香港资本市场运行顺畅,香港金融市场仍然稳定,股票、债券及其他项目的活动也依然稳定。
我问林丹:“您都七十多岁了,还这样不辞辛劳地工作,不觉得累吗?”
TOP5热点:大外交|美对华所谓“对等关税”将生效,中国应对凸显经济韧性国精产品一二三线999
西藏自治区双拥工作领导小组办公室主任格桑罗布
TOP6热点:出租房暗藏非法代孕活动?杭州市卫健委通报:查封涉事场所13277大但人文艺术日本
许正宇表示,美国的加息周期以及地缘政治风险影响,虽让香港经济受到牵连,但香港资本市场运行顺畅,香港金融市场仍然稳定,股票、债券及其他项目的活动也依然稳定。
TOP7热点:圆桌|中美欧专家:美“对等关税”冲击多边体系,全球化遭遇转折14may18_XXXXXL56endian个
发挥高水平科研平台的优势,在高水平科研实践中培养高层次科研人才,让青年人才走到科学最前沿去,是世界通行的优秀人才培养模式。
TOP8热点:上汽大众率先提出“整车终身质保”,把价格竞争变为终身陪伴河南妇女毛深深的沟WCD
完美公司还坚持做生态环境保护的宣导者,通过开展环保公益活动、支持环保宣教事业等方式,传播环保理念,树立和强化员工及社会公众的环保意识,助力生态环境保护。2010年,完美公司捐资出版了中国第一本中、英双语环保漫画书――《低碳漫画总动员》,并且自购两万本赠予青少年学生,希望让新生代群体更早地学习领悟到绿色环保的意义,进而参与到保护环境、共建美丽中国的行动中来。
随着澳大利亚队以91:64战胜韩国队,2023年女篮亚洲杯赛的四强全部产生。半决赛中,中国女篮将对阵澳大利亚队,日本队将迎战新西兰队。
TOP9热点:图说|“住手”示威席卷全美,特朗普表示不会暂停关税政策g718.sx.张津瑜
布隆迪环境与农畜业部领土规划、灌溉和遗产保护总干事迪奥梅德・恩达伊鲁基耶说,中国农业专家帮助布隆迪取得许多成功,特别是在引进杂交水稻方面。“得益于中国技术,我们从每公顷生产3吨到4吨大米变成每公顷10吨甚至11吨大米。”
“今年八十八岁,健康得很!好像比六年前你来采访的时候还要硬朗……”小沈说。
TOP10热点:商务部:如美方升级关税措施落地,中方将坚决采取反制措施99精产国品一二三产
笔者在看樊锦诗的自述时,就感觉像和她在聊天一样,没有造作,也没有拔高,就是一个活生生的普通人。在《她已将生命融入了敦煌》一文中,笔者写道:“对于个人的回忆录或自述,如果能做到‘别人看了不摇头,自己看了不脸红’,就算成功了。因为工作的关系,我与樊锦诗先生有多年的接触和交往,读她的自述作品,深觉该书所写非常真实,书中描述的传主与我了解的樊锦诗是一致的。”她认为我写的“别人看了不摇头,自己看了不脸红”,是对她最真实的解读。有次我和她聊天后感慨:这哪里是和大名鼎鼎的樊锦诗聊天,完全就是和一位邻家老太太在拉家常。
推荐阅读
香港“三级女王”李华月,3年连拍11部三级片,如今她过得怎样
大尺度电影推荐,部部都是经典,值得你熬夜观看!
福耀玻璃董事长曹德旺:不管美国加多少税,反正不赚钱我是不卖!
第一批2纳米光刻机,美国拿6台,ASML称:中国只配用低端技术
中方刚拒买波音,不到24小时,特朗普发起报复:对华关税加到245%
男子失联后同事和开锁师傅上门发现人已离世

刘晓宇伤情更新!北控遭晴天霹雳,北汽6主力负伤,山西捡大便宜
山西重罚?李春江递纸条指挥,杜润旺或追加处罚,杜锋怒骂闫军
正式确认!杜兰特宣布降薪5000万加盟火箭,最新交易方案曝光
被逆转,王皓黑脸提前离场,张本智和绕场庆祝,谁注意黄友政反应
中国不给台阶下,特朗普紧急签总统令,要求白宫骨干守住国家安全
美国白宫紧急解释:对中国加征245%关税不属实,特朗普总统不想再惹事
9岁女童从25楼坠落,奇迹生还!
