环球新闻-"jl"-北大才女李飞飞,花了363元,做出媲美DeepSeek的AI模型jl

jl北大才女李飞飞,花了363元,做出媲美DeepSeek的AI模型jl

jl北大才女李飞飞,花了363元,做出媲美DeepSeek的AI模型jl

北大才女李飞飞,花了363元,做出媲美DeepSeek的AI模型jl

说白了她是想要逼老郭放弃芳芳的。

来源 | 奇偶工作室撰文 | 一个基哥DeepSeek R1 引爆了全球科技界,全球不少AI研究团队,都在尝试复现DeepSeek的奇迹。这不,又一个成果来了。李飞飞等斯坦福大学和华盛顿大学的研究人员,站在开源模型Qwen2.5的肩膀上,训练成本仅花了不到50美元,就成功训练出了s1的AI推理模型,性能媲美OpenAI!在数学和编程能力测试中,s1的表现与OpenAI的o1模型和DeepSeek R1模型相当!s1的代码和数据已在GitHub上开源,共其他人使用。1训练成本不到50美元s1模型论文的作者,斯坦福大学在读博士 Niklas Muennighoff在论文中表示,训练过程使用了16个英伟达 H100 GPU,耗时 26 分钟。以不到50美元的云计算费用,约合人民币约362元,就训练了一个名叫s1的人工智能推理模型。特别值得一提,这位大佬还是北京大学本科毕业的。还拿了北大的全额奖学金,北大出人才。2少即是多,开源的胜利s1也采用了DeekSeek类似的蒸馏技术。在现有的阿里巴巴Qwen2.5-32B-Instruct的基础开始,然后使用谷歌最新的Gemini 2.0 Flash Experimental进行微调。为了微调模型,他们使用了监督微调(SFT),这种方法比DeepSeek的强化学习(RL)更快,耗时更少。作者Niklas Muennighoff,他还特别感谢了Meta。Meta AI提出了一种新的大语言模型训练方法LIMA,“Less Is More for Alignment”,即“少即是多的对齐”。通过使用少量(如1000个)精心挑选的问题,从少数示例中学习并泛化到未见过的问题。s1大模型,就是用1000个高质量、多样化和困难的问题来训练。此外,研究团队还采用了一个技巧,在推理过程中添加“等待”一词,从而提高答案的准确性。延长了小模型的思考时间,就实现了对大模型的精细化模仿!结果来看,s1-32B在竞赛数学问题上,性能比o1-preview提升了高达27%(MATH和AIME24)。相比于DeepSeek R1:在MATH 500中,二者相差并不大(DS R1:97.3%);(S1-32B:93.0%)。模型、数据和代码在github上都能找到。3大神李飞飞作为s1论文作者之一的李飞飞,在1976年出生于中国北京,是家中的独女,16岁时赴美求学。原本主修物理,后来转系攻读电气工程,立志要让机器拥有视觉能力。2005年获得电子工程博士学位。33岁时就成为斯坦福计算机系终身教授,她创立了ImageNet:一个拥有1500万张图片的数据库,成为人工智能计算机视觉研究的奠基之作。这张图片可能很出名了:2016年8月,黄仁勋亲手将DGX-1至位于旧金山的OpenAI总部。上面写了:“致埃隆和OpenAI团队!献给计算与人类的未来,为你们呈上全球首台DGX-1!”而没有人记得的是。在紧接着的一周里,黄仁勋将另一台带有他签名的DGX-1,就送到了斯坦福大学李飞飞的实验室。几天之后,2016年ImageNet竞赛拉开了帷幕。4结语在2025年开始,Meta、谷歌和微软计划投资数千亿美元用于AI基础设施,其中一部分将用于训练下一代AI模型。DeepSeek R1引爆了全球科技界,它大幅简化了算力需求,撼动了英伟达万亿市值,引发了全行业的反思。DeepSeek开源,全球研究员大量参与,开源AI大模型可以更进一步。s1模型的神奇“低成本”,是建立在开源基础模型,例如阿里Qwen之上的,可谓依然是开源的胜利。闭源与开源,在AI大战中,谁胜谁负,谁是更优秀的形式,结果还未可知。

koa12jJid0DL9adK+CJ1DK2K393LKASDad

编辑:关仁

TOP1热点:OpenAI奥特曼:DeepSeek令人印象深刻

坍塌在雨天发生,附近有目击者听到“轰”的一声,还以为是打雷。。

民警还查到,娇娇是个失足女,在足浴店工作,并且多次被民警打击过。

TOP2热点:本周休2上4休1

毕力夫

她后悔杀了老郭,后半生恐怕要把牢狱坐穿了。

TOP3热点:《唐探1900》票房破22亿久久日

现在民警基本确定娇娇和表姐是同一个人了,他们找到娇娇,想要了解整个诈骗的来龙去脉。

习近平会见基辛格

TOP4热点:京沪延长公共交通运营时间欧美致敬很多经典的黑白mv

习近平会见基辛格

说白了她是想要逼老郭放弃芳芳的。

TOP5热点:记者:新鹏城阵容框架基本搭建完成movavi

什么样的选择,才值得被历史和时间铭记?

波兰方面则回应称,普京的言论是诽谤,令人愤怒。22日,波兰外交部“紧急”召见俄罗斯大使,抗议华沙所谓的俄总统普京的“挑衅性声明”。

TOP6热点:大S抢救时就通知了汪小菲国精产品999国精产品官网

而且阿兵还说自己也不需要杨姐开太多工资,

再加上王超是一个飞行员,全国各地飞,她对王超是崇拜的。

TOP7热点:汪小菲清空带货橱窗MAY18_XXXXXL56

历史是公正的,一个政治家的所作所为,无论是非功过,历史都要记上一笔。

前段时间,《纽约时报》专门刊发了一篇万字长文,把美国对华高科技领域的封锁定义为一种“战争”行为。

TOP8热点:返程高峰 20余万辆车集中返沪貂蝉的兔子好软水好多的动画视频

说完芳芳也把她和老郭的亲密照片,发给阿珠看。

长春市公安局朝阳区分局一名工作人员表示,该案件为红旗街派出所受理,对具体案情不太了解;红旗街派出所相关负责人则拒绝了采访。

TOP9热点:男子十几万转错账 对方却称没钱还男生把坤坤放女生定眼里

经19个小时全力搜救,截至24日上午10时,15名被困人员全部找到。15名被困人员中,有4人无生命危险,6人经抢救无效死亡;另外5人现场已无生命体征,也尽全力组织了施救,但仍然没有挽回他们鲜活的生命。

7月16日,美国总统气候问题特使约翰·克里开启了访华之行,他是近一个月来第三位访华的美国政府高级官员。在他之前,美国国务卿安东尼·布林肯于6月18日至19日访问中国,7月6日至9日美国财政部部长珍妮特·耶伦对中国进行了访问。美国高官接连访华,为沉寂已久的中美关系带来了新的活力,受到全世界的关注。

TOP10热点:汪小菲清空带货橱窗亚洲精华国产精华液的护肤功效

政知君注意到,第一届至第九届会议都是周小川(2002年至2018年任央行行长)出席;第十届和第十一届会议由易纲出席。

昨天下午,黑龙江省齐齐哈尔市第三十四中学,一座体育馆发生坍塌,事故造成多人被困。7月24日上午,最后一名失联人员被找到,现场搜救工作结束。

发布于:伊春美溪区