直播-"大尺度日本深夜剧 三观炸裂"-梁大尺度日本深夜剧 三观炸裂文锋就是AI界的黄峥_ZAKER新闻

大尺度日本深夜剧 三观炸裂梁大尺度日本深夜剧 三观炸裂文锋就是AI界的黄峥_ZAKER新闻

大尺度日本深夜剧 三观炸裂梁大尺度日本深夜剧 三观炸裂文锋就是AI界的黄峥_ZAKER新闻

梁大尺度日本深夜剧 三观炸裂文锋就是AI界的黄峥_ZAKER新闻

  从受大漠花开的启迪,到在舞台上传播“马兰”精神,再到亲手种下一朵属于自己的“马兰花”,“花开”指引着师生寻找人生绽放的方向。

本文来自微信公众号:字母榜,作者:马舒叶,编辑:王靖,题图来自:AI 生成梁文锋带领着 DeepSeek,还在继续搅动大模型行业。继用 R1 模型炸场之后,1 月 28 日凌晨,除夕夜前一晚,DeepSeek 又开源了其多模态模型 Janus-Pro-7B,宣布在 GenEval 和 DPG-Bench 基准测试中击败了 DALL-E 3(来自 OpenAI)和 Stable Diffusion。随后特朗普在会议上提到 DeepSeek 的出现为美国的企业敲响了警钟," 我们需要集中精力在竞争中获胜 "。相隔一天,据外媒报道,多名美国官员称 DeepSeek 是 " 偷窃 ",正对其展开国家安全调查。OpenAI 也适时发布声明称一直知道其他公司试图蒸馏美国领先公司的模型,如今 " 采取反制措施保护我们的知识产权 ",并表示将和美国政府紧密合作保护最先进模型免受窃取。或许梁文锋自己都想不到,意外火出海的 DeepSeek,刺痛着更多人的神经。而一年前,DeepSeek V2 模型发布时,便开始被冠上 AI 界拼多多的称号。反卷大厂的梁文锋,早已在 AI 领域复制过黄峥式 " 后来居上 " 的故事,并在国内掀起打到骨折的大模型价格战。当时,在接受 36 氪采访中,梁文锋表示,"我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。"如果说梁文锋的鲶鱼效应,在于证明了用低成本也能高效率训练出 AI 大模型,无意卷到了 BAT。去年一年,黄仁勋则在制造另一种鲶鱼效应,即以每 6 个月为周期,更新更高性能的芯片,使得害怕抢不到最新 GPU 而掉队的巨头们,疯抢英伟达 GPU,微软、谷歌、Meta、马斯克,都被拽进了这场 GPU 大作战游戏里。一年后,DeepSeek 成为硅谷眼中 " 神秘的东方力量 ",被 Scale AI 创始人亚历山大 · 王(Alexandr Wang)评价道," 过去十年来,美国可能一直在人工智能竞赛中领先于中国,但 DeepSeek 的 AI 大模型发布可能会‘改变一切’。"起因是 DeepSeek 在年前发布了新的开源模型 DeepSeek R1,不仅性能追上了 OpenAI o1 完整版,用 550 万美元的训练开销做到硅谷投入上亿美元的效果。在这场热潮前,大模型的主流叙事是英伟达高端 CPU" 一芯难求 ",而如今,黄仁勋的销冠神话,迎来了梁文锋的正面冲击。梁文锋所带领的 DeepSeek,让美国华尔街开始重新审视,在这场大模型生存战里,英伟达芯片和高端算力的需求是否存在泡沫。这样的担忧,使得英伟达在 1 月 27 日一夜蒸发近 6000 亿美元市值。而这一切,在梁文锋看来,只是" 按照自己的步调来做事 ",然后核算成本定价。梁文锋并非有意成为鲶鱼,但正如硅谷著名风投家 Marc Andreessen 的评价:" 作为开源项目,这是对世界的一份深远馈赠 。" 他们节约了大量的成本,也让很多高薪的硅谷大佬,和享受这个行业巨大泡沫的公司,颜面扫地。1 月 28 日,OpenAI CEO 奥特曼终于回应了 DeepSeek,他夸赞 DeepSeek 让人印象深刻,特别在于提供模型的性价比上。随后则话锋一转,强调 OpenAI 将提供更好的模型,并暂停一些发布。此前,奥特曼在 X 上迅速发布首个智能体 Operator,还开始剧透起了即将上线的 o3-mini。网友戏称,"DeepSeek 逼出了奥特曼的新大招。"同时,根据外媒爆料,DeepSeek 的发布引发了 Meta 的紧急加班,工程师疯狂拆解代码,员工爆出其高管的薪资竟比训练整个 V3 模型的成本还高。 2025 年,不想当鲶鱼的梁文锋,结结实实搅动了一池春水。" 大部分中国公司习惯 follow,而不是创新。" 而在采访中,对于上一次 DeepSeek 引发大模型价格战的热议,梁文锋表示,DeepSeek 正以创新贡献者的身份,参与到这场此前由美国主导的科技创新游戏里。这位 80 后 AI 创业者,组织起一些 Top 高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人,他形容团队成员们," 很多人对做研究的渴望,远超对钱的在意。"梁文锋将 DeepSeek 定义为 " 硬核创新 ",做最难的事,似乎成为他所带领的 DeepSeek 的一致认知。在鲶鱼的外观之下,DeepSeek 在梁文锋眼中,内里则满是技术理想主义的叙事。此前,梁文锋曾断言," 中国必然需要有人站到技术的前沿 "。而这一次,DeepSeek 先踏上浪头,但无论是鲶鱼梁文锋,还是 " 技术理想主义者 " 梁文锋,要回答的问题还很多、很多。一这次 DeepSeek 的出圈,总少不了与 OpenAI 的对比。更有网友调侃,"DeepSeek 活成了真 OpenAI(开放模型),而 OpenAI 活成了 close AI(封闭模型)"。实际上,奥特曼和梁文锋,都是典型的学霸型创业者。前者 18 岁考上斯坦福大学计算机系,大二便辍学创业;后者毕业于浙江大学,2015 年成立幻方量化,在采访中梁文锋提到,2022 年底 ChatGPT 风靡时,他们就开始动手招聘了。2023 年 7 月,梁文锋成立了 DeepSeek。梁文锋并不讳言 OpenAI 对他的启发性,甚至,他在不少地方都和奥特曼展现出了惊人的相似。出售一手创办的初创公司 Loopt 后,奥特曼创立了风投基金 Hydrazine Capital。2015 年,30 岁的奥特曼成为知名孵化器 YC 的总裁,但在 AGI(通用人工智能)不被看好,融资艰难的 2015 年,认定深度学习前景无量的奥特曼,却和特斯拉创始人马斯克共同创立了 OpenAI。梁文锋曾是币安的早期成员,并一手创办了幻方量化,作为同样有着投资经历的创业者,梁文锋入局的 2023 年,大厂探入,许多创业型公司放弃了只专注通用型大模型的大方向,梁文锋却坚定 DeepSeek 要专注基础模型的研究和突破。同样,在早期,兜里没钱的奥特曼,会将" 一起构建 AGI"写在招聘信息里。这个当时可怕而遥远的目标,让 OpenAI 吸引到了一大批年轻的 AGI 信仰者。" 年轻、有潜力 ",成为奥特曼和梁文锋共同的选人标准。在梁文锋看来,如果追求短期目标,找现成有经验的人是对的。但如果看长远,经验就没那么重要,基础能力、创造性、热爱等更重要。也正是因此,这个没有知名技术大牛,不在播客分享创业感悟的纯本土创业团队,成了最快追上 OpenAI 的队伍。甚至,在最开始,如同成立之初以非营利为目的的 OpenAI,商业化也并未写入 DeepSeek 的 to do list。在这点上,奥特曼与梁文锋同样有着一致的想法。"OpenAI 早期投资人投钱时,想的一定不是我要拿回多少回报,而是真的想做这个事。" 在采访中,梁文锋面对大模型烧钱的相关提问表示,如果一定要找一个商业上的理由,(一个商业公司去做一种无限投入的研究性探索),可能是找不到的,因为划不来。从商业角度来讲,基础研究投入回报比很低。但 " 一件激动人心的事,或许不能单纯用钱衡量。就像家里买钢琴,一来买得起,二来是因为有一群急于在上面弹奏乐曲的人。"如今,梁文锋的 AGI 梦想已经震动了整个硅谷。不过,曾经以非营利为目的的 OpenAI,希望对抗大公司的 AI 霸权,奥特曼随后引入微软的巨额投资。在奥特曼的主导下,OpenAI 将成为一家真正的营利性企业。而后来者的梁文锋,却始终坚持模型开源,并希望更多人,哪怕一个小 APP 都可以低成本用上大模型,而不是技术只掌握在一部分人和公司手中,形成垄断。对创立初便以 AGI 普惠全人类为使命的 OpenAI 来说,奥特曼曾射出这颗子弹,如今时隔 10 年,正中自己的眉心。从这一点来看,相比起做一条鲶鱼,技术理想主义者的标签,似乎更适合梁文锋。二但不想成为鲶鱼的理想主义者梁文锋,却意外两次 " 卷到了 " 所有人。第一次,DeepSeek 成了引发中国大模型价格战的源头。在被 AI 连续轰炸的 2024 年 5 月,DeepSeek 声名鹊起。起因是它们发布的一款名为 DeepSeek V2 的开源模型,堪称价格屠夫:推理成本被降到每百万 token 仅 1 块钱,约等于 Llama3 70B 的七分之一,GPT-4 Turbo 的七十分之一。DeepSeek 凭借超绝性价比成了 "AI 界拼多多 ",BAT 们也被卷得坐不住,纷纷降价。中国大模型价格战由此一触即发。首先智谱 AI 跟进,将入门级产品降价,随后字节将旗舰模型降到和 DeepSeek 同价,接着阿里、腾讯等随即跟上。尽管,除了同为 DeepSeek 创始人的徐进毕业于竺可桢学院,是黄峥的学弟,DeepSeek 与拼多多并无更多交集。一心想着" 让 AI 变成人人可以用得起的东西 "的梁文锋,甚至诧异于大厂的跟进动作,毕竟 " 大厂的模型成本比我们高很多,所以我们没想到会有人亏钱做这件事。"而第二次,DeepSeek 引发了硅谷大地震。更低成本、不输 OpenAI 成熟模型的效率,梁文锋带领下的 DeepSeek 再次坐稳了 "AI 界拼多多 " 的宝座,并且成功出海。目前,DeepSeek 官方尚未公布训练推理模型 R1 的完整成本,但官方公布了其 API 定价,R1 每百万输入 tokens 在 1 元~4 元人民币,每百万输出 tokens 为 16 元人民币。作为对比,OpenAI o1 的运行成本约为前者的 30 倍。换言之,梁文锋以不到十分之一的成本,做出了硅谷需要上亿投入才能烧出的大模型。硅谷的震动几乎是必然的。除了被拿来全面对标的 OpenAI,首当其冲的是 Meta。以 " 大模型开源之王 " 为 title 的 Meta,内部员工匿名发布消息称,Meta 的生成式 AI 部门正因 DeepSeek 处于恐慌中,甚至爆料称尚未发布的新一代开源模型 Llama 4,在基准测试中已经落后于 DeepSeek。a16z 合伙人、AI 大模型 Mistral 董事会成员 Anjney Midha 更是发文说道,从斯坦福到麻省理工,DeepSeek R1 几乎一夜之间就成了美国顶尖大学研究人员的首选模型。与此同时,梁文锋带领的 DeepSeek 正撬起 OpenAI 的墙角。企业级 AI 代理开发商 SuperFocus 的联合创始人表示,相比起正在使用的 OpenAI 旗舰模型 GPT-4,DeepSeek 提供的支持不仅相似,甚至更好。"SuperFocus 可能会在未来几周转向 DeepSeek,因为 DeepSeek 可以免费下载、在自家服务器上存储和运行,并将增加销售产品的利润率。" 比 OpenAI 便宜 30 倍的 API 价格,让梁文锋一不小心就出了海。同时,作为纯本土团队的 DeepSeek 火了,梁文锋领军年轻中国团队,无海外背景却硬刚硅谷巨头的叙事成了流量密码。三爆火之下,梁文锋还需要回答更多的新问题。字母榜尝试让 DeepSeek 作为一名记者,对梁文锋提一个问题,这是 DeepSeek 的回答:"DeepSeek 宣称其模型训练成本仅为行业 1/10,但有开发者指出,这可能是通过大幅缩减模型参数规模或依赖幻方早期囤积的廉价算力实现的,而非真正的技术突破。您是否承认这种‘成本优势’本质是金融资源套利,而非算法创新?"令人惊讶的是,这个由 DeepSeek 问出的问题,几乎可以概括如今围绕着 DeepSeek 的大部分争议。正如 ChatGPT 横空出世让 OpenAI 成为当之无愧的 AI 头部企业,英伟达的 GPU 凭借高性能成为算力基础,让黄仁勋享尽高光,现在,DeepSeek 的 R1 模型,却只能证明梁文锋有能力做出一个和 OpenAI 最新模型相差无几的模型。在采访中,梁文锋不止一次地提到希望打破硅谷的科技垄断,希望站在 " 技术的前沿 ",但做一个和 OpenAI 最新模型相差无几的模型,还远谈不上真正的超越,R1 仍然是对 OpenAI 的模仿和跟随。DeepSeek 爆火之下,冲浪达人马斯克一直罕见地并未发表评论,却在最近点赞了一则推文。推文中提到了 DeepSeek 大量依赖模型蒸馏技术,需要借助 ChatGPT-4o 和 o1 才能完成训练。尽管模型蒸馏是一项常见的技术手段,能够将 OpenAI 中的大量数据迅速提炼重点并快速理解和应用,但这种模式只能让 DeepSeek 接近 OpenAI,而难以真正超越 OpenAI。更不必说,尽管宣扬自己是技术理想主义,梁文锋的背后是量化私募巨头幻方,是 BAT 之外唯一能够储备万张 A100 芯片的公司。据 " 财经十一人 " 报道,2023 年时国内拥有超过 1 万枚 GPU 的企业不超过 5 家,其中便包括幻方。而能够用十分之一的成本做出同等规模的大模型,也正是基于梁文锋的实验室已经投入了数亿美元做前期研究,并拥有大规模的芯片。想成为 AI 界拼多多,普通 AI 创业团队几乎难以复现梁文锋的路径。图注:X 上有关 deepseek 的 meme 图,图源:X 平台需要肯定的是,站在 OpenAI 这个巨人的肩上,梁文锋带领 DeepSeek 实现了一场颇为惊艳的突围,但什么时候能够赶在 OpenAI 前面推出未来一代模型,如 GPT-5,那时才是梁文锋技术理想的 AHA 时刻。彼时,没有 OpenAI 做坐标,梁文锋还能否继续靠低成本策略做出性能强大的大模型,才是等待 DeepSeek 的更大考验。梁文锋曾这样介绍自己,在广东一个五线城市长大,父亲是小学老师。" 九十年代,广东赚钱机会很多,当时有不少家长到我家里来,家长觉得读书没用。但现在回去看,观念都变了。因为钱不好赚了,连开出租车的机会可能都没了。一代人的时间就变了。"梁文锋充满信心,在他看来,以后的硬核创新会越来越多。" 我们只是还需要一堆事实和一个过程。"如今,外界都在期待梁文锋和 DeepSeek 会是那个过程之一。参考资料:《揭秘 DeepSeek: 一个更极致的中国技术理想主义故事》 暗涌 Waves 《疯狂的幻方:一家隐形 AI 巨头的大模型之路》 暗涌 Waves《DeepSeek 推翻两座大山》 字母榜本文来自微信公众号:字母榜,作者:马舒叶

koa12jJid0DL9adK+CJ1DK2K393LKASDad

编辑:钱汉祥

TOP1热点:低 GI 大米升糖测评

  一、9月26日(星期一)21时起,凡是居住在我区(高新区华苑片区、经开区微电子园除外)的群众,采样前要在当时居住地保持原地静止,按照属地社区(村)的组织安排,有序到指定地点进行核酸检测,不落一户、不漏一人。采样后需持有本次核酸筛查采样证明和24小时核酸阴性证明可在本区内安排必要出行,提倡核酸检测结果阴性后出行。。

  根据规划,今后研究院将深化病毒学研究领域的合作共享机制,并逐步与国内外相关企业形成广泛战略合作关系,构建成果转化平台,以此助力上海市生物医药产业发展。研究院将坚持合作开放、资源共享的原则,通过建立协同攻关、成果共享、人员学术交流等互通合作机制,整合多方优势力量共同参与和推动研究院的建设,并与其他研究机构和科研平台形成定位互补、错位发展、协同共进的良好发展态势。

TOP2热点:低 GI 大米会越吃越饿吗

  “锂电池出货量即将进入TWh时代,2023年全球出货量预计超过1TWh(TWh是电量单位,1TWh等于10亿KWh,1KWh即日常所称1度电)。2025年中国锂电池出货量会迈过这一门槛,产值超过1万亿元。”近日,中国科学院院士欧阳明高预测称。更有行业报告指出,未来新能源汽车及储能需求双核驱动下,预计到2050年全球锂电池出货量将超过14TWh,形成超十万亿级的巨量市场规模。

  一、9月26日(星期一)21时起,凡是居住在我区(高新区华苑片区、经开区微电子园除外)的群众,采样前要在当时居住地保持原地静止,按照属地社区(村)的组织安排,有序到指定地点进行核酸检测,不落一户、不漏一人。采样后需持有本次核酸筛查采样证明和24小时核酸阴性证明可在本区内安排必要出行,提倡核酸检测结果阴性后出行。

TOP3热点:山西一产科医生涉嫌介绍婴儿买卖二人世界刺激战场

  除资源丰富外,四川的品位也更高。这点无疑已被亿纬锂能、宁德时代、蜂巢能源、中创新航等正在布局四川的锂电池厂们所重视。在欧阳明高看来,四川不仅锂资源丰富,占到全国一半以上,石墨资源也在附近,加上人力成本低,这些都促使锂电池产业向四川转移。

  对于“花开”剧组的青年师生来说,最好的纪念方式就是把“花开”故事传递给更多的人。寒暑假期间,他们都会组织去往青海原子城纪念馆、青海金银滩、新疆马兰基地……傅宇杰曾跟随剧组去全国10余个省份演出、采风,每一次的经历都会为剧组注入更多的活力,让这朵马兰花更具有生命力,“当我们去亲身感受老一辈奋斗过的地方,真实环境带来的震撼会让我们更加坚定自己的理想和选择”。

TOP4热点:相声演员张金铭去世想要慢慢慢慢把你填满什么歌

  (七)请广大群众积极主动配合各采样点工作人员做好样本采集和镇街(园区)、社区(村)管理工作,不恐慌、不造谣、不信谣、不传谣,确保“应检尽检”,对自己和家人的健康负责。凡是未在规定时间内参加核酸检测的居民,“健康码”调整为“黄码”,完成核酸检测且结果呈阴性,并向居住地社区(村)报备后转为“绿码”。对未落实核酸筛查采样证明和72小时核酸阴性证明查验的场所、单位及其负责人,对拒不配合、不支持、涉嫌故意逃避核酸检测、扰乱秩序、瞒报、谎报、伪造信息的人员,将依法从严追究法律责任。

  所谓“商转公”,即商业性个人住房贷款转公积金贷款,因为商贷与公积金贷款的利率差异较大,二者之间的转换无疑可以降低购房者的还款压力。从各地新政的描述也可以看出,支持“商转公”的目标较为一致——提振居民消费信心和楼市需求。

TOP5热点:专家称提升农村养老金可促进消费人间水蜜桃mac923

  这一幕场景让覃川难以忘怀。在他看来,这正是上一辈科技工作者立志“干惊天动地事,做隐姓埋名人”的奉献精神的最好体现,“他们没有把参与国家重大工程研制作为炫耀的资本,而是用朴实的行动默默地撑起了祖国的脊梁”。

  一、9月26日(星期一)21时起,凡是居住在我区(高新区华苑片区、经开区微电子园除外)的群众,采样前要在当时居住地保持原地静止,按照属地社区(村)的组织安排,有序到指定地点进行核酸检测,不落一户、不漏一人。采样后需持有本次核酸筛查采样证明和24小时核酸阴性证明可在本区内安排必要出行,提倡核酸检测结果阴性后出行。

TOP6热点:2024年你加班多吗三上悠亚退役最后一集

  在碳酸锂等上游资源价格飙升的背景下,锂电池产业链的利润向上游集聚。天齐锂业半年报显示,公司2022年上半年实现净利润120.05亿元,同比增长超百倍。据赣锋锂业半年报,公司今年上半年实现净利润73.5亿元,同比增长402.51%。

  上海交通大学医学院院长范先群在致辞中表示,上海市病毒研究院是交大医学院在成立70周年之际,主动对接国家和上海市重大战略,服务人民健康需求的一项重要战略举措。研究院将进一步创新体制机制,汇聚一批高层次创新人才,推动病毒学研究原始创新,加快突破关键核心技术,实现高水平成果转化,为推动上海具有全球影响力的科技创新中心建设,构建人类健康命运共同体作出交大医学院应有的贡献。

TOP7热点:《再见爱人 4》第十二期水蜜桃很硬

  (五)因特殊原因无法按规定时间参加核酸检测的居民,请主动向居住地所在社区报备或通过“天津数字防疫”APP进行未筛查报备,以便及时安排补检。

  (六)全面落实属地、行业、单位、个人“四方责任”,务必做到“应检尽检、不落一户、不漏一人”。各镇街(园区)要安排专人值守,在小区(村)出入口严格落实测温、扫码、查验、登记等管理措施。公安机关要增加警力配备,加强交通管制。疫情防控、核酸检测和社会运行保障相关工作人员听从本镇街(园区)、本单位安排,保障工作出行并及时参加检测。全区各级机关、各行业主管部门、各级各类企事业单位要压实责任,督促本单位职工和本行业从业人员在核酸检测前及时在居住地或必需的岗位工作地参加核酸检测,并严格落实本次核酸筛查采样证明、72小时核酸阴性证明、场所码和健康码的查验,对于未参加本次核酸筛查的,要及时提醒到就近核酸采样点进行核酸检测。

TOP8热点:周末游上海成韩年轻人度假新时尚左右为难1v2

  (一)核酸采样前,凡是居住在我区的群众在居住地点保持原地静止,按照镇街(园区)的统筹部署和社区(村)组织安排,分时段有序前往指定采样点进行核酸采样。凡津南区常驻居民和通勤人员筛查当日在市内六区和东丽区、西青区、北辰区的,须在所在区参加核酸筛查;如居住在滨海新区、武清区、宝坻区、宁河区、静海区、蓟州区,须到该区常态化核酸检测点同步进行核酸采样。各镇街(园区)、社区(村)将同步开展“敲门行动”,因特殊原因无法按规定时间参加核酸检测的群众,请提前主动向居住地社区(村)报备(倡导使用“天津数字防疫”APP进行报备),以便核查和补检。9月27日,全区暂停常态化核酸检测。

  “《马兰花开》总是有一种力量可以让我们沉静下来,感受着上一辈科学家的专注和纯粹。”如今,阎博从当初参演话剧的学生成长为一名心理教师,在她看来,帮助新一代青年在不确定性中寻找到精神内核是“花开”所承载的另一个重要意义,“一代人有一代人的使命和担当,我们的‘根’永远相同”。

TOP9热点:张家口 7 旬冬泳者被困冰下后遇难苏州丝瓜晶体有限公司iOS山

  根据当前疫情防控形势,为进一步加强疫情隐匿传播风险排查,巩固疫情防控工作成效,切实保障人民群众生命安全和身体健康,按照市疫情防控指挥部部署,区疫情防控指挥部决定,9月27日(周二)在全区范围开展核酸检测。现通告如下:

  据中指研究院不完全统计,今年以来已经有接近20个城市推行“商转公”政策,以此减轻购房者还贷压力。尤其自9月以来,云南普洱、河南洛阳、广西防城港、陕西汉中等多个城市密集发布了“商转公”新政。

TOP10热点:李明德创飞所有人除了田曦薇韩版金银瓶1-5

  据GGII数据,2021年华东地区动力电池已投产产能达300GWh,全国占比超60%,排名第一。四川在内的西南地区产能占比12%,排名第二,但未来随着动力电池企业在四川的投产,四川动力电池产能将超过350GWh。

  三、对于接种新冠病毒疫苗后48小时内人员,暂不安排参加此次核酸检测,各属地提前做好备案统计,妥善安排后续检测。对于疫情防控、核酸采样检测和城市运行保障相关工作人员,要做好统筹安排,保障工作出行。

发布于:昌乐县