ALEXANDERWANG妈妈DeepSeek爆火,国内同行ALEXANDERWANG妈妈度过了一个痛苦的春节_ZAKER新闻
DeepSeek爆火,国内同行ALEXANDERWANG妈妈度过了一个痛苦的春节_ZAKER新闻
_______________
DeepSeek 让国内一众大模型同行度过了一个 " 痛苦 " 的春节。年前,DeepSeek 掀起 AI 海啸,有某大厂大模型业者就捶胸顿足:" 产品超出了我的想象,比咱家的各方面都好,真想跳槽到 DeepSeek。" 还有很多人反思,为啥咱自家就没做出 DeepSeek。也有业者不服气,认为 " 它的火只是一种情绪的泡沫。"一、焦急:DeepSeek 比咱家的好太多李辉(化名)是北京一家大模型公司的资深从业者。DeepSeek 爆火时,李辉的公司还没放假,他跟工位上的同事们展开热烈讨论。" 我开玩笑说,真想跳槽到 DeepSeek。个人认为,产品能力与 ChatGPT 不存在差别,满意程度 80-90 分,国内其它大模型分数我只给一半。" 李辉说。李辉的公司一直被认为是国内大模型行业的先行者,相关技术积累很深,过去一年与各行业开展大模型商业化应用,也取得了一些早收成果。但在李辉看来,DeepSeek 有两点让他觉得 " 很厉害、有希望 "。一是产品能力。就李辉的使用体验,其它国内大模型用起来,十分挑用户输入的 prompt(提示词)。但 DeepSeek 用起来,向自然语言交互又迈进了一步。" 不管说什么它都能理解,不用费劲解释或重新调整提示词,它回答起来上下文也很顺畅。"李辉就让 DeepSeek 帮自己整理了一套某类型漫画,结果从中文到日文名,全部条分缕析、进行了罗列。" 我也有让它推荐下载地址,结果问了好几次都被 DeepSeek 拒绝,因为它也有版权保护意识。"二是给行业带来了希望。李辉虽然身系 " 局中人 ",但他一直觉得:各行各业高估了大模型的作用。虽然 DeepSeek 的产品能力令他眼前一亮,但他仍然没有改变目前的观点。" 让我稍微觉得欣慰的是,deepseek 用较为低廉的成本,取得了跟 OpenAI 差不多的效果,这意味着它的商业化发展有了更大的眉目。"这句话切中的是 2024 年国内大模型的发展痛点。2023 年国内大模型烧的是钱、比的是技术,但到了 2024 年,国内各家都在抓紧探索大模型的商业化变现之路。原因无它,只因为大模型是个烧钱机器,即便是账户上躺着数百亿现金的大公司,也经不起GPU、电力能源、训练成本三座吞金兽的重压。而 DeepSeek 推出后,全球乃至国内各家公司争相宣布接入,可以说 DeepSeek 正在给无资本、无技术、无知识储备的公司带来普惠。如此夸竞对的产品,一个尴尬的问题也免不了被同事追问," 为何咱自家公司没能做出这样的产品?"李辉说:" 做不出倒是符合预期。不仅咱们,国际上那么多巨头不也被干趴下了吗。很认真地说,如果有机会,我还真愿意跳槽去 DeepSeek。"不过可能他已经晚了。小红书上,后悔没有接 DeepSeek offer 的帖子已经多如牛毛。二、应激:这只是情绪的泡沫李辉对 DeepSeek 这条鲶鱼是比较正向的评价,他痛苦自己 " 身在曹营心在汉 ",业内还有另一波 " 痛苦声音 " —不认同、不服气。另一家总部位于北京的某大模型公司从业者王锐(化名),对 DeepSeek 的爆火持相对理性的态度。他和自家人都用 DeepSeek 做了测试,结果遇到两个 bug,让他对 DeepSeek 没有建立起先入为主的好印象。他的父亲先是问 DeepSeek 立春是几时?别的大模型都能准确答出:是 22 时 10 分。但 DeepSeek 回答是:下午 4 点。然后他自己又问 DeepSeek 春节档电影票房排名,结果 DeepSeek 把还没有上映的《流浪地球 3》也算了进来。对小错误 " 斤斤计较 " 的背后,是王锐不认为市场主流的其他大模型产品能力就逊色于 DeepSeek," 大模型幻觉 "这个广泛存在的难题依旧存在。他认为若一定要在此时此刻论 DeepSeek 的功绩,在于它在开创了全新的模型训练模式,在加速 AI 行业迭代的同时,对 AI 产品做了进一步的用户破圈,而这是 2024 年各家大模型都在努力去做但收效还在路上的一件事——即从重视 B 端客户(企业客户),转向面向 B 端和 C 端并重,尤其是 C 端,即普通人用户。这个背景是,多家头部公司都在 2024 年不约而同地意识到:只靠 B 端客户,难以支撑起大模型的用户规模,因而需要 C 端也多多用起来,而面向 C 端用户推出相关 AI 应用级产品、探索相关的商业模式,成为各家去年重点发力目标。2024 年,夸克(阿里系)和豆包(字节系)成为国内 166 款主要 App 中唯二迈入 " 亿级俱乐部 " 的玩家,成功为行业 AI to C 市场拓展打了个样。而就在 2 月 6 日,阿里又宣布,引进全球顶尖人工智能科学家许主洪教授(Steven Hoi)出任集团副总裁,负责 AI To C 业务的多模态基础模型及 Agents(智能体)相关基础研究与应用解决方案,这些都是头部玩家在 AI to C 端市场布局的表现。更有媒体称,"AI to C 已经走到了 super APP 的前夜"。不过 DeepSeek 虽然吸引了 1600 万次下载,但王锐有一个疑问是:很多人可能更多是出于一种跟风的情绪来下载使用它,而情绪从来就是一种泡沫。《黑悟空》制作人冯骥就把 DeepSeek-R1,称为 " 国运级别的科技成果 "。在极客圈聚集的知乎和即刻平台内,也有人因而把 DeepSeek 视为 "AI 界的华为 ",但王锐认为,大家忽视了真正产品力上的对比。"而这些靠情绪而来的用户,是否真的是产品的核心高频用户,也是个疑问"。图 | 截图来自冯骥微博另一家 AI 公司从业者梁伦(化名)也和王锐持有部分相同的观点。他引用网上自来水的评价称," 感觉 DeepSeek 并没有 xx 产品(梁伦家的产品)回复的准确性高,这背后是资本的力量吗?"但梁伦表示,DeepSeek 爆火后,身边同事也明显有了更乐观的情绪:" 这说明中国科技公司完全有机会挑战美国市场,也瞬间把国产 AI 的斗志给提了起来,之前那么多的冷嘲热讽,接下来的技术竞赛有得看。"三、冷静:DeepSeek 能保持红利多久?普通从业者对 DeepSeek 议论纷纷,很多是从个人角度考虑,比如是否应该跳槽,获得更大的职业发展性。老板们的眼界就不一样了。去年 12 月末," 雷军出手千万年薪挖来 95 后 AI 天才少女罗福莉 " 的消息不胫而走,她被称为是 DeepSeek 的首席架构师。不过该消息并没有后续——即罗福莉官宣是否有加入。随着 DeepSeek 爆火全球,罗福莉是否产生了动摇不得而知。舆论场上有一种声音,可能受到冲击更大的,是来自国内大模型的六大独角兽公司,也被称为 "AI 六小虎 "。李辉就表示,此前 AI 六小虎对内讲故事,但在海外知名度多并不高,除了其中一家因被列入美国商务部的出口管制实体清单而在海外有了些许认知度外。因为国外大模型进不来,所以国内 AI 六小虎的故事,此前还多少还有点听众。" 但现在就不同了,DeepSeek 直接就把战线拉到了跟 OpenAI、Gemini 齐平的水平。就在 2 月 6 日(昨日,编者注),Google 发布 Gemini 2.0(多模态大模型),媒体都报道剑指的就是 DeepSeek,这在之前是不可想象的。DeepSeek 对海外巨头形成了降维打击,接下来 AI 六小虎的故事、企业融资、企业估值是否有变化,值得关注。甚至是否会终结国内的百模大战,也不是不可能。"此外,李辉还补充道,DeepSeek 可能反而会让业界对大模型的期待降低,DeepSeek 一定程度上戳破了大模型的泡沫,让行业回归理性。" 之前是画大饼,现在是开始讲谁性价比更高了,因为大模型谁都能搓,但能搓出来既好用又便宜的才行。最近几个大模型发布的时候都在强调价格低。"这说的确实也是事实。从 2024 年至今,各家大模型卷起了价格战。各大厂主力大模型纷纷降价,比如去年 5 月,通义千问 GPT-4 级主力模型 Qwen-Long,API 输入价格就直降 97%。这意味着,1 块钱可以买 200 万 tokens,相当于 5 本《新华字典》的文字量。其它诸如智谱 AI 等也都纷纷降价。有媒体冠上标题,"大模型定价进入了厘时代",意思是每一千 tokens 价格不足 1 厘。不过,一如普通从业者的意见分化,国内也有不少来自机构的声音认为,目前市场对 DeepSeek 的" 追捧有点过了 "。有大厂不愿意具名的业者就表示,"DeepSeek 目前可能还威胁不到大厂,因为大厂也能做。" 也有声音点出,可能 DeepSeek 目前更适合中小企业,因为中小企业一般都是 "哪个便宜够用就用哪个"。李辉虽然觉得 DeepSeek 产品力很棒,但他仍然有两点疑问。DeepSeek-R1 的成本宣称仅为国外大模型的三十分之一 ,事实果真如此?第二个疑问是,既然有 DeepSeek,就有可能哪天冒出来一个 DeepFind,DeepSeek 未必就是国内性价比大模型的终点。就在昨日,有媒体报道,有 "AI 教母 " 之称的李飞飞等斯坦福大学和华盛顿大学的研究人员以不到 50 美元的云计算费用,成功训练出了一个名为 s1 的人工智能推理模型,据称该模型在数学和编码能力测试中的表现,与 Open AI 的 O1 和 DeepSeek 的 R1 等尖端模型不相上下。媒体采访相关业内人士后发现,s1 是基于阿里云通义千问模型进行了监督微调,意思是后者才是 " 真牛 "。不管怎么说,国内有竞争,对各方都是好事一件。对于普通企业和个体用户来说,能够不断以较低的成本使用能力更强的 AI,就是利好。只是对从业者而言,在中国 AI 军团开始真正登上国际舞台肉搏的这个时代,痛苦和快感将是 2025 年的一体两面。koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:余克勤
TOP1热点:知乎推文加入
每月“科学”流言榜由北京市科学技术协会、北京市委网信办、首都互联网协会指导,北京科技记者编辑协会、北京地区网站联合辟谣平台共同发布。。
TOP2热点:女子高校工作 16 年发现未缴养老险
2021年,文化和旅游部先后发布了《“十四五”文化和旅游发展规划》和《“十四五”文化和旅游科技创新规划》,提出了“实施文化产业数字化战略”和“积极发展智慧旅游”的发展战略部署,并对如何实施文化产业和旅游业数字化创新发展做出了详细规划。从技术与业态融合的整体趋势看,信息技术的强势崛起对文化产业和旅游业的发展产生诸多助益,包括但不限于不同生产领域的融合创新、充分挖掘下沉市场发展潜力、盘活沉默资本、推动新兴消费模式壮大等。进入数字化工业时代,数字技术已然浸入文化产业和旅游业经营发展的各个方面,是文化和旅游消费模式、消费者消费习惯发生转变的主要因素。随着《数字乡村发展战略纲要》的深入推进实施,我国数字乡村建设已初具规模,必须继续发挥数字技术的改革创新作用,推动乡村文旅融合高质量发展。
TOP3热点:台湾台南市发生5.1级地震暴躁老外玩minecraft
在30余米深的海底,让8万吨重的沉管实现毫米级对接,难度堪比载人飞船和“天宫”空间站对接。
TOP4热点:知乎创作收益麻花星空影视传媒制作公司
本报记者张志锋
TOP5热点:观自贡灯,过中国年13又嫩又紧又多水AV
——督促地方引导社会支持、理解、参与需求侧响应,进一步提升需求侧响应能力,有效消解高峰时段压力。
比如,位于龙脊梯田核心区域的平安村和大寨村,主要以梯田景观和稻作农耕文化为定位,开发了九龙五虎、七星伴月、金佛顶、西山韶乐、千层天梯等观景点,打造了核心旅游吸引物,成为游客青睐的热门打卡地。
TOP6热点:电影哪咤之魔童闹海预售票房破亿一线产区二线生产区的区别
从战略谋划,到编制规划,再到推进建设,6年多里,每逢雄安建设重要节点,习近平总书记总会深入新区实地调研,同大家共商千年大计,亲自推动一座高水平现代化城市拔节生长。
TOP7热点:知乎创作收益一面亲着一面膜胸口
同时,民营企业要践行新发展理念,转变发展方式、调整产业结构、转换增长动力,坚守主业、做强实业,自觉走高质量发展路子,在推进科技自立自强和科技成果转化中发挥更大作用,为构建新发展格局、推动高质量发展作出更大贡献。
相比4年前,大会期间产学研各界不仅讨论5G的应用,而且还讨论5.5G(5GAdvanced),乃至6G的技术进展以及应用场景。
TOP8热点:为何机场需要 checkin 才能登机天堂草原电视剧在线观看
夏季极端天气频发多发,应急是安全最后一道防线。国家电网福建电力公司滚动完善电力保供应急预案、电网故障联合处置预案、防汛抗灾预案等措施,持续完善灾害监测预警与应急指挥管理系统,组建785人的应急救援、8770人的应急抢修队伍,筹备应急发电车142辆。
TOP9热点:为何机场需要 checkin 才能登机国精产品呦呦仙踪林
联合国文明联盟高级代表莫拉蒂诺斯说,感谢习近平主席一直以来对世界文明交流互鉴的高度重视与大力支持。“我十分赞同习近平主席提出的全球文明倡议,该倡议与联合国文明联盟的工作有许多相通之处。”他表示,相信这一倡议将有力推动不同文明之间的理解与对话。
见到正在作业的矿工,习近平同志走上前去一一握手,一一问好。他说,安全生产是第一位的,一定要珍爱每一位矿工的生命,让大家高高兴兴下井、平平安安回家。
TOP10热点:等固态电池出来再买车好吗一个晚上用了好几个小雨伞
2016年,在一次专家讨论会上,研发团队有人提议:干脆给船带上“腿”(即让船自带动力),把两个安装船连成一体。“当时,这个提议让大家眼前一亮,觉得是一个很好的思路,我们细化研究后觉得方案可行。”中交一航局总技术顾问李一勇回忆说。
那天,省委书记习近平将他在浙江下基层接待信访群众的第一站选在了浦江。浦江中学会议室里,蒋星剑第一个发言,反映省道浦江段拓宽改造问题。