airmax97杂交李开复:最新预训练模型Yi-Lightningairmax97杂交超越GPT-4o,中美顶尖模型只差5个月_ZAKER新闻
李开复:最新预训练模型Yi-Lightningairmax97杂交超越GPT-4o,中美顶尖模型只差5个月_ZAKER新闻
此后,化工所改制、房改施行,有条件的住户搬了出去,风光无限的高级家属楼慢慢沦为周边房龄最老,居住条件最差的老房。2007年,孙兵的儿子要上学,他在报纸上看中这套价格洼地的老房,成交价每平方米6000多元,比周边便宜了近3000元/平方米。
(图片来源:钛媒体 App 编辑林志佳拍摄)" 前一阵声称国内六家大模型公司里有几家放弃了预训练,我们正式辟谣,零一万物绝不放弃预训练,而且我们的预训练做得又快又好。"10 月 16 日上午,面对市场的猜测和质疑,零一万物创始人李开复开宗明义公布这段话,并宣布推出新的旗舰预训练模型 Yi-Lightning" 闪电模型 "。据李开复介绍,在国际权威盲测榜单 LMSYS 上,Yi-Lightning 超越 OpenAI GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet,排名世界第六,中国第一。他还称,Yi-Lightning 是 " 顶级模型白菜价 ",在推理速度和价格上,Yi-Lightning 的最高生成速度提速近四成,每百万 token 仅需 0.99 元,且该定价仍有利润。" 它是第一个在国际权威达到非常高排名、打败多数的美国大模型,成为首度超越全球头部的 OpenAI GPT-4o 的中国大模型。Yi-Lightning 闪电模型不但模型性能世界一流、推理非常快速,而且价格非常低,不论是 App 调用、还是企业应用场景调用,都是非常适合的。" 李开复表示。会后交流时,李开复向钛媒体 App 强调,很多人问中国的预训练是否落后美国?我们也坦诚中国是落后美国,但有人说落后十年、二十年,今天我们可以用非常精确的数字来算,GPT4o 在 5 月做出来的模型,我们在 10 月的今天已经把它打败了。如果真的算中国赶超美国有多远的距离,至少,零一万物离 OpenAI 的模型,只差 5 个月。据悉,零一万物(01.AI)成立于 2023 年 5 月 16 日,致力于打造全新的 AI 2.0 平台与 AI-first 生产力应用的全球化公司,由创新工场董事长兼 CEO 李开复创立,并担任零一万物 CEO。核心团队成员来自谷歌、微软、IBM、百度等公司。融资层面,截至目前,零一万物已完成三轮融资,其中包括由阿里领投的 2.5 亿美元(约合人民币 18.08 亿元)Pre-A 轮融资,估值已超过 10 亿美元,跻身独角兽行列。(详见钛媒体 App 前文:《对话李开复:中美大模型差距越来越小,我 10 年不 " 套现 "》)产品和商业化层面,零一万物主打国外 To C(消费级)付费市场、国内 To B(企业级)付费市场。对于 B 端与 C 端的布局,李开复表示,一家大模型公司同时去做 To B 和 To C 很辛苦,需要多元化的管理方式,因为两个团队的基因不同,做事方法与衡量 KPI 也不同。To B 领域,零一万物目前主要聚焦国内市场,如餐饮领域的数字人方案;To C 领域主要布局海外,因为在国内 To C 产品的流量是一个很大的成本问题,在当下较为挑战的环境下需要谨慎判断。其中,C 端领域,今年 5 月,零一万物发布 AI 生产力工具 " 万知 ",可速读 60 万字《马斯克传》。零一万物预计今年 To C 端营收预计可达 1 亿人民币。李开复表示,"to C 我们主要布局海外,有几个理由:第一、当我们开始做零一万物时国内还没有合适的中文模型,我们只有在国外先尝试,尝试了一段就有了心得,就迭代了一个、两个、三个产品,这些产品现在表现有些很好,有些没有那么好,我们也在不断地调整中。我们也在观察什么时候适合在国内做什么样的产品,国内 to C 产品的流量的成本越来越高,我们也看到了有些友商的用户从十几块人民币加到三十多块人民币,近来还有相当的流失,在这样一个挑战环境里我们会非常谨慎,先不推出中国本土新的 to C 的应用,我们已有的产品还会继续维护,但更多的精力会在国外的土壤用更低廉的钱买到非常高质量的用户,或者能直接把 App 卖出去,让用户来订阅收费,这个订阅的习惯在国外也是比较良好,主要是这几个理由。现在当下最大的理由还是说国外做 to C 的产品,我们变现能力和消耗用户增长的成本算账可以算得过来,以后再关注国内有什么机会可以推出。"如今,零一万物再度选择优化预训练模型,并且会上也首度公布了全新 ToB 战略下的首发行业应用产品 AI 2.0 数字人,聚焦国内零售和电商等 To B 业务场景。"对于回答的生成都是靠我们 Yi-Lightning 大模型,某酒旅企业 GMV 销售额直升 170%。我觉得,大模型应用与其说卖模型或模型做客服等应用,最好的是能够有一个大模型公司看到完整的用户需求,从端到端打造一个完整的解决方案,让购买大模型和数字人的公司能立刻看到每一使用就赚钱,用得越多赚得越多,这样他对我们的付费意愿也会增长。" 李开复直言,零一万物 to B 选择做国内,是因为找到了一些破局的空间,比如用数字人来做零售、餐饮等,形成一个完整的解决方案,另外还有两三个领域开始在做,但现在还不方便披露。李开复强调," 全世界的范畴来说,to B 供应商基本都是当地的,跨国的设立分公司做 to B,绝对不是我们或其他的创业公司能做的,所以 to B 在国外就放弃了,做 to B 就做国内,做 to B 就做有利润的解决方案,而不只是卖模型,不只是做项目制,这是我们 to B 的做法。"谈及成本问题,李开复称,此次预训练零一万物用了 2000 张 GPU,训练了一个半月,花费了三百多万美元,但成本约为 Grok 的 1%-2%。李开复认为,OpenAI 是一家很厉害的公司,已发布的 OpenAI o1 虽然隐藏了所有中间的思考状态,但 o1 将此前预训练中的 Scaling 趋势扩展到推理,对行业形成认知改变,让行业认识到预训练之外,后训练 SFT(Supervised Fine-Tun-ing,监督微调)与强化训练都非常重要," 相信很多中美公司都在向 o1 方向狂奔。" 李开复称。谈及未来行业形势,李开复强调,公司不会放弃预训练,但这是个技术活,需要懂芯片、推理、模型、算法 " 如果一家公司能拥有这么多优秀的人才,能够跨领域合作,相信中国可以做出世界排名前十的预训练通用模型,但由于成本比较高,未来可能会有越来越少的大模型公司做预训练。" 中国的六家大模型公司,只要有够好的人才,想做预训练的决心,融资额跟芯片都不会是问题的。" 李开复称。以下是李开复和钛媒体 App 等部分对话信息:问:模型做到 " 世界第六,中国第一 ",同时以较低的价格推向市场,是如何实现的?李开复:零一万物在 Yi-Lightning 的定价上并没有亏本。成立第一天起,零一万物同时启动了模型训练、AI Infra、AI 应用三大团队,三个团队成熟后,再对接到一起。零一万物将这一模式总结为模基共建、模应一体两大战略。AI Infra 助力模型训练和推理,以更低的训练成本,训练出性能领先的模型,以更低的推理成本支撑应用层的探索。我们不会赔钱卖模型,但也不会赚很多钱,而是在成本线上加一点点小小的利润,就得到了今天 0.99 元 / 百万 token 的价格。挑选模型 API 最重要的一点,是模型性能一定要优秀,在这个前提之下才去挑最便宜的,我相信,综合 Yi-Lightning 的模型质量和价格来看,Yi-Lightning 很可能是很多开发者最认可、最高性价比的模型。问:此前有消息称,大模型 " 六小虎 "(零一、智谱、百川、MiniMax、月之暗面、阶跃星辰),其中某几家放弃了预训练。站在行业的角度,逐步放弃模型预训练会成为行业整体趋势吗?李开复:做好预训练模型是一个技术活,而且要非常多有才华的人在一起工作,慢工出细活。需要有懂芯片的人、懂推理的人、懂基础架构的人、懂模型的人、很好的算法同学,一起做出来。如果一个公司能有幸拥有这么多优秀的人才,能够跨领域的合作,我相信中国绝对可以做出世界排名前十的预训练的通用模型,但不是每家公司都可以做这件事情,做这件事情的成本也比较高,以后有可能会越来越少的大模型公司做预训练。不过据我所知,这六家公司融资额度都是够的,我们做预训练的 production run,训练一次三四百万美金,这个钱头部公司都付得起。我觉得中国的六家大模型公司只要有够好的人才,想做预训练的决心,融资额跟芯片都不会是问题的。问:零一万物首次公布 ToB 相关矩阵,未来会进一步在 ToB 方向深耕吗?李开复:在国内,大模型 ToB 相对于 AI 1.0 时代有不同的打法,首要任务就是要寻找少数能够按使用情况收费的方法,而不是项目定制的方法。能得到比较高利润率的订单再去做。今天零一万物推出的 AI 2.0 数字人解决方案不是做一单赔一单的做法,它专注到用户重大的痛点需求和盈利点,也就是一个店长或 KOL 平时做一次直播浪费最重要的资源——他的时间。这个时间就算做一小时直播能赚到一千块钱,也就是这一千块钱,但如果用数字人直播就不是一小时了,可能可以做一千个小时(直播),哪怕每一个小时只能赚一半的钱,一千个小时还是可以赚五百倍的钱,这样账就很好算了。如果真的能把数字人做到端到端,只要输入公司内部的东西,选一个形象、声音按一个钮就开始直播,等于卖给这个企业一个印钞机,印钞机要收租赁费就可行。除了直播以外,我们的 AI 2.0 数字人解决方案已经跑通了更多业务场景,比如 AI 伴侣、IP 形象、办公会议等等。整体来看,零一万物 ToB 整体解决方案会采取「一横一纵」的打法。先将单个行业做深做透,进而以自身技术能力和行业积累为基础,凝练出标准化的 ToB 解决方案,为各行各业的企业客户将本提效。问:除了数字人解决方案,零一万物是否还有其他 ToB 解决方案?李开复:除了我们已经发布的 AI 2.0 数字人、API 之外,零一万物目前还有 AI Infra 解决方案、私有化定制模型等其他 ToB 业务,我们会在近期正式对外发布,敬请期待。问:零一万物在海外推出 ToC 产品,国内陆续推出 ToB 产品,当前在 B 端、C 端的产品现状如何?李开复:一个大模型公司同时做 ToB 和 ToC 很辛苦,销售方法、利润的比例、需要多少投放才会有收入等评估体系完全不同。也需要多元化的管理方式,因为两个团队的基因不一样,做事的方法、衡量 KPI 的方法都不太一样。我在这两个领域有经验,也在试着做,但也绝对不能什么都做。ToB 上,零一选择做国内市场,是因为找到了一些破局的空间,比如用数字人来做零售、餐饮等,能做一个完整的解决方案。另外还有两三个领域开始在做,现在还不方便披露。ToB 不做海外市场,是因为全世界的范畴里,ToB 供应商基本都是当地的。选择在国内做 ToB,还要选择有利润的解决方案做,而不只是卖模型、不只是做项目制,这是我们 ToB 的做法。ToC 我们主要布局海外。当我们开始做零一万物时,国内还没有合适的中文模型,只有在国外先尝试,迭代了一个、两个、三个产品,这些产品现在表现有些很好,有些没有那么好,在不断地调整中。我们也在观察什么时候适合在国内市场做什么样的产品,目前做 ToC 产品面临一个很大的问题——流量成本越来越高。我们也看到有些友商的用户从十几块人民币加到三十多块人民币,近来还有相当的流失,在这样一个环境里,我们会非常谨慎,先不推出中国本土新的 ToC 应用,同时已有的产品还会继续维护,但更多的精力会在海外的土壤用更低的成本买到非常高质量的用户,或者能直接把 App 卖出去,让用户来订阅收费,那边订阅习惯相对成熟。换句话说,现在现状选择在海外做 ToC 产品,变现能力和消耗用户增长的成本算账可以算得过来,以后再关注国内有什么机会可以推出。问:今年 5 月,Yi-Large 把中美顶尖模型的时间差缩短到六个月,这次 Yi-Lightning 发布直接击败了 GPT-4o,把时间差甚至缩短到了五个月,你觉得之后中美大模型如何缩短时间差?李开复:缩短时间差非常困难,我不预测我们可以缩短这个时间差。因为毕竟人家是用十万张 GPU 训练出来,我们用的是两千张 GPU 训练出来。Yi-Lightning 的效果是因为团队和社区大家都热心聪明去使用,去理解对方做出来的东西,再加上我们自己每家的研发有特色,比如数据处理、训推优化等等,现在这一套方法论在零一万物已经成熟了,我们有信心把自己的创新加上我们的一些特长,在关注 OpenAI 和其他公司发布的新技术,尽快地去能够了解这些技术的核心重要性,然后把它的能力在我们自己的产品里面发挥出来。我觉得这套方法保持在六个月左右,就已经是很好的结果了。如果期待破局,可能需要一个前所未有的算法才有机会。我们千万不要认为落后六个月是一个很羞耻的事情,或者一定是要追赶的事情,因为我很多海外朋友都认为中国会远远落后,人家十万张 GPU 等,我们要被甩掉三年、五年甚至十年都有可能,现在零一万物证明了不会落后这么多,而且这次 LMSYS 的榜单上也有其他两家中国公司表现不错。(本文首发于钛媒体 App,作者|林志佳,编辑|胡润峰)koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:于学忠
TOP1热点:十四届全国人大三次会议闭幕会将于3月11日下午3时举行
雪崩发生后,西藏立即暂停了希夏邦马峰登山活动,并立即组织救援力量赶赴希夏邦马峰登山大本营。截至目前,重伤的尼泊尔籍登山者已脱离生命危险,正由救援队护送下撤。。
TOP2热点:一脸正气!因表情包出圈的周云杰28年前的采访“被考古”
在张玉延的新家中,二层阁楼的书架上印着“大漠孤烟直,长河落日圆”与“常为而不置,常行而不休”两句诗,他常以这两句诗来自比十年的跋涉,像是在孤独的大漠中行走,没有先例借鉴,靠着“常行不休”的信念坚持,个中滋味只有自己知道。
TOP3热点:如何破解普职分流焦虑?委员建议优化招生制度,“分轨不分流”ZOOM与人性ZOOM2区别
邱志平是业主代表中最年轻的一个,他是一名上班族,也是经常陪同李小菠跑各个行政部门的业主之一,“我们看到她(李小菠)一个女同志到处跑确实不容易,有时候说得难受都哭了,六十多岁的人了,也蛮可怜的”。
TOP4热点:DeepSeek深挖2543篇两会报道:代表委员热聊新质生产力的四大高频词嗯嗯哼哼哼哼哼哼哼哼这是什么歌
鼓励中小银行重塑服务地方经济、服务中小企业、服务本地市民的战略定位,走特色化、差异化发展之路。中国经济最大的特征就是多重二元结构,城市与乡村、沿海与内地、北方与南方等,这意味着必须要有差异化的金融体系来承接差异化的金融需求,中小银行的价值和发展空间长期存在。鉴于此,应鼓励中小银行推广线下化、非标准化为主的服务模式,通过线下与客户的高频沟通,增强客户粘性,减少信息不对称的问题。例如,江浙沪地区的台州银行、泰隆银行等,依靠线下高成本有效解决信息不对称问题,保持了较低的不良率,节省了风险成本。还需鼓励中小银行集中资源,围绕一两个产业链,将服务和产品做深做实。例如,安徽亳州的药都农商银行,服务当地中药材市场,满足了农村地区和药材批发市场客户“短小频急”的金融服务需求。再如,新疆的汇和银行,主要业务围绕新疆的棉花产业链,贷款中超过六成投向棉花产业。
在经贸领域,中美互动更加频繁。9月22日,经中美双方商定,成立经济领域工作组,包括“经济工作组”和“金融工作组”,旨在强化经济领域沟通。美财政部称,两国财政部副部长级官员将定期举行会议。
TOP5热点:中国驻刚果(布)大使李岩同志去世,终年52岁TOBU8-HD100
布林肯认为,拜登政府在过去一段时间通过的《通胀削减法案》《芯片与科学法案》等法案,这为美国在中美竞争中取得优势地位奠定了良好基础,并再次强调了“团结盟友”的重要性。不过随后布林肯话锋一转,再次强调了中美关系的重要性,并指出中美在许多地方需要合作。
日本农林中金综合研究所的理事研究员阮蔚对《日本经济新闻》分析称,中国转向巴西玉米有两个原因:一是随着丰收,巴西玉米的价格下降,竞争力增强。二是为了增强粮食安全,这是中国推动进口国多样化的结果。
TOP6热点:清华毕业生罗生门失联超过两周,荷兰警方介入成版人黄APP破解版
此前,商务部部长王文涛已就此当面表达不满。9月24日,王文涛在京与来访的欧委会执行副主席兼贸易委员东布罗夫斯基斯举行会谈。王文涛重点就欧盟将对中国电动汽车发起反补贴调查表达严正关切和强烈不满。
[环球时报报道 记者 倪浩]中国正在推进玉米进口的多元化,以改变进口过度集中于美国一家的格局。而随着中国进口的增加,巴西和美国玉米的市场份额之争将会愈演愈烈。
TOP7热点:古装剧《似锦》登陆卫视,走进宋代诗意世界WWW.RB444.COM
日本农林中金综合研究所的理事研究员阮蔚对《日本经济新闻》分析称,中国转向巴西玉米有两个原因:一是随着丰收,巴西玉米的价格下降,竞争力增强。二是为了增强粮食安全,这是中国推动进口国多样化的结果。
郑强在声明中强调,吕某发布虚假信息,所述内容均为捏造虚构,对其本人进行敲诈和勒索,严重损害其个人名誉,造成极坏影响和极大伤害。“如我本人存在任何违反纪律和法律的言行,我本人愿意接受组织的审查和处理。”
TOP8热点:泽连斯基:乌克兰准备停火30天,俄罗斯必须表明其意愿大巴车轮轩诗歌摘抄
正在医院看望伤者的中国驻泰国大使韩志强接待国王王后代表。对方表示,哇集拉隆功国王和素提达王后对在事件中不幸遇难的中国公民表示哀悼,对遇难者家属及受伤中国公民表示慰问,希望伤者早日康复。
TOP9热点:何小鹏谈与小米SUV竞争:小米YU7一定大卖,小鹏G7肯定大卖乐可全文番外TXT百度免费下载
张玉延常常跟媒体提及这次对话,但是他当时没有完整说出来的是,复制的关键在于人和制度保证缺一不可。依靠居民自主更新,离不开强有力的推动者,但推动者本身也只是一个普通居民,如何协调所有人劲往一处使?如果没有制度保障,那就是一个“吃力不讨好”的角色,最终很难成功,这一切需要成熟配套的政策。
此外,企业界也对此举持质疑和反对态度。宝马集团首席财务官默特尔警告欧盟,不要对中国电动汽车征收惩罚性关税,并担心会对其他行业产生影响。
TOP10热点:颜宁,有新任职男生女生修修修轮滑鞋
另一位1日从成都飞抵曼谷的游客,在枪击事件发生时同样在商场内的游客则告诉界面新闻,他们已经取消后续行程,并购买了4日的班机回国。
[环球时报报道 记者 倪浩]中国正在推进玉米进口的多元化,以改变进口过度集中于美国一家的格局。而随着中国进口的增加,巴西和美国玉米的市场份额之争将会愈演愈烈。