CHlNAESEⅩⅩⅩⅩⅩ阿里开源推CHlNAESEⅩⅩⅩⅩⅩ理模型QwQ!可联网搜索,思维链裸奔,开发者玩疯了_ZAKER新闻
阿里开源推CHlNAESEⅩⅩⅩⅩⅩ理模型QwQ!可联网搜索,思维链裸奔,开发者玩疯了_ZAKER新闻
梵净山上,层峦叠嶂,云海翻涌,四方游客争相打卡;赤水河畔,水清岸秀,瓜果飘香,沿河群众以“绿”生财;苗岭深处,山林如海,点绿成金,林下经济创新拓展……
智东西 2 月 25 日报道,今天,阿里通义千问团队推出 QwQ-Max-Preview 深度思考模型,并支持联网搜索,展现出超强的通用能力,不仅现场锐评了最新的《哪吒 2》电影,还能写代码、做数学题,并可以胜任创意写作、游戏开发等开放性任务。这款模型会在不久后开源,目前已在通义千问的新官网上线,仅需点击聊天框左下角的 " 深度思考(QwQ)" 按钮即可体验。QwQ-Max-Preview 的博客文章有满屏醒目的颜文字,并附上跳转到体验页面和 Discord 的链接,还特别标注出这篇博客是正是由新模型亲自操刀的,模型撰写博客时的思考过程也被一并呈现在文内。体验链接:https://chat.qwen.ai/Discord 链接:https://discord.com/invite/yPEP2vHTu4在 DeepSeek 推出 DeepSeek-R1 深度思考模型后,阿里和腾讯都争相推出了类 R1 的深度推理模型。QwQ-Max-Preview 基于 Qwen2.5-Max 构建,在数学、编程以及通用任务中展现了更强的能力,同时在与 Agent 相关的工作流中也有不错的表现。作为即将发布的 QwQ-Max 的预览版,这个版本还在持续优化中。通义千问团队计划在不久的将来以 Apache 2.0 许可协议开源发布 QwQ-Max 以及 Qwen2.5-Max。此外,通义千问计划面向全球用户推出 Qwen Chat App,并开源更适合端侧的小尺寸推理模型。博客内,通义千问团队放出了多个实测案例。通义千问的深度思考模型能与联网功能结合,根据实时互联网信息进行推理,先来看看通义千问是怎么评价《哪吒 2》的。在打开深度思考和联网搜索功能后,千问快速查询互联网信息,并在思考过程中与答案里都清晰地引用信源。下方是 QwQ 对《哪吒 2》的评价,截图后由 Qwen2.5-VL-72B-Instruct 翻译:下一个案例主要展现了模型的代码能力。提示词为 " 创建一个 p5.js 脚本,用于在旋转的球体内创建 100 个弹跳的黄色小球。小球被限制在球体内,并且正确处理了碰撞检测。球体缓慢旋转以产生动态效果。"长时间思考后,QwQ-Max-Preview 输出了 71 行代码,并附上了对代码主要功能的描述和使用指南,可以说是十分全面了。复制代码并运行后,可以看到动画的效果基本符合提示词要求。不过,当智东西将同款提示词甩给体验链接中的 QwQ-Max-Preview,它给出的代码运行后可以说是 " 车祸现场 ",黄色小球漫天飞舞,完全忽视了 " 小球被限制在球体内 " 这一要求。这一现象或许是由于预览版本尚不稳定。接下来的测试任务是游戏开发。QwQ-Max-Preview 收到的需求是:" 在同一个 HTML 文件中创建一个游戏。发挥你的想象力,将俄罗斯方块和 2048 游戏结合成一个游戏。"模型开发出的新游戏确实将两款游戏的玩法结合了起来,原版 2048 游戏是通过滑动方块进行相同数字的消除,而新游戏中数字将会从上方掉落,需要玩家进行操作并消除。这款模型还能胜任更为复杂的游戏开发任务,例如下方提示词这种带调整的:创建一个棋盘游戏网页,显示一个六边形网格,就像在《卡坦岛》游戏中一样。每个六边形网格都标有从 1 到 N 的数字,其中 N 是六边形格子的总数。使其具有通用性,以便可以使用滑块更改 " 环 " 的数量。例如,在《卡坦岛》中,半径为 3 个六边形。请使用单个 HTML 页面。案例中模型对提示词的理解还是比较到位的,拖动滑块确实可以修改环的数量。不过,在我们用同样提示词进行的实测中,完成效果依旧不太理想,从六边形的形状到格子的排列,都与原提示词的要求有些偏差,还出现了超出显示范围的问题。或许在未来正式版发布后,这些问题能得到解决。通义千问思考模型本次还融入了 Agent 能力,支持工具选择,不过目前的体验版本尚不支持。在博客文章中提供的案例里,可以看到这些工具包括图像生成、物流追踪、二维码生成、港股行情等。示例中,测试人员选择了二维码生成器和图像生成两款工具,要求模型生成一个穿着白色连衣裙的女孩,然后展示一个指向 taobao.com 的二维码图片。生成结果是这样的,可以看到模型选择了二次元的画风,画面内容符合要求,二维码实测也可以跳转至淘宝官网。据通义千问团队介绍,本次他们既会开源满血版思考模型,也将推出轻量级的变体,还会将其融入应用,此举是为了让不同层次用户都能体验到这款模型的能力。他们也邀请全球开发者社群对这些模型进行实验、优化和扩展,探索从教育工具到 agent 等多样化应用场景。QwQ-Max-Preview 的发布及将要到来的开源,意味着阿里也正式加入了这波推理模型的开源潮。阿里的 Qwen 系列模型作为当今全球影响力最大的开源模型家族之一,衍生模型数量已经超过 9 万个,还霸榜了 Hugging Face 开源榜单的全球前 10 名。在正式版的 QwQ-Max 开源发布后,或许还会给全球开发者带来更多的惊喜。koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:节振国
TOP1热点:自动辅助驾驶识别到石墩仍撞击?车企:驾驶员接管后发生
推荐读物。
TOP2热点:王毅在慕安会谈乌克兰危机:任何冲突的终点都是谈判桌
璞玉需要打磨。2019年12月,刘丹开始了他的毕业实训。刘丹至今记得实训第一天接到的任务——做20个子冶石瓢壶。这是紫砂壶的基础器型,刘丹对制作工艺早已烂熟于胸,很快便做完十几把,但负责品质把控的邱老师打眼一看就发现了问题。“小刘,你这把壶明针不到家啊,嘴把不在一条线上,这样的壶是卖不了的。”刘丹细细一看,果然出了问题,而这样的细节以前在学校时从未注意过。
新华社北京7月6日电(记者丁文娴、姬烨)中国羽毛球协会日前在官网公示杭州亚运会参赛运动员名单,奥运冠军陈雨菲、世界冠军石宇奇将领衔出战。
TOP3热点:直播丨勇救三名落水儿童!对话救人英雄周建明:冰点之下,我为何纵身一跃?男男伦流澡~你tm别㖭了漫画
一会儿工夫,记者急得满头大汗,困在了最基础的准备环节。刘丹上手帮忙,笑着安慰:“做不好很正常,我当初学做紫砂壶,光打泥条就练了3个月呢!”
TOP4热点:言短意长|人们为什么关注出席这场座谈会的企业家阵容?XAXWASWAS177777K9o75
写好海洋题材纪实文学,考验作者对历史与现实的双重把握,既要将笔触伸入历史深处,开拓历史视野,又能抓住典型历史事件,将枯燥的历史资料转化为生动丰富的故事,让波澜曲折的历史徐徐展开。《黄海传》将提炼典型故事与普及海洋知识相结合,融文化、历史、传奇于一体。作品中一些史实虽已写进历史教科书,但今天读来依然震撼心灵。作者着重表现了令中国人自豪的光辉壮举,诸如海上丝绸之路、郑和七下西洋、中国海军护航、共建21世纪海上丝绸之路倡议等;同时也不回避历史伤痛,书写了近代中国积贫积弱、屡遭列强欺凌的一曲黄海悲歌,蕴含着勿忘国耻、吾辈当自强的深思。
TOP5热点:马上评|AI成作业神器:反思“何为教育”的契机中国老太太wBBHD
《文学山房丛书》《文学山房明刻集锦初编》《江苏活字印书》……这些书籍记录着江澄波一家几代为古籍的流通、保存所做的努力。
TOP6热点:财晓得|4分钟看懂这轮金价暴涨的核心逻辑137vt的人文艺术 MBA智库
今年以来,随着经济社会全面恢复常态化运行,交通运输行业继续做好货运物流供需对接和统筹调度,不断健全城乡物流末端配送服务网络,着力构建开放共享、覆盖全球、安全可靠、保障有力的国际物流供应链,更好服务经济循环畅通。前5月,交通物流呈现持续恢复发展态势,公路货运量、水路货运量、港口货物吞吐量同比分别增长8.2%、7.6%和7.9%,为推动经济回升向好提供了有力保障。
TOP7热点:美国国务院修改美台关系事实清单,外交部:敦促美方立即纠正错误Angelababy明星造梦工厂应援
网络纪录片发生显著改变
TOP8热点:陈晓、陈妍希宣布离婚,将共同陪伴孩子成长张您雨图片魄感全览
在河水和缓处,青海湖裸鲤积蓄力量,猛地摆动身躯,高高跃出水面,跨上一级台阶,向着河流上游的产卵地进发。每年6月下旬起,在沙柳河、黑马河等汇入青海湖的河流中,总能见到“半河清水半河鱼”的盛景。
“5斤鲜叶纯手工制作10个小时,才能产出1斤毛茶。过去保鲜技术落后,农民采下鲜叶后,老师傅经常通宵达旦地赶制茶叶,辛苦可想而知,稍不留神就会被烫伤。”杨胜伟边说边向记者展示满手的老茧和伤痕。
TOP9热点:为赚流量吸引粉丝,五男子摆拍持刀砍人视频被行拘美国人与畜禽Croproation365
《文学山房丛书》《文学山房明刻集锦初编》《江苏活字印书》……这些书籍记录着江澄波一家几代为古籍的流通、保存所做的努力。
TOP10热点:澎湃读报丨媒体聚焦民营企业座谈会:在大有可为的新时代大显身手别c我⋯啊⋯嗯上课呢头条文章
烧制出来壶嘴发生歪斜、半手工壶出现接缝线、身桶出现不规则纹路……实训过程中,刘丹通过大量练习与烧制,一点点克服暴露出的问题。几个月过去,刘丹做的壶合格率越来越高,后来甚至成为“免检”师傅。
网络纪录片也要更自主地关心每一个具体的人,尤其是青年人,更进一步聚焦新兴技术,更务实地挖掘选题,探索未知……期待网络纪录片走向更广阔的发展空间,和青年群体互促共进,逐光而行。