泰山HB 板对比了DeepSeek和Ope泰山HB 板nAI的思考过程后,我发现咱家这个有点狠。_ZAKER新闻
对比了DeepSeek和Ope泰山HB 板nAI的思考过程后,我发现咱家这个有点狠。_ZAKER新闻
“施工千万条,安全第一条”。每一次不规范的施工和对安全的怠慢,都有可能酿成大祸。相关悲剧一再发生,相关常识也被重复了千万遍,唯有真正敬畏施工规范,敬畏安全,强化施工过程的监督管理,才能避免重蹈覆辙。
哥几个你敢信,咱 DS 哥( DeepSeek )这一波的影响力,到现在都还没有结束。让 AI 成为大家茶余饭后的谈资不说,还把对手们的安生日子搅的是天翻地覆,特别是 OpenAI ,恐怕是这次事变中,受刺激最大的一家公司了。( 英伟达除外哈 )要不然, OpenAI 也不会紧跟在 DeepSeek 后面发布 o3-mini 、免费开放 ChatGPT 搜索,奥特曼也不会亲口承认,在开源和闭源的选择上站错了队。不过世超原本以为,到这儿 OpenAI 估计也就消停一阵了,回去潜心修炼后面再憋个大的也不迟。但没想到, OpenAI 这次使的居然是连招。。是这样的,在免费开放搜索功能的第二天,世超就看到 OpenAI 公开了 o3-mini 的思维链。这个思维链( Chain of Thought , CoT )说白了,其实就是 AI 模型在回答问题之前,整个的思考过程。用户可以根据思维链的内容,看到模型的推理逻辑,并参与验证,相当于把黑箱透明化。就比如你问 ChatGPT 今天怎么不是周五,它能一顿分析推理,检查日期、公式计算,还对闰年的特殊情况进行了处理。但公开思维链的做法,也算不得什么新鲜事,毕竟人家 DeepSeek 早就有了。所以,世超这次顺手对比了下 o3-mini 和 DeepSeek R1 的思维链,结果发现这俩的 " 思考方式 " 还是挺不一样的。最明显的一点,就是 R1 想得多, o3-mini 想得少。正好今天周六调休,世超用同一个问题( 今天是周六,为什么还需要工作? ),来测试两个模型。咱们先来看 o3-mini 的回答,上来就猜用户的情绪,没有太多的分析过程,后面给出的几种原因也很简明扼要,只思考了 7 秒,就给出了答复。再看 R1 这边,思考的过程就非常详尽了。先分析问题的背景,接着考虑周六可能需要工作的原因,再去验证这些原因的可能性。等问题想清楚以后,该怎么回答,用什么语气。。。都包括在了 R1 的思维链里。当然,这样一顿深度思考下来,也确实花了不少时间,推理时长足足是 o3-mini 的 3 倍。从思考的内容上看,其实 o3-mini 和 R1 都考虑到了加班、所处行业、单休还有项目 deadline 等原因,但只有 R1 想到了,今天要上班可能是因为法定节假日调休。要不说,还得是咱们国内的模型呢。接着,我又问了俩模型一个有点绕逻辑的数学题。o3-mini 还是同样的用时短、话少,就是吧,里面那句 " 老板的损失不单单是水的售价 " 给我整不会了,有没有人能告诉我一下,这个水是从哪来的。。。但有一说一, o3-mini 的整个分析逻辑,世超觉着没有那么循序渐进。作为对比,大伙儿可以看看 R1 的思考过程。先明确正常情况下( 没有假币 )的收支情况,再通过整个交易过程的现金流入和流出情况,来计算总损失。另外, R1 在算出 80 元的实际损失后,还考虑到了包含预期利润的另外一种思路。虽说花了 48 秒,但 R1 的思考过程更完整,思维发散得更广,考虑到了很多细枝末节的东西。最后咱再来整个活,问问两个模型,如果我和它们的大老板同时掉水里了,会救谁。两个模型都知道自己没有物理实体,想救人也是心有余而力不足。但 o3-mini 的思维,世超觉着有点太一板一眼了,冷冰冰的直击问题要害。最后输出的答案,也在解释自己如果有能力的话,不会在两条生命中进行选择。相反, R1 想得就周全得多了,还知道我问这个问题是想测试它的反应、得到重视,连这个问题的文化背景都考虑到了。而输出的答案也假设了一波,当紧急情况发生的时候它会怎么做,再给我提了点应急建议,情绪价值算是到位了。当然了,这次测试并不是非要分出个高下来,让大伙儿了解两个模型思维链之间的差异就行。不过世超也注意到,国外有细心的网友发现, o3-mini 的思维链掺水了。。。在 OpenAI 的推文下面,有老哥对思维链的真实性提出了质疑,说现在的思维链只不过是原始思考过程的总结摘要。还有咱们开头提到官方的展示案例里, o3-mini 的思维链显示使用了蔡勒公式进行计算,却也没有具体的计算过程。很快, OpenAI 的研究员 Noam Brown 就出来实锤, o3-mini 的思维链确实不是原始的思维链。包括奥特曼本人也下场认锤,解释说是为了让思维链更具可读性。但评论区底下的网友可没那么好糊弄,毕竟 DeepSeek 那边不光免费,还公开了原始的思维链, OpenAI 这诚意明显不够啊。而除了过程的可读性外, OpenAI 的一众员工在 Reddit 答网友问的时候,也提到了一个点,公开原始思维链会导致竞争性蒸馏。说白了就是怕被抄呗。后续如果用户想看到完整的思维链,世超估计就得加钱才行了。不过有一说一, OpenAI 从 o1 藏得严严实实,到 o3-mini 半公开思维链,已经算是不小的进步了。世超原本以为, OpenAI 作为闭源阵营的长期支持者,会一条路走到黑,没想到被 DeepSeek 逼了一把,马上就乱了阵脚。盲猜他们后面在开源上应该会有不小的动作,说不定哪天开源阵营,就又要多一位强大的盟友了。koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:章汉夫
TOP1热点:针对某些集采药品可能存在质量风险等问题,国家医保局牵头调查:重点交流三方面情况
不会忘记老朋友,渗透在基辛格访华的每一个细节里。。
TOP2热点:特朗普称希望在上任后100天内访华,外交部回应
“决议”称,该项提案,关联董事余建华、万鹤群回避表决。独立董事甘耀仁未在规定时间内回复。其余董事赞成。表决结果为:通过。
TOP3热点:2024年公募“冠军基”四季度重仓AI算力及应用端,新进生益电子、水晶光电八戒,八戒影视剧在线观看
民警告诉他,让他慢慢说,把事情的来龙去脉讲一下。
TOP4热点:2025年地方两会带来哪些“民生礼包”?MD-190-6我是苏畅
在该殡仪馆内,一位遇难者家属告诉新黄河记者,他的女儿是当地二十八中学的初二学生,在三十四中学体育馆内训练时不幸遇难,年仅15岁。这位父亲告诉记者,23日傍晚,他从手机上看到学校出事的新闻后,迅速赶到现场。“我到学校以后都六七点钟了,学校都已经封锁了,只能干等,出来的几个学生都没有生命迹象。”24日零时许,他的女儿被救援人员发现,随即被送往齐齐哈尔市第一医院。“(凌晨)2点多,我们得到通知,说孩子已经不行了,其实送来(医院)时就已经不行了。”
他和娇娇说两个人不联系了,对于王超来说,娇娇只是他生命里的一个过客,他和娇娇的事情就这样结束了。
TOP5热点:大学生开钟点房洗衣服被吐槽“薅羊毛”?酒店回应妻子6免费的电视剧完整版韩剧网
根据记者多方核实,受伤人员为该校女排队多名女队员和教练。事发前一天,该校官微刚刚公布了该队在省学生运动会中获得亚军的好消息。
在2018年之前,央行的党委书记和行长都是由一人担任。2018年3月,易纲出任央行行长、党委副书记,郭树清担任央行党委书记、副行长。
TOP6热点:推动中长期资金入市,六部门联合印发实施方案和老板出差住同一间房怎么办
有媒体指出,排雷工作不仅进度缓慢且成本高昂。有专家估计,在当前情况下,若派出500个排雷小组,也需要耗时757年才能完成乌克兰全境的排雷工作。此外,美国已承诺就乌克兰的排雷问题投入超过9500万美元。不过根据世界银行预测数据显示,乌克兰的排雷成本为每平方米2至8美元。未来十年,用于该国排雷行动上的花销可能高达374亿美元。
TOP7热点:汕头一女子称因未婚生育被认定为“出嫁女”,当地回应:正调查处置我是你爸爸语音播放
阿斌向家人求救的聊天记录。受访者供图
在园区,阿斌要先接受培训,学习使用诈骗软件和话术。直到3月31日,他才在厕所找到机会,用偷偷藏下的另一部手机,与家人取得联系。电话那头,哥哥让家人想办法救他回去。
TOP8热点:存款80万元到期取不出来?工行:客户转账80万至第三方公司账户用于投资唐朝国际最新二维码
2015年9月,第七届中日韩央行行长会议在土耳其安卡拉举行,时任中国人民银行行长周小川出席。
TOP9热点:台湾台南市6.2级地震已致15人受伤京东影业在线观看的成功之路
她没想过要杀死老郭,毕竟老郭还是很爱她的,他们同居了6年了。
公开信息显示,坍塌体育馆建筑面积约1200平方米,墙体为网架结构,顶棚为混凝土板。馆内拥有300多个座位的观众席,1间健身房,1间淋浴室,1间洗手间,2间办公室,篮球场、排球场、羽毛球场、乒乓球场地。
TOP10热点:加沙停火协议达成后,中东问题特使翟隽穿梭访问以、巴subwaysurfers老版
2022年8月7日,吉林电视台《守望都市》栏目曾报道过发生于该公寓处的另一起高空抛物事件。据报道,李女士在经过长春市红旗街万达广场2号门时,楼上突然掉落了一个大水桶,掉落的位置离她仅有不到一米的距离。
李春生执掌广东警界期间,2013年12月,他曾指挥剿灭广东“冰毒教父”蔡东家团伙,该案件后来被改编拍摄成电视剧《破冰行动》。