越南14MAY18_XXXXXL56ENDIANAI搜索大热,谁走越南14MAY18_XXXXXL56ENDIAN在最前面?_ZAKER新闻
AI搜索大热,谁走越南14MAY18_XXXXXL56ENDIAN在最前面?_ZAKER新闻
汪文斌说,金砖国家应有关国家请求作出扩员决定,符合新兴市场和发展中国家的共同愿望,顺应世界多极化的历史潮流,我们将携手金砖伙伴推动“大金砖合作”不断取得新成果。
出品|虎嗅科技组作者|余杨编辑|苗正卿头图|视觉中国最近打开 AI 新闻,大块的版面都和 AI 搜索相关,AI 巨头们,从文生视频的 Sora 卷到了搜索界。这让我想起前几天我难住了 Kimi 的一个问题。即:100ml 咖啡粉大约是多少 g 咖啡豆。是这样的,双十一我买了一包 250g 的咖啡豆,到咖啡店磨成粉来做手冲,我朋友想尝尝,并且一定要和我 AA,但我们没有秤,没法计算。最终 ta 拿来一个 ml 计量的容器,装了 100ml。于是我准备偷个懒问问 Kimi,Kimi 给完答案,我当场截了屏。Kimi 阅读了 35 个网页告诉我,100ml 的咖啡粉大约对应于 285.71 克的咖啡豆。 而我买的咖啡豆,一共 250g。我表示这太难了,再三劝说朋友,ta 最终放弃了和我 AA。因此,今天写测评,我将把 " 难题 " 作为 prompt,来测评一下 AI 搜索哪家强。prompt:100ml 咖啡粉大约是多少 g 咖啡豆?参赛选手则包括月之暗面 Kimi、字节豆包、秘塔 AI 搜索、Perplexity 和 ChatGPT。月之暗面 Kimi首先我们再给 Kimi 一次机会,此次使用的是 Kimi 探索版,主打解决复杂的搜索问题,大约 15 秒后,Kimi 给出了自己的答案。在 Kimi 的陈述中,100ml 咖啡粉前面需要 20g 咖啡豆,后面需要 67g 咖啡豆,这让我感到,它没有理解这 100ml 究竟是咖啡粉还是制作出来的咖啡。再看 Kimi 的工作流程,它搜索了我的问题,灰色字显示,Kimi 采用的是关键词搜索方法。在右侧的搜索栏中,Kimi 搜索到最多的是咖啡的粉水比,文不对题,有一种上帝视角给出答案,但是没有具体路径的即视感。这让我多少有点失望。我调整了自己的措辞又试了一次。打开一个新的对话,依旧使用探索版,将 prompt 改为:把 250 克咖啡豆磨成粉,用来做手冲咖啡,取出 100 毫升咖啡粉,请问这 100ml 咖啡粉是由多少克咖啡豆制成的?Kimi 看似开始向答案靠近,右侧的搜索栏也看起来逐渐正确,但我点开右侧的链接,前 5 个链接里都找不到 Kimi 所参考的密度信息。另外,前三个链接都来自一个咖啡爱好者分享的帖子,信息来源的可靠性,大概确实是:内容由 AI 大模型生成,请仔细甄别。字节豆包豆包的左侧功能区为 AI 搜索专门留出一个模块,输入 prompt 后,它在 8 秒钟左右给了我答复。虽然豆包的工作流程也是理解问题 - 搜索网页 - 找到来源 - 总结陈述,但从结论上看,豆包一开始就没有理解问题,而是根据搜索到的信息交出了一份潦草答卷。值得表扬的是,豆包在总结文本中添加了来源引用标注,使文本更加有路可循。那么让我们也对豆包友好一点,打开一个新的对话,使用更为确切的 prompt,搜索一下:把 250 克咖啡豆磨成粉,用来做手冲咖啡,取出 100 毫升咖啡粉,请问这 100ml 咖啡粉是由多少克咖啡豆制成的?豆包表示,由于缺少咖啡粉的密度数据,无法直接换算出对应的质量,搜索的网页数量,从 5 变成了 6,有所进步但仍显怠工。于是,我尝试了深入搜索,等待了 30 秒,豆包输出了 1500 字长文,向我讲了许多道理。其中包括 250 克咖啡豆磨粉后的粉量范围、手冲咖啡用的咖啡粉量估算等等信息,但都没有毫升和克重的换算。秘塔 AI 搜索秘塔 AI 最近风很大,此次经过 16 秒左右的等待,秘塔交出了自己的答卷。 不得不说,秘塔 AI 的表现令人惊喜。不仅在文本陈述中展现了搜索的完整路径,还精准地锁定了我的问题所对应的字节,给出了相应的答案。这像极了人类使用搜索引擎查找信息的过程。在秘塔的搜索栏中,还给出了全网、文库、学术、图片、推荐几个板块,适应不同搜索类型的需求。另外在右侧可以看到,秘塔甚至做好了下一步替我生成 PPT 的准备。总的来说,秘塔 AI 展现了优秀的问题理解能力,我也无需再进一步明确 prompt,流畅直接。PerplexityPerplexity 是一家总部位于美国的 AI 初创公司,创立于 2022 年,公司创始人阿拉温德 · 斯里尼瓦斯来自 OpenAI。据悉,Perplexity 在 AI 搜索领域表现出色,尤其是在答案引擎方面具有显著优势。2023 年 10 月,Perplexity 完成了一轮融资,估值达到 5 亿美元。此外,软银集团愿景基金二期计划向 Perplexity 投资 1000 万至 2000 万美元,对 Perplexity 的估值为 30 亿美元。最近,Perplexity 正在进行新一轮融资谈判,希望将其估值增加一倍以上,达到 80 亿美元或更高。Perplexity 在 8 秒钟即给出了答复。但从答案看来,Perplexity 也认为我要喝 100ml 的咖啡。考虑到中英文理解的难度,我修改 prompt 试试看:把 250 克咖啡豆磨成粉,用来做手冲咖啡,取出 100 毫升咖啡粉,请问这 100ml 咖啡粉是由多少克咖啡豆制成的?Perplexity 的答案立竿见影地好起来了。ChatGPT再看 ChatGPT,输入 prompt 后,ChatGPT 在 13 秒左右给出了我答案:ChatGPT 活狠话不多,答案简单明了。首先是理解问题的能力硬挺,其次算法逻辑在 5 位选手中是一股清流,而数值和上文虽然相差较大,但也在波动范围内。似乎也不需要我再进一步明确 prompt 了。AI 搜索 vs 传统短查询此次测评所选取的 prompt,指向的是近期 AI 领域大热的数学推理能力和 " 搜索引擎替代说 "。10 月 31 日,OpenAI 发布了 ChatGPT Search,引发世界热议,即生成式 AI 是否将就此改变人们获取信息的方式?谷歌(Google)作为传统搜索引擎更是首当其冲,许多人认为 OpenAI 的搜索引擎或将成为未来的 "Google 杀手 "。国内多款大模型也先后推出 AI 搜索版,它们可以直接提供实时答案,帮助用户避免浏览大量广告和 SEO 优化的文章,快速找到所需信息,并以相对简洁的格式呈现答案,同时附上信息来源的链接,引用的标注也可以对 AI 生成的文本进行快速校验。但是无论哪一家,离技术成熟都还有很长的路要走。这不仅仅是 AI 不够 " 聪明 " 的问题。更深刻的问题在于,AI 搜索使用的是关键词搜索,而传统搜索引擎如 Google 最常使用的功能是导航型检索(navigational queries)。四个字以内的简短查询占据了 Google 搜索的大部分,这些通常是用户知道但懒得逐字输入的网址,或者只是通过关键词快速找到目标网页的搜索。比如 " 上海天气 "、" 白色 T 恤 "、" 咖啡馆营业时间 "、" 附近自习室 " 等等,这些查询让谷歌成为数十亿网民上网的入口。我输入 " 白色 T 恤 " 想购物,但豆包给我解释了几种白色 T 恤的款式、面料和设计。大语言模型可能并不适合处理这些短提示。它通常需要完整的问题才能有效回答,因为完整问题能创建强有力的统计模式。AI 搜索并不了解,搜索 " 白色 T 恤 " 的人可能是想购物,而不是了解这种衣物的材质。对于这些问题,用户可能需要像我修改 prompt 那样,一遍一遍地具体化和精确化。OpenAI 发言人 Niko Felix 在一份邮件声明中表示:" 使用 ChatGPT Search 时,我们观察到用户比以往使用其他搜索工具时更倾向于以自然语言提问。同时——网络导航查询——通常较短且相当常见。我们计划随着时间的推移改进这些查询类型的体验。"Perplexity 也曾被吹捧为 "Google 杀手 ",但它在短查询上也遇到了同样的问题。Perplexity CEO Aravind Srinivas 曾谈起用户对其产品与 Google 搜索的不同使用方式," 在 Google 搜索中的查询字数中位数在 2 到 3 之间,而在 Perplexity 上则在 10 到 11 之间。所以显然,用户在 Perplexity 上直接提出问题的频率更高。而在谷歌上,用户通常输入几个关键词快速找到特定链接。"但换个角度看,这意味着,AI 搜索在回答长问题时表现相当不错。类似 " 美联储继续宣布降息,对全球经济将产生什么影响?" 这样的复杂问题,谷歌往往难以回答,而 AI 搜索可以快速从多个网站获取信息并提供一个合理的答案(Perplexity 在回答此类问题方面也表现出色)。要真正替代 Google,AI 搜索需要改进人们日常生活中更常用的短查询。但问题在于,AI 搜索为何非替代 Google 不可呢?AI 搜索在提供被传统搜索掩盖的信息方面填补了一个新空白,这本身是有价值的。深耕知识性长问题,掘一口新井,又有何不可?koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:赵德茂
TOP1热点:筱婷 妈给录着呢
南非的亚洲及金砖事务特使苏克拉尔(Anil Sooklal)周五接受采访时说,五个受邀国派出高级代表参加了本月早些时候在南非德班举行的金砖国家协调人会议,他们全面参与了这次会议,“这清楚表明他们已经接受了邀请”。他透露,新成员国还将派官员参加1月30日在莫斯科举行的协调人会议。。
TOP2热点:筱婷 妈给录着呢
据《内蒙古日报》消息,<strong>在伊利集团设立武装部,建设一支“平时服务、急时应急、战时应战”的国防力量,是内蒙古自治区党委和政府贯彻习近平强军思想的重要举措,也是内蒙古自治区国防体制改革的重大实践。</strong>
TOP3热点:微博之夜明星互动片多多免费观看
全会的主要任务包括审议《中共重庆市委关于深入贯彻落实习近平总书记重要指示精神奋力实现“三攻坚一盘活”改革突破的意见》,全面部署重庆市深化机构改革任务,<strong>深入推进国有企业、园区开发区、政企分离改革攻坚,全力推动国有资产盘活。</strong>
如何进一步完善转移支付,是新一轮改革要解决的另一重要问题。当前,中央对地方转移支付规模过大,且每年都在快速增加,趋势难以持续。
TOP4热点:沈腾踢了一脚马丽的裙子TOBU16
中国第三艘航母福建舰,于2022年6月17日下水。一年多以来,福建舰备受关注,在2024年1月2日的《新闻联播》中,福建舰再现身影。
英国路透社1月2日发布简短消息,称泰国总理赛塔当日告诉媒体,泰国和中国将从3月起实施针对两国公民的永久互免签证安排,这将提升泰中两国之间的关系。
TOP5热点:我的紫在哪 我的昕在哪刻晴大战史莱姆外网免费
过去一年,我国科技创新实现新的突破,一个个“大国重器”惊艳亮相,《国家创新指数报告2022-2023》显示,中国创新能力综合排名上升至第10位,是唯一进入前15位的发展中国家,向创新型国家前列进一步迈进。下面跟随记者的镜头,一同重温2023年“大国重器”的惊艳时刻。
近期,一场“今冬以来最强”雾、霾过程 “跨年”影响我国华北、黄淮、江淮等地。2023年12月27日至今,大雾预警已连发8天。
TOP6热点:西藏13岁姑娘叮嘱武警姐姐休息上边一面亲下边一面膜的作用
米莱此前表态称要拒绝与中国、巴西和俄罗斯合作,转而支持与美国、以色列加强关系。彭博社称米莱是“政治门外汉”,他的竞选活动以激进的自由主义政策方向和“特朗普式”言论为标志,出人意料地当选了阿根廷总统。但随着米莱逐渐从竞选状态切换到阿根廷候任总统身份,美国彭博社发现,“米莱语气软化,显示阿根廷有多需要中国。”
TOP7热点:虞书欣又当站姐了扑克牌视频不盖被子
顶端评论员认为,2024年春节前,各地应以全国人大法工委的声音为契机,尽快修改相关规定,终结全面禁放。#全面禁燃烟花爆竹不合法#
TOP8热点:白鹿 怪不得我们四个总被黑八重神子去内奖励旅小女孩
如刘思敏所说,服务意识是长期形成的。短期集中为旅客作出改变的“讨好型市格”,也许能解一个季度旅游旺季的燃眉之急,但只有建立更加平等的“友好型市格”,才能让网红城市走得长远。
TOP9热点:倪妮张婧仪同框WNTPPS偷窃小便
<span>其次,证明中国的反间谍工作是卓有成效的。打掉了美国的在华间谍网,并让它在10年期间不能重建,这是反间谍工作的一大成果,让美国在中国筑牢的反间谍安全长城面前摔了大跟头。中国修订反间谍法曾引来美西方舆论的口诛笔伐,现在看来是想让中国尽可能地撤掉防卫,最好让他们的间谍到中国如入无人之境。好在中国不会上这样的套。中国过去能防住,将来也有能力让美国中情局的间谍渗透成为无用功。</span>
TOP10热点:微博之夜短片 宏大叙事家国情怀男人的坤坤升到女人的坤坤
3月14日,“十三五”国家重大科技基础设施高能同步辐射光源(HEPS)直线加速器实现满能量出束,成功加速第一束电子束。高能同步辐射光源从此进入科研设备安装、调束并行阶段。12月11日,HEPS储存环最后一台磁铁安装就位,标志着HEPS储存环主体设备安装闭环。