高限HAI搜索应该显示几条高限H结论?_ZAKER新闻
AI搜索应该显示几条高限H结论?_ZAKER新闻
亚太新机遇,全球最大自贸区启动。由中国与东盟十国、日本、韩国、澳大利亚以及新西兰15个国家共同签署的《区域全面经济伙伴关系协定》(简称“RCEP”),自2022年1月1日起对签署国陆续生效。一年多来,在这个区域里的微观和宏观变化正在发生。2023年8月22日,由第一财经携手大华银行中国出品的《促融合增动能——RCEP落地观察报告》正式发布。想要了解报告的精华内容,欢迎观看视频,也可扫描结尾二维码下载具体报告内容。我们期待联结东盟内外力量,缔造个人与企业美好的未来。
本文来自微信公众号:王智远,作者:王智远,题图来自:AI 生成使用 AI 搜索时,我注意到一个问题:不同 AI 搜索产品给出的答案数量参差不齐,有的比较简单,一两句话总结;有的比较复杂,结构化呈现 5~6 条,没一个能用的。这让我好奇,AI 搜索结果,到底展示多少条合适?要不要结构化?多少条是人们接受的?带着问题,我进行了测试和调研。先说结论:最满意 Kimi.AI 和知乎直答。为什么呢?测试部分,我问 Kimi 探索版,AI 搜索应该显示几条内容?它搜索 39 个网页后,给出的结论只有 5 句话,即:搜狗搜索每页显示 10 条结果,最多可以设置为 100 条;百度搜索可以提供 10 条、20 条或 50 条内容,数量取决于用户选择。必应则说自己有置顶框,会展示 AI 总结和相关链接。perplexity 只呈现五六条结果;360 AI 是通过答案再提供 20 到 30 条信源链接。从 Kimi 的回答结果看,搜狗、百度的结论是基于传统搜索引擎,而必应、perplexity、360 可能是基于 AI 的。带着问题,我又问了腾讯的 ima.copilot,这是一个笔记软件,能搜索所有公众号内容;我说:AI 搜索应该显示几条内容?它提到结果呈现方式取决于搜索目的、用户需求、内容类型和 AI 算法性能;百度一般显示 10 条结果,最多 100 条;Google 可以在 10 到 100 条之间显示,根据用户需求决定。不过,它的答案的确很繁琐,结构化了还很长,以上都是我帮它优化后的。接着,我测试了知乎知答。答案很简单,只有 4 句话:AI 搜索内容不固定,由算法根据用户最有价值、最相关的结果决定;搜索引擎的目标是提供最相关的结果,数量从几条到几十条不等,同时考虑用户体验和多样性。比如:谷歌搜索可能显示 10 条结果,并提供下一页链接以浏览更多内容;AI 搜索工具会挑选最重要、最合适的内容,关键在于质量而不是数量(这个例子是知乎直答答案中的)。然后,我测试了文心一言,它给出 5 条结构化内容。不同的是,它比较模棱两可;它说,答案数量取决于用户需求、搜索上下文、设备和界面、算法与性能以及用户体验,并且会根据这些因素动态调整。微信的 AI 搜索自然也不能放过,它的 AI 在 " 搜一搜 " 里,相对隐蔽。我测试了几个问题,发现微信搜一搜的 AI 生成式答案相对简单直接。我搜索 " 王智远是谁 " 时,结果显示王智远是个多才多艺的人,有多种身份,包括一级建造师、艺人和商业创作者,每个身份都有进一步的 5 点介绍。综上认为,Kimi 的答案结构化,且简洁有力;知乎知答则更为直接,没有列出具体条数,但直接给出了答案;相比之下,文心一言的回答与问题的相关性较弱,微信搜一搜则更注重直接陈述。对比不难看出,AI 搜索给出的答案,大致分为两类:一,简洁明确的;问题和答案匹配,不拖泥带水,二,切题详实的,AI 会围绕答案展开很多讨论;这些讨论看似正确,实际上只有一部分对用户有帮助。为什么会这样?带着好奇,我询问了身边两位技术朋友:他们说,可以从问题理解、技术逻辑和使用体验三个角度来看。首先,使用 AI 搜索,不能指望它像人类一样理解我们。聊天时,我能知道你的过去、经验和外貌,但 AI 做不到。AI 更像一个 " 缸中之脑 "(Brain in a Vat)。这个概念有点奇怪,就像一个人的大脑被放在装满营养液的缸里,通过电脑来操纵,让它感觉像人脑一样。实际上,AI 的模型像大脑,外部信息像营养液,我们给 AI 一个问题,它会在各种知识库中搜索,然后整合信息找到答案。因此,它对问题的理解是基于大量数据做出的平衡,平衡什么呢?就是那些被大量点击的,或者相对准确的信息,有些模型为了准确性,自然会选择呈现多一些内容。其次,从技术角度来看,当你输入一个问题后,AI 会捕捉这个问题,利用搜索引擎,比如 Google,或者一些第三方服务来寻找答案。AI 会用一种叫 embedding 的技术来处理搜索结果,这个技术就像给结果排序和分类,让它们更容易管理;最后,AI 会使用 RAG 技术,从众多网页中挑选出与你问题相关的信息,再通过一个大型模型整合这些信息,最终给出答案。很多 AI 搜索产品不会自己建立搜索引擎,因为成本太高了,爬取 5000 万个网页可能需要花费一两百万人民币,而且爬取的内容还需要进行安全检查。现在大型搜索引擎拥有的网页数量是以千亿计的,这是多年积累的结果,从时间和金钱来,一般创业者难以承担。所以,AI 搜索找到网页内容后,会把它们按照段落、句子切成小块,这样处理更方便,那么,很自然地如果问题很长,答案可能也会很详细;如果问题很短,或者一个词有多个解释,它也可能给出很多相关的信息。这就像找东西,一个词能引出很多相关内容。朋友还说,针对一个问题,AI 给的答案比较丰富,也取决于生成式(generative)和交互式(interactive)。什么意思呢?AI 搜索系统本质上是一个问答系统,它的答案和传统检索方式有很大区别。传统检索只是把相关网页展示出来,而生成式可能返回一个文档或一组链接,这样用户可以直接获取所有信息,不用再从多个来源中筛选总结。这种技术有创造性,因为它要理解你的语料后,再给出答案。所以,虽然有些内容可能我们不需要,但这些多余的内容能增强人与 AI 的互动性。比如说:你问 " 如何提升工作效率?",AI 可能会先给你一个常见的几条建议,比如设定清晰目标、合理分配时间等。但它还可能进一步提到一些新工具或方法,类似于 " 你可以尝试使用时间管理工具,如 Notion 或 Todoist,它们能帮助你更好地安排任务 ";这样,你会因为这些额外的信息对某个工具产生兴趣,从而进行下一次的搜索。问题是:我们真需要那么多答案吗?我从体验角度做了样本测试。有些人说:用 AI 搜索时,喜欢先看到结论,再看过程,这样能让他们更快地找到想要的信息。虽然 AI 能提供很多长文本,但并不是每个人都想要,就像一个知识渊博的人能讲很多,但并不是所有内容我们都感兴趣一样。你要不明白,就想象一下,在工作中,如果领导问你事情办得怎么样,你先说一大堆过程,最后才说没办成,领导肯定不高兴,相反,先告诉领导结果,再详细说过程,这样更好。但也有人觉得,AI 搜索显示的内容越多越好,因为这样可以学到更多知识,提高找信息的效率。比如:我问一个问题,可能还没完全想清楚,如果 AI 能展示很多内容,有些反而会激发我的好奇心,这种好奇心再次引导我探索更多不同的解决方法。然而,实际情况是这样吗?虽然历史上没有人专门研究 AI 搜索结果,但我查了一些关于传统搜索引擎的用户调研。到了 2024 年,谷歌搜索的用户调研显示,排名第一的链接点击率高达 39.8%,第二名是 18.7%,后面的点击率会越来越低。这说明用户更关注搜索结果页面靠前的链接,越往下,关注度就越低 [ 1 ] 。统计数据还显示,75% 的用户从不浏览搜索结果第一页之外的内容,只有 0.78% 的用户会点击谷歌第二页的结果。而那些直接显示答案的精选摘要(Featured Snippets),在 2018 年初的出现频率约为 12%,到 2020 年初增长到了约 16% [ 2 ] ;这意味着在搜索页面上,直接展示答案可能减少了用户对更多搜索结果页面的需求。换言之,用户愿意直接获取答案,不想浏览无关信息。我也读了谷歌核心工程师玛丽莎 · 梅耶(Marissa Mayer)的一些用户调研。她说:很多用户告诉她,他们希望每页能看到尽可能多的结果,20 个不够,25 个也不行,最好是 30 个;但当她观察用户的实际行为时,发现了一个不同的趋势:用户其实更喜欢每页显示较少的结果。当搜索结果数量在 10 到 20 之间时,用户的点击率会急剧下降。当每页显示 25 个结果时,点击率下降得更多,而当每页显示 30 个结果时,情况最为糟糕。最后,梅耶决定每页显示 10 个搜索结果,这个决定也被谷歌一直沿用至今。所以,这个结论是:用户在 AI 搜索时,往往只关注一个屏幕内的内容;如果这一屏的前面就能完整呈现结论,他们就能获取所需要的结果,而后面的内容,对他们来说,可能就没那么相关了。问题是,为什么人们说的话和实际行为不一致呢?我们总说想看到更多内容,但当 AI 搜索结果真的呈现大量内容时,却不愿意花时间去看?经过长期使用 AI 搜索,我找到了答案:速度。很多人没有意识到,大量搜索结果会干扰我们的认知,影响体验。举个例子:我尝试了 Kimi 和天工 AI 的探索版,当我问它们一个心理学研究的问题时,一个给了简短有力的答案,并适当引导我去网页查看更多。另一个却给了很多内容,要我先浏览再点击链接查看;相比之下,后者让我感到选择困难,甚至觉得大脑负担加重,而前者的信息,让我获取得更直接、更方便。扎克伯格在 Facebook 早期发展时,也遇到过类似情况。当 Facebook 从哈佛扩展到耶鲁和哥伦比亚大学时,学生们一开始表示怀疑,甚至有些嘲讽,尽管他们抱怨,但没人真正删除信息或停止使用,反而使用频率增加了。扎克伯格得出结论:" 人们并不擅长预测自己对新事物的反应。"Facebook 的成功证明,用户可能对新事物持怀疑态度,但最终会喜欢成为其中的一部分。很少有人能清楚表达自己的真实需求,尤其是在面对未知的新事物时,语言可能会骗人,但行动不会,因为行动的代价比语言更大。在产品开发中,我们常听到一句话:" 不要听别人说什么,要看他们做什么。" 这句话同样适用于 AI 产品,用户可能会说他们想要更多功能或选项,但他们的行为表明,很多人更喜欢简单快捷的解决方案。所以,有两个结论:一,AI 搜索一开始不要展示太多内容,搜索引擎应该先直接给出答案,然后,逐步引导用户探索,这样更合适。二,AI 越专业,答案越简洁,长文本能力应该用在解释过程上,而不是直接给答案。你认为是不是这样?AI 搜索后,你期望看到几条结论?研究参考:1.WSR 团队 . ( 2024 ) . 30+ GOOGLE 搜索引擎统计数据和趋势 [ 2024 年更新 ] .2. 谷歌洞察 . ( 2024, March 8 ) . 用户搜索行为分析 .本文来自微信公众号:王智远,作者:王智远koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:冷德友
TOP1热点:学生党手机副业推荐
陈洋:这两个核事故有可比性。个人觉得福岛核事故没有切尔诺贝利事故严重,但福岛的后续影响比较多,特别是这次核污染水排海,将持续30年,这对人类健康福祉和全球海洋生态带来的影响是难以估量的。。
TOP2热点:哪咤汽车
她说:“他们(雇主)付的钱更少,要求却越来越高。”(小小)
对于银联时隔十多年再增资,业内认为,处于银行卡产业核心和枢纽地位的中国银联,通过增资将进一步增强资本实力,备战新的业务版图和全球业务竞争。
TOP3热点:知乎写小说盈利吗CHINESE篮球体育生白袜腹..
针对ISV生态产品研发及赋能,用友网络客户技术方案与赋能部总经理李绍文为在场伙伴带来前沿分享。
同样受到“小作文”影响的还有智飞生物。其疫苗业务以HPV疫苗、肺炎疫苗等为主。生物制品业务于2022年为公司贡献了382.6亿元,综合毛利率为33.63%,占总营收的99.9%。
TOP4热点:哪吒汽车称官网已恢复正常并已取证倒闭谣言407宿舍(双/3/p)懒得取名字
盘面上,水产品、煤炭、食品安全、传媒娱乐等板块相对活跃,通信设备、家居用品、超导概念、航空等板块跌幅居前。
TOP5热点:周琦cba生涯盖帽数追平姚明打开扇贝就可以吃火腿肠
专业级VR/MR硬件和软件提供商Varjo最近宣布将其MR和沉浸式视觉效果与NVIDIAOmniverse相结合,NVIDIAOmniverse是NVIDIA用于开发统一3D工作流程和基于通用场景描述(OpenUSD)应用程序的平台。Varjo表示,其XR技术与Omniverse平台的结合将为XR开发者和用户解锁高保真照片级真实感和实时光线追踪功能。
TOP6热点:勇气翻唱JMCICON官方入口下载地址
另外大家最关注的问题,就是
下一步,中国互联网金融协会将在人民银行的领导下,在国标委和金标委的指导支持下,加强对以上已发布的4项金融国家标准的宣传培训,通过协会自律管理、检测认证等方式促进标准的贯彻实施。
TOP7热点:年味,也可以是桔子味的来嘛我想要
首席技术官TaylorGordon拥有20多年编程经验,曾在FacebookAI、Instagram和YouTube担任工程师;CPOJoeyFlynn曾在Facebook和Instagram担任设计师。
TOP8热点:趁过年,给父母换「大件儿」八重神子开襟大欧派乳液SS
到2030年,新型基础测绘体系、实景三维中国、新一代地理信息公共服务平台(天地图)全面建成;测绘地理信息数据基础制度基本建立,数据要素市场配置机制基本形成;测绘地理信息安全屏障更加牢固,支撑经济社会高质量发展能力明显增强。
TOP9热点:全面取消在就业地参保户籍限制夹玉器一天都不能掉出来
《收获日3》是一款非常受欢迎的游戏,新的官方宣传预告进一步激发了玩家们的期待。预告片中展示了游戏的新特性和玩法,让人对9月21日的上线充满了期待。
TOP10热点:最具「质价比」的游戏笔记本推荐公的浮之手中字
据悉,NVIDIA的深度学习超采样技术(DLSS)即将升级至3.5版本。据了解,DLSS3.5将主要专注于光线重建技术(RayTracingReconstruction,简称RR),这种新技术相较于传统的去噪技术,能够提供更加优秀的视觉体验。据披露的数据显示,DLSS3.5的光线重建技术的训练数据量将是DLSS3的五倍。这意味着,通过更多的训练和合并额外的游戏、软件引擎数据,DLSS3.5能够识别出更多种类的光线追踪效果。另据消息,NVIDIA已经确认DLSS3.5将于今年秋季正式推出,并将在《赛博朋克2077:往日之影》、《传送门RTX版》以及《心灵杀手2》等游戏中率先应用。这无疑将为玩家带来更为出色的游戏体验。