扒开老女毛荫荫的黑森林视频_金融新闻_遭G扒开老女毛荫荫的黑森林视频PT-4o碾压,豆包们直面语音AI生死战_ZAKER新闻

扒开老女毛荫荫的黑森林视频遭G扒开老女毛荫荫的黑森林视频PT-4o碾压,豆包们直面语音AI生死战_ZAKER新闻

扒开老女毛荫荫的黑森林视频遭G扒开老女毛荫荫的黑森林视频PT-4o碾压,豆包们直面语音AI生死战_ZAKER新闻

遭G扒开老女毛荫荫的黑森林视频PT-4o碾压,豆包们直面语音AI生死战_ZAKER新闻

  张凯回忆,疫情之前,他们全世界各地带团跑,一年能挣上几十万,常去丹麦、瑞典、挪威、芬兰等北欧国家,一般每年4月到10月是旅游旺季。

文 | 科技新知 ,作者丨廖政   编辑丨蕨影最近,语音 AI 这个赛道,又被 OpenAI 搞火了。就在 9 月 25 日,GPT-4o 高级语音终于开始全量推出,Plus 用户一周内都能用了。在 OpenAI 的移动端 APP 上即可体验!讲真,这是 AI 渐冷的日子里,为数不多的 " 高光时刻 "。此外,还带上了一些更新,增加自定义指令、记忆、5 种新的声音和改进的口音。与标准语音模式进行区分(黑色旋转球),高级语音将以蓝色旋转球表示。并且,其中还包括对诸如重庆话、北京儿化音等地域性方言的精准模仿,可以说是学嘛像嘛。在消除语音机械感的同时,用户不仅可以随时打断通话,即使不和它说话时,它也能保持安静,一旦有任何问题可随时向它提出。从总体上来说,这次语音 AI 的更新,让 GPT-4o 的交互越来越有 " 人味 " 了。不过,早在 GPT-4o 的实时语音功能推出前,国内的一批大厂,就已经率先开始了对语音 AI 这块高地的争夺,其焦点也是冲着 " 实时交流 "" 真人化 " 等方向去的。至于结果…… 只能说,在 " 徒有其表 " 的模仿下,国内的语音 AI,离真正通用且泛化的人机交互方式,还有相当一段距离。Part.1  短板暴露在 AI 时代,语音 AI 最大的意义是什么?对于这个问题,科大讯飞给出了一个具有全局性的答案:语音平台可能成为未来物联网的 " 操作系统 ",换句话说,就是当物联网将所有的设备都能联网后,什么智能硬件、自动驾驶汽车、消费级机器人等等,都是潜在的应用场景。到那时候,要想让这些设备能听懂人话,那就得靠语音平台了。但是,虽然总的思路挺有格局的,但在具体实施的手段上,讯飞这样的大厂却走了一条" 自下而上 " 的路线。大体意思是,在语音 AI 生态的构建上,讯飞这几年基本上是从行业场景一个个往下打,像教育、医疗、政务这些场景,都是它们重点发力的地方。从总体上看,讯飞的策略是先抓住这些垂直领域,通过提供专用解决方案来逐步累积数据和优化算法。这个做法有个好处,就是每个场景里,讯飞可以做得很深、很专。举例来说,讯飞在 2022 年推出了 " 讯飞医疗 AI 医生助手 ",这款产品能在病历记录、辅助诊疗等方面提供语音输入和智能建议,帮助医生减轻文书工作压力。类似的例子,还有讯飞在 2023 年推出了 " 智慧课堂解决方案 ",旨在通过语音识别和评测技术,帮助教师进行实时的课堂互动与教学反馈。在这些垂直领域,星火的定制化方案,确实解决了很多行业痛点,也使得讯飞能够在激烈的市场竞争中保持行业的龙头地位。在 GPT-4o 推出语音演示功能后,讯飞的星火大模型,也紧随其后,推出了同样能够极速响应、自由打断,且能在各种情感、风格、方言随意切换的语音 AI。然而,对于构建能够 " 统一调度 " 的大平台级别的语音 AI 来说,除了做到布局广,且 " 说话流畅 " 之外,还有至关重要的一步。那就是:实时状态下的语音 AI,究竟能否帮助用户解决一些较为复杂的需求?关于这点,我们对讯飞的星火大模型进行了一次测试。左右滑动查看更多左:纯文本状态下的回答,右:实时语音状态下的回答例如,在询问开封有哪些著名景点时,讯飞的实时语音 AI,虽然回答得很流畅,但答案却较为简单,比纯文本状态下省略了很多内容。那造成这种差距的关键原因是什么?其实,对于 GPT-4o 这样的语音 AI 来说,除了确保通话流畅的 RTC 技术外,其背后还有一种关键的技术。这就是端到端的语音大模型。在以往的 AI 语音交互中,语音的处理大致分成了三个步骤。传统的 STT(语音识别,Speech-to-Text)-LLM(大模型语义分析)- TTS(文本到语音,Text To Speech)三步走的语音技术。这样的技术,特点是成熟,但反应慢,缺乏对语气等关键信息的理解,无法做到真正的实时语音对话。与过去的三步式语音交互产品相比,GPT-4o 是一款跨文本、视觉和音频端到端训练的新模型,这意味着所有输入和输出都由同一个神经网络处理。这也是 GPT-4o 说话时反应贼快,智商还在线的重要原因。而当今一众力图模仿 GPT-4o 的国产厂商,例如字节跳动,虽然依靠 RTC 技术,让语音 AI 做到了流畅、即时,但在最核心的 " 内功 ",即端到端语音模型方面,却露出了短板。Part.2  " 智力 " 缩水在今年的 8 月 21 日,字节挑动的豆包大模型,搭载了火山引擎的 RTC 技术,也实现了类似 GPT-4o 的实时音频互动表现,能够做到随时打断,交流自然,感觉就像真人说话一样。所谓 RTC(Real-Time Communication)技术,是一种支持实时语音、实时视频等互动的技术。旨在降低语音通话中的延迟,使得用户在进行语音对话时感觉更加自然和顺畅。但 RTC 主要解决的,仅仅是语音 AI 流畅性和实时性问题,但它并不能直接整合语音识别、理解和生成的步骤。换句话说,在实时通话时,模型虽然话说得利索了,但智商却不一定在线。一个明显的例子,就是字节的豆包大模型,在通过实时语音 AI 与用户交流时,遇到了和讯飞星火一样的问题,那就是语音 AI 的智力,明显比纯文本大模型被 " 砍 " 了很多。左右滑动查看更多左:实时语音状态下豆包的回答,右:纯文本状态下豆包的回答例如,在对《黑神话:悟空》这一话题进行交流时,纯文本状态下的豆包,回答明显要比实时语音的豆包要更详细,更有针对性。一个可能的原因,是豆包在进行语音交互时,使用的并不是真正的端到端语音大模型。在非端到端模型中,语音识别、理解和生成可能仍然是分开的步骤,模型需要在极短的时间内完成语音识别、理解和生成,而这一过程的计算和响应速度,会限制其对复杂问题的深入处理。当模型被迫快速反应时,由于无法充分利用上下文信息,从而导致了 " 智力下降 " 的表现。其实,真正的端到端语音大模型,实现起来远非想象中那么简单。其中的难点,一在训练数据,二在计算资源;根据腾讯算法工程师 Marcus Chen 的推测,GPT-4o 这样的端到端语音大模型,背后使用的一种工程学方法,很可能是一种名叫离散化技术的路子。这个技术,简单点说,就是把这些连续的声音波形切成一段一段的,每一段都提取出它特有的特征,比如语音的语义信息和声学特征。这些特征就像是一个个小的 " 口令 ",机器可以把它们当成输入,丢到语言模型里去学习和理解。但这可不是什么人人都能轻松掌握的技术。要想做出高质量的语音 token,需要大量的数据积累和复杂的建模过程。这样的高质量数据,往往来自高质量的视频、播客等等。成本是过去文字训练模型的几十倍甚至更高。而在计算资源方面,在实时互动场景中,计算必须在极短的时间内完成,这意味着端到端的大模型,通常需要消耗大量的计算资源,尤其是在处理高维度的语音数据任务时。这也是为什么,OpenAI 在推出 GPT-4o 的语音 AI 功能后,对用户的使用量进行了额度限制。其额度消耗和 GPT-4o 回复的额度一样。反观现在以豆包为首的一些国产语音 AI,虽然以免费、不限次数为噱头,但其生成质量,却相较于纯文本状态大打折扣。这或许正是在算力资源紧张的情况下,模型采取的一种 " 权宜之计 "。因为当计算资源不足时,模型可能会优先选择简单的、低耗能的响应方式,以确保能够及时回应用户的请求。毕竟,又想要免费无限地使用,又想要高质量的实时回复,天底下哪有那么好的事?Part.3  算力困境在 AI 时代,各类 To C 语音产品的主要逻辑是,将昂贵或难以获得的人类服务,且是基于对话且可以在线完成的,替换为 AI,主要场景包括心理疗愈、辅导、陪伴等。对于 To C 类 APP,要想大范围地落地,其中一个前置条件,必然是成本的大幅度降低。唯有如此,企业才能够以更低的价格提供服务,进而不断扩大用户基数。但问题是,在降低成本的同时,质量和成效能否保障一定的水准?这正是最考验讯飞、字节等大厂的一点。从商业上来说,在降低成本的同时,要想质量不拉胯,就需要有源源不断的资金,进行研发和技术迭代。这就要求企业找到一种明确的商业模式,来自我造血。OpenAI 之所以能在如此短的时间推出 GPT-4o 的语音功能,是因为背靠微软,能获得源源不断的融资,从而不断强化其模型的能力。相较之下,坐拥几乎是行业内最为丰富业务场景的科大讯飞,虽然赶上了 2023 年 AI 浪潮,并在同年 6 月市值一度逼近 2000 亿大关,可随着其大模型持续高额的投入、销售费用持续攀升。当下,讯飞对大模型收益能否覆盖成本尚无定论,成本压力始终存在。一个重要的问题是:既然在一些特定的行业,例如医疗、教育、客服等,传统语音 AI 已经能够胜任了,那么以端到端大模型为核心的语音 AI,又该怎样从中获取自己的市场份额?一个可能的方向,就是在各种长尾需求中,对一系列复杂查询和非标准化指令做出回应。例如在智能汽车或移动应用中,端到端模型可以通过自然语言,理解用户说的犄角旮旯的地点在哪,并提供精确的导航指令。然而,在这种模式下,用户更多地是为语音 AI 背后强大的语言模型付费,为其出众的智力付费。因此,端到端语音 AI 的盈利之路,一开始就因为这种 " 附属地位 " 而充满了坎坷,因为前者的能力一旦遇到瓶颈,其也会跟着 " 一损俱损 "。而在附属于语言大模型的尴尬之下,在算力资源的分配方面,语音 AI 也面临着一种不利的态势。例如,对于字节来说,迄今为止,字节跳动已经推出了 11 款 AI 应用;其中,豆包是国内用户最多的 AI 独立应用,其 MAU 可能已达到 2000 万量级。然而,从业务布局上来说,语音 AI 现阶段不太可能是字节的重点。在 9 月 24 日的深圳 AI 创新巡展上,火山引擎发布两款视频生成大模型 PixelDance(像素舞动)和 Seaweed(海草),很多业内人士分析,这条视频 AI 的类 "Sora" 赛道,才是以短视频闻名的字节真正不能输掉的一仗。而 AI 视频生成,恰恰又是最消耗算力的一条赛道。来源:豆包 AI 视频生成模型与语音 AI 相比,同样消耗高算力的视频生成 AI,因为对应着短视频这个更明确,且更易于盈利的赛道,因此在资源分配上,更有可能得到大厂或投资者的倾斜。结合之前豆包在实时通话状态下的智力表现,我们或许能够推断,留给豆包打造端到端语音大模型的算力,未必会那么充足。而这种资源不足,却又要在面上与 GPT-4o 一较高下的情况,这正是当下实时语音 AI 这支 " 偏军 " 在中国 AI 版图中的窘境所在。语音交互技术火热了十来年,到了大模型时代,OpenAI、科大讯飞、字节这些大厂,又开始重新在往这领域挤,为何?因为这种技术,实际上暗藏着语音平台可能成为未来物联网 " 大脑 " 的想象。通过一个语音平台,操控所有智能终端,这是所有传统语音 AI 都办不到的事。但是,这技术要想做得好,得先解决一个大问题,就是机器得能真正理解人说的话。这就需要 AI 在自然语言理解、知识获取这些领域有新的突破。然而,在语言大模型遇到瓶颈,且算力资源被视频 AI 等 " 光环 " 更耀眼的产品抢走的情况下,语音 AI 在中国人工智能的版图中,暂且只能是个尴尬的存在。

koa12jJid0DL9adK+CJ1DK2K393LKASDad

编辑:洪学智

TOP1热点:12.2亿!光线买楼:动画制作团队已成人数最多业务单元,还在招人

  中央社会工作部划入民政部的指导城乡社区治理体系和治理能力建设、拟订社会工作政策等职责,统筹推进党建引领基层治理和基层政权建设。划入中央和国家机关工作委员会、国务院国有资产监督管理委员会党委归口承担的全国性行业协会商会党的建设职责,划入中央精神文明建设指导委员会办公室的全国志愿服务工作的统筹规划、协调指导、督促检查等职责。。

  事实上,两岸经贸合作对台湾经济民生贡献巨大,大陆长期是台湾贸易顺差的最大来源,而两岸产业链供应链深度相嵌,携手发展,共蒙其利。两岸“脱钩断链”违背经济规律,根本做不到。赖清德需要正面回答岛内舆论的质问:若限制台湾产品出口大陆,岛内厂商将大量倒闭,造成发展衰退与严重失业,何来“经济安全”?美国加速把台积电变成“美积电”,这种“掏空”才是台湾经济真正的危机!

TOP2热点:马上评|最高法报告中的“小案”:以司法托举善良诚信公平

  中央社会工作部划入民政部的指导城乡社区治理体系和治理能力建设、拟订社会工作政策等职责,统筹推进党建引领基层治理和基层政权建设。划入中央和国家机关工作委员会、国务院国有资产监督管理委员会党委归口承担的全国性行业协会商会党的建设职责,划入中央精神文明建设指导委员会办公室的全国志愿服务工作的统筹规划、协调指导、督促检查等职责。

  据悉,下一步,金融管理部门将完整、准确、全面贯彻新发展理念,着力提升平台企业金融业务常态化监管水平,依法将各类金融活动全部纳入监管,确保同类业务适用同等监管规则,实现公平监管。

TOP3热点:男子疑似在海底捞包间内往火锅里排尿,企业方称已报案处理国产SUV精品一区二区6

  金融管理部门当日发布的行政处罚信息显示,对蚂蚁集团及旗下机构处以罚款(含没收违法所得)共计超71亿元,其中支付宝处罚约30亿元;对腾讯集团旗下机构财付通处以罚款(含没收违法所得)共计近30亿元。

  每天出发前,她得算好时间,不能迟到,中间环节也不能掉链子。按照她的经验,她推算龚贺那天早上5点左右就得起床,带孩子们吃早餐,“提供保姆式服务”。

TOP4热点:北京:从2025年秋季学期开始,全市中小学校开展人工智能通识教育16may20_XXXXXL56endian

  同时,这也意味着对平台经济已初步建立规范、透明的监管,有利于形成积极、正向、稳定的预期,引导、督促大型平台企业合规稳健经营,更好发挥资本作为生产要素的积极作用,更好地服务实体经济和民生需求。

  对此,岛内人士发出关于“民主伙伴”的诘问:美国对台湾予取予求,这种伙伴交再多有什么用?民进党一向标榜“民主”,“全面执政”这些年又有多民主?在岛内打压异己、撕裂社会、钳制舆论、大搞“绿色恐怖”……民进党的“民主神主牌”已塌,赖还谋算把两岸关系装进“民主对抗威权”的虚假叙事中,台湾社会还“信得下去”吗?

TOP5热点:乌克兰驻英大使批美国“破坏世界秩序”,乌外交部:仅代表个人立场少妇大叫太大太粗太爽了

  业内人士也认为,此次处罚在法律法规框架下,划清了合法与非法的界限,规范了市场秩序,切实维护了金融消费者合法权益,有利于营造公平有序的市场环境。

  中新经纬7月7日电 据证监会网站7日消息,近年来,金融管理部门坚持发展和规范并重,建立健全平台经济治理体系,出台一系列制度办法,初步形成平台企业金融业务发展与监管制度框架,促进平台经济规范健康发展。2020年11月以来,从依法加强监管和有效防范风险的角度出发,金融管理部门督促指导蚂蚁集团、腾讯集团等大型平台企业全面整改金融活动中存在的违法违规问题。目前,平台企业金融业务存在的大部分突出问题已完成整改。金融管理部门工作重点从推动平台企业金融业务的集中整改转入常态化监管。

TOP6热点:又一“双一流”高校本科扩招:指标用于基础学科、新兴学科等麻花传媒MV与其它传媒公司比较

  在美团望京站点,相关负责人表示,美团计划先期投入7亿元高温关怀金专项补贴。在今年的连续高温天气下,美团外卖优化了骑手取送路线,降低配送难度,减少骑手暴露在户外的时间,同时新增防暑驿站,加大防暑物资发放力度。骑手APP还将上线“夏季关怀保障中心”,根据天气情况向骑手实时推送高温预警弹窗、附近防暑驿站位置等信息。

  潜伏期5-21天,多为6-13天。猴痘病毒感染后主要表现为显性疾病,也存在无症状感染者。前驱症状约1-5天,发病早期可出现发热、头痛、背痛、肌痛和淋巴结肿大等前驱症状。

TOP7热点:姚明说自己一天屏幕使用时长七八小时:尝试过息屏,有些焦虑Base掀起OnchainSummer热潮

  经过两年多的集中整改,金融管理部门表示,目前平台企业金融业务存在的大部分突出问题已经完成整改。金融管理部门的工作重点从推动平台企业金融业务的集中整改转入常态化监管。

  方案显示,组建中央社会工作部。负责统筹指导人民信访工作,指导人民建议征集工作,统筹推进党建引领基层治理和基层政权建设,统一领导全国性行业协会商会党的工作,协调推动行业协会商会深化改革和转型发展,指导混合所有制企业、非公有制企业和新经济组织、新社会组织、新就业群体党建工作,指导社会工作人才队伍建设等,作为党中央职能部门。

TOP8热点:北京:从2025年秋季学期开始,全市中小学校开展人工智能通识教育x姓女rapper

  接种天花疫苗对猴痘病毒存在一定程度的交叉保护力。未接种过天花疫苗的人群对猴痘病毒普遍易感。2022年5月以来的全球疫情,96%的感染者为青壮年男性(中位年龄34岁),与疫情主要在男男性行为人群中发生有关。  

  据悉,下一步,金融管理部门将完整、准确、全面贯彻新发展理念,着力提升平台企业金融业务常态化监管水平,依法将各类金融活动全部纳入监管,确保同类业务适用同等监管规则,实现公平监管。

TOP9热点:12.2亿!光线买楼:动画制作团队已成人数最多业务单元,还在招人两阳夹一阴后续走势

  接种天花疫苗对猴痘病毒存在一定程度的交叉保护力。未接种过天花疫苗的人群对猴痘病毒普遍易感。2022年5月以来的全球疫情,96%的感染者为青壮年男性(中位年龄34岁),与疫情主要在男男性行为人群中发生有关。  

  近日,据多家媒体报道,中石油旗下寰球工程项目管理(北京)有限公司的执行董事、党委书记、总经理胡某勇在闹市与一名女子逛街,两人亲密牵手的动作被一名街拍摄影师拍下后发布到网上,引发大量网友关注。6月8日,据华商报大风新闻报道,中国石油北京项目管理公司宣布涉事两人均停职,接受纪委调查。上游新闻(报料邮箱baoliaosy@163.com)记者搜索发现,疑似“牵手门”女当事人董某某的社交媒体账号也被网友扒出,虽然已经删掉全部内容并销号,但很多涉嫌炫富的内容已经被网友截屏转发。

TOP10热点:两会外长会丨王毅对美国发出5问:从这些年的关税战、贸易战中得到了什么?男孩子都会夹住女孩子头发

  作为领队,龚贺主要提供旅游景区的讲解服务,还包括介绍北京的饮食文化、传统习俗等。大巴车行驶时,他也会对行程和景点进行讲解。到午间,他再负责安排所有人用餐。

  经过两年多的集中整改,金融管理部门表示,目前平台企业金融业务存在的大部分突出问题已经完成整改。金融管理部门的工作重点从推动平台企业金融业务的集中整改转入常态化监管。

发布于:长汀县