财经速递-"吃花核心流水喝"-火吃花核心流水喝山引擎丢出视频大模型「王炸」，云厂商从「价格战」回归「卷性能」

火吃花核心流水喝山引擎丢出视频大模型「王炸」，云厂商从「价格战」回归「卷性能」_ZAKER新闻

使用音乐≠音乐治疗

自今年 2 月 Sora 面世以来，很多人都期待字节的动作。拥有抖音和剪映这两个最强的视频 App 在手，字节的视频生成大模型，被寄予厚望。这就来了。9 月 24 日，字节跳动旗下火山引擎在深圳举办 AI 创新巡展，一举发布了包括「豆包视频生成大模型」「音乐生成大模型」在内的多款模型。在此之前，海内外不少现象级的同类模型产品相继发布，包括字节跳动相继发布的即梦、海绵音乐，和剪映（含 CapCut）中的新功能。秘而不宣的海绵音乐 App 更是被视为最适合中文的音乐生成 App、国内当之无愧的「Suno」。字节为什么选择在多少有些「AI 产品看麻了」的 9 月，推出这几款 AI App 背后的大模型引擎？对此，火山引擎总裁谭待向极客公园表示，不是按照某个固定计划精心设计什么节点发布，AI 模型进展日新月异，什么时候做好、适合对外就尽快发布。这背后的逻辑是，火山引擎的定位是字节跳动的 ToB 云平台，模型对企业的开放由火山引擎来做，但推出产品前，需要先在内部使用，打磨到一定程度、做到企业级可用，才会向外推出。此前发布的豆包也是如此，先有字节内部推出的产品豆包 App，再有今年 5 月由火山引擎推出企业级可用的豆包大模型。他补充说：「不一定要抢第一，要推出成熟的产品，因为模型对未来 10 - 20 年影响长远，做好积累后发先至也是好事。」而火山引擎未来十年要驶向的远方，并不是一个、两个模型比如视频生成模型的领先，而是「成为全球领先的云和 AI 服务商」。 01 抖音和剪映加持，字节视频生成大模型更关注使用场景视频生成大模型，成为整场发布会最大的亮点。谭待表示，「因为视频特别难，我们一次性推出两个，充分解决视频里面的各种问题」。豆包家族新成员——豆包视频生成 -PixelDance、豆包视频生成 -Seaweed，正式面向企业市场开启邀测。从现场展示来看，豆包视频模型可以根据文字和图片的输入，生成相应的视频。值得注意的是，字节跳动并没有公布其模型生成视频的最大时长，尽管后者被认为是体现技术能力的一大表现。豆包视频生成大模型，更强调其在实际应用中、各种生活和商业场景所需的三个核心功能点。首先是模型对复杂指令的理解遵循。以下图的视频为例，输入「特写⼀个⼥⼈的面部，有些⽣⽓，戴上了⼀副墨镜；这时⼀个男⼈从画⾯右侧⾛进来抱住了她」。在这个相对复杂的描述下，豆包模型生成的视频呈现出了一个人情绪的变化、动作前后时间的变化，还出现了一个新的人物，这个新的人物跟原来的人物也有交互。换言之，豆包视频大模型能够根据指令实现时序性上有连续的动作指令，并且可以生成多个主体，并且让多个主体间进行交互。豆包视频模型的第二个特点在于运镜，⾖包视频模型让视频在主体的⼤动态与镜头中进行切换，拥有变焦、环绕、平摇、缩放、⽬标跟随等多镜头语⾔的实现。生成的视频可以灵活控制视⻆，更接近真实世界的体验｜视频来源：字节跳动第三个特点则是⼀致性多镜头。在 AI 生成的视频中，如何保证多镜头来回切时，不同主体在来回切换中的镜头是一致的，这也是当前行业的共性难点。豆包在一个 prompt 下生成的视频，可以实现多个镜头切换，同时保持主体、⻛格、氛围的⼀致性。｜来源：字节跳动在谈及豆包视频生成大模型的特点时，谭待表示，豆包视频大模型背后有两方面优势，一是技术突破和全栈能力等优势，在技术上，字节在这两款视频模型上做了大量技术创新，比如通过⾼效的 DiT 融合计算单元、全新设计的扩散模型训练⽅法和深度优化后的 Transformer 结构，让整个⽣成视频的动作更灵动、镜头更多样、细节更丰满。同时抖音、剪映对视频的理解也是优势。「剪映对视频的理解、对豆包视频生成模型有帮助，指令遵循做得好也离不开语言模型，豆包是全体系模型，底层有基座模型有助于更好地理解指令。」在深入到视频场景的解决方案上，豆包视频模型支持不同题材类型，⽀持包括⿊⽩、3d 动画、2d 动画、国画、⽔彩、⽔粉等多种⻛格，包含支持 1:1，3:4，4:3，16:9，9:16，21:9 等多个比例，对应于电影、电视、电脑、手机等多个商业场景。⾖包视频⽣成模型通过整个模型能把商品快速 3D，而且动态多⻆度展⽰，还能配合不同的节日，比如中秋、七夕、春节等节点快速替换背景和⻛格，⽣成不同尺⼨的内容发布到不同平台上，最终适合整体营销的战略完成。在更聚焦的场景上，豆包视频模型也推出了更适配的解决方案，⽐如电商营销场景，可以让用户根据商品生成大量的配合营销节点的视频素材，并且适配不同媒体平台的不同尺⼨发布。在视频发布环节，还有一个彩蛋，火山引擎带来了内部——剪映和即梦如何使用视频⽣成模型的实践案例。从抖音转战剪映 CapCut 的张楠（Kelly）通过数字分身 Kelly 的形式亮相。在该数字人视频中，Kelly 数字分身的动作像真人一样自然，口型也可以与各国的不同语言完全适配。这个案例也向外界展示了豆包视频大模型在场景上带来的新可能，比如自媒体、口播、营销、带货、企业培训等，不必亲自上阵进行拍摄，内容制作成本也可以大幅降低。据悉，豆包视频模型不是期货，最新模型会在国庆节后上线到火山引擎方舟平台，即梦最新内测版已经使用了豆包视频生成模型 -Seawe。至于定价问题，谭待表示还没确定。他称「视频模型和语言模型应用场景不同，定价逻辑也不同。要考虑新体验 - 老体验 - 迁移成本，最终能否广泛应用取决于是否比以前生产力 ROI 提升很多。」 02 从「卷」价格，回到「卷」性能与视频大模型一同发布的，还有音乐大模型、同声传译大模型，和豆包主力模型的新升级。就像豆包视频模型的效果让人眼前一亮，上述模型产品也均有亮眼的性能提升。这一系列新升级也反应了，火山引擎开始从「卷价格」到「卷性能」的转变，后者将会成为其下一阶段的战略重点。会后接受采访时，火山引擎总裁谭待重申了这一立场，他表示：「大模型的应用成本已经得到很好解决。大模型要从卷价格走向卷性能、卷更好的模型能力和服务」。早在今年 5 月，火山引擎推出的豆包大模型把价格降至最低每千 token 低于一厘钱，引发了大模型厂商的价格战。从那以来，模型厂商的整体模型调用量均出现了大幅提升。据火山引擎披露，截至 9 月，豆包语言模型的日均 tokens 使用量超过 1.3 万亿，相比 5 月首次发布时增长超十倍，多模态数据处理量也分别达到每天 5000 万张图片和 85 万小时语音。尽管如此，模型性能掣肘成为了模型调用量进一步提升的瓶颈，同时也是机会。谭待举例称，业内多家大模型目前最高仅支持 300K 甚至 100K 的 TPM（每分钟 token 数），难以承载企业生产环境流量。例如某科研机构的文献翻译场景，TPM 峰值为 360K，某汽车智能座舱的 TPM 峰值为 420K，某 AI 教育公司的 TPM 峰值更是达到 630K。为此，豆包大模型默认支持 800K 的初始 TPM，超行业平均水平，客户还可根据需求灵活扩容。此前 MiniMax 创始人闫俊杰向极客公园表示，从技术发展的角度看，模型推理成本 10 倍、百倍的降低是必然，只是时间问题，难的是通用模型的性能提升。在看到从 ChatGPT 到 GPT-4，性能出现了大幅提升时，大模型领域也沿着 OpenAI 在模型预训练上做 Scaling Law，旨在用更多的数据、加更多的算力、提升模型参数量的做法来提升模型性能。随着这一路径的效率降低、优质数据耗尽的担忧，通过这一方法提升性能的路径陷入瓶颈。现在，随着 o1 的出现，大模型在推理阶段引入强化学习的路径，带来了进一步提升模型性能的明确路径。同时，随着更多企业在 AI 应用上的探索，也为模型性能的定向提升带来了很多工程调优手段。更好的模型性能、更好用的模型服务，才能在产品上打开更多场景，而这也将成为包括火山引擎在内的 AI 基础设施服务商们下一阶段的重点。

koa12jJid0DL9adK+CJ1DK2K393LKASDad

编辑:刘宝瑞

TOP1热点：一天蒸发5900亿美元！英伟达评价DeepSeek：是卓越进步，推理需要大量GPU

付凌晖说，下阶段，要继续推进稳增长稳就业稳物价，落实好促消费各项政策，积极恢复和扩大传统消费，加快培育新型消费，促进消费稳定增长，推动经济持续健康发展。。

省电抽油烟机关太早

TOP2热点：美国宣布退出后，世卫组织将削减成本并重新设定优先事项

2019年2月1日，习近平总书记走进北京胡同考察。他从草厂四条北口下车，踏着青石板往胡同里走，感受着老北京特有的京味民俗扑面而来。考察中，总书记对北京开展旧城保护整治的思路和做法表示肯定。他强调，要把老城区改造提升同保护历史遗迹、保存历史文脉统一起来，既要改善人居环境，又要保护历史文化底蕴，让历史文化和现代生活融为一体。

（作者：秦春华，系北京大学教育经济研究所研究员，北京大学考试研究院院长）

TOP3热点：【社论】回家路，中国年全新国产max485csa

推进义务教育教师交流轮岗，让优秀校长、教师到欠发达地区学校及乡村学校任教，必须加大对乡村教育的投入，切实保障教师的待遇。2018年印发的《中共中央国务院关于全面深化新时代教师队伍建设改革的意见》提出，突显教师职业的公共属性，强化教师承担的国家使命和公共教育服务的职责，确立公办中小学教师作为国家公职人员特殊的法律地位，明确中小学教师的权利和义务，强化保障和管理。在具体的教师队伍建设中应遵循这一方向，提高教师职业荣誉感，促进教师职业化、专业化发展。

人工智能作为一种技术手段，应该尊重人类的尊严和价值。儒家思想和人工智能伦理之间存在密切的关系。儒家思想强调人的尊严和价值、道德规范和社会秩序，这些都是人工智能伦理所关注的问题。

TOP4热点：中国大模型DeepSeek表现震惊扎克伯格：“中美差距很小”雨宿后

大国形象往往在国际交往中树立。广西作为中国面向东盟开放合作的前沿和窗口，在促进政策沟通、设施联通、贸易畅通、资金融通、民心相通等方面作出了积极探索。

新华社香港6月26日电（梁文佳章雅昭）2023港澳・浙江周开幕式暨浙港携手合作主题论坛26日在香港举行。浙港双方现场签署共同推进高质量发展合作协议以及3项合作备忘录，同时签约多个合作项目，涉及高端制造、信息技术、教育科技等领域。

TOP5热点：中央领导同志看望老同志搞机的软件免费下载嘉兴圈

据张芳华介绍，华北、黄淮等地高温天气过程强度大、持续时间长，主要原因有4个方面：第一，在低层受到暖气团的控制，而且暖气团比较强大，持续的时间较长；第二，这一带高空在高压脊控制的情况下，天空的云量较少，太阳辐射较强，非常有利于气温的升高。同时在高压脊控制下盛行的下沉气流，也会造成下沉增温效应，使气温升高；第三，目前刚刚进入夏至节气，白天光照时间较长，有利于气温升高以及高温的持续和维持；第四，华北、黄淮地区白天的相对湿度比较低，空气比较干燥，也有利于气温的升高。

面对海量数据，徐永明善于利用团队的力量，“过去整理古籍，主要是个体作业，以书为单位，不能修改、不可关联，效率不高。”他说，“现在，我们将古籍整理任务通过勤工俭学、暑期社会实践等形式，遴选相关专业学生、专家，在线上线下一同参与，努力发挥集体的智慧。”

TOP6热点：“模圈黑马”DeepSeek能否一直火下去？可以插千仞雪模拟器的软件

党的二十大报告提出：“加强国际传播能力建设，全面提升国际传播效能，形成同我国综合国力和国际地位相匹配的国际话语权。”习近平法治思想坚持把马克思主义法治理论同中国具体实际相结合、同中华优秀传统法律文化相结合，深刻回答了新时代为什么实行全面依法治国、怎样实行全面依法治国等一系列重大问题，推动中国特色社会主义法治理论和实践实现新飞跃。我们要深入学习贯彻党的二十大精神，加强习近平法治思想国际传播，向世界充分展现我们党对法治不断深化的理论认识和实践探索，不断擦亮法治中国名片。

由此可知，抗击无人平台的最好方式是“以彼之道还治彼身”，即采用无人平台应对无人平台。其作战样式构想如下：由若干不同任务能力的无人平台与传统有人舰艇组成的集群构成海战基本单元，有人舰艇担任指挥节点，无人平台实施作战。通过变换无人平台集群的内部队形，遂行不同作战任务，实现对海区的控制，进而提升海上作战体系的生存能力和敏捷性，反制敌方无人平台的攻击。

TOP7热点：一天蒸发5900亿美元！英伟达评价DeepSeek：是卓越进步，推理需要大量GPUzztt49.ccm黑料不打烊

源浚者流长，根深者叶茂。

东方金诚研究发展部高级分析师冯琳在接受《证券日报》记者采访时表示，今年前5个月新增专项债发行量落后于2022年同期，但是明显快于2021年同期，仍然延续了财政靠前发力的特征。从投向来看，基建领域仍为专项债资金支持的重头，今年前5个月发行的新增专项债资金约五成投向基建领域。

TOP8热点：众多旅游城市宣布春节提供免费停车，机关企事业单位停车场对外开放雷电将军被丘丘人俘虏繁育后代

李彦宏认为，以大模型为关键驱动的数字经济，与实体经济深度融合，将做强做优做大实体经济。汽车制造、能源、交通等行业，大模型可以深入核心业务场景，在智能客服、供应链、系统调度等版块创新，促进行业的数字化转型和智能化提升。

新华社摄影部制作

TOP9热点：韩国检方对尹锡悦提起拘留起诉可以插千仞雪模拟器的软件

江桂斌说，基于人工智能的深度学习系统可以让新污染物的防控与风险预警更进一步。比如可以从一个化合物的结构设计开始，提出绿色化学合成方案，从源头减少对生态环境具有潜在危害的化学品的产生，为环境友好型替代品的安全设计提供虚拟筛查等。（记者李禾）

本场“核心价值观百场讲坛”活动将采取专家宣讲与践行典范分享相结合的形式举行，同时邀请了云南省大理白族自治州洱源县疾病预防控制中心名誉主任李桂科作为践行典范分享他信守“平凡医生”承诺，四十载治病治心治贫，最终带领山石屏村实现从“麻风村”到“幸福村”变迁的事迹。本次活动由云南省委宣传部、云南省发展改革委、光明网承办，云南省委教育工委、云南大学、云南广播电视台协办。欢迎广大读者、网友参与互动，请访问专题页http://topics.gmw.cn/bcjt/。（光明网记者郑芳芳）

TOP10热点：李兴伟已调往中央编办任职，曾任青岛科技大学党委书记金银瓶1-5美国

但似乎孩子们并不感到困惑，相反，他们非常清楚他们的父母、牧师、校长和总统用他们的行动告诉他们：你的整个存在不断受到威胁。许多人在否认中寻求庇护。许多人在娱乐中寻求逃避。许多人否认他们有自由意志，因此没有能力寻求或促进变革。许多人只是拿起枪，并效仿他们的“领导人”，宣称有几乎无限制的持枪权利，向第一个“机会目标”开火。一些无辜者被卷入交火，但他们只是"附带损害"。只要问问今天的总统，他就会耸耸肩，确认“附带损害”发生了。

据广州市文物考古研究院工作人员介绍，竹园岭遗址考古发掘共发现商时期形状大小不同的各类灰坑近1500个，其中部分形制规整、深度超过1米的灰坑应属储藏性质的窖穴或祭祀用途的祭祀坑；大小深浅不一的柱洞1800余个，其中相当一部分与干栏式建筑有关；还有长度不等、深浅不一的灰沟25条，推测与先民们生产生活中的自然或人工给排水有关。竹园岭遗址商时期出土数量最多的遗物是各类石器，有戈、璋、戚、钺、锛、凿、镞、砺石、磨盘、杵、磨石、环、有领环等，以残器、半成品、废料或余料为主。有1件保存完好的石碾槽，磨制精细，为广东先秦考古发现所罕见；玉器很少，完整器仅见玉璧和玉玦；地表耕土层出土1件有銎青铜斧，是竹园岭遗址目前发现的唯一一件先秦铜器，但不确定时代能否早至商时期。陶片出土数量并不很多，主要出自灰坑和文化层当中，以泥质灰陶和灰白陶、夹砂灰黑陶和橙黄陶为主，纹饰有长方格、方格凸点、重方格凸点、方格对角线、重菱格凸点纹、叶脉纹等，可辨器形有泥质高柄豆、凹底罐、圜底釜、纺轮等，但陶片的拼合度很低，可复原者很少。

发布于：双峰县

吃花核心流水喝火吃花核心流水喝山引擎丢出视频大模型「王炸」，云厂商从「价格战」回归「卷性能」_ZAKER新闻

吃花核心流水喝火吃花核心流水喝山引擎丢出视频大模型「王炸」，云厂商从「价格战」回归「卷性能」_ZAKER新闻