把英语课代表按到桌子上抄一日连发两款视频大模型,火山引擎要让每个人都能用上AI_ZAKER新把英语课代表按到桌子上抄闻
一日连发两款视频大模型,火山引擎要让每个人都能用上AI_ZAKER新把英语课代表按到桌子上抄闻
(据新华社电记者宋宇)
9 月 24 日,字节跳动旗下火山引擎在深圳举办 AI 创新巡展,并首次对外发布豆包视频生成 -PixelDance、豆包视频生成 -Seaweed 两款 AI 大模型,并公布了多项 AI 大模型的全新升级,以一种全新的姿态迎接 AI 时代的到来。雷科技此次受邀参与巡展,在活动现场就发现了不一样的东西,现场设置了四个不同的展示区,用来展示目前 AI 大模型在 C 端最受欢迎的四款应用:AI 奇遇、AI 音乐、AI 智能助手和 AI Bot,分别对应娱乐、创作、问答和个性化 AI 需求四大板块。图源:雷科技这一系列的 AI 应用中,AI Bot 受到了许多人的关注,这是一个全新的 AI 应用开发平台,利用 AI 大模型的强大理解能力,帮助用户开发专属于自己的 AI 应用。你不需要懂得编程、调试、DeBug,只需要按部就班地给出自己的需求,剩下的一切 AI 都会帮你完成。此前,雷科技上线的小雷 Bot 就是基于 AI Bot 打造,利用雷科技过去十年积累的海量文章与评测数据,为读者提供购买咨询、产品问答等多项功能。而在 AI 奇遇中,用户可以扮演一个角色,偶遇某些人或故事,通过用户给出的反馈,故事也会发生相应的改变,一切均由 AI 实时生成,让每个人都有独属于自己的故事。这项技术不仅可以让用户创作出属于自己的故事,同时也能为游戏厂商提供新的创作思路,真正做到千人千面的故事情节塑造。至于 AI 问答,大家估计都不陌生,作为 AI 大模型最早期的应用,豆包对 AI 问答进行过多轮升级,如今已经支持最高 256K 的上下文理解,并且能够进行复杂的逻辑推理,满足用户多样化的提问需求。还差个 AI 音乐?别急,我们待会再来聊聊。在视频创作领域,火山引擎及其背后的字节跳动,恐怕是最有发言权的,抖音在全球掀起的全民视频创作热潮,造就了一个全新的互联网视频时代。所以,火山引擎的视频生成模型更关注用户在实际使用时的创作流程和创作效果,而不仅仅是简单地生成画面和动作。火山引擎希望用户可以在视频生成模型中,得到与实际拍摄几乎一致的画面效果。为此他们对视频生成模型进行了大量的优化,基于 DiT 架构结合高效的 DiT 融合计算单元,让视频生成模型拥有执行复杂指令的能力,并且能够根据要求进行大动态和运镜的切换,在专业拍摄中常用的变焦、环绕、平摇、缩放、目标跟随等镜头语言效果,大模型都能做到。借助运镜切换功能,豆包视频生成模型可以真正提供更真实的拍摄效果,并且让创作者更好地展示自己的创意想法,这在以往的视频生成大模型中少见的。而且,火山引擎还攻克了视频主体在运动时,经常会出现的服装、头饰、光影、风格突变问题。这类问题此前一直困扰视频生成模型用户,因为人们对连贯画面里的突兀变化会更加敏感,所以即使只有些许的差异,也会让观看体验大打折扣,而 AI 生成的不确定性,让 AI 视频在这方面的问题显得尤为严重。对此,火山引擎借助 DiT 架构的多种特性,让视频生成模型能够对生成的画面元素进行标记,并在后续的生成中时刻保持相关元素的存在。虽然并不能保证完全的一致,但是已经能够最大程度消除明显的服装、配饰、风格变化等问题,确保视频画面不会出现易察觉的 BUG。此外,火山引擎还解决了多动作指令互动、人物中途插入等痛点,在现场的演示视频中,就有这样的片段:一个女人生气地看向侧边,然后转头戴上眼镜,此时一个男人出画面边缘进入,拥抱住女人。虽然在传统拍摄中,这是一个很普通的镜头,但是在 AI 视频里,却要求 AI 在表情神态、多动作执行、新元素插入等方面都不能出错,才能生成一个合格的视频。随后火山引擎还展示了多个由豆包视频生成模型制作的 AI 视频,从多人互动到运动长镜头,都可以在保证视频流畅度的同时确保视频元素的一致和主体风格不变化。在我看来已经完全满足日常的创作需求,如果愿意花更多的时间去打磨,即使是普通人也能坐在家里用 AI 制作出一部大片。为了满足更多用户的创作风格需求,火山引擎还引入了深度优化的 Transformer 结构,大幅度提升了豆包视频生成模型的泛化能力,不仅支持 3D 动画、2D 动画、国画、黑白、厚涂等多种风格,还支持多种比例的视频生成,让模型能够被应用到各个领域。显然,这也是火山引擎对豆包视频生成模型的期待,成为每一个创作者的助手,让每个人都能创作出属于自己的作品。豆包视频生成模型并非巡展中唯一的看点,火山引擎同时还宣布了豆包通用模型、音乐模型等多个模型的全面升级,现在,豆包 AI 大模型可以给大家在更多领域提供更好的体验。比如前面提到的 AI 音乐,在展示区中雷科技就已经体验到了其强大的创作能力,在极短的时间里就能生成一首朗朗上口的音乐,根据要求切换不同的曲风并生成歌词。可以说,豆包音乐生成模型已经成功打通了整个 AI 音乐的创作链路,普通的创作者不需要再纠结歌词、曲风和演唱效果,只需要说出要求,然后点击生成即可。虽然现场试用时感觉创作流程非常简单,背后却是火山引擎的「负重前行」,通过对音乐模型的全面升级与优化,结合独特的音乐生成通用架构和全新的解码模型,豆包音乐生成模型能够以秒为单位完成音乐生成,并且呈现出更真实的演唱效果。实话说,在现场聆听演示音乐时,周围不少嘉宾都下意识发出感叹:" 这个真的不错 ",如果不提前说是 AI 创作的话,估计不少人会误以为是某个新锐歌手的作品。从视频到音乐,火山引擎已然攻克了 AI 创作的两大难关,并且完成了整个 AI 创作链路的整合:豆包通用模型完成故事脚本、文生图模型完成前期视觉设定、视频生成模型与音乐模型完成作品素材创作,最后再由剪映提供 AI 智能剪辑支持,让视频创作的门槛与难度得到前所未有地降低。图源:雷科技火山引擎还在现场展示了全新的数字人生成应用,仅需数分钟即可完成数字人生成,并在数秒内进行音色克隆。简单的操作就可以让用户得到一个专属数字人,拟真的神态和语气,可以满足直播、在线教学、智能客服对话等多个领域的应用。此外,豆包的数字人还能与同声传译模型结合,让数字人随时切换不同的语言进行对话,这项功能在现场也引起了许多关注。近年来,出海、海外直播市场已经成为电商生态的另一个支柱,但是能够熟练掌握外语的主播数量却远无法满足市场需求,利用数字人 + 同声传译模型制作的外语主播,将有望成为市场的新选择,这也是火山引擎向泛领域进军的一个重磅项目。从视频、音乐到数字人,火山引擎正在构建一个涵盖多领域的 AI 创作生态,推动着 AI 技术走向更加广泛的行业应用。未来,随着这些技术的持续优化与普及,无论是内容创作者还是企业,都能够在 AI 生态中找到更高效的创作方式,开启全新的智能化创作时代。为了满足日益高企的 AI 模型需求,火山引擎一直在升级大模型的承载能力。目前业内多数大模型最高支持 300K 甚至 100K 的 TPM(每分钟 token 数),而豆包大模型的默认并发流量标准已经提高到 800K TPM,是行业普遍标准的 2-8 倍以上,并且允许用户灵活扩容。与业界最高并发流量标准相辅的,还有进一步降低的算力成本。在会后的采访中,火山引擎 CEO 谭待提到,火山引擎是业内最早降低算力成本的大模型团队之一,截至目前豆包大模型的算力定价已经低于行业 99%,目前定价仅为 0.0008 元 / 千 Tokens,引领算力成本进入「厘」时代。谭待认为,只有算力成本降低,才能解锁更多的应用场景,降低开发者的进入门槛,并且减少运营成本支出,才能形成更好的 AI 应用生态。而且,降低成本也带来了更高的调用量,让大模型获得更好的成长,得以进行快速的迭代升级。在今年 5 月份推动降价后,仅 4 个月的时间豆包调用量就达到每天 13000 亿次,是 5 月份的 10 倍,市场里的 AI 应用覆盖增长显著,而且火山引擎在降价的同时还在提升大模型的整体能力,降价提质也让更多的开发者热衷于豆包大模型。作为字节跳动的 2B 云平台,火山引擎此前就对企业开放了大量的底座模型,这在大模型团队中并不多见。针对这个问题,谭待也做了进一步的解读,火山引擎选择开放底座大模型的初衷就是推动行业创新,通过对豆包大模型的技术进行整合,为企业端提供更安全、稳定的底座大模型,并非简单地将豆包大模型丢给企业,而是从企业端的需求出发,提供更多的服务与应用,助力企业进行 AI 创新。此外,采访中还提到了 Sora,作为最早的视频生成模型之一,Sora 的问世一度引起广泛关注,但是至今为止 Sora 仍未公开发布,以至于被业内称之为「期货」。因为对算力的高要求,视频生成大模型的全面开放一直存在不小的阻力,这也让我们担心豆包视频生成大模型是否可以在短期内放出。对此,谭待充满了信心,因为豆包并非一个独立的视频生成模型,其本质上是依托于豆包通用模型等一系列技术的成果,所以许多技术挑战在此之前就已经解决了,同时火山引擎也一直在优化视频生成模型的效率,使其能够更快地进入公开市场,目前在即梦 AI 等功能里已经可以申请内测体验,并且在国庆节后会放出更多的公开 API。谭待在采访中还特别强调了技术积累和长期规划的重要性。他指出,火山引擎的目标不仅仅是解决当前的市场需求,更是在为未来的 AI 发展打下坚实的基础。通过持续优化底层技术架构,火山引擎能够以更低的成本提供更高质量的服务,从而保持技术领先优势。最后,谭待认为随着 AI 技术的不断成熟,拥有庞大用户和企业支持的火山引擎将继续保持在行业内的领先地位。未来几年,火山引擎将持续专注于技术深耕和行业落地,通过更高效、更智能的 AI 解决方案帮助企业实现数字化转型和创新发展。koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:谭平山
TOP1热点:小莫布里12中8贡献22分13板
新华社北京6月14日电(记者戴小河)国家能源局14日发布的数据显示,5月份,全社会用电量7222亿千瓦时,同比增长7.4%。。
TOP2热点:张凌赫回应被田曦薇背的感受
消费回暖
然而,看着刚买的电瓶车,一单还没送就回去,田丹有点不甘心。深呼吸了几口气,稳定住情绪,田丹向一个路过的外卖骑手求助。骑手耐心地给她指了路,终于在最后10分钟内,田丹成功送到了自己的第一单。
TOP3热点:尹锡悦被捕后发文:戒严不是犯罪斗罗大陆PS比比东乳液视频
“受委屈只是个别情况。”田丹说,“更多的时候,顾客让我越来越喜欢做外卖骑手。”
在车水马龙的都市中,在街头巷尾人们注意不到的地方,无数像田丹一样的外卖骑手,不惧寒暑,无畏风雨,用他们的汗水和辛劳为市民的生活带来了方便和温暖。
TOP4热点:#整治体育饭圈乱象应从何抓起#亚洲无线一线二线三线区别
香港经济正逐步迈向复苏,香港旅游发展局总干事程鼎一近日表示,今年前5个月访港旅客数量突破1000万人次大关,包括内地居民在内的世界各地旅客重临香港,大大提振了消费市场信心,为香港经济发展注入充沛活力。同时,中央不断推出各种优惠政策,粤港澳大湾区建设加快,特区政府各项发展政策逐步落地,令香港经济出现强劲的发展势头。
TOP5热点:乌军大规模袭击俄境内欧美巨大巨粗黑人性AAAAAA
多位与会嘉宾表示,随着世界进入新的动荡变革期,多重不确定性因素以及个别国家为了维护自身的政治利益和全球霸权地位,在国际人权领域大搞人权政治化等,对全球人权事业构成极大挑战。
“卖石头”虽然让村民腰包鼓了起来,却造成严重的环境问题。有村民回忆,当时的余村,山成了“秃头光”,水成了“酱油汤”。晾晒在外的白衬衫,不出多久就染成了灰衬衫。
TOP6热点:兵马俑坑惊现跑酷小松鼠耕耘大婶的肥沃的土地是什么意思
那天夜里,跑了一天的田丹正要倒头睡一会,手机响了,是一条短信:“真的很谢谢你,孩子也非常感激阿姨,她说阿姨是‘孤勇者’。”
TOP7热点:MiniMax发布新一代开源模型无忧传媒的短视频制作技巧
开阔的大草坪上,架着几张露营帐篷。游客在帐篷下三两成群,或谈天说笑,或嬉闹游戏……夏日,浙江省安吉县天荒坪镇余村村口好不热闹。草坪一侧,刻着“余村印象”的一幢新潮建筑拔地而起。“这是一座零碳建筑,可以靠光伏发电实现‘碳抵消’。”余村村支书汪玉成说。
TOP8热点:男子捡到“白酒”喝完抢救21天东北骚妇老熟女DHXXXXX
“要实现高质量发展,产业迭代升级是关键。”汪玉成说。去年7月,余村启动了“全球合伙人”计划。来自全国多地的60余名青年来到余村,打造起乡村咖啡馆、文创店等新业态。越来越具“年轻范儿”的乡村,也引来更多客人。去年,余村接待游客70万人次,村集体经济收入突破1300万元,村民人均收入达到6.4万元。
TOP9热点:美国加州火灾风险达到极度危险水平老卫抱着淑蓉进房间导演是谁
朱凤莲说,两岸关系和平发展是维护两岸和平、促进两岸共同发展、造福两岸同胞的正确道路,最符合两岸同胞切身利益和共同心愿,最符合时代发展潮流。两岸关系发展的事实证明,坚持一个中国原则和“九二共识”是确保两岸关系和平发展的关键。只有坚持“九二共识”,两岸关系才能改善发展,反之,就会陷入紧张动荡。
TOP10热点:尹锡悦被捕时只说了句:知道了走吧美女露00身体无挡图
国际货币基金组织认为,鉴于香港过渡至“后疫情”较预期顺畅,加上大量受积压的需求,未来带动经济复苏的步伐或快过预期。高盛也表示,受惠于内地与香港全面通关、香港取消社交距离措施等利好因素,香港私人消费表现强劲,第一季度经济表现优于市场预期。考虑到访港旅客持续攀升、特区政府派发消费券等,预计香港第二季度经济可以延续复苏势头。