女生把坤放男生定眼里Sora再次“期货式”发布!国产大模女生把坤放男生定眼里型早已抢跑,哪家最出众?_ZAKER新闻
Sora再次“期货式”发布!国产大模女生把坤放男生定眼里型早已抢跑,哪家最出众?_ZAKER新闻
冯杰
Sora 来了,但没有完全来。在 12 天连续发布会活动的第三天,OpenAI 正式面向大众发布了 AI 视频大模型 Sora Turbo,最高支持生成 20 秒视频,仅为初次公布 Sora 时宣传时长的三分之一。更离谱的是,不是任何用户都可以立即体验 Sora Turbo,该应用仍处于小范围测试阶段。在 Sora 之前,海外已有 AI 公司开发出了视频大模型,但直到今年 2 月 Sora 首次亮相,视频大模型行业才真正进入黄金发展期。然而带动视频大模型快速发展的 Sora,却似乎掉队了。不说我们可能较为陌生的海外,仅仅是国内市场,就涌现了不下二十款 AI 视频大模型,互联网巨头腾讯、阿里巴巴、字节跳动等,更是每一家都推出了 AI 视频大模型。站在行业的角度,AI 视频大模型赋予了大模型理解和重构真实世界的能力,站在用户的角度,AI 视频大模型则给了我们发挥想象力的无限可能。与面向泛用场景的大语言模型不同,视频大模型的使用场景相对更加专业,因而现阶段基本需要付费才能随心生成视频。免费用户只能领取系统的积分或每日赠送的次数生成视频,而且可能无法体验部分高阶功能。正因如此,不关注 AI 大模型的小伙伴可能并不清楚国内有哪些视频大模型。接下来,小雷就盘点六款目前国内知名度较高的 AI 大模型,并分析其功能特性,或许未来它们就会成为你手中将想法、灵感转化为现实的工具。国内视频大模型众多,功能和体验也有不小的差异,经过数月时间的提升,大多能够识别人类自然语言,而非依靠限定词生成内容。这是视频大模型的一小步,却是互联网行业的一大步,理解自然语言,才拥有将我们想法或小说中的内容转化成影像的能力。至于视频大模型该怎么选,别急,跟随小雷一起看看互联网巨头们的视频大模型表现如何,或许你的心中就会有答案。1、可灵:行业先行者,体验出众。训练视频大模型需要大量视频资源,视频平台具备先天优势,Sora 发布后仅 4 个月,快手科技旗下的 AI 团队就推出了视频大模型可灵,如今更是进化到了 1.5 版本。就小雷的体验而言,可灵在国内众多视频大模型中,体验足以位列前三。可灵支持文生视频和图片生成视频(也可以加入文字描述)两种模式,而且可以调整创意想象力和创意相关性。可灵 1.5 大模型免费用户使用文生视频功能,最高可生成 5 秒高品质视频(1.5 版本不支持生成标准品质视频,1.0 版本可生成 10 秒标准品质视频),使用图生视频功能,则可以生成最高 10 秒标准品质或 5 秒高品质视频,且支持运镜调节。小雷以 " 宁静的海滩,满月高悬在天空,微风吹动着海边的椰子树,发出哗啦啦的声音,一只小猫咪慵懒地躺在沙滩上,舔舐着前腿上的毛发 " 为描述语生成了一段视频。具体结果如下,无论是舔舐毛发还是风吹动椰子树,细节丰富程度都非常高,唯一较为明显的漏洞可能在于生成的结果是在白天,而非小雷描述的夜晚。(图源:可灵生成)作为国内最早一批 AI 视频大模型,可灵的表现极为出色,提供的功能选项较为丰富。期待可灵能够尽快推出生成视频更长的版本,达到微短剧的要求,帮助微短剧作者创作视频,降低微短剧的制作成本,进而提升可灵的实用价值。2、即梦:语言解析能力强,可惜缺乏灵动感。快手推出可灵后,抖音不甘示弱,也推出了视频大模型即梦。除了文生视频和图生视频外,即梦还加入了对口型功能,即导入图片、视频后,再上传文本或录音,即梦便可调整视频。即梦发布时间虽晚一些,但更新迭代速度极快,至今官网已提供视频 1.2、视频 2.0、视频 2.0 Pro 三个版本可用。需要注意的是,该大模型注册即送 60 积分,视频 1.2 大模型生成 4/6/8 秒视频分别需要 4/6/8 积分,视频 2.0 模型生成 5 秒钟视频需要 5 积分,视频 2.0 Pro 模型生成视频则需要 20 积分。小雷以相同的描述语,使用即梦视频 2.0 Pro 模型生成了一段视频,质量也相当不错,小雷描述的场景基本展现了出来。不过这段视频也不算完美,例如猫咪的动作过于单调和僵硬,缺少灵动感,树叶也没有随风而动等。(图源:即梦生成)即梦对于自然语言的理解能力,在小雷看来比可灵还要更高一些,描述语中的元素基本具备,但生成的视频质量略逊于可灵。3、混元:功能有待丰富,成长空间较大。说完了快手、抖音两大短视频巨头,自然也不能落下腾讯公司。腾讯日前推出了混元视频大模型,并在腾讯元宝 App 和网页端上线。腾讯混元视频大模型现阶段仅支持文生视频,每日可免费生成 4 次标准品质和 2 次高品质视频。小雷也使用腾讯混元大模型生成了一段视频,太大的月亮造成了虚假感,猫咪舔舐毛发的动作更是满满的违和感,椰子树距离过远,细节不够丰富。(图源:混元大模型生成)或许是因为诞生时间太短,腾讯混元大模型生成的视频质量欠佳,明显不如可灵和即梦。不过拥有国内互联网巨头腾讯作为后盾,相信经过几次迭代升级后,该大模型生成的视频质量能够媲美可灵和即梦。4、Vidu:功能丰富,运镜自然。作为北京数生科技与清华大学联合研发的 AI 视频大模型,Vidu 可能没有腾讯、字节跳动那样强大的财力,但大模型的表现毫不逊色。该模型也推出了 1.5 版本,支持文生视频和图生视频,还支持上传同一主体不同角度的图片,从而生成更具真实感的立体画面。需要注意的是,该大模型免费用户仅能生成 720P 视频。在实测中,Vidu 生成的视频质量高不下于可灵和即梦,运镜的自然流畅度比可灵还要强一些。细节方面也非常丰富,海水、椰子树、风等元素均有展现,仔细看会发现远处还有身影靠近。唯一的漏洞在于沙滩的质感不足,一般只有刚刚落潮的海滩才会有类似的情况。(图源:Vidu 生成)Vidu 的表现已相当不错,开放 API,探索商业模式后,大概率可以获得不少投资,Vidu 可以利用这笔投资购买芯片和视频资源。拥有足够的视频资源用于训练大模型和算力支持,Vidu 才能加快前进的脚步。5、清影:同具清华血脉,与 Vidu 有差距。智谱清言的前身是清华大学计算机系知识工程研究室团队,与 Vidu 算得上同出一门,甚至更具正统性。智谱清言开发的 AI 视频大模型清影功能极为丰富,支持文生视频和图生视频,其中文生视频可调节视频风格、情感氛围、运镜方式等参数,图生视频则最高支持 16 秒 4K 60 帧视频生成,是小雷体验过的视频大模型中,生成视频最长的。然而,清影生成的视频却令小雷大失所望,别的就不说了,我的猫呢???而且画面几乎看不出来这是一段视频,小雷差点以为我生成的是图片。(图源:清影生成)与同出一门的 Vidu 相比,清影的问题十分明显,对于自然语言的理解能力可能存在问题,有待进一步提升。6、PixVerse:画面唯美,动作却很僵硬。对于爱诗科技,国内普通网友可能比较陌生,但其创始人王长虎曾担任微软亚洲研究院主管研究员,后续跳槽到字节跳动,先后担任了人工智能技术总监、视觉技术负责人等职位,主导了字节跳动视觉大模型的基础建设工作。爱诗科技的视频大模型 PixVerse 功能同样丰富,支持特效、风格、比例等元素的设置和调整,还能预设角色,生成视频最长为 8 秒。不过注册赠送的积分只有 90,每日再赠送 30 积分,生成 5 秒视频需要 30 积分,8 秒视频则为 60 积分。从生成的视频来看,PixVerse 的特性与其名字一样充满唯美感,画面色调十分讨喜小猫的毛发细节和背后的水面的波纹都很到位。(图源:PixVerse 生成)与即梦相同,PixVerse 生成视频的问题也出在猫咪身上,小猫的动作过于刻意,反而出现了僵硬感。瑕不掩瑜,PixVerse 的表现非常出色,让我们看到了爱诗科技的实力。数月时间,国内 AI 企业在视频大模型领域已迈出了从无到有的关键一步,现在正从有到强进发。就小雷的体验而言,可灵、即梦、Vidu、PixVerse 均表现不错,并列第一梯队,腾讯混元视频模型位列第二梯队,清影则位列第三梯队。因使用场景、风格要求等细节的不同,视频大模型的输出结果可能会存在一定的差异,小雷的体验不能表现出这些视频大模型的全部实力。即便是表现较好的大模型,在细节方面也存在一定的漏洞,除了上文频频提到的猫咪动作僵硬问题,还有一个非常明显且普遍的情况,即沙滩的沙子不会因为猫咪的动作而流动。AI 视频大模型虽在不断升级迭代,并取得了不菲的成果,但细节方面依然有不少进步的空间。(图源:豆包 AI 生成)AI 视频大模型的升级重点围绕自然语言解析能力、画面细节打磨和运镜、时长三大方面,这三大核心因素也决定了 AI 视频大模型未来能够取得的成果。唯有能够理解人类自然语言,才能真正让每一个人都能利用 AI 视频大模型尽情释放想象力,画面和运镜的升级可以提高视频质量,时长足够的前提下,AI 视频大模型方能成为用户手中创作微短视频的助手。另外,尽管 AI 视频大模型普遍采用收费方案,但价格过于昂贵,以至于付费用户有限,再加上训练成本和推理成本居高不下,大多数 AI 视频大模型公司的处境并不乐观。主攻视频生成领域的 AI 公司,要么与 B 端客户联合,针对定制场景打造专属版本,要么就要加速升级迭代,满足 C 端用户的需求,寻找盈利点。近期亚马逊云科技、谷歌、OpenAI 等企业相继发布了 AI 视频大模型,预计明年还会有更多 AI 公司推出视频大模型,整个行业的竞争将愈发激烈。这些已走在前面的企业,应当尽快利用自身优势创造盈利点,避免在更卷的环境中被淘汰。koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:谢大海
TOP1热点:「宝可梦超级联动1??!」我的兄弟们怎么变成了狗??!
社区治理是需要及时感知、捕捉的,而这样的敏锐感知,离不开覆盖全面、数据共享、智慧共用的物联感知体系。近年来高新区不断延伸物联感知的“神经末梢”,截止目前已经整合接入1628套公安监控设备、156部智慧电梯安全监管系统,4套高空鹰眼瞭望(含噪声监测、扬尘监测),2部单兵设备,1套无人机巡查系统、1套区域空气监测设备(含PM2.5、PM10及SO?等6个空气指标),1套智慧能源管理系统,初步形成了辖区全覆盖、高中低互补的全天候、多维度视频监管巡查格局。今年以来,各类视频巡查共发现城市运行管理问题超一百件,随着各类感知终端接入“一网统管”,各类与市民生活息息相关的数据、重点领域实时运行状况得以“一屏展示”“一网打尽”“一目了然”,社区“智”理的感知预判能力不断提升。。
TOP2热点:相机能看到人眼看不到的东西!被诅咒的相机
1.看外观
“大数据平台可以实时监测销售情况,务工人员实时统计,包括种植点位、种植核心数据、病虫害的情况。通过这些数据,我们可以做一些水土提前量的预知。”海南智卉科技有限公司副总经理杨富说。
TOP3热点:“#筑梦前行,不止于此,从一杯清水开始”意大利ведо
上海一中院从上述一般侵权认定的四项构成要件出发,经过逐一分析,认为小章未能举证证明其在微博上发表涉案文章内容的真实性,其发表涉案文章的行为构成诽谤,小章发表涉案文章、虚假陈述使得两个微博阅读量均达到100多人次的行为,足以造成小陈相关方面社会评价降低的后果,且从小章的发帖内容及频率看具有积极追求侵犯小陈名誉、使其社会评价降低的目的,存在主观故意,故小章的行为满足名誉侵权的构成要件,理应承担相应的侵权责任。
2.低盐腌蛋:取新鲜鸭蛋清洗干净后晾干→将鸭蛋放入腌制罐→倒入浓度为18%的食盐溶液→密封→在20~25℃下腌制10天→将18%的盐溶液更换为6%的盐溶液→密封→在20~25℃下继续腌制25天。
TOP4热点:逆水寒破解版在外网热议,国服玩家太惨被老外同情舔舐花蜜
(原标题为《关于调整上海市纠正医药购销领域和医疗服务中不正之风联席工作机制成员单位及职责分工的通知》)
2.低盐腌蛋:取新鲜鸭蛋清洗干净后晾干→将鸭蛋放入腌制罐→倒入浓度为18%的食盐溶液→密封→在20~25℃下腌制10天→将18%的盐溶液更换为6%的盐溶液→密封→在20~25℃下继续腌制25天。
TOP5热点:如何证明你的超能力11体内㓔精69XXXXXx白浆
(原标题:《七宝镇静安新城这13条无名道路命名难有下文了》)
TOP6热点:【4K】维吉尔大病电影《抛瓦户缔》主题曲PV 定档6.15小BBW大小BBW小BBw
青海省体育局副局长杨海宁介绍,第十二届环青海湖大学生公路自行车赛暨第九届环青海湖残疾人公路自行车赛作为环青海湖国际公路自行车赛的重要衍生赛事,不仅丰富了环湖赛的赛事架构,更成为自行车运动全民推广的重要抓手。
TOP7热点:受诅咒的相机人与野鲁❌❌❌❌❌片多多
住房租赁企业、房地产经纪机构应当自从业人员办理入职手续后30日内,为其办理从业信息卡;从业人员离职或信息变更的,应当及时注销、变更注销从业信息卡。从业人员包括,向租赁当事人提供居间代理、房源收储、客户接待、业务咨询和签约备案等服务的人员。
TOP8热点:《三角洲行动》焰火赛季故事短片!pansy中老年妈妈
当前雷电黄色预警高挂
《食品安全国家标准食品添加剂使用标准》(GB2760—2014)中规定,调味品中不允许使用二氧化硫。本次抽检的这款姜粉二氧化硫残留量检测结果为0.163g/kg。
TOP9热点:对不起,没能走进你心里尻逼
青海省体育局副局长杨海宁介绍,第十二届环青海湖大学生公路自行车赛暨第九届环青海湖残疾人公路自行车赛作为环青海湖国际公路自行车赛的重要衍生赛事,不仅丰富了环湖赛的赛事架构,更成为自行车运动全民推广的重要抓手。
TOP10热点:R技能 神出鬼没意大利ведо
比如,野象谷的讲解员是有十余年工龄的哈尼族姑娘,说起象群为夭折的小象举办葬礼、集体默哀的故事潸然泪下,她对这份工作真挚的热爱也打动了孩子和家长们。夜幕降临时,孩子们发现,人类制造的光源惊扰着河谷,大家努力呼唤伙伴熄灯,屏息迎接黑暗中害羞的萤火虫家族慢慢靠近的探访。