强㢨the癶乀pro阿里国际发布最新开源多模态模强㢨the癶乀pro型Ovis,多模态能力再升级_ZAKER新闻
阿里国际发布最新开源多模态模强㢨the癶乀pro型Ovis,多模态能力再升级_ZAKER新闻
党的十八大报告提出“努力建设美丽中国”;党的十九大报告首提“乡村振兴战略”;党的二十大报告明确“全面推进乡村振兴”。
看一眼菜品图就知道怎么做、能给植物看病、能把手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际 AI 团队发布了一款多模态大模型 Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了 SOTA(最新技术)水平。多模态大模型能够处理和理解多种不同类型的数据输入,例如文本、图像。与大型语言模型(LLMs)相比,大语言模型在处理和生成文本数据方面有专长,而多模态大模型能够处理非文本数据,如图像等等。根据多模态权威综合评测平台 OpenCompass 的数据,Ovis1.6-Gemma2-9B 在 30B 参数以下的模型中取得了综合排名第一,赶超 MiniCPM-V-2.6 等行业优秀大模型。 图:Ovis 在 OpenCompass 上的测评数据情况 据介绍,Ovis 能够在数学推理问答、物体识别、文本提取和复杂任务决策等方面展现出色表现。例如,Ovis 可以准确回答数学问题,识别花的品种,支持多种语言的文本提取,甚至可以识别手写字体和复杂的数学公式。 案例 1:Ovis 对手写文案的识别及翻译能力 案例 2:Ovis 对复杂数学公式的处理能力 案例 3:Ovis 通过对图片的识别处理能够给出菜谱 具体来说,Ovis 模型有五大优点:1、创新架构设计:可学习的视觉嵌入词表:首次引入,将连续的视觉特征转换为概率化的视觉 token,再经由视觉嵌入词表加权生成结构化的视觉嵌入,克服了大部分 MLLM 中 MLP 连接器架构的局限性,大幅提升多模态任务表现。2、高分图像处理:动态子图方案:支持处理极端长宽比的图像,兼容高分辨率图像,展现出色的图像理解能力。3、全面数据优化:多方向数据集覆盖:全面覆盖 Caption、VQA、OCR、Table、Chart 等各个多模态数据方向,显著提升多模态问答、指令跟随等任务表现。4、卓越模型性能:Ovis 展现出了优异的榜单表现。在多模态权威综合评测 Opencompass 上,Ovis1.6-Gemma2-9B 在 30B 参数以下的模型中取得了综合排名第一,超过了 Qwen2-VL-7B、MiniCPM-V-2.6 等模型。尤其在数学问答等方向表现媲美 70B 参数模型;在幻觉等任务中,Ovis-1.6 的幻觉现象和错误率显著低于同级别的模型,展现了更高的生成文本质量和准确性。5、全部开源可商用:Ovis 系列模型 License 采用 Apache 2.0。Ovis 1.0、1.5 的数据、模型、训练和推理代码都已全部开源,可复现。Ovis1.6 系列中的 Ovis1.6-Gemma2-9B 也已开源权重。在 AI 领域,多模态大模型的应用场景非常广泛,包括但不限于自动驾驶、医疗诊断、视频内容理解、图像描述生成、视觉问答等。例如,在自动驾驶领域,多模态大模型可以整合来自摄像头、雷达和激光雷达的数据,以实现更精准的环境感知和决策。由于多模态大模型能够学习如何联合理解和生成跨多种模式的信息,也被视为朝向通用人工智能的下一个步骤。根据此前媒体报道,阿里国际在去年成立了一支 AI 团队,目前已经在 40 多个电商场景里测试了 AI 能力,覆盖跨境电商全链路,包括商品图文、营销、搜索、广告投放、SEO、客服、退款、店铺装修等,其中多个应用场景均基于 Ovis 模型进行开发,已帮助 50 万中小商家、对 1 亿款商品进行了信息优化。据介绍,商家的 AI 需求不断增长,近半年的数据显示,平均每两个月,商家对于 AI 的调用量就翻 1 倍。附相关链接:论文 arXiv: https://arxiv.org/abs/2405.20797Github: https://github.com/AIDC-AI/OvisHuggingface: https://huggingface.co/AIDC-AI/Ovis1.6-Gemma2-9BDemo: https://huggingface.co/spaces/AIDC-AI/Ovis1.6-Gemma2-9B雷峰网koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:李四光
TOP1热点:男子冒用表哥身份在国企上班26年
互换球衣,并肩作战,不分你我,这看似不符合专业足球比赛的规矩,却击中了观众内心。才让公保说,这次他们还为对方球员带来了家乡的风干牛肉和藏香。。
“现在这儿是打卡地,以前一片黑臭水体。”凤桥镇副镇长、联丰村党委书记李正峰说。“五水共治”“三改一拆”“美丽庭院”多措并举,臭河浜变亲水地,农家乐、采摘园,联丰村成大花园。
TOP2热点:奶奶摘花椒15分钟2岁孙女失踪
“两封信,一封嘱托兴产业,一封教我们兴乡村。”横坎头村党委书记黄科威感慨。
TOP3热点:专家称菜价将在两三周内回归张雨欣人文艺术欣赏ppt
“果然,停下车来,周边转转,脏乱差的村子不少。”顾益康说。
绍兴嵊州市甘霖镇东王村,百年越剧发源地。2004年12月14日,习近平同志来到东王村调研,肯定了村里打算复建古戏台的想法。
TOP4热点:美国继续拱火 重提对菲5亿美元军援年轻善良的㥰子
6月23日,贵州省榕江县足球队球员(左)与青海省果洛州格萨尔王足球队球员在友谊赛中拼抢。
TOP5热点:全国妇联等部门将举办万人集体婚礼tfrg4may18_XXXXXL
90后罗伟特是土生土长的香港人,毕业于香港中文大学。大四时一次机缘巧合的社会实践活动,让他对鱼菜共生农业技术产生了兴趣。“看着一粒种子变成一棵成熟的蔬菜,是一件特别神奇的事。”罗伟特依然记得当时的感受。
TOP6热点:澳饮用水集水区检出永久性化学物质班长让我吃她胸🐻摸她奶作文
“加强规划源头管控,把资源节约集约的原则融入国土空间规划编制、审批、实施、监督工作中,优化农业、生态、城镇等功能空间,提升国土空间资源利用效率。”中国人民大学公共管理学院院长严金明说。
“源头花漫处,踏石问轻舟”。温州市永嘉县岩坦镇源头村,拆违建、清“臭源”、建智能垃圾分类回收平台,楠溪江畔“无废乡村”,千年舴艋舟,今朝争上游。
TOP7热点:山西文旅赢麻了黄上黄
《人物龙凤图》与大部分绘画的不同之处在于,它是画于丝帛之上。此作不是作者用来抒发自我情感的艺术作品,而是具有重要使用功能之物,兼具艺术与实用价值。画中对于祝祷的女性形象的描绘,直观反映出当时以贵族阶级为首的楚国人民的审美与信仰,从中能够读出人们对于生死的坦然和对于精神的追求。
浙江提出,3年打造1万家“共富工坊”,实现山区26县乡镇全覆盖、乡村振兴重点帮促村全覆盖。目前已有7000多家,累计吸纳34万多人就业。
TOP8热点:孙颖莎说热爱依旧tttzzz传送门2023
90后罗伟特是土生土长的香港人,毕业于香港中文大学。大四时一次机缘巧合的社会实践活动,让他对鱼菜共生农业技术产生了兴趣。“看着一粒种子变成一棵成熟的蔬菜,是一件特别神奇的事。”罗伟特依然记得当时的感受。
TOP9热点:日本46人河川戏水后上吐下泻alexanderwang妈妈
杭州市淳安县中联村,鸠坑乡中心小学,与百里外的西湖区行知小学,同上一堂课。
农业农村农民,中国经济社会发展的基本盘、压舱石。环境资源生态,发展中国家迈向现代化的短板与瓶颈。
TOP10热点:男生15天骑行1328公里到北大报到美国一面亲上边一面膜下边
树高根深。郑初一记得:考察途中,习近平同志看到一棵千年银杏,根系裸露在外,立即和我们说,这是金星村的象征,十分珍贵,不能让它枯掉。