VLM 系列——MoE-LLaVa——论文解读

一、概述

1、是什么

     moe-Llava 是Llava1.5 的改进 全称《MoE-LLaVA: Mixture of Experts for Large Vision-Language Models》,是一个多模态视觉-文本大语言模型,可以完成:图像描述、视觉问答,潜在可以完成单个目标的视觉定位、名画名人等识别(问答、描述),未知是否能偶根据图片写代码(HTML、JS、CSS)。支持单幅图片输入(可以作为第一个或第二个输入),多轮文本对话。

    整体基于Llava1.5,包括训练数据,主要变化在于LLM换为了更小的几个版本,并且LLM增加了moe模块,进行了三阶段训练(前两个阶段和llava1.5相同,第三阶段训练moe层)。具体结构包含:基于CLIP的视觉编码器,以及多个小语言解码器(添加moe层),使用最简单的两层FC构成MLP映射视觉特征到文本长度。

2、亮点

    论文中作者的总结贡献分为三点:

    *探索了 MoE-tuning,这是一种新的三阶段训练策略,用于将 MoE 适应 LVLM,并防止稀疏引起的模型退化。

    *提出了 MoE-LLAVA,这是一种基于 MoE 的稀疏 LVLM 框架,在保持计算成本的同时显着扩展了参数的数量。

    *广泛的实验表明,MoE-LLAVA 在多模态理解和幻觉抑制方面显示出巨大潜力在多个视觉理解数据集上仅使用


http://www.niftyadmin.cn/n/5365590.html

相关文章

linux下的预编译、编译、汇编、连接,生成单独文件,感受编译过程

linux下的预编译、编译、汇编、连接,生成单独文件。首先需要确认系统安装了gcc编译器,输入gcc -v或者g -v,如果能看到版本号等信息就是已经存在了,如图(centos7): 然后随便vim产生一个.cpp文件&…

嵌入式软件设计方式与方法

1、嵌入式软件与设计模式 思从深而行从简 软件开发,难的不是编写软件,而是编写功能正常的软件。软件工程化才能保证软件质量和项目进度,而设计模式使代码开发真正工程化,设计模式是软件工程的基石。 所谓设计模式就是对常见问题的…

玻色量子荣获2023年“中国移动产投协同标杆奖”!唯一上榜量子计算企业!

2024年1月,中国移动首次设立“产投协同标杆奖”,在前期征集的50多个案例中,组织聚焦“强战略、有实效、可推广”,评选出了10个协同模式创新、协同成果突出的标杆案例。 移动云联合玻色量子共同打造的“五岳量子计算云平台”成功入…

SpringBoot过滤器获取请求的参数

一、背景 在项目开发过程中,需要对于某些接口统一处理。 这时候就需要获取请求的报文,再对获取的报文进行统一处理。 二、了解过滤器 首先了解一下过滤器拦截器的区别: JAVA中的拦截器、过滤器:https://blog.csdn.net/qq_38254…

【Android】GridLayout实现等比布局

GridLayout是十年前的老布局了&#xff0c;因为太久没用过&#xff0c;导致细节方面已经记不太清楚了 初衷是想让GridLayout中每行每列的元素大小都相等&#xff0c;结果怎么试都没有效果 原来是要只设置比例&#xff0c;不设置宽高才行&#xff0c;特意记录下 <GridLayou…

简单的TcpServer(英译中)

目录 一、TCP socket API 详解1.1 socket()1.2 bind()1.3 listen()1.4 accept()1.5 connect 二、TcpServer&#xff08;英译中&#xff09;2.1 TcpServer.hpp2.2 TcpClient.cc2.3 Task.hpp2.4 Thread.hpp2.5 ThreadPool.hpp2.6 makefile2.7 Main.cc2.8 log.hpp2.9 Init.hpp2.10…

绝对完美解决hdfs datanode数据和磁盘数据分布不均调整(hdfs balancer )——经验总结

Hadoop集群Datanode数据倾斜,个别节点hdfs空间使用率达到95%以上,于是新增加了三个Datenode节点,由于任务还在跑,数据在不断增加中,这几个节点现有的200GB空间估计最多能撑20小时左右,所以必须要进行balance操作。 通过观察磁盘使用情况,发现balance的速度明显跟不上新…

C语言内存函数:memcpy、memcat、memmove介绍和模拟实现(实用性高,建议三连收藏)

目录 1.memcpy函数 1.1函数介绍 1.2函数示范使用 1.3函数的模拟实现 1.4补充 2.memmove函数 2.1函数介绍 2.2函数的使用示范 2.3函数的模拟实现 3.memcmp(内存比较函数&#xff09; 3.1函数介绍 3.2函数的示范使用&#xff0c;有趣的例子 4.函数补充memset(内存…