16.ViT模型介绍

news/2024/7/19 10:10:15 标签: 算法, 目标检测, 深度学习, transformer

Vision Transformer

关于ViT

Transformer201706月由谷歌团队在论文Attention Is All You Need中提出后,给自然语言处理领域带去了深远的影响,其并行化处理不定长序列的能力及自注意力机制表现亮眼。根据以往的惯例,一个新的机器学习方法往往先在NLP领域带来突破,然后逐渐被应用到计算机视觉领域。时间来到202010月,同样是谷歌团队提出了将Transformer应用到视觉任务的方法,Vision Transformer(ViT)

论文:AN IMAGE IS WORTH 16X16 WORDS:
TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

关于对Transformer的介绍可以参考Transformer 介绍

Transformer应用于视觉任务的一种想法是将图像每个像素都flatten,得到一个表示图像的序列,作为模型的输入。但对使用自注意力模块的transformer来说,这种方法随着图像分辨率的变大,计算复杂度也变得很高,因为scaled dot self attention计算时 Q K d k V \frac{QK}{\sqrt{d_k}}V dk QKV的复杂度是序列长度的平方。譬如对于640*640的图像,序列长度 L L L将达到409600,这远远超出当前transformer所能处理的序列长度。

ViT中,作者是将输入图像等分成大小为16X16patch,然后通过image embedding将输入从NCHW转换成(N, hidden_dim, (n_h * n_w)), n_hn_wH//patch_sizeW//patch_size的大小,flatten后得到长度为 L = n h ∗ n w L=n_h*n_w L


http://www.niftyadmin.cn/n/5138570.html

相关文章

数据查找(search)-----散列表(哈希表)

目录 前言 一.散列表(哈希表)基本概念 二.哈希函数的构造 构造原则 构造方法 1.直接定址法 2.除留余数法 3.数字分析法 三.地址冲突 四.处理冲突的方法 开放定址法 1.线性探测法 2.二次探测法 3.伪随机探测法 链地址法 五.散列表的查找 前…

div 中文本太长用省略号隐藏展示,鼠标放上来弹出提示

需求描述 div 中有一行文本。 文本特别特别的长, 反正是超出了div所容纳的长度。 你呢, 现在想要的效果是: 1.文本就展示一行,多余的部分用省略号代替展示; 2.鼠标放上去的时候,用tip的方式展示完整的信息…

Objective-C基本数据类型使用

// // main.m // OC_BASE_USEAGE // // Created by Hacker X on 2023/10/22. //#import <Foundation/Foundation.h>int main(int argc, const char * argv[]) {autoreleasepool {NSLog("Objective-C 数据类型基本使用");//Objective-C 数据类型对应的格式化…

QDDR究竟是什么?

QDDR究竟是什么? 在当今的高科技时代&#xff0c;我们经常遇到各种各样的缩写和术语&#xff0c;其中QDDR就是其中一个。那么&#xff0c;究竟什么是QDDR呢&#xff1f; QDDR&#xff0c;全称Quad Data Rate&#xff0c;是一种同步动态随机存储器&#xff08;SDRAM&#xff09…

博弈论学习笔记(3)——完全信息动态博弈

前言 在这个部分&#xff0c;我们学习的是完全信息动态博弈。主要内容包括扩展式博弈、子博弈精炼Nash均衡、重复博弈和子博弈精炼Nash均衡的应用。 一、扩展式博弈 1、扩展式博弈 1&#xff09;扩展式博弈是什么 扩展式博弈是博弈问题的一种规范性描述&#xff0c;扩展式博…

SPSS单样本t检验

前言&#xff1a; 本专栏参考教材为《SPSS22.0从入门到精通》&#xff0c;由于软件版本原因&#xff0c;部分内容有所改变&#xff0c;为适应软件版本的变化&#xff0c;特此创作此专栏便于大家学习。本专栏使用软件为&#xff1a;SPSS25.0 本专栏所有的数据文件请点击此链接下…

通过gosec白盒扫描Go代码中的SQL注入

背景 朋友说他们公司近期发现一些SQL注入问题&#xff0c;究其原因还是因为代码中使用了拼接查询&#xff0c;没有使用参数化查询&#xff0c;而且这种历史遗留问题较难梳理&#xff0c;可能很多都是3-5年前的代码&#xff0c;于是和我了解一种批量白盒审计SQL注入的方法。 方…

QModelIndex 与QStandardItem相互转换

目录 1、 QModelIndex 转换成QStandardItem 2 、QStandardItem 转换成 QModelIndex 3、示例 4、总结 1、 QModelIndex 转换成QStandardItem QStandardItem * itemQStandardItemModel::​itemFromIndex(const QModelIndex & index) const 借助QStandardItemModel来完成…