视觉transformer面试题:vit

news/2024/7/19 11:29:14 标签: transformer, 深度学习, 机器学习

输入端适配

通过patch0与每个patch计算value来整合信息 最后分类

因为transformer的输入输出维度是一致的,transformer block的任何一个输出 无法进行很好的分类

为什么不使用输出patch相加求平均?patch 可能是1616的数量,然后哪怕256256的大小,输出向量也无法接受

位置编码

图像切分重排后丢失位置信息,并且transformer计算无需位置信息

结果分析

attention的距离等价于Conv中的感受野大小

可以看到越深的层数,attention跨的距离越远

但是在越底层,也有的head可以覆盖很远的距离

这两点可以看到transformer确实在负责global信息整合


http://www.niftyadmin.cn/n/1714706.html

相关文章

动态规划-最大子段和

1.题目描述 2.算法思想 方法1&#xff1a;枚举 将所有的(i,j)对找出来&#xff0c;计算对应子段和&#xff0c;最后得到最大的。 int MaxSum(int*a ,int *besti,int &bestj){int sum0,T;for(int i1;i<n;i)for(int ji;i<n;j){T0;for(int ki;k<j;k)Ta[j];if(T>s…

特征工程面试题

进行特征工程的第一步是对数值类型进行理解 类别字段的特征工程 缺失值填充 使用出现次数最多的字段值进行填充 #独热编码 pd.get_dummier(数据的dataframe,columns[列名])#自然数编码 label encoder sklearn版 from sklearn.preprocessing import LabelEncoder le LabelEnc…

GCC对抗缓冲区溢出攻击

1.栈随机化 ①为了在系统中插入攻击代码&#xff0c;攻击者还要插入指向这段代码的指针。产生这个指针需要知道字符串的栈地址。 ②栈随机化使得程序每次运行栈的位置都有变化。不同机器运行同样的代码&#xff0c;栈的位置不一样。 实现&#xff1a; 程序开始时在栈上分配…

通俗易懂tf.split

输入参数方式1&#xff1a;待分割的向量&#xff0c;切割后子向量的数量&#xff0c;被切割的维度 输入 [50,40,30],num_or_size_splits2,axis0 输出 两个[25,40,30]的子向量 输入参数方式2&#xff1a;待分割的向量&#xff0c;切割后子向量的分量&#xff0c;被切割的维度…

栈保护者Canary的实现细节

1.示例copy函数 汇编代码&#xff1a; 失去栈保护的汇编代码&#xff1a; 比对发现&#xff0c;在有栈保护的汇编代码中增加了一些指令&#xff0c;其中&#xff1a; mov %gs:0x14,%eax mov %eax,-0xc(ebp)两句指令&#xff0c;是向栈中插入一个canary值。使用栈保护的copy…

Vmware提示以独占方式锁定此配置文件失败。另一个正在运行的VMware进程可能正在使用配置文件

因为某些原因&#xff0c;之前VMWARE虚拟机运行的时候卡住&#xff0c;于是强制关机&#xff0c;再次打开时报错Vmware提示以独占方式锁定此配置文件失败&#xff0c;另一个正在运行的VMware进程可能正在使用配置文件。 1.查看任务管理器&#xff0c;发现实际上有一台虚拟机正…

动态规划-凸多边形最优三角形剖分

一.题目概述 ①通常&#xff0c;用多边形顶点的逆时针序列表示凸多边形&#xff0c;即P{V0, VI, … Vn 1}表示具有n条V0V1、 V1V2、 … Vn-1Vn的凸多边形。其中&#xff0c;约定V0Vn。 ②多边形的三角剖分是指将多边形分割成互不相交的三角形的弦的集合T。 凸多边形最优三角剖分…

Windows10定时关机

&#xff08;Ubuntu 64位虚拟机还没有装完&#xff0c;奶奶就叫我去睡觉了。就想着是不是可以定时关机&#xff0c;嗯还真可以。&#xff09; winR 输入cmd 定时关机命令&#xff1a;shutdown -s -t 时间(/s) 取消&#xff1a;shutdown -a