Transformer视频理解学习的笔记

news/2024/7/19 12:27:58 标签: transformer, 学习, 笔记

今天复习了Transformer,ViT,
学了SwinTransformer,
还有观看了B站视频理解沐神系列串讲视频上(24.2.26未看完,明天接着看)
这里面更多论文见:https://github.com/mli/paper-reading/

B站视频理解沐神系列串讲视频下(明天接着看)

在这里插入图片描述
上面这张图中的知识蒸馏,可以回头看一下


上面这个github网址

论文:

Video Transformers: A Survey

博客:
TimeSformer视频理解框架:视频理解中的Transformer
TimeSformer:抛弃CNN的Transformer视频理解框架

Transformers in Vision: A Survey

transformer综述汇总与变形分析
复旦大学邱锡鹏教授团队:Transformer最新综述

TimeSformer 解析:视频理解中的transformer

CVPR2021| TimeSformer-视频理解的时空注意模型

重磅开源!首个基于Transformer的视频理解网络来啦!
https://cloud.tencent.com/developer/article/1807487
https://blog.csdn.net/m0_59596990/article/details/122120545

论文:
Is Space-Time Attention All You Need for Video Understanding?

A Survey of Transformers

github
TimeSformer
https://github.com/facebookresearch/TimeSformer

知乎
https://zhuanlan.zhihu.com/p/452354607
https://zhuanlan.zhihu.com/p/459946348


http://www.niftyadmin.cn/n/5394741.html

相关文章

input输入框过滤非金额内容保留一个小数点和2位小数

这篇是输入框过滤非金额内容保留一个小数点和2位小数,金额的其他格式化可以看这篇文章常用的金额数字的格式化方法 js方法直接使用 该方式可以直接使用过滤内容,也可以到onInput或onblur等地方过滤,自行使用 /*** 非金额字符格式化处理* p…

视频推流、视频处理、拉流、手机预览演示

视频推流、视频处理、拉流、手机预览演示 版本信息操作步骤搭建rtmp服务安装pingos配置nginx(/usr/local/pingos/conf/nginx.conf) http端口为:8081启动nginx服务搭建rtmp鉴权和启动视频处理的服务下载ffmpeg用于拉流、视频处理、推流rtmp推流服务的鉴权服务代码(rtmp_auth_srv…

2024.2.26

今天又复习了一下熟悉的C语言 #define _CRT_SECURE_NO_WARNINGS #include<stdio.h> #include<string.h> #include<windows.h>int main() {//数组初始化int n;scanf("%d", &n);int array[500];int i 0;for (i 0; i < n; i){scanf("%…

算法【线性表的查找-顺序查找】

线性表的查找-顺序查找 顺序查找基本思想应用范围顺序表的表示数据元素类型定义查找算法示例分析 时间效率分析顺序查找的特点如何提高查找效率 顺序查找 基本思想 在表的多种结构定义方式中&#xff0c;线性表是最简单的一种。而顺序查找是线性表查找中最简单的一种。 顺序查…

【JS】【Vue3】【React】获取滚轮位置的方法:JavaScript、Vue 3和React示例

目录 使用JavaScript原生方法在Vue 3中获取滚轮位置在React中获取滚轮位置 随着Web应用程序的发展&#xff0c;滚轮位置的获取变得越来越重要&#xff0c;可以用于实现页面的滚动效果、导航条的隐藏和显示等功能。本文将探讨在JavaScript、Vue 3和React中获取滚轮位置的不同方法…

SpringBoot源码解读与原理分析(三十五)SpringBoot整合MyBatis时的核心组件自动装配

文章目录 前言第11章 SpringBoot整合MyBatis11.1 MyBatis框架概述11.2 SpringBoot整合MyBatis项目搭建11.3 自动装配的核心11.3.1 mybatis-spring-boot-starter11.3.2 MybatisLanguageDriverAutoConfiguration11.3.3 MybatisAutoConfiguration11.3.3.1 SqlSessionFactory&#…

元学习(meta-learning)的通俗解释

目录 1、什么是元学习 2、元学习还可以做什么 3、元学习是如何训练的 1、什么是元学习 meta-learning 的一个很经典的英文解释是 learn to learn&#xff0c;即学会学习。元学习是一个很宽泛的概念&#xff0c;可以有很多实现的方式&#xff0c;下面以目标检测的例子来解释…

海智算法训练营第三十三天 | 第八章 贪心算法 part03 | ● 1005.K次取反后最大化的数组和 ● 134. 加油站● 135. 分发糖果

今日任务&#xff1a; 1.k次取反后最大化数组和 2.贪心解决加油站问题 3.左右边界分别处理——分发糖果 1.k次取反后最大化数组和 力扣题目链接 这道题比较简单就不多说了。 class Solution {public int largestSumAfterKNegations(int[] nums, int k) {Arrays.sort(nums);f…