文献阅读(50)—— Transformer 用于肺癌诊断预测

news/2024/7/19 9:15:55 标签: transformer, 深度学习, 人工智能

文献阅读(50)—— Transformer 用于肺癌诊断预测

文章目录

  • 文献阅读(50)—— Transformer 用于肺癌诊断预测
    • 先验知识/知识拓展
    • 文章结构
    • 背景
    • 文章方法
      • 1. 文章核心网络结构
      • 2. Time Encoding ViT (TeViT)
      • 3. Time Aware ViT(TaViT)
    • 文章结果
      • 1. 在Tumor-CIFAR 上验证
      • 2. 在NLST上验证
    • 总结
      • 1. 文章优点
      • 2. 文章不足
      • 可借鉴点/学习点?

Time-distance vision transformers in lung cancer diagnosis from longitudinal computed tomography
在这里插入图片描述
这一篇也是一篇刚出来的文章,觉得还是有必要精读的。后面几天会更新一下最近看的Transformer的文章

先验知识/知识拓展

  • 核心任务:使用纵向数据对肺癌CT数据分类

文章结构

  • 摘要
  • introduction
  • related work
  • method★
  • experiments and results
  • conclusions

背景

提出问题:
纵向的医学数据在采集的过程中多数不是等间隔的,可能存在相隔时间很久,不同个体相同时间内的采样次数也是不同的。虽然自注意力机制是一种将时间序列和图像有效结合的学习方法,但是在解释稀疏,不规则采样空间特征之间的时间距离方面尚未被探索。针对这个问题,作者提出两个module来解决此问题:

文章方法

1. 文章核心网络结构

作者在Transformer的基础上增加了两个小模块提升性能的同时增加模型的可解释性。

  • 利用连续时间的embedding向量(Time Encoding ViT)
  • 使用一个是temporal emphasis model权衡自注意力机制(Time Aware ViT)
    在这里插入图片描述

2. Time Encoding ViT (TeViT)

将每张图片的时间encoding为一个和图像特征等长的向量共同作为输入特征。其中rt是最后一个时间和现在时间点差值(两者的时间间隔)
在这里插入图片描述

3. Time Aware ViT(TaViT)

TaViT是为了学习一个temporal emphasis model(TEM)来衡量每个头部的自注意力机制的权重。其中的R就是TaViT的核心,是时间i和时间j之间的时间间隔,把他们转换为非负值(越接近现在时间点的CT影响越大)
转化过程
在这里插入图片描述
普通的注意力机制
在这里插入图片描述
改进后的
在这里插入图片描述

文章结果

1. 在Tumor-CIFAR 上验证

在这里插入图片描述

2. 在NLST上验证

将CS-CNN,TeViT,和TaViT对比
在这里插入图片描述

总结

1. 文章优点

  • 提出了两个精妙的trick,将纵向数据中的时间作为其中的考虑因素,将时间encoding和feature token一起作为transformer的输入,就可以考虑每一张照片的时间
  • 之后在attention的部分,有效的结合之前的ct信息,根据现在时间和时间的时间差值对attention机制中的queue,key 和value进行权重加持,因为时间间隔越久越不重要。
  • 很巧妙,最近看到很多文章在考虑时间的时候都是加一个scale

2. 文章不足

可借鉴点/学习点?

文章写的还是很容易读懂的,这种思想值得借鉴。


http://www.niftyadmin.cn/n/287756.html

相关文章

【测试面试】软件测试技术面试,知己知彼百战百胜-成为offer收割机...

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 软件测试面试题&am…

今天 国际青年节 “International Youth Day “

《劝学》孟郊 击石乃有火,不击元无烟。 人学始知道,不学非自然。 万事须己运,他得非我贤。 青春须早为,岂能长少年。 Strike stones to make it burn; No smoke unless you strike. Youre crude if you dont learn; And you…

Python 中 随机数 random库 学习与使用

python中的随机数应用大体包含,随机整数、随机浮点数 和 获取随机数序列三类。 一. 随机整数 1.1 随机整数,包含上下限(闭区间) randint(a, b):随机选取 [a, b] 之间的一个整数,随机整数包含a 和 b&#…

JUC多并发编程 Synchronized与锁升级

锁规范: 高并发时,同步调用应该去考量锁的性能消耗。能用无锁数据结构,就不要用锁,能锁区块,就不要锁整个方法体,能用对象锁,就不要用类锁。尽可能使加锁的代码块工作量尽可能的少,…

2023年第二届材料科学与工程国际会议(CoMSE 2023) | IOP-JPCS出版

会议简介 Brief Introduction 2023年第二届材料科学与工程国际会议(CoMSE 2023) 会议时间:2023年7月21日-23日 召开地点:中国泰州 大会官网:www.icomse.org CoMSE 2023由四川大学、华南理工大学亚热带建筑科学国家重点实验室、国际电气电子和…

windows的命令行

命令行就是文本交互界面,通过命令行可以使用一个一个的指令来操作计算机 任何的计算机的操作系统中都包含有命令行(windows、linux、macOS) 命令行有多个不同的名字: 命令行、命令行窗口、DOS窗口、命令提示符、CMD窗口、Shell、终…

docker的底层原理,带你上天

1、docker的层级怎么看 先查看当前机器上有哪些镜像 docker images 这里选看mysql的层级 docker image inspect mysql:5.7.29 命令。其中RootFS部分则是表示了分层信息。 2、查看docker的系统信息 因为这台机器的docker不是我安装的,所以不知道具体的根目录在哪里…

vue集成animate.css

vue集成animate.css 一 <transition> 标签的用法二 关于animate.css三 vue集成animate.css使用 一 <transition> 标签的用法 使用<transition></transition>标签包裹要加动画的元素。 标签中添加属性name&#xff0c;表示执行动画的名字&#xff0c;不…