【Transformer】Transformer and BERT(1)

news/2024/7/19 12:26:41 标签: transformer, bert, 深度学习

在这里插入图片描述

文章目录

  • Transformer
  • BERT

太…完整了!同济大佬唐宇迪博士终于把【Transformer】入门到精通全套课程分享出来了,最新前沿方向

学习笔记

Transformer

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
无法并行,层数比较少

在这里插入图片描述
在这里插入图片描述
词向量生成之后,不会变,没有结合语境信息的情况下,存在一词多义,无法处理

在这里插入图片描述
词如何编码成向量

在这里插入图片描述
在这里插入图片描述
第一句话中,it 和 animal 的相应最高

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
内积,正交的话内积为0,越相近(相关),内积越大

在这里插入图片描述
在这里插入图片描述

d k \sqrt{d_k} dk 的目的,向量维度越大,内积也越大, d k \sqrt{d_k} dk 起到 scale 的作用

在这里插入图片描述
对于每个输入 x1 … xn, 计算一样的,可以并行为一个矩阵乘法

在这里插入图片描述
多头类比多个卷积核,来提取多种特征

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
不同的头得到的特征表达也不相同
在这里插入图片描述
多头包含在了 self-attention 中了

在这里插入图片描述
引入位置编码,形式有很多,比如 one-hot,原文中作者使用的是周期性信号进行编码

在这里插入图片描述
layer normalization 和 residual structure

在这里插入图片描述
在这里插入图片描述

encoder-decoder attention,encoder 的 K,V,decoder 的 Q

在这里插入图片描述
mask 机制:以翻译为例,不能透答案了,翻译到 I am a 的时候,student 要被 mask 起来,只能计算 I am a 的注意力

不能用后面未知的结果当成已知的条件

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

BERT

在这里插入图片描述
在这里插入图片描述
语料
在这里插入图片描述
预测出 mask,来训练提升特征编码能力

在这里插入图片描述
在这里插入图片描述
end-to-end 的形式,词编码表达和 task 一起训练

在这里插入图片描述
在这里插入图片描述
答案 d2->d3


http://www.niftyadmin.cn/n/5271469.html

相关文章

爬虫持久化保存

## open方法- 方法名称及参数markdown **open(file, moder, bufferingNone, encodingNone, errorsNone, newlineNone, closefdTrue)****file** 文件的路径,需要带上文件名包括文件后缀(c:\\1.txt)**mode** 打开的方式(r,w,a,x,b,t…

Qt容器QStackedWidget小部件堆栈

# QStackedWidget QStackedWidget是Qt框架中的一个控件,用于在同一区域显示多个子控件,只有一个子控件可见。以下是一些常用的QStackedWidget函数: addWidget(QWidget *widget):向QStackedWidget中添加一个子控件。 insertWidget(int index, QWidget *widget):在指定位置…

【算法集训】基础数据结构:十、矩阵

矩阵其实就是二维数组,这些题目在9日集训中已经做过,这里做的方法大致相同。 第一题 1351. 统计有序矩阵中的负数 int countNegatives(int** grid, int gridSize, int* gridColSize) {int r gridSize;int c gridColSize[0];int ret 0;for(int i 0;…

STM32_通过Ymodem协议进行蓝牙OTA升级固件教程

目录标题 前言1、OTA升级的重要性和应用场景2、理论基础2.1、单片机的启动流程2.2、什么是IAP?2.3、什么是OTA?2.4、什么是BootLoader?2.5、Ymodem协议是什么?2.6、IAP是如何实现的? 3、具体操作3.1、软硬件工具准备3.…

探索人工智能中的AI作画:创意、技术与未来趋势

导言 AI作画是人工智能领域中一个备受关注的前沿应用,它将传统艺术与先进技术相结合,创造出令人惊艳的艺术品。本文将深入探讨AI作画的创意过程、技术原理以及未来可能的发展趋势。 1. AI作画的创意过程 艺术风格迁移: AI作画通过学…

React面试题:React高阶组件、Render props、hooks有什么区别?为什么要不断迭代?

回答思路:这三个分别是什么-->共同点-->不同点-->为什么要不断迭代 这三个分别是什么: React高阶组件:和高阶函数(参数为函数,返回值也是函数)很相似,以组件作为参数,返回…

Ubuntu 常用命令之 cd 命令用法介绍

Ubuntu 常用命令之 cd 命令用法介绍 cd命令在Ubuntu系统中用于改变当前工作目录。它是change directory的缩写。这是一个非常基本的命令,经常在日常工作中使用。 以下是cd命令的一些基本用法 cd /:这将把你的工作目录改变为根目录。 cd ..&#xff1a…

蓝牙 Mesh 网络:塑造智能家居和工业自动化的未来

随着物联网 (IoT) 技术的飞速发展,蓝牙 Mesh 网络已成为智能家居和工业自动化领域的关键技术。这种新型网络不仅拓宽了蓝牙技术的应用范围,还为建立更智能、更高效的环境提供了可能。本文将深入探讨蓝牙 Mesh 网络的原理、优势以及它在智能家居和工业自动…