Transformer模型 | Transformer模型描述

news/2024/7/19 12:15:07 标签: transformer, 深度学习, 人工智能

谷歌推出的BERT模型在11项NLP任务中夺得SOTA结果,引爆了整个NLP界。而BERT取得成功的一个关键因素是Transformer的强大作用。谷歌的Transformer模型最早是用于机器翻译任务,当时达到了SOTA效果。Transformer改进了RNN最被人诟病的训练慢的缺点,利用self-attention机制实现快速并行。并且Transformer可以增加到非常深的深度,充分发掘DNN模型的特性,提升模型准确率。在本文中,我们将研究Transformer模型,理解它的工作原理。Transformer由论文《Attention is All You Need》提出,现在是谷歌云TPU推荐的参考模型。论文相关的Tensorflow的代码可以从GitHub获取,其作为Tensor2Tensor包的一部分。哈佛的NLP团队也实现了一个基于PyTorch的版本,并注释该论文。从宏观的视角开始 首先将这个模型看成是一个黑箱操作。在机器翻译中,就是输入一种语言,输出另一种语言。那么拆开这个黑箱,我们可以看到它是由编码组件、解码组件和它们之间的连接组成。编码组件部分由一堆编码器(encoder)构成(论文中是将6个编码器叠在一起——数字6没有什么神奇之处,你也可以尝试其他数字)。解码组件部分也是由相同数量(与编码器对应)的解码器(decoder)组成的。
图片
所有的编码器在结构上都是相同的,但它们没有共享参数。每个解码器都可以分解成两个子层。从编码器输入的句子首先会经过一个自注意力(self-attention)层,这层帮助编码器在对每个单词编码时关注输入句子的其他单词。我们将在稍后的文章中更深入地研究自注意力


http://www.niftyadmin.cn/n/5099914.html

相关文章

如何手动控制nacos注册

背景 在使用nacos作为服务注册与发现时,我们可能需要手动控制服务注册到nacos中的时机,如系统启动好之后,需要预热一段时间,加载一些缓存数据之后才允许被其它微服务访问。 解决方案 1.配置文件中关闭nacos 自动注册 spring.c…

20231018 自然常数的存在性

1 除了使用魏尔斯特拉斯定理,还可以使用不定式的洛必达法则来证明这一极限。首先,将 lim ⁡ x → ∞ ( 1 1 x ) x \lim _{x \rightarrow \infty}\left(1\frac{1}{x}\right)^x x→∞lim​(1x1​)x 写成以下形式: lim ⁡ x → ∞ ( 1 1 x ) …

Android12之DRM基本接口实现(二)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 人生格言: 人生…

【算法】TOP101-二叉树篇(持续更新ing)

文章目录 1. JZ36 二叉搜索树与双向链表2. 100. 相同的树3. 572. 另一棵树的子树 1. JZ36 二叉搜索树与双向链表 JZ36 二叉搜索树与双向链表 解题思路: 由题目可知,这是一颗二叉搜索树.二叉搜索树的特点就是他的中序遍历是有序的.所以本题我们大的框架就是要在中序遍历里完成…

程序的编译(预处理操作)+链接

目录 前言: 1. 程序的翻译环境和执行环境: 2. 详解编译链接 翻译环境: 1.预处理:(文本操作) 2.编译: 3.汇编: 4.链接: 运行环境 预处理详解 : #defi…

【深入了解C++引用:传递、修改和优势】

C编程语言以其强大的功能和灵活性而闻名,引用(Reference)是其中一个非常重要的特性。引用提供了一种在函数中传递参数、修改数据和提高代码效率的方法。在本文中,我们将深入探讨C引用的概念、用法以及它们的优势。 引用的基本概念…

ruoyi项目登录验证变更

背景:我用的是ruoyi-vue3.8.6版本,因公司需要使用window的域用户进行登录验证,因此原有的ruoyi登录验证方法就得替换掉 1. 首先登录系统添加一些域账号,以确保登录方式更改后,能在sys_user中找到该账号,因…

Python爬虫基础之Selenium详解

目录 1. Selenium简介2. 为什么使用Selenium?3. Selenium的安装4. Selenium的使用5. Selenium的元素定位6. Selenium的交互7. Chrome handless参考文献 原文地址:https://program-park.top/2023/10/16/reptile_3/ 本文章中所有内容仅供学习交流使用&…