白话 Transformer 原理-以 BERT 模型为例

白话 Transformer 原理-以 BERT 模型为例

第一部分:引入

1-向量

在数字化时代,数学运算最小单位通常是自然数字,但在 AI 时代,这个最小单元变成了向量,这是数字化时代计算和智能化时代最重要的差别之一

举个例子:银行在放款前,需要评估一个人的信用度;对于用户而言,可以简单地用一个向量来表示其信用度,如下所示:

[ID,性别,年龄,学历,地区,年收入,存款,交易额,违约]

向量是一组数据的集合,可以想象成在一个超高维度空间里的一个点。一个具体的信用度向量,就是在 9 个特征组成的高维空间的一个点。数据在高维空间将展现更多的数学性质,容易让我们抓住更多隐藏的规律。在 AI 领域,向量的维度可达数千维、甚至数万维。以 BERT-Base 中文模型为例,每个汉字都被表示为 768 维的向量。

如下图所示,从人们的认知来看,超过 3 维空间便很难直观的理解了。在 AI 时代,数据的维度远远超过 3 维,我们不能再以传统的思维来看待问题。
在这里插入图片描述




http://www.niftyadmin.cn/n/5356153.html

相关文章

C++ Primer Plus(第6版)第二章 开始学习 C++

2.1 进入 C 一个简单的入门程序如下&#xff1a; // mytirst.cpp -- displays a message#include <iostream> int main() {using namespace std;cout << "Come up and C me some time.";cout << endl;cout << "You wont regret it!&…

CUDA 笔记

CUDA笔记 cuda 内存管理 cuda通过内存分配、数据传递、内存初始化、内存释放进行内存管理&#xff1b; Standard C FunctionCUDA C FunctionmalloccudaMallocmemcpycudaMemcpymemsetcudaMemsetfreecudaFree 内存分配 主机内存分配&#xff1a;extern void malloc(unsigned…

【Node.js基础】Node.js的介绍与安装

文章目录 前言一、什么是Node.js&#xff1f;二、安装Node.js2.1 Windows系统2.2 macOS系统2.3 Linux系统 三、运行js代码总结 前言 随着互联网技术的不断发展&#xff0c;构建高性能、实时应用的需求日益增长。Node.js作为一种服务器端运行时环境&#xff0c;以其事件驱动、非…

05. 交换机的基本配置

文章目录 一. 初识交换机1.1. 交换机的概述1.2. Ethernet_ll格式1.3. MAC分类1.4. 冲突域1.5. 广播域1.6. 交换机的原理1.7. 交换机的3种转发行为 二. 初识ARP2.1. ARP概述2.2. ARP报文格式2.3. ARP的分类2.4. 免费ARP的作用 三. 实验专题3.1. 实验1&#xff1a;交换机的基本原…

ubuntu22.04@laptop 常用基础环境安装

ubuntu22.04laptop 常用基础环境安装 1. 源由2. 步骤2.1 安装ubuntu22.04 LTS系统2.2 必备软件安装2.3 基本远程环境2.3.1 远程ssh登录2.3.2 samba局域网2.3.3 VNC远程登录 2.4 开发环境安装 3. 总结 1. 源由 应朋友要求&#xff0c;整理下一个个人常用的工作笔记本常用开发环…

Docker核心教程

1. 概述 官网&#xff1a;https://docs.docker.com/ Docker Hub 网站&#xff1a;https://hub.docker.com/ 容器较为官方的解释&#xff1a; 一句话概括容器&#xff1a;容器就是将软件打包成标准化单元&#xff0c;以用于开发、交付和部署。 容器镜像是轻量的、可执行的独立…

服务器选购的那些事

A100显卡 A100显卡是英伟达&#xff08;NVIDIA&#xff09;推出的一款高性能计算显卡&#xff0c;其显存容量可以根据具体型号而有所不同。目前市面上主要有两种型号的A100显卡&#xff1a; 1.NVIDIA A100 PCIe&#xff1a;这款显卡的显存容量为40 GB。 2.NVIDIA A100 SXM4&a…

SolidWorks曲面功能介绍

在SolidWorks中提供了功能丰富的曲面功能&#xff0c;那为什么我们需要使用曲面功能&#xff1f;曲面功能一般是在处理一些复杂外形的时候来使用&#xff0c;这些形状需要通过曲线的变化来控制&#xff0c;从而得到满意的外形&#xff0c;一般来说这样的外形是很难通过实体建模…