建筑兔零基础人工智能自学记录101|Transformer（1）-14

建筑兔零基础人工智能自学记录101|Transformer（1）-14

bicheng/2026/1/25 21:55:39/文章来源:https://blog.csdn.net/tzcnancy/article/details/148291624

Transformer

谷歌提出，一组编码-解码器

可以同时处理，通过位置编码来处理单词

实质是token词语接龙（只是有不同的概率）

token对应向量

Transformer简述

文生图就需要用到transformer黑箱

token

内部层次

中间主要是embedding matrix嵌入矩阵、attention注意力模块、multilayer perception多层感知机(MLP)

attention注意力模块内部是互相交流的、multilayer perception多层感知机(MLP)内部是并行不交流的

本质就是线性代数

实质通过矩阵运算

有不同的矩阵

嵌入矩阵

如何推测的举例：1、男人之于女人≈国王之于王后

如何推测的举例：2、妈妈之于爸爸≈ 女人之于男人

3、希特勒+意大利-德国≈ 墨索里尼（从轴心国领导人/意大利两个角度找到）

4、寿司+德国-日本≈ 油煎香肠

点积是表达两个向量是否相近的方式，通过运算结果正负判断

context size就是一次处理向量的数量

所以当context size较少时，gpt会出现遗忘了之前说的

解嵌入矩阵

softmax

补充：另一个transformer介绍，不是很生动。所以只看了开头。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.tpcf.cn/bicheng/83213.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Unity基础学习（十二）Unity 物理系统之范围检测

Unity基础学习（十二）Unity 物理系统之范围检测

目录一、关于范围检测的主要API： 1. 盒状范围检测 Physics.OverlapBox 2. 球形范围检测 Physics.OverlapSphere 3. 胶囊范围检测 Physics.OverlapCapsule 4. 盒状检测 NonAlloc 版 5. 球形检测 NonAlloc 版 6. 胶囊检测 NonAlloc 版二、关于API中的两个重…

阅读更多...

构建安全高效的邮件网关ngx_mail_ssl_module

构建安全高效的邮件网关ngx_mail_ssl_module

一、快速上手：最小配置示例 worker_processes auto;mail {server {# 监听 IMAP over TLSlisten 993 ssl;protocol imap;# TLS 协议与密码套件ssl_protocols TLSv1.2 TLSv1.3;ssl_ciphers HIGH:!aNULL:!MD5;# 证书与私钥ssl_…

阅读更多...

打卡day41

打卡day41

知识回顾数据增强卷积神经网络定义的写法batch归一化：调整一个批次的分布，常用与图像数据特征图：只有卷积操作输出的才叫特征图调度器：直接修改基础学习率卷积操作常见流程如下： 1. 输入 → 卷积层 → Batch归一化层…

阅读更多...

MySQL高级查询技巧：分组、聚合、子查询与分页【MySQL系列】

MySQL高级查询技巧：分组、聚合、子查询与分页【MySQL系列】

本文将深入探讨 MySQL 高级查询技巧，重点讲解 GROUP BY、HAVING、各种聚合函数、子查询以及分页查询（LIMIT 语法）的使用。文章内容涵盖实际应用中最常见的报表需求和分页实现技巧，适合有一定 SQL 基础的开发者进一步提升技能。一…

阅读更多...

现代 CSS 高阶技巧：实现平滑内凹圆角的工程化实践

现代 CSS 高阶技巧：实现平滑内凹圆角的工程化实践

通过数学计算 CSS mask 复合遮罩实现的真正几何内凹效果： 背景是一张图片，用来证明中间的凹陷是透明的。完整代码： app.js import FormPage from "./pages/formPage"; import "./App.css"; const App () > {re…

阅读更多...

Qt不同布局添加不同控件

Qt不同布局添加不同控件

对于这种不同布局添加不同控件的情况，可以采用以下几种简化方法：方法 1：使用 std::pair 或 std::tuple 配对（C++17 推荐） for (auto [layout, widget] : {std::pair{m_layoutMistakeCalibrate,

阅读更多...

MySQL 事务解析

MySQL 事务解析

1. 事务简介事务（Transaction） 是一组操作的集合，它是一个不可分割的工作单位，事务会把所有的操作作为一个整体一起向系统提交或撤销操作请求，即这些操作要么同时成功，要么同时失败。经典案例&#xff1…

阅读更多...

PyTorch中 torch.utils.data.DataLoader 的详细解析和读取点云数据示例

PyTorch中 torch.utils.data.DataLoader 的详细解析和读取点云数据示例

一、DataLoader 是什么？ torch.utils.data.DataLoader 是 PyTorch 中用于加载数据的核心接口，它支持： 批量读取（batch）数据打乱（shuffle）多线程并行加载（num_workers）自…

阅读更多...

在MDK中自动部署LVGL，在stm32f407ZGT6移植LVGL-8.4，运行demo，显示label

在MDK中自动部署LVGL，在stm32f407ZGT6移植LVGL-8.4，运行demo，显示label

在MDK中自动部署LVGL，在stm32f407ZGT6移植LVGL-8.4 一、硬件平台二、实现功能三、移植步骤1、下载LVGL-8.42、MDK中安装LVGL-8.43、配置RTE4、配置头文件 lv_conf_cmsis.h5、配置lv_port_disp_template 四、添加心跳相关文件1、在STM32CubeMX中配置TIM7的参数2、使能…

阅读更多...

德思特新闻 | 德思特与es:saar正式建立合作伙伴关系

德思特新闻 | 德思特与es:saar正式建立合作伙伴关系

德思特新闻 2025年5月9日，德思特科技有限公司（以下简称“德思特”）与德国嵌入式系统专家es:saar GmbH正式达成合作伙伴关系。此次合作旨在将 es:saar 的先进嵌入式开发与测试工具引入中国及亚太市场，助力本地客户提升产品开发效率…

阅读更多...

fork函数小解

fork函数小解

学了好久终于搞懂fork函数的一些作用 1. fork函数作用：用于创建新的子进程这是fork最根本的功能，在父进程里创建新的子进程、但是创建新的子进程之后呢？ 子进程和父进程的关系是什么样的？ 为什么fork得到的子进程返回值为0&am…

阅读更多...

opencv(C++) 变换图像与形态学操作

opencv(C++) 变换图像与形态学操作

文章目录使用腐蚀和膨胀图像形态滤波器实现案例使用形态学滤波器对图像进行开运算和闭运算实现案例在灰度图像上应用形态学操作算子形态学梯度（Morphological Gradient）黑帽变换（Black-hat Transform）使用分水岭算法进行图像分割使用 MSER 提取显著区域MSER 检测与可视化使…

阅读更多...

测试工程师学LangChain之promptTemplate 实战笔记

测试工程师学LangChain之promptTemplate 实战笔记

一、引言：大模型时代的测试自动化革命 2025 年，随着大模型（如 DeepSeek）在自动化测试领域的广泛应用，Prompt 编写已成为测试工程师的核心技能之一。为什么？大模型输出的质量 90% 取决于输入的 PromptLangChain 的 PromptTemplate 提供了参数化 Prompt 的标准化方案Ope…

阅读更多...

CP2K 软件介绍与使用指南

CP2K 软件介绍与使用指南

CP2K 软件介绍与使用指南一、CP2K简介 CP2K是一款开源的量子化学和固态物理模拟软件包，主要用于原子尺度模拟，特别擅长以下领域： 第一性原理计算：基于密度泛函理论(DFT)的电子结构计算分子动力学(MD)：包括从头算分…

阅读更多...

npm、pnpm、yarn使用以及区别

npm、pnpm、yarn使用以及区别

npm 使用安装包：在项目目录下，npm install <包名> 用于本地安装包到 node_modules 目录，并添加到 package.json 的 dependencies 中；npm install -g <包名> 用于全局安装，适用于命令行工具等。初始化项目…

阅读更多...

2025年北京市职工职业技能大赛第六届信息通信行业网络安全技能大赛复赛CTF部分WP-哥斯拉流量分析

2025年北京市职工职业技能大赛第六届信息通信行业网络安全技能大赛复赛CTF部分WP-哥斯拉流量分析

2025年北京市职工职业技能大赛第六届信息通信行业网络安全技能大赛复赛CTF部分WP-哥斯拉流量分析一、流量分析题目没有任何提示，附件gzl.pcap 解题哥斯拉流量300多KB包很多，没啥经验只能挨个看回来之后又狠狠得撸了一把哥斯拉流量分析我这里用的是哥斯拉4.0.1 测试链接…

阅读更多...

GitLab 18.0 正式发布，15.0 将不再受技术支持，须升级【六】

GitLab 18.0 正式发布，15.0 将不再受技术支持，须升级【六】

GitLab 是一个全球知名的一体化 DevOps 平台，很多人都通过私有化部署 GitLab 来进行源代码托管。极狐GitLab 是 GitLab 在中国的发行版，专门为中国程序员服务。可以一键式部署极狐GitLab。学习极狐GitLab 的相关资料： 极狐GitLab 官网极狐…

阅读更多...

React 项目中封装 Excel 导入导出组件：技术分享与实践

React 项目中封装 Excel 导入导出组件：技术分享与实践

文章目录前言一、为什么需要封装 Excel 组件？二、技术选型三、核心实现1. 安装依赖2. 封装Excel导出3. 封装导入组件 （UploadExcel） 总结前言在 React 项目中，处理 Excel 文件的导入和导出是常见的业务需求。无论是导出报表数…

阅读更多...

RustDesk 搭建自建服务器并设置服务自启动

RustDesk 搭建自建服务器并设置服务自启动

目录 0. 介绍 1. 事前准备 1.1 有公网 ip 的云服务器一台 1.2 服务端部署包 1.3 客户端安装包 2. 部署 2.1 服务器环境准备 2.2 上传服务端部署包 2.3 运行 pm2 3. 客户端使用 3.1 安装 3.2 配置 3.2.1 解锁网络设置 3.2.2 ID / 中级服务器 3.3 启动效果 > …

阅读更多...

基于Qt封装数据库基本增删改查操作，支持多线程，并实现SQLite数据库单例访问

基于Qt封装数据库基本增删改查操作，支持多线程，并实现SQLite数据库单例访问

抽出来的，直接用就行头文件CPP文件使用示例头文件 #ifndef DATABASECOMMON_H #define DATABASECOMMON_H/** 单例封装SQLite通用操作，支持多线程调用；可扩展兼容其他数据库，照着SysRunDatabase写，并且重载openDataba…

阅读更多...

最新文章