李宏毅genai笔记：模型编辑

李宏毅genai笔记：模型编辑

diannao/2026/1/22 4:37:09/文章来源:https://blog.csdn.net/qq_40206371/article/details/149161475

0 和post training的区别

直接用post training的方法是有挑战的，因为通常训练资料只有一笔
而且之后不管问什么问题，都有可能只是这个答案了

1 模型编辑的评估方案

reliability——同样的问题，需要是目标答案
generalization——问题（输入）有一些改变，输出应该根据目标改变
locality——其他无关的问题结果不应该有改变

不同论文不同设定

取决于考量

现在大部分只能paraphrase

2 不动参数的方法

直接in context 编辑的话，llm可能会不相信提供的新知识

Can We Edit Factual Knowledge by In-Context Learning?

需要给模型一些范例，告诉模型怎么使用新知识

3 改变参数的方法

编辑模型的模型
接受指令后，输出e，e的大小和待编辑模型的参数一样
e加到待编辑模型的参数中

那怎么知道e呢？

训练的时候拼在一起当作一个神经网络

e看作中间某一层的hidden representation

u1是无关的 locality的问题

实际上的做法大多是
- 根据问题和我们要编辑的知识，计算一个loss和待编辑模型各个参数的梯度g
- 然后计算一个梯度g到e的神经网络

但是对于这个问题，假设即使只有一层，那么这个neural network'的参数也是1024^4个

没办法做这么大的neural network

这里利用了gradient des的一个特征

假设一个矩阵他的graident是一个1024*1024的矩阵，那么这个matrix的rank是1

将大矩阵拆分成两个向量u和v，分别通过neural network学习对应的u‘，v’，拼起来就是e

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.tpcf.cn/diannao/90535.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Oracle：union all和union区别

Oracle：union all和union区别

UNION ALL和UNION在Oracle中的主要区别体现在处理重复记录、性能及结果排序上：处理重复记录‌UNION‌：自动去除重复记录，确保最终结果唯一。‌UNION ALL‌：保留所有记录，包括完全重复的行。性能表现‌UNION‌&#xff…

阅读更多...

[C#/.NET] 内网开发中如何使用 System.Text.Json 实现 JSON 解析（无需 NuGet）

[C#/.NET] 内网开发中如何使用 System.Text.Json 实现 JSON 解析（无需 NuGet）

在实际的企业开发环境中，尤其是内网隔离环境，开发人员经常面临无法使用 NuGet 安装外部包的问题。对于基于 .NET Framework 4.8 的应用，JSON 解析是一个常见的需求，但初始项目中往往未包含任何 JSON 处理相关的程序集。这时&#…

阅读更多...

JVM（Java 虚拟机）的介绍

JVM（Java 虚拟机）的介绍

JVM原理JVM 核心架构与工作流程1. 类加载机制（Class Loading）2. 运行时数据区（Runtime Data Areas）堆（Heap）方法区（Method Area）:元空间（Metaspace）公共区域虚…

阅读更多...

Qt 信号槽的扩展知识

Qt 信号槽的扩展知识

Qt 信号槽的扩展知识一、信号与槽的重载Qt信号与槽的重载问题注意事项示例场景二、一个信号连接多个槽1、直接连接多个槽2、使用lambda表达式连接3、连接顺序控制4、断开特定连接5、自动连接方式三、多个信号连接一个槽基本连接语法使用QSignalMapper区分信号源（Qt…

阅读更多...

链表算法之【合并两个有序链表】

链表算法之【合并两个有序链表】

目录 LeetCode-21题 LeetCode-21题将两个升序链表合并成一个新的升序链表并返回 class Solution {public ListNode mergeTwoLists(ListNode list1, ListNode list2) {if (list1 null)return list2;if (list2 null)return list1;ListNode dummyHead new ListNode();ListN…

阅读更多...

Linux - firewall 防火墙

Linux - firewall 防火墙

🔥 什么是 firewalld？firewalld 是一个动态管理防火墙的守护进程（daemon），它提供了一个 D-Bus 接口来管理系统或用户的防火墙规则。与传统的静态 iptables 不同，firewalld 支持：区域&#xff08…

阅读更多...

【GESP】C++二级真题 luogu-B4356 [GESP202506 二级] 数三角形

【GESP】C++二级真题 luogu-B4356 [GESP202506 二级] 数三角形

GESP C二级，2025年6月真题，多重循环，难度★✮☆☆☆。题目题解详见：【GESP】C二级真题 luogu-B4356 [GESP202506 二级] 数三角形 | OneCoder 【GESP】C二级真题 luogu-B4356 [GESP202506 二级] 数三角形 | OneCoderGESP C二级&…

阅读更多...

遥感影像岩性分类：基于CNN与CNN-EL集成学习的深度学习方法

遥感影像岩性分类：基于CNN与CNN-EL集成学习的深度学习方法

遥感影像岩性分类：基于CNN与CNN-EL集成学习的深度学习方法大家好，我是微学AI，今天给大家介绍一下遥感影像岩性分类：基于CNN与CNN-EL集成学习的深度学习方法。该方法充分利用了多源遥感数据的光谱和空间信息，同时结合…

阅读更多...

【STM32 学习笔记】SPI通信协议

【STM32 学习笔记】SPI通信协议

SPI通信协议 SPI协议是由摩托罗拉公司提出的通讯协议(Serial Peripheral Interface)，即串行外围设备接口， 是一种高速全双工的通信总线。它被广泛地使用在ADC、LCD等设备与MCU间，要求通讯速率较高的场合。学习本章时，可与I2C…

阅读更多...

Kafka如何做到消息不丢失

Kafka如何做到消息不丢失

一、三种消息传递语义（Message Delivery Semantics）：核心是“消息被消费处理的次数” Kafka的三种传递语义本质上描述的是“一条消息从生产到最终被消费者处理完成，可能出现的次数”，这由生产者的消息写入可靠性和消费者的offset提交策略共同决定。 1. At most once（最…

阅读更多...

HEVC/H.265 码流分析工具 HEVCESBrowser 使用教程

HEVC/H.265 码流分析工具 HEVCESBrowser 使用教程

引言研究视频编解码的都知道，少不了各类的分析工具助力标准研究和算法开发，目前最出名的流媒体分析工具就是elecard系列，但基于一些原因可能大家用的都比较少。因此，找到合适的码流分析工具才是编解码研究的便捷途径&#xff0c…

阅读更多...

量子计算+AI芯片：光子计算如何重构神经网络硬件生态

量子计算+AI芯片：光子计算如何重构神经网络硬件生态

前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站量子计算AI芯片：光子计算如何重构神经网络硬件生态 ——2025年超异构计算架构下的万亿参数模型训练革命产业拐点&a…

阅读更多...

linux 4.14 kernel屏蔽arm arch timer的方法

linux 4.14 kernel屏蔽arm arch timer的方法

在 ARMv7 架构的单核 CPU 系统中，完全禁用 coretime 时钟中断（通常是 ARM 私有定时器中断）需要谨慎操作，因为这会导致调度器无法工作，系统可能失去响应。以下是实现方法及注意事项：方法 1：通过 …

阅读更多...

[实战]调频（FM）和调幅（AM）信号生成（完整C语言实现）

[实战]调频（FM）和调幅（AM）信号生成（完整C语言实现）

调频（FM）和调幅（AM）信号生成文章目录调频（FM）和调幅（AM）信号生成1. 调频（FM）和调幅（AM）信号原理与信号生成调幅（AM&#…

阅读更多...

【LeetCode 热题 100】21. 合并两个有序链表——（解法一）迭代法

【LeetCode 热题 100】21. 合并两个有序链表——（解法一）迭代法

Problem: 21. 合并两个有序链表题目：将两个升序链表合并为一个新的升序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。文章目录整体思路完整代码时空复杂度时间复杂度：O(M N)空间复杂度：O(1)整体思路这段代码旨在解决…

阅读更多...

力扣 hot100 Day40

力扣 hot100 Day40

23. 合并 K 个升序链表给你一个链表数组，每个链表都已经按升序排列。请你将所有链表合并到一个升序链表中，返回合并后的链表。 //自己写的垃圾 class Solution { public:ListNode* mergeKLists(vector<ListNode*>& lists) {vector<int…

阅读更多...

validate CRI v1 image API for endpoint “unix:///run/containerd/containerd.sock“

validate CRI v1 image API for endpoint “unix:///run/containerd/containerd.sock“

1.现象pull image failed: Failed to exec command: sudo -E /bin/bash -c "env PATH$PATH crictl pull 172.23.123.117:8443/kubesphereio/pause:3.9"FATA[0000] validate service connection: validate CRI v1 image API for endpoint "unix:///run/container…

阅读更多...

【会员专享数据】2013-2024年我国省市县三级逐月SO₂数值数据（Shp/Excel格式）

【会员专享数据】2013-2024年我国省市县三级逐月SO₂数值数据（Shp/Excel格式）

之前我们分享过2013-2024年全国范围逐月SO₂栅格数据（可查看之前的文章获悉详情）!该数据来源于韦晶博士、李占清教授团队发布在国家青藏高原科学数据中心网站上的中国高分辨率高质量近地表空气污染物数据集。很多小伙伴拿到数据后反馈栅格数据不太方便使…

阅读更多...

锐捷网络重磅发布RG-UNC CS网络数字化平台：四大核心能力重塑企业网络管理新范式

锐捷网络重磅发布RG-UNC CS网络数字化平台：四大核心能力重塑企业网络管理新范式

近期，锐捷重磅发布RG-UNC网络数字化平台CS系列产品，通过全网统一融合管理、组网编排及自动化部署、便捷准入与访问控制、全链业务保障与可视四大核心能力，重新定义企业网络管理标准。置身于数字化转型的进程中，您的网络是否还在面…

阅读更多...

使用虚拟机远程登陆ensp模拟器交换机

使用虚拟机远程登陆ensp模拟器交换机

本文使用软件：VMware，eNSP，mobaxterm要登陆ensp里面的设备，需要使用到cloud下面我们先搭建如下拓扑：首先点击cloud，端口一绑定UDP信息，添加；端口2绑定VMnet8网卡（注意网段…

阅读更多...

最新文章