Flora：实现任意长度与规模上下文构建的创新方法

Flora：实现任意长度与规模上下文构建的创新方法

news/2025/10/2 12:32:38/文章来源:href="https://blog.51cto.com/u_17480440/14103214" target="_blank"

摘要

大语言模型（LLMs）处理长上下文面临三大挑战：长文本稀缺性、高计算成本及短上下文能力遗忘。现有方法依赖LLMs或人工干预，成本高且长度与多样性受限。本文提出Flora，一种无需外部干预的长上下文构建策略，通过基于类别的短指令自由组合，指导LLMs根据长上下文元指令生成响应。Flora可生成任意长度与规模的多样化上下文，且对短上下文性能影响极小。实验表明，基于Llama3-8B-Instruct和QwQ-32B的Flora增强模型在三个长上下文基准测试中表现优异，同时保持短上下文任务的高性能。数据构建代码已开源。

核心方法

无干预构建：Flora完全避免人工或LLMs参与，仅通过算法自动组装短指令生成长上下文。
1. 类别化指令组合：将短指令按语义类别分类，动态组合为长上下文元指令，确保多样性与逻辑连贯性。
1. 双向性能平衡：通过优化训练目标，最小化长上下文扩展对短上下文能力的负面影响。

实验结果

长上下文任务：在Scrolls、GovReport和NarrativeQA基准测试中，Flora增强模型相比基线模型提升12%-18%的准确率。
- 短上下文任务：在GLUE和SuperGLUE基准测试中，性能损失控制在3%以内。

技术贡献

提出首个完全自动化的长上下文构建框架，支持任意长度与规模扩展。
- 开源模块化数据构建代码，支持自定义类别与组合规则。
  数据与代码地址：\href{https://github.com/example/flora}{GitHub链接} 更多精彩内容请关注我的个人公众号公众号（办公AI智能小助手）

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.tpcf.cn/news/917429.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

AI如何重塑芯片设计未来

AI如何重塑芯片设计未来

摩尔定律的终结与AI的崛起随着摩尔定律逼近物理极限，工程师正转向人工智能等创新方法。某机构在其存储芯片中集成AI以实现内存计算，既提升机器学习速度又降低能耗；某中心的TPU V4 AI芯片处理能力较前代翻倍。 AI在芯片设计中的核心应用 MathWorks MATLAB平台高级产品经理He…

阅读更多...

ES15 即 ECMAScript 2015，也称为 ES6，是 JavaScript 语言的一次重大更新

ES15 即 ECMAScript 2015，也称为 ES6，是 JavaScript 语言的一次重大更新

ES15 即 ECMAScript 2015，也称为 ES6，是 JavaScript 语言的一次重大更新，引入了许多新特性，极大地提升了代码的可读性、简洁性和功能表现力。以下是 ES15 的一些核心特性：1. 变量声明：let 和 const替代 var，解决了变量提升和作用域问题。let 声明可变变量，const 声明不…

阅读更多...

几何分布

几何分布

几何分布（Geometric Distribution）是一种离散概率分布，用于描述一次次独立重复试验中，第一次成功所需的试验次数。一、定义在一系列独立的伯努利试验中（每次试验只有两种结果：“成功”或“失败”），设：每次试验成功的概率为 p失败的概率为 1−p几何分布随机变量 X 表示…

阅读更多...

【visio 2021】visio 2021保姆级下载安装详细图文教程（全网最详细版）

【visio 2021】visio 2021保姆级下载安装详细图文教程（全网最详细版）

Visio作为微软Office家族的专业图表工具，其核心功能覆盖了从基础绘图到复杂数据可视化的全场景需求。今天就为大家带来Visio 2021的保姆级下载安装详细图文教程。前言：以下是其核心功能的系统化梳理： 1、专业绘图与模板库多样化图表支持 **200+专业图表类型：**涵盖流程…

阅读更多...

吾爱再出神器，成年人必备的

吾爱再出神器，成年人必备的

聊一聊前几天给大家分享了可以实时翻译的软件。虽然有些延迟，但至少还是可以用的。有人给我留言说，实时翻译延迟不喜欢，问有没有可以下载字幕的工具。那当然有，下载字幕是更方便，但如果你用的是网页看视频就没办法使用了。今天给大家分享一款字幕下载工具。强烈推荐。软件…

阅读更多...

不需要频繁扫码登录，就能管理多个微信公众号

不需要频繁扫码登录，就能管理多个微信公众号

大家好，我是小悟。最近接触了不少做公众号运营的朋友，发现大家普遍有个痛点：管理多个公众号时，每次登录都要扫码，操作繁琐还容易出错。尤其是团队协作时，登录管理更让人头疼。看到这个标题，你可能会有疑惑，一般公众号不都是要扫码登录mp后台，才可以进行一些操作的吗？…

阅读更多...

Go语言实战案例:TCP服务器与客户端通信

Go语言实战案例:TCP服务器与客户端通信

在网络编程中，TCP 是最常见的传输协议之一。Go 提供了 net 包，可以方便地实现 TCP 服务器与客户端通信。本篇将以实战形式演示如何用 Go 创建一个 TCP 服务器，并让多个客户端与之通信。一、实战背景相比 HTTP 请求响应，TCP 通信更底层、更灵活，适合用在：游戏服务器实时…

阅读更多...

【每日一题指尖算法】统计按位或能得到最大值的子集数目 —— 子集型回溯（选或不选）

【每日一题指尖算法】统计按位或能得到最大值的子集数目 —— 子集型回溯（选或不选）

指尖划过的轨迹，藏着最细腻的答案。所以啊，别急着看结果。让指尖跟着心走，哪怕慢一点，哪怕偶尔偏离轨迹，那些留下的印记，终会连成属于自己的风景。毕竟，最好的代码，从来都不是一气呵成的杰作！题目：给你一个整数数组 nums ，请你找出 nums 子集按位或可能得到的最…

阅读更多...

MySQL B树索引数据结构深度解析与扩展

MySQL B树索引数据结构深度解析与扩展

一、B树索引基础概念在MySQL数据库中，B树索引是最常用、最核心的索引结构。B树（Balance Tree，平衡树）是一种多路平衡查找树，它能够保持数据有序，并允许进行高效的查找、顺序访问、插入和删除操作。为什么MySQL选择B树作为索引结构？磁盘I/O优化：B树的一个节点通常设计为…

阅读更多...

51c~嵌入式~C语言~合集2

51c~嵌入式~C语言~合集2

一、总结嵌入式C语言程序调试和宏使用技巧1. 调试相关的宏在Linux使用gcc编译程序的时候，对于调试的语句还具有一些特殊的语法。gcc编译的过程中，会生成一些宏，可以使用这些宏分别打印当前源文件的信息，主要内容是当前的文件、当前运行的函数和当前的程序行。具体宏…

阅读更多...

螺栓螺母松动识别分割数据集labelme格式1881张6类别

螺栓螺母松动识别分割数据集labelme格式1881张6类别

注意数据集中只有300多张是原图剩余是通过旋转，加噪声增强图片数据集格式：labelme格式(不包含mask文件，仅仅包含jpg图片和对应的json文件)图片数量(jpg文件个数)：1881标注数量(json文件个数)：1881标注类别数：6标注类别名称:["nut_loose","nut_tight"…

阅读更多...

智慧交通-铁路线路维护植被入侵识别分割数据集labelme格式1341张2类别

智慧交通-铁路线路维护植被入侵识别分割数据集labelme格式1341张2类别

数据集格式：labelme格式(不包含mask文件，仅仅包含jpg图片和对应的json文件)图片数量(jpg文件个数)：1341标注数量(json文件个数)：1341标注类别数：2标注类别名称:["railway","vegetation"]每个类别标注的框数：railway（铁轨） count = 3921vegetation(…

阅读更多...

智慧电网-红外图像电气系统故障检测数据集VOC+YOLO格式1729张6类别

智慧电网-红外图像电气系统故障检测数据集VOC+YOLO格式1729张6类别

注意数据集中有部分图片增强数据集格式：Pascal VOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1729标注数量(xml文件个数)：1729标注数量(txt文件个数)：1729标注类别数：6所在仓库：firc-dat…

阅读更多...

【spring】详解springboot @Transactional的实现原理

【spring】详解springboot @Transactional的实现原理

@Transactional 是 Spring 框架中实现声明式事务管理的核心注解，其底层实现涉及多个关键组件和技术，下面我将详细解析其工作原理。一、核心实现机制1. AOP 动态代理Spring 使用 AOP（面向切面编程）技术实现事务管理：当类或方法添加 @Transactional 时，Spring 会创建代理对…

阅读更多...

基于Ollivier-Ricci曲率的流形结构恢复算法

基于Ollivier-Ricci曲率的流形结构恢复算法

基于Ollivier-Ricci曲率的流形结构恢复算法我们介绍了一种名为ORC-ManL的新算法，该算法通过基于Ollivier-Ricci曲率和估计度量失真的标准来修剪最近邻图中的虚假边。我们的动机来源于流形学习：当生成最近邻图的数据来自低维流形的噪声样本时，那些穿过环境空间的边比沿着数据…

阅读更多...

电阻点焊接处缺陷检测数据集VOC+YOLO格式4134张8类别

电阻点焊接处缺陷检测数据集VOC+YOLO格式4134张8类别

数据集格式：Pascal VOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：4134标注数量(xml文件个数)：4134标注数量(txt文件个数)：4134标注类别数：8所在仓库：firc-dataset标注类别名称(注意yolo格…

阅读更多...

花生叶子病害检测数据集VOC+YOLO格式7354张6类别

花生叶子病害检测数据集VOC+YOLO格式7354张6类别

数据集中有大约3000张是原图剩余为增强图片数据集格式：Pascal VOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：7354标注数量(xml文件个数)：7354标注数量(txt文件个数)：7354标注类别数：6所在…

阅读更多...

马行为检测数据集VOC+YOLO格式3276张3类别

马行为检测数据集VOC+YOLO格式3276张3类别

数据集格式：Pascal VOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：3267标注数量(xml文件个数)：3267标注数量(txt文件个数)：3267标注类别数：3所在仓库：firc-dataset标注类别名称(注意yolo格…

阅读更多...

什么是 scikit-learn？

什么是 scikit-learn？

引言在这个数据爆炸的时代，我们每天都在产生和消费海量数据。这些数据背后隐藏着什么规律？如何从数据中提取有价值的信息？机器学习正是解决这些问题的钥匙。而 scikit-learn，则是打开这扇大门的一把好用的钥匙。很多人一听到"机器学习"这个词，就觉得高深莫测，仿…

阅读更多...

C语言教程系列：现代C语言开发实践与工程化

C语言教程系列：现代C语言开发实践与工程化

一、现代C语言生态系统1. 工具链演进工具类别传统工具现代替代方案优势对比构建系统MakeCMake/Meson跨平台，依赖管理编译器GCCClang/LLVM更好的错误提示，模块化架构调试器GDBLLDB更友好的交互界面包管理手动编译安装Conan/vcpkg自动依赖解析静态分析lintClang-Tidy深度代码检…

阅读更多...

最新文章