【C/C++】STL实现版本为什么比手写版本高?

文章目录

  • 为什么标准库版本效率更高?
    • 1 具体介绍
      • 1.1 **内联优化(Inlining)和模板展开**
      • 1.2 **分支预测友好(Branch Prediction)**
      • 1.3 **迭代器解耦 + 静态分发**
      • 1.4 **代码紧凑,编译器优化空间大**
      • 1.5 **高质量手工优化的底层实现**
    • 2 是不是永远都不用手写版本?
    • 3 实际对比示例(基准测试)
    • 4 总结

为什么标准库版本效率更高?

C++ 标准库中的 lower_bound / upper_bound 为例, STL版本几乎总是比手写的版本运行得更快,即便逻辑是一样的。这种性能差距主要来自于 编译器优化、库实现细节和泛型设计


1 具体介绍

1.1 内联优化(Inlining)和模板展开

  • 标准库函数是模板函数,通常被内联展开(inline),避免了函数调用开销。
  • 编译器知道 STL 函数的模式和行为,能做更 aggressive 的优化。

手写版本往往无法做到等效的内联效果,尤其是你写在 main() 外部或者分文件时。


1.2 分支预测友好(Branch Prediction)

  • STL 实现通常设计得非常简洁,控制流固定,对 CPU 的分支预测非常友好。
  • 手写代码可能含有更多不必要的条件判断,使得 CPU 预测失误,影响流水线效率。

1.3 迭代器解耦 + 静态分发

  • 标准库使用泛型迭代器(例如 RandomAccessIterator),可以在编译期决定是否使用加法或 std::advance,提高泛用性和效率。
  • 对于 vector,STL 使用的是原始指针(内置类型),访问元素极快。

1.4 代码紧凑,编译器优化空间大

  • STL 实现是高度压缩、无冗余的模板代码,结构良好。

  • 编译器更容易分析和优化,比如:

    • 循环展开
    • SIMD(向量化)
    • 常量传播

1.5 高质量手工优化的底层实现

  • STL 是由库专家手写并经过多年优化的。比如 libstdc++, libc++ 都对这些函数进行了低级别手工优化。
  • 它们处理了你写代码时容易忽略的边界和性能细节。

2 是不是永远都不用手写版本?

不一定:

使用 STL手写实现
适合几乎所有实用场景适合特别调试、教育用途或嵌入特殊逻辑
易读、稳定、最优性能可加入自定义行为,比如“自定义比较器”、“更复杂的数据结构”

3 实际对比示例(基准测试)

#include <algorithm>
#include <chrono>
#include <vector>int manual_lower_bound(const std::vector<int>& v, int value) {int left = 0, right = v.size();while (left < right) {int mid = (left + right) / 2;if (v[mid] < value)left = mid + 1;elseright = mid;}return left;
}

【网上搜集资料显示】在多次测试中,std::lower_bound 常比手写版快 5% ~ 30%,特别是在大数据量(如 1e6+)时差距明显。


4 总结

原因说明
编译器能充分优化 STL模板 + 内联 + 无分支陷阱
实现精简控制流干净,CPU 分支预测更精准
针对常用容器做了专门优化vector, array, pointer 等几乎零开销
可读性和可靠性极强无需重复造轮子,避免 bug

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.tpcf.cn/diannao/86225.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

35.成功解决编写关于“江协科技”编写技巧第二期标志位积累的问题

江科大学长又发布了第二期的编写技巧&#xff01; 大家可以看看&#xff1a;https://space.bilibili.com/383400717 最后面给了一个未完成的任务&#xff1a; 这里我已经把这个问题给解决了&#xff01; 总代码放在资源里面&#xff0c;key.c放在文章最后面&#xff01;同时感…

STM32什么是寄存器

提示&#xff1a;文章 文章目录 前言一、背景二、2.12.2 三、3.1 总结 前言 前期疑问&#xff1a; 1、什么是寄存器&#xff1f; 答&#xff1a;在4GB的地址空间中&#xff0c;512MB的block2上&#xff0c;每4个字节组成32位&#xff0c;这个32位为一个单元&#xff0c;控制&a…

【Pinia】Pinia和Vuex对比

Pinia 是 Vue 官方团队成员专门开发的一个全新状态管理库&#xff0c;并且 Vue 的官方状态管理库已经更改为了 Pinia。 在 Vuex 官方仓库中也介绍说可以把 Pinia 当成是不同名称的 Vuex 5&#xff0c;这也意味不会再出 5 版本了。 优点 1. 更加轻量级&#xff0c;压缩后提交只…

通过 Ansible 在 Windows 2022 上安装 IIS Web 服务器

拓扑结构 这是一个用于通过 Ansible 部署 IIS Web 服务器的实验室拓扑。 前提条件&#xff1a; 在被管理的节点上安装WinRm 准备一张自签名的证书 开放防火墙入站tcp 5985 5986端口 准备自签名证书 PS C:\Users\azureuser> $cert New-SelfSignedCertificate -DnsName &…

Oracle双平面适用场景讨论会议

4月28日&#xff0c;我在杭州组织召开了Oracle双平面会议讨论沙龙。在国产化数据库浪潮的今天&#xff0c;Oracle数据库作为国产数据库的应急库&#xff0c;在国产数据库发生故障或者性能下降时&#xff0c;如何更好的使用Oracle。会议主题如下&#xff1a; 1、背景与痛点速览&…

10.Linux进程信号

1. 理解信号 信号VS信号量 老婆&#xff1a;老婆饼-》没有任何关系&#xff01;信号&#xff1a;闹钟&#xff0c;上课铃声&#xff0c;脸色...人-》进程&#xff1b;信号中断人正在做的事&#xff0c;是一种事件的异步通知机制&#xff1b; 我们自习一会&#xff0c;等张三回…

求解插值多项式及其余项表达式

例 求满足 P ( x j ) f ( x j ) P(x_j) f(x_j) P(xj​)f(xj​) ( j 0 , 1 , 2 j0,1,2 j0,1,2) 及 P ′ ( x 1 ) f ′ ( x 1 ) P(x_1) f(x_1) P′(x1​)f′(x1​) 的插值多项式及其余项表达式。 解&#xff1a; 由给定条件&#xff0c;可确定次数不超过3的插值多项式。…

C++刷题:日期模拟(1)

&#xff08;注&#xff1a;本文所展示代码均为本人所写&#xff0c;不一定为最优&#xff09; 我们首先用纯逻辑和手动计算来拆解日期模拟题&#xff0c;再来代码实现&#xff0c;看看这些问题的底层思路怎么玩明白&#xff5e; 一、基础日期计算&#xff1a;直接算“过几天是…

深入剖析Nginx:从入门到高并发架构实战

深入剖析Nginx&#xff1a;从入门到高并发架构实战 摘要&#xff1a;本文全面解析Nginx的核心功能、架构原理及实战配置&#xff0c;涵盖负载均衡、反向代理、动静分离等高级应用场景&#xff0c;助你构建高性能Web服务架构。 一、Nginx是什么&#xff1f;为什么它如此重要&…

Qt客户端技巧 -- 窗口美化 -- 圆角窗口

不解析&#xff0c;直接给代码例子 利用窗口重绘事件处理函数paintEvent main.cpp #include <QtCore/qglobal.h> #if QT_VERSION > 0x050000 #include <QtWidgets/QApplication> #else #include <QtGui/QApplication> #endif#include "roundedwin…

Three.js学习笔记-三要素

Three.js 学习笔记-三要素 一、Three.js 简介 (一)前世今生 Three.js 是一款运行在浏览器中的 3D 引擎,由 Ricardo Cabello(Mr.doob)在 2010 年 4 月于 GitHub 首次发布 。其起源可追溯到本世纪初,代码最初用 ActionScript 编写,2009 年移植到 JavaScript。随着 Web…

动力电池点焊机:驱动电池焊接高效与可靠的核心力量|比斯特自动化

在新能源汽车与储能设备需求激增的背景下&#xff0c;动力电池的制造工艺直接影响产品性能与安全性。作为电芯与极耳连接的核心设备&#xff0c;点焊机如何平衡效率、精度与可靠性&#xff0c;成为电池企业关注的重点。 动力电池点焊机的核心功能是确保电芯与极耳的稳固连接。…

OpenCV CUDA模块图像处理------创建一个模板匹配(Template Matching)对象函数createTemplateMatching()

操作系统&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 编程语言&#xff1a;C11 算法描述 创建一个用于在 GPU 上执行模板匹配的 TemplateMatching 对象。 该函数返回一个指向 TemplateMatching 的智能指针&#xff08;Ptr&#xff09;…

natapp 内网穿透失败

连不上网络错误调试排查详解 - NATAPP-内网穿透 基于ngrok的国内高速内网映射工具 如何将DNS服务器修改为114.114.114.114_百度知道 连不上/错误信息等问题解决汇总 - NATAPP-内网穿透 基于ngrok的国内高速内网映射工具 nslookup auth.natapp.cnping auth.natapp.cn

游戏(game)

题目描述 小明最近迷上了一款游戏&#xff0c;并且很想成为这款游戏的高手&#xff0c;这款游戏需要用 资源来买装备。他刚开始的资源价值为0,于是他每天都会做日常任务来获得价值为1的资源。 这款游戏中有每日商店&#xff0c;小明已经提前知道了接下来n天会出现的装备&#x…

C# 类和继承(抽象类)

抽象类 抽象类是指设计为被继承的类。抽象类只能被用作其他类的基类。 不能创建抽象类的实例。抽象类使用abstract修饰符声明。 抽象类可以包含抽象成员或普通的非抽象成员。抽象类的成员可以是抽象成员和普通带 实现的成员的任意组合。抽象类自己可以派生自另一个抽象类。例…

关于脏读,幻读,可重复读的学习

mysql 可以查询当前事务隔离级别 默认是RR repeatable-read 如果要测脏读 要配成未提交读 RU 读到了未提交的数据。 3.演示不可重复读 要改成提交读 RC 这个是指事务还未结束&#xff0c;其他事务修改了值。导致我两次读的不一样。 4.RR–可以解决不可重复读 小总结&…

华为云Astro中服务编排、自定义模型,页面表格之间有什么关系?如何连接起来?如何操作?

目录 一、核心关系解析 二、连接方式与操作步骤 (一)服务编排与自定义模型的连接 (二)自定义模型与页面表格的连接 (三)服务编排与页面表格的连接 三、操作示例:构建数据处理闭环 场景:用户在页面表格中修改设备信息,触发服务编排校验数据并更新数据库。 四、…

Docker镜像无法拉取问题解决办法

最近再学习RabbitMQ&#xff0c;需要从Docker镜像中拉取rabbitMQ&#xff0c;但是下拉失败 总的来说就是无法和docker镜像远程仓库建立连接 我又去尝试ping docker.io发现根本没有反应&#xff0c;还是无法连接找了许多办法还是没有办法解决&#xff0c;最后才发现是镜像问题&a…

向 AI Search 迈进,腾讯云 ES 自研 v-pack 向量增强插件揭秘

作者&#xff1a;来自腾讯云刘忠奇 2025 年 1 月&#xff0c;腾讯云 ES 团队上线了 Elasticsearch 8.16.1 AI 搜索增强版&#xff0c;此发布版本重点提升了向量搜索、混合搜索的能力&#xff0c;为 RAG 类的 AI Search 场景保驾护航。除了紧跟 ES 官方在向量搜索上的大幅优化动…