使用Python进行PDF图片识别OCR

使用Python进行PDF图片识别OCR

web/2026/7/29 15:25:50/文章来源:href="https://blog.51cto.com/u_17486389/14147174" target="_blank"

使用场景#

使用图片识别可以快速提取图片中的信息，方便高效。

Python并不能直接对PDF进行识别，所以如果是识别PDF的话，需要先将PDF转化为图片，然后再进行识别。

必备工具#

Python #

可以安装3.7及以上版本

tesseract-ocr #

下载地址： https://github.com/UB-Mannheim/tesseract/wiki 使用最新版本即可

python 库pip install pytesseract#

pip install pillow
pip install opencv-python
pip install fitz
pip install PyMuPDF

代码示例

from PIL import Image
import os
import pytesseract 
import cv2 as cv
import fitzdef pdf_image(pdfPath,imgPath,zoom_x,zoom_y,rotation_angle):# 打开PDF文件pdf = fitz.open(pdfPath)# 逐页读取PDFfor pg in range(0, pdf.pageCount):page = pdf[pg]# 设置缩放和旋转系数trans = fitz.Matrix(zoom_x, zoom_y).preRotate(rotation_angle)pm = page.getPixmap(matrix=trans, alpha=False)# 开始写图像pm.writePNG(imgPath+str(pg)+".png")#pm.writePNG(imgPath)pdf.close()
pdf_path ='D:/123.pdf'
img_path ='D:/123.png'
pdf_image(pdf_path,img_path,5,5,0)
# 依赖opencv
img=cv.imread(img_path)
text=pytesseract.image_to_string(Image.fromarray(img),lang='chi_tra')
# 不依赖opencv写法
# text=pytesseract.image_to_string(Image.open(img_path))
print(text)

总结

识别清晰的文字图片的时候准确率非常高

但是识别手写体的话效果不太好

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.tpcf.cn/web/94700.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

给项目再加点儿松弛感：为什么减少流程限制更能响应变化？

给项目再加点儿松弛感：为什么减少流程限制更能响应变化？

最近一直在思考一个问题：为什么有些团队明明资源不差，却在抢市场这件事儿上总是慢半拍？反观很多小团队，没那么多规矩，却能快速调整方向，抓住机会。这样一细想，发现很多大公司斥巨资搞标准化的功能迭代，按部就班走完流程，上线时却发现用户需求早变了；而有些小团队没那…

阅读更多...

给项目再加点儿松弛感：为什么减少流程限制更能响应变化？

给项目再加点儿松弛感：为什么减少流程限制更能响应变化？

最近一直在思考一个问题：为什么有些团队明明资源不差，却在抢市场这件事儿上总是慢半拍？反观很多小团队，没那么多规矩，却能快速调整方向，抓住机会。这样一细想，发现很多大公司斥巨资搞标准化的功能迭代，按部就班走完流程，上线时却发现用户需求早变了；而有些小团队没那…

阅读更多...

jQuery addClass()方法使用场景及实例代码

jQuery addClass()方法使用场景及实例代码

jQuery的addClass()主要用于向选中的元素添加一个或多个CSS类，可以链式调用，并且不会移除已有的类。同时，jQuery UI扩展了这个方法，支持动画效果，比如持续时间、缓动函数等。使用场景动态修改样式在用户交互（如点击、悬停）或条件满足时，动态为元素添加 CSS 类以改变…

阅读更多...

Python 之单例模式的基本使用以及原理(68)

Python 之单例模式的基本使用以及原理(68)

Python 之单例模式的基本使用以及原理一、引言在软件开发中，设计模式是解决特定问题的通用解决方案。单例模式作为一种创建型设计模式，在许多场景下都发挥着重要作用。单例模式确保一个类只有一个实例，并提供一个全局访问点来获取这个实例。在 Python 中，实现单例模式有多种…

阅读更多...

Python 之单例模式的基本使用以及原理(68)

Python 之单例模式的基本使用以及原理(68)

Python 之单例模式的基本使用以及原理一、引言在软件开发中，设计模式是解决特定问题的通用解决方案。单例模式作为一种创建型设计模式，在许多场景下都发挥着重要作用。单例模式确保一个类只有一个实例，并提供一个全局访问点来获取这个实例。在 Python 中，实现单例模式有多种…

阅读更多...

Python 之异常处理的基本使用以及原理(69)

Python 之异常处理的基本使用以及原理(69)

Python 之异常处理的基本使用以及原理一、引言在编程的世界里，错误和异常是不可避免的。Python 作为一门强大且灵活的编程语言，提供了完善的异常处理机制，帮助开发者优雅地处理程序运行过程中出现的各种意外情况。通过合理使用异常处理，我们可以增强程序的健壮性，提高用户…

阅读更多...

Python 之面向对象编程的基本使用及原理(57)

Python 之面向对象编程的基本使用及原理(57)

Python 之面向对象编程的基本使用及原理一、引言在软件开发领域，编程范式是指导开发者编写代码的一种方法论。面向对象编程（Object-Oriented Programming，OOP）是其中一种广泛使用且非常强大的编程范式。Python 作为一门高级编程语言，对面向对象编程提供了全面而深入的支持…

阅读更多...

Android FastJson不同JSON数据类型的识别机制原理深度剖析(11)

Android FastJson不同JSON数据类型的识别机制原理深度剖析(11)

Android FastJson不同JSON数据类型的识别机制原理深度剖析一、FastJson中JSON数据类型识别的整体架构在FastJson解析JSON数据的过程中，准确识别不同的数据类型是构建正确对象模型的基础。FastJson通过词法分析器（Lexer）和语法分析器协同工作，实现对JSON数据类型的识别。词法…

阅读更多...

Android FastJson词法分析器（Lexer）源码解析与原理剖析(8)

Android FastJson词法分析器（Lexer）源码解析与原理剖析(8)

Android FastJson词法分析器（Lexer）源码解析与原理剖析一、FastJson词法分析器概述在FastJson解析JSON数据的流程中，词法分析器（Lexer）是最基础且关键的环节。它的核心任务是将输入的JSON字符流拆解为一个个独立的词法单元（Token），为后续的语法分析和语义分析提供基础数…

阅读更多...

Android FastJson类型自适应机制的设计思路与实现(19)

Android FastJson类型自适应机制的设计思路与实现(19)

Android FastJson类型自适应机制的设计思路与实现一、类型自适应机制概述在Android开发中，JSON数据与Java对象的转换是常见需求。FastJson的类型自适应机制允许开发者在不进行复杂配置的情况下，将JSON数据自动映射到对应的Java类型。该机制通过动态识别JSON数据结构，并匹配目…

阅读更多...

Android FastJson词法分析器（Lexer）源码解析与原理剖析(8)

Android FastJson词法分析器（Lexer）源码解析与原理剖析(8)

Android FastJson词法分析器（Lexer）源码解析与原理剖析一、FastJson词法分析器概述在FastJson解析JSON数据的流程中，词法分析器（Lexer）是最基础且关键的环节。它的核心任务是将输入的JSON字符流拆解为一个个独立的词法单元（Token），为后续的语法分析和语义分析提供基础数…

阅读更多...

Android FastJson类型自适应机制的设计思路与实现(19)

Android FastJson类型自适应机制的设计思路与实现(19)

Android FastJson类型自适应机制的设计思路与实现一、类型自适应机制概述在Android开发中，JSON数据与Java对象的转换是常见需求。FastJson的类型自适应机制允许开发者在不进行复杂配置的情况下，将JSON数据自动映射到对应的Java类型。该机制通过动态识别JSON数据结构，并匹配目…

阅读更多...

Android Gson复杂数据结构（如Map、List）的序列化逻辑原理剖析(20)

Android Gson复杂数据结构（如Map、List）的序列化逻辑原理剖析(20)

Android Gson复杂数据结构（如Map、List）的序列化逻辑原理剖析一、复杂数据结构序列化概述1.1 复杂数据结构处理的重要性在Android开发中，JSON数据往往包含复杂数据结构，如Map、List等。Gson作为常用的JSON处理库，其对复杂数据结构的序列化能力至关重要。准确处理这些结构能…

阅读更多...

Android Tinker中bsdiff/bspatch算法的应用原理与源码深度剖析(4)

Android Tinker中bsdiff/bspatch算法的应用原理与源码深度剖析(4)

Android Tinker中bsdiff/bspatch算法的应用原理与源码深度剖析一、bsdiff/bspatch算法基础1.1 算法概述bsdiff/bspatch是由Colin Percival开发的一对二进制文件差分与合成算法，主要用于生成和应用二进制文件的补丁。这对算法的核心优势在于能够高效地找出两个二进制文件之间的…

阅读更多...

Android Tinker Dex文件格式解析与字节码修改原理的源码深度剖析(5)

Android Tinker Dex文件格式解析与字节码修改原理的源码深度剖析(5)

Android Tinker Dex文件格式解析与字节码修改原理的源码深度剖析一、Dex文件格式基础1.1 Dex文件概述Android应用的Java代码在编译后会转换为Dex(Dalvik Executable)格式，这种格式专为移动设备优化，减少了冗余信息并提高了类加载速度。Dex文件是Android应用的核心执行文件，理…

阅读更多...

Android Tinker核心架构剖析(1)

Android Tinker核心架构剖析(1)

一、Tinker核心架构总览1.1 架构设计目标与核心价值Tinker作为Android热修复框架，核心目标是在不重启App的情况下实现代码、资源和So库的动态更新。其架构设计围绕高效差分合成、稳定加载机制和系统兼容性展开，核心价值体现在：最小化补丁包体积：通过bsdiff/bspatch算法生成…

阅读更多...

【路径规划】基于matlab A_Star结合DWA算法电气设备巡检机器人路径规划研究（Matlab代码实现）

【路径规划】基于matlab A_Star结合DWA算法电气设备巡检机器人路径规划研究（Matlab代码实现）

💥💥💞💞欢迎来到本博客❤️❤️💥💥🏆博主优势：🌞🌞🌞博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。📋📋📋本文内容如下：🎁🎁🎁 ⛳️赠与读者👨💻做科研，涉及到一个深在的思想系统，需要科研者…

阅读更多...

Android Tinker运行时错误上报流程原理深度剖析(20)

Android Tinker运行时错误上报流程原理深度剖析(20)

Android Tinker运行时错误上报流程原理深度剖析一、引言在Android应用开发中，热修复技术能够快速修复线上问题，提升用户体验。Tinker作为一款优秀的热修复框架，其运行时错误上报流程是保证框架稳定性和可维护性的关键。本文将从源码级别深入分析Tinker的运行时错误上报流程原…

阅读更多...

Android Runtime BootClassLoader核心逻辑原理(22)

Android Runtime BootClassLoader核心逻辑原理(22)

Android Runtime BootClassLoader核心逻辑原理一、BootClassLoader概述1.1 Android类加载器体系与BootClassLoader定位在Android系统的类加载机制中，类加载器构成了一个层次分明的体系，主要包括BootClassLoader、PathClassLoader和DexClassLoader 。其中，BootClassLoader处于…

阅读更多...

系统盘不知不觉满了怎么办？7个解决方法

系统盘不知不觉满了怎么办？7个解决方法

很多用户在日常使用电脑时，都会发现一个令人头疼的问题：C盘（系统盘）容量越来越小，甚至动不动就弹出“磁盘空间不足”的提示。尤其是 Windows 系统，一旦系统盘剩余空间不足，不仅会导致运行速度变慢，还可能影响系统更新、软件运行，甚至造成数据丢失。在本文中，我们不仅…

阅读更多...

最新文章