python识别pdf文字_原来图片文字、扫描版PDF可以这样识别,涨姿势了

论坛 期权论坛 编程之家     
选择匿名的用户   2021-6-2 20:55   2350   0

当你在网上下载了一个PDF文件,打开发现是扫描版的,无法直接复制、编辑里面的文字,该怎么办呢?

有人会选择对照PDF,手动一个一个字地输入,这种做法简直太蠢了,既浪费时间又浪费生命。聪明人会利用一些现成的OCR识别工具,将PDF文字提取出来,就可以自由地复制编辑啦!

那么问题来了:我们怎么识别图片文字、扫描版PDF呢?下面教你几种方法。

一、利用在线OCR识别工具

在线OCR识别工具的优点是无需安装、打开即用,比如下面这款「在线迅捷PDF转换器」,它不仅支持OCR,还支持文档格式转换、语音识别、在线PS等功能。

a770d87650af60a58d0ccd5aeb0705e2.png

下面我们就对它的OCR识别工具做一个简要介绍:

1、图片局部识别

这个功能可以让你自由地选择图片识别区域,选完后网站会自动对图片文字进行识别,十分快捷。

9d42abd1b8c602b0cacb8bb282ed0a34.gif

2、图片OCR识别

如果整张图片的文字都需要识别,可以利用此功能直接将整张图片上传到网站。

234e93d4ae3633b7621779dd9c3a24fe.gif

3、PDF OCR识别

将一整个扫描版PDF上传到网站,选择识别页码、效果以及转换格式,让网站自动处理。

d43296a6f2641ad25bb19b92d1ed06f3.png

这就是利用在线工具进行图片文字、扫描PDF识别的方法,下面我们再看另外一种方法。

二、利用微信小程序

微信上有一款叫做「迅捷文字识别」的小程序,可以把它理解为上面那个网站的小程序版,它也支持图片识别的功能。

b95b1c1dc2cf0c223c8b6c6b322cf41d.png

打开小程序后选择功能,上传图片,小程序就会自动识别图片文字了。

7e2788ef739241a314fa9cc6f0e82057.png

识别完成后,可以自由对文字进行翻译、复制、转发。

bdb25de56119156549549a5751c1ee10.png

那么,这两种图片文字识别的方式,你学会了吗?

分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:3875789
帖子:775174
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP