当前位置:首页 > 编程笔记 > 正文
已解决

Python统计pdf中英文单词的个数

来自网友在路上 173873提问 提问时间:2023-09-19 01:03:24阅读次数: 73

最佳答案 问答题库738位专家为你答疑解惑

之前的文章提供了批量识别pdf中英文的方法,详见【python爬虫】批量识别pdf中的英文,自动翻译成中文上。以及自动pdf英文转中文文档,详见【python爬虫】批量识别pdf中的英文,自动翻译成中文下。
  
本文实现python统计pdf中英文字符的个数。

文章目录

    • 一、要统计字符的pdf文档
    • 二、识别pdf中的字符
    • 三、定义统计单页pdf中字符个数的函数
    • 四、统计pdf中字符的个数

  

一、要统计字符的pdf文档

  
首先看下要统计字符的pdf长什么样。

在这里插入图片描述

为了简单、清晰,本文以统计两页英文pdf字符为例进行阐述,代码直接可以应用到任意页数的英文pdf中。

  
  

二、识别pdf中的字符

  
接着应用pdfplumber库识别pdf中的字符,具体代码如下:

查看全文

99%的人还看了

猜你感兴趣

版权申明

本文"Python统计pdf中英文单词的个数":http://eshow365.cn/6-9002-0.html 内容来自互联网,请自行判断内容的正确性。如有侵权请联系我们,立即删除!