发现问题
用PDF阅读器PDF-XChange edit打开文件时出现部分文字无法正常显示的问题
分析原因
系统中字体库不全,需要下载并安装相应的字库
解决方法
在PDF-Xchange edit软件中打开文件属性,查看字体中显示未嵌入的字体,基本上就是系统字体库中缺失的字体,根据提示的字体文件名称及编码信息查找相应的字体并安装,最后重启PDF-Xchange edit软件,PDF文件中的字体就可以正常显示了。另外用python中的PDFminer-six打开PDF文件出现编码异常的问题时,可以用这个软件打开相应的文件,查看对应字体的编码,再到GitHub上下载相应的编码支持的文件,并放置到C:\Python\Lib\site-packages\pdfminer.six-20181108-py3.7.egg\pdfminer\cmap文件夹下,格式均为.gz扩展,可以有效解决因编码异常导致的识别出错。