工作中经常会遇到需要处理网上查询的数据,手工整理起来费时费人,之前新闻报道过某大学生通过代码提取图片信息大大减轻信息收集工作人员的工作量,处理过程其实是不复杂的。本文介绍如何通过python提取列表类型的图片文字并输出到有excel的行中,其他类型的图片信息,只需举一反三修改一下识别后的文字处理逻辑即可,话不多说,马上行动起来。
图片样例如下图:
列表类型的图片
最终输出到excel文档中如下图:
提取的图片文字
关键代码逻辑如下:
1、需要用到easyocr库,安装命令:pip inatall easyocr
2、 ocr识别图片文字部分如图下
3、识别后处理文字输出到excel文档,使用到pandas库输出到excel文档
代码逻辑比较简单,需要的朋友们关注我评论一下,看到后我会把完整代码发你的喔~~~