2019-02-04

python实现批量截屏

豆瓣、网易的阅读都不能导出，尝试看了调试台自己的能力不能提取文本。后来转换思路，感觉可以通过抓图解决。

昨天尝试了百度的OCR接口，个人用很好用，每天50000次，效果很好。但排版不好。考虑在win平台用ahk，下载了一下发现还要熟悉语言，于是放弃，回到linux平台，python解决。

思路是开两个窗口，一个终端、一个浏览器，分屏。在脚本里先执行切换窗口，然后截取指定区域，保存图片，然后模拟键盘翻页，直到整个电子书翻完。所有图片导入OCR软件即可识别，效果很好。代码在github。

办法很低端，但能解决问题就好。做为用户就够了。