..

python实现批量截屏

豆瓣、网易的阅读都不能导出,尝试看了调试台自己的能力不能提取文本。后来转换思路,感觉可以通过抓图解决。

昨天尝试了百度的OCR接口,个人用很好用,每天50000次,效果很好。但排版不好。考虑在win平台用ahk,下载了一下发现还要熟悉语言,于是放弃,回到linux平台,python解决。

思路是开两个窗口,一个终端、一个浏览器,分屏。在脚本里先执行切换窗口,然后截取指定区域,保存图片,然后模拟键盘翻页,直到整个电子书翻完。所有图片导入OCR软件即可识别,效果很好。代码在github。

办法很低端,但能解决问题就好。做为用户就够了。