李理的博客

微信服务号爬虫

微信公众号爬虫v1.2实现了订阅号的抓取,但是没有实现服务号的抓取,原因是服务号的页面无法通过pywinauto得到页面的信息,从而无法模拟人的操作点击文章。本文通过视觉的页面分析,让爬虫模拟人类分析出文章的位置,从而实现服务号抓取。


Python函数的进阶知识(二)

本文介绍Python函数相关的进阶知识。


Python函数的进阶知识(一)

本文介绍Python函数相关的进阶知识。


使用pytesseract识别微信阅读数

上文在抓取微信公众号文章阅读数的时候实现了阅读区域的定位,但是还有一个遗留问题那就是需要获得阅读数。本文使用pytesseract提取其中的阅读数。


使用pywinauto抓取阅读数的尝试

本文的相关项目为微信公众号爬虫的抓取原理。这是尝试抓取阅读数的记录。


使用pywinauto驱动微信客户端实现公众号抓取

本文介绍项目微信公众号爬虫的抓取原理。


Huggingface Transformer教程(一)

本系列文章介绍Huggingface Transformer的用法。


使用Appium驱动手机版微信(三)

本文是使用Appium驱动手机版微信的系列文章的第三篇,详细介绍使用Appium时需要做的一些设置。


Tensor2Tensor中英翻译代码阅读(五)

本系列文章是Tensor2Tensor的代码阅读,主要关注中英翻译的实现。本文是第五篇,继续介绍预测解码的代码。


Tensor2Tensor中英翻译代码阅读(四)

本系列文章是Tensor2Tensor的代码阅读,主要关注中英翻译的实现。本文是第四篇,继续介绍Transformer的训练代码。