因为淘宝的防抓取机制更新后更加严格,导致原先的Curl抓取方式基本上作废了,这次的更新主要就是把抓取核心从Curl换成selenium,因为是模拟浏览器访问网页,所以相比Curl来说抓取更加的直观和易操作。
Archive | DEV
API中Callback函数的作用
一些api都支持带Callback参数的请求,那到底提供的这个Callback参数有什么用,下面一起来看看。
My Life Time V1.0
实现功能
计算自出生到目前的总时间
ANFtools数据库统计
自从今年4月份开始把ANFtools搜索的论坛店铺抓取的结果存入数据库之后,至今已有了4万条数据,总大小已经达到了23MB。
ANFtoolsV2核心更新
这次双十一之后,发现淘宝更改了屏蔽策略,直接抓取店铺会被跳转到登陆页面。