Top Menu

Archive | DEV

获取实时汇率数据

今天尝试抓取汇率数据的时候发现找不到靠谱的API或者数据来源,最后选定了Google财经HK。它的汇率数据在 class=bid 的元素里,但是是数字中文混在一起的,通过截取前6位字符串可以分析出汇率。并且查询也可以直接通过URL进行参数输入,比较方便。

Continue Reading 0

抓取AF美国官网数据

今天尝试抓取AF美国官网数据,在抓取的过程中发现,网站会自动根据访问IP地址跳转到HK官网,导致抓取的网站内容变成了香港官网数据,遂采用cURL使用代理进行抓取。

然后将cURL获得的结果 $output 代入PHP Simple HTML DOM Parser进行分析

这里需要用到 str_get_html ( string $content ) 代替原来的 file_get_html ( string $filename )

Continue Reading 0

保存程序处理状态

因为淘宝对抓取次数由限制,故在抓取的过程中要被打断多次,每次都需要手动更改循环初始参数非常麻烦,所以试着保存程序最后处理状态,在下次运行程序时可以直接读取最后的处理状态。

Continue Reading 0

Powered by WordPress. Designed by WooThemes