Top Menu

抓取AF美国官网数据

今天尝试抓取AF美国官网数据,在抓取的过程中发现,网站会自动根据访问IP地址跳转到HK官网,导致抓取的网站内容变成了香港官网数据,遂采用cURL使用代理进行抓取。

然后将cURL获得的结果 $output 代入PHP Simple HTML DOM Parser进行分析

这里需要用到 str_get_html ( string $content ) 代替原来的 file_get_html ( string $filename )

最后抓取成功。

虽然平时上AF美国管网都是挂代理,但是一直没有想明白服务器端怎么进行代理抓取,这次尝试用cURL进行抓取,然后再交给分析程序,解决了直接用分析程序抓取出现的各种问题,这个方法也可以十分方便的抓取到一些受限的国外网站的数据。

PS:上海AF店这个月开业了,下次有空去瞧瞧。

There are no comments yet

  • Hello, guest

Powered by WordPress. Designed by WooThemes