Archive | DEV

AFtools 2014年5月数据库更新

By minirplus on 2014-05-23 in ANFtools

进入5月，又到了衣服更新换代的季节。美国官网也开始对折促销了，趁这个时间更新了论坛店铺数据，然后对所有店铺的商品信息做了一次全面的抓取，收获不小。

Continue Reading 0

在PHPStorm中使用Composer管理GitHub开源项目

By minirplus on 2014-04-26 in DEV

由于现在大多数GitHub开源项目都在用Composer，导致要用到这些开源项目的时候不得不在自己的项目上也使用Composer。但是在集成Composer到自己项目的时候碰到很多的问题，

Continue Reading 0

获取实时汇率数据

By minirplus on 2014-04-25 in DEV

今天尝试抓取汇率数据的时候发现找不到靠谱的API或者数据来源，最后选定了Google财经HK。它的汇率数据在 class=bid 的元素里，但是是数字中文混在一起的，通过截取前6位字符串可以分析出汇率。并且查询也可以直接通过URL进行参数输入，比较方便。

Continue Reading 0

AF Tools V1.3 Private

By minirplus on 2014-04-25 in ANFtools

V1.3更新内容

增加了关键词搜索结果和价格区间搜索结果显示

增加了美元价格和港币价格显示

收录店铺数据181家

收录商品数据16712条

Continue Reading 0

抓取AF美国官网数据

By minirplus on 2014-04-25 in DEV

今天尝试抓取AF美国官网数据，在抓取的过程中发现，网站会自动根据访问IP地址跳转到HK官网，导致抓取的网站内容变成了香港官网数据，遂采用cURL使用代理进行抓取。

//初始化

$ch = curl_init();

//设置选项，包括URL

curl_setopt($ch, CURLOPT_URL, $url);

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

//curl_setopt($ch, CURLOPT_REFERER, $refer);

curl_setopt($ch, CURLOPT_HEADER, 0);

//curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, 0); // 对认证证书来源的检查

//curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 1); // 从证书中检查SSL加密算法是否存在

curl_setopt($ch, CURLOPT_PROXYAUTH, CURLAUTH_BASIC); //代理认证模式

curl_setopt($ch, CURLOPT_PROXY, "127.0.0.1"); //代理服务器地址

curl_setopt($ch, CURLOPT_PROXYPORT, 8088); //代理服务器端口

//curl_setopt($ch, CURLOPT_PROXYUSERPWD, ":"); //http代理认证帐号，username:password的格式

curl_setopt($ch, CURLOPT_PROXYTYPE, CURLPROXY_HTTP); //使用http代理模式

curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)");

//执行并获取HTML文档内容

$output = curl_exec($ch);

//释放curl句柄

curl_close($ch);

然后将cURL获得的结果 $output 代入PHP Simple HTML DOM Parser进行分析

1 2	//进行解析 $html = str_get_html($output);

这里需要用到 str_get_html ( string $content ) 代替原来的 file_get_html ( string $filename )

Continue Reading 0

← Previous 1 … 67 68 69 … 81 Next →

Top Menu

Navigation

Archive | DEV

AFtools 2014年5月数据库更新

在PHPStorm中使用Composer管理GitHub开源项目

获取实时汇率数据

AF Tools V1.3 Private

抓取AF美国官网数据