PHP的cURL库简介及使用示例
使用PHP的cURL库可以简单和有效地去抓网页。你只需要运行一个脚本,然后分析一下你所抓取的网页,然后就可以以程序的方式得到你想要的数据了。无论是你想从从一个链接上取部分数据,或是取一个XML文件并把其导入数据库,那怕就是简单的获取网页内容,cURL是一个功能强大的PHP库。
PHP中的CURL函数库(ClientURLLibraryFunction)
curl_close—关闭一个curl会话 curl_copy_handle—拷贝一个curl连接资源的所有内容和参数 curl_errno—返回一个包含当前会话错误信息的数字编号 curl_error—返回一个包含当前会话错误信息的字符串 curl_exec—执行一个curl会话 curl_getinfo—获取一个curl连接资源句柄的信息 curl_init—初始化一个curl会话 curl_multi_add_handle—向curl批处理会话中添加单独的curl句柄资源 curl_multi_close—关闭一个批处理句柄资源 curl_multi_exec—解析一个curl批处理句柄 curl_multi_getcontent—返回获取的输出的文本流 curl_multi_info_read—获取当前解析的curl的相关传输信息 curl_multi_init—初始化一个curl批处理句柄资源 curl_multi_remove_handle—移除curl批处理句柄资源中的某个句柄资源 curl_multi_select—GetallthesocketsassociatedwiththecURLextension,whichcanthenbe"selected" curl_setopt_array—以数组的形式为一个curl设置会话参数 curl_setopt—为一个curl设置会话参数 curl_version—获取curl相关的版本信息 curl_init()函数的作用初始化一个curl会话,curl_init()函数唯一的一个参数是可选的,表示一个url地址。 curl_exec()函数的作用是执行一个curl会话,唯一的参数是curl_init()函数返回的句柄。 curl_close()函数的作用是关闭一个curl会话,唯一的参数是curl_init()函数返回的句柄。
例子一:基本例子
﹤?php //初始化一个cURL对象 $curl=curl_init(); //设置你需要抓取的URL curl_setopt($curl,CURLOPT_URL,'http://www.cmx8.cn'); //设置header curl_setopt($curl,CURLOPT_HEADER,1); //设置cURL参数,要求结果保存到字符串中还是输出到屏幕上。 curl_setopt($curl,CURLOPT_RETURNTRANSFER,1); //运行cURL,请求网页 $data=curl_exec($curl); //关闭URL请求 curl_close($curl); //显示获得的数据 var_dump($data); ?>
例子二:POST数据
sendSMS.php,其可以接受两个表单域,一个是电话号码,一个是短信内容。
﹤?php $phoneNumber='13812345678'; $message='Thismessagewasgeneratedbycurlandphp'; $curlPost='pNUMBER='.urlencode($phoneNumber).'&MESSAGE='.urlencode($message).'&SUBMIT=Send'; $ch=curl_init(); curl_setopt($ch,CURLOPT_URL,'http://www.lxvoip.com/sendSMS.php'); curl_setopt($ch,CURLOPT_HEADER,1); curl_setopt($ch,CURLOPT_RETURNTRANSFER,1); curl_setopt($ch,CURLOPT_POST,1); curl_setopt($ch,CURLOPT_POSTFIELDS,$curlPost); $data=curl_exec(); curl_close($ch); ?﹥
例子三:使用代理服务器
﹤?php $ch=curl_init(); curl_setopt($ch,CURLOPT_URL,'http://www.cmx8.cn'); curl_setopt($ch,CURLOPT_HEADER,1); curl_setopt($ch,CURLOPT_RETURNTRANSFER,1); curl_setopt($ch,CURLOPT_HTTPPROXYTUNNEL,1); curl_setopt($ch,CURLOPT_PROXY,'proxy.lxvoip.com:1080'); curl_setopt($ch,CURLOPT_PROXYUSERPWD,'user:password'); $data=curl_exec(); curl_close($ch); ?﹥
例子四:模拟登录
Curl模拟登录discuz程序,适合DZ7.0,将username改成你的用户名,userpass改成你的密码就可以了.
<?php
/**
*Curl模拟登录discuz程序
*尚未实现开启验证码的的论坛登录功能
*/
!extension_loaded('curl')&&die('Thecurlextensionisnotloaded.');
$discuz_url='http://www.lxvoip.com';//论坛地址
$login_url=$discuz_url.'/logging.php?action=login';//登录页地址
$get_url=$discuz_url.'/my.php?item=threads';//我的帖子
$post_fields=array();
//以下两项不需要修改
$post_fields['loginfield']='username';
$post_fields['loginsubmit']='true';
//用户名和密码,必须填写
$post_fields['username']='lxvoip';
$post_fields['password']='88888888';
//安全提问
$post_fields['questionid']=0;
$post_fields['answer']='';
//@todo验证码
$post_fields['seccodeverify']='';
//获取表单FORMHASH
$ch=curl_init($login_url);
curl_setopt($ch,CURLOPT_HEADER,0);
curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
$contents=curl_exec($ch);
curl_close($ch);
preg_match('/<input\s*type="hidden"\s*name="formhash"\s*value="(.*?)"\s*\/>/i',$contents,$matches);
if(!empty($matches)){
$formhash=$matches[1];
}else{
die('Notfoundtheforumhash.');
}
//POST数据,获取COOKIE
$cookie_file=dirname(__FILE__).'/cookie.txt';
//$cookie_file=tempnam('/tmp');
$ch=curl_init($login_url);
curl_setopt($ch,CURLOPT_HEADER,0);
curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch,CURLOPT_POST,1);
curl_setopt($ch,CURLOPT_POSTFIELDS,$post_fields);
curl_setopt($ch,CURLOPT_COOKIEJAR,$cookie_file);
curl_exec($ch);
curl_close($ch);
//带着上面得到的COOKIE获取需要登录后才能查看的页面内容
$ch=curl_init($get_url);
curl_setopt($ch,CURLOPT_HEADER,0);
curl_setopt($ch,CURLOPT_RETURNTRANSFER,0);
curl_setopt($ch,CURLOPT_COOKIEFILE,$cookie_file);
$contents=curl_exec($ch);
curl_close($ch);
var_dump($contents);
?>
以上就是本文的全部内容了,希望大家能够喜欢。