PHP的cURL库简介及使用示例
使用PHP的cURL库可以简单和有效地去抓网页。你只需要运行一个脚本,然后分析一下你所抓取的网页,然后就可以以程序的方式得到你想要的数据了。无论是你想从从一个链接上取部分数据,或是取一个XML文件并把其导入数据库,那怕就是简单的获取网页内容,cURL是一个功能强大的PHP库。
PHP中的CURL函数库(ClientURLLibraryFunction)
curl_close—关闭一个curl会话 curl_copy_handle—拷贝一个curl连接资源的所有内容和参数 curl_errno—返回一个包含当前会话错误信息的数字编号 curl_error—返回一个包含当前会话错误信息的字符串 curl_exec—执行一个curl会话 curl_getinfo—获取一个curl连接资源句柄的信息 curl_init—初始化一个curl会话 curl_multi_add_handle—向curl批处理会话中添加单独的curl句柄资源 curl_multi_close—关闭一个批处理句柄资源 curl_multi_exec—解析一个curl批处理句柄 curl_multi_getcontent—返回获取的输出的文本流 curl_multi_info_read—获取当前解析的curl的相关传输信息 curl_multi_init—初始化一个curl批处理句柄资源 curl_multi_remove_handle—移除curl批处理句柄资源中的某个句柄资源 curl_multi_select—GetallthesocketsassociatedwiththecURLextension,whichcanthenbe"selected" curl_setopt_array—以数组的形式为一个curl设置会话参数 curl_setopt—为一个curl设置会话参数 curl_version—获取curl相关的版本信息 curl_init()函数的作用初始化一个curl会话,curl_init()函数唯一的一个参数是可选的,表示一个url地址。 curl_exec()函数的作用是执行一个curl会话,唯一的参数是curl_init()函数返回的句柄。 curl_close()函数的作用是关闭一个curl会话,唯一的参数是curl_init()函数返回的句柄。
例子一:基本例子
﹤?php //初始化一个cURL对象 $curl=curl_init(); //设置你需要抓取的URL curl_setopt($curl,CURLOPT_URL,'http://www.cmx8.cn'); //设置header curl_setopt($curl,CURLOPT_HEADER,1); //设置cURL参数,要求结果保存到字符串中还是输出到屏幕上。 curl_setopt($curl,CURLOPT_RETURNTRANSFER,1); //运行cURL,请求网页 $data=curl_exec($curl); //关闭URL请求 curl_close($curl); //显示获得的数据 var_dump($data); ?>
例子二:POST数据
sendSMS.php,其可以接受两个表单域,一个是电话号码,一个是短信内容。
﹤?php $phoneNumber='13812345678'; $message='Thismessagewasgeneratedbycurlandphp'; $curlPost='pNUMBER='.urlencode($phoneNumber).'&MESSAGE='.urlencode($message).'&SUBMIT=Send'; $ch=curl_init(); curl_setopt($ch,CURLOPT_URL,'http://www.lxvoip.com/sendSMS.php'); curl_setopt($ch,CURLOPT_HEADER,1); curl_setopt($ch,CURLOPT_RETURNTRANSFER,1); curl_setopt($ch,CURLOPT_POST,1); curl_setopt($ch,CURLOPT_POSTFIELDS,$curlPost); $data=curl_exec(); curl_close($ch); ?﹥
例子三:使用代理服务器
﹤?php $ch=curl_init(); curl_setopt($ch,CURLOPT_URL,'http://www.cmx8.cn'); curl_setopt($ch,CURLOPT_HEADER,1); curl_setopt($ch,CURLOPT_RETURNTRANSFER,1); curl_setopt($ch,CURLOPT_HTTPPROXYTUNNEL,1); curl_setopt($ch,CURLOPT_PROXY,'proxy.lxvoip.com:1080'); curl_setopt($ch,CURLOPT_PROXYUSERPWD,'user:password'); $data=curl_exec(); curl_close($ch); ?﹥
例子四:模拟登录
Curl模拟登录discuz程序,适合DZ7.0,将username改成你的用户名,userpass改成你的密码就可以了.
<?php /** *Curl模拟登录discuz程序 *尚未实现开启验证码的的论坛登录功能 */ !extension_loaded('curl')&&die('Thecurlextensionisnotloaded.'); $discuz_url='http://www.lxvoip.com';//论坛地址 $login_url=$discuz_url.'/logging.php?action=login';//登录页地址 $get_url=$discuz_url.'/my.php?item=threads';//我的帖子 $post_fields=array(); //以下两项不需要修改 $post_fields['loginfield']='username'; $post_fields['loginsubmit']='true'; //用户名和密码,必须填写 $post_fields['username']='lxvoip'; $post_fields['password']='88888888'; //安全提问 $post_fields['questionid']=0; $post_fields['answer']=''; //@todo验证码 $post_fields['seccodeverify']=''; //获取表单FORMHASH $ch=curl_init($login_url); curl_setopt($ch,CURLOPT_HEADER,0); curl_setopt($ch,CURLOPT_RETURNTRANSFER,1); $contents=curl_exec($ch); curl_close($ch); preg_match('/<input\s*type="hidden"\s*name="formhash"\s*value="(.*?)"\s*\/>/i',$contents,$matches); if(!empty($matches)){ $formhash=$matches[1]; }else{ die('Notfoundtheforumhash.'); } //POST数据,获取COOKIE $cookie_file=dirname(__FILE__).'/cookie.txt'; //$cookie_file=tempnam('/tmp'); $ch=curl_init($login_url); curl_setopt($ch,CURLOPT_HEADER,0); curl_setopt($ch,CURLOPT_RETURNTRANSFER,1); curl_setopt($ch,CURLOPT_POST,1); curl_setopt($ch,CURLOPT_POSTFIELDS,$post_fields); curl_setopt($ch,CURLOPT_COOKIEJAR,$cookie_file); curl_exec($ch); curl_close($ch); //带着上面得到的COOKIE获取需要登录后才能查看的页面内容 $ch=curl_init($get_url); curl_setopt($ch,CURLOPT_HEADER,0); curl_setopt($ch,CURLOPT_RETURNTRANSFER,0); curl_setopt($ch,CURLOPT_COOKIEFILE,$cookie_file); $contents=curl_exec($ch); curl_close($ch); var_dump($contents); ?>
以上就是本文的全部内容了,希望大家能够喜欢。