欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

PHP中curl post的用法及原理解析

程序员文章站 2024-02-03 22:34:52
...
1、首先说明一下,curl的百科解释是:

PHP[2]支持的由Daniel Stenberg创建的libcurl库允许你与各种的服务器使用各种类型的协议进行连接和通讯。libcurl目前支持http、https、ftp、gopher、telnet、dict、file和ldap协议。libcurl同时也支持HTTPS认证、HTTP POST、HTTP PUT、 FTP 上传(这个也能通过PHP的FTP扩展完成)、HTTP 基于表单的上传、代理、cookies和用户名+密码的认证。PHP中使用cURL实现Get和Post请求的方法

2、简单来说,curl就是抓取页面的升级版,即支持GET、POST等浏览器行为,从而可以达到一个模拟浏览器操作的目的。

最简单的一个模型就是如下图所示的模型:


就是初始化,配置,取页面源代码数据,关闭。一个非常简单的例子如下所示:


我们可以看到浏览器会输出百度的页面结果。我们继续深入研究如何使用curl来达到一个模拟登陆的过程,也就是模拟post的过程。

3、POST的过程比较复杂一些,但是原理和浏览器提交过程相同,简单来说,就是利用curl直接将用户名和密码(或者其他相应的参数,这个根据post页面具体讨论)提交到post指向的处理页面即可。过程如下图:


当然,我们可以看到过程几乎一样,只是在curl初始化之后,要生成一些列的post参数,然后再提交,等待返回数据。

例子如下:


注:例子亲测有效,只是我把我自己测试的真实账号修改了一下。

上面的例子就可以显示,我们可以成功或者失败的返回数据。

但是上面有一个问题,就是失效性,也就是我们仅仅登陆成功了登陆页是没有效果的,服务器不一定保持了我们的登陆状态,所以如果我们直接取其他页面的数据,网站又会给出未登录提示,这里就需要设置一个cookie。

4、cookie设置及登陆


根据图形,我们可以分两步走,第一步模拟登陆并且设置cookie。第二步读取cookie并且加载需要登陆后访问的页面。

下面给出测试成功的例子。


根据结果,显示成功。这里我的网址和相关参数全部修改了,读者可以根据自己的需要做相应的修改。

上一篇: 怎么抓取网页实时内容

下一篇: