php中curl抓取页面

function curl($url){
$ch = curl_init();
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 5000);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_HTTPHEADER, array(‘User-Agent: Mozilla/5.0 (iPhone; CPU iPhone OS 8_0 like Mac OS X) AppleWebKit/600.1.3 (KHTML, like Gecko) Version/8.0 Mobile/12A4345d Safari/600.1.4‘));
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);
$contents = curl_exec($ch);
curl_close($ch);//关闭一打开的会话
return $contents;
}

注意这两个的重要性:

curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);

原文地址：https://www.cnblogs.com/NaN221/p/10109147.html

时间： 2024-10-19 09:30:21

php中curl抓取页面的相关文章

好用的 curl 抓取页面的封装函数

由于经常使用php curl 抓取页面的内容,在此mark 平时自己封装的 curl函数,(其实现在也开始用 Python 来爬了~ ^-^) /** * 封装curl方法 * @author FredGui * @param string $url 必选接口地址 * @param string $post 可选如果是post访问填写post参数数组 * @param int $timeout 可选超时时间 * @param string $cookie * @param int $de

curl抓取页面时遇到重定向的解决方法

用php的curl抓取网页遇到了问题,为阐述方便,将代码简化如下: [php] view plaincopy <?php function curlGet($url) { $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_HEADER, true); return curl_exec($ch);

CURL抓取页面

cURL的基本原理 curl是利用URL语法在命令行方式下工作的开源文件传输工具,他能够从互联网上获得各种各样的网络资源.简单来说,curl就是抓取页面的升级版. 1 2 3 4 5 6 7 8 9 10 11 12 <?php //1.初始化,创建一个新cURL资源 $ch = curl_init(); //2.设置URL和相应的选项 curl_setopt($ch, CURLOPT_URL, "http://www.baidu.com/"); curl_setopt

curl 抓取页面信息

<?php // 1. 初始化 $ch = curl_init(); // 2. 设置选项,包括URL curl_setopt($ch, CURLOPT_URL, "www"); curl_setopt($ch, CURLOPT_HEADER, 0); //curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); //加上这一行,则返回的内容作为变量储存,而不是直接输出 curl_setopt($ch, CURLOPT_HTTPHEADER, ar

curl只能抓取页面的部分内容的原因

核心提示:先列出 HessianPHP 的错误提示: CURL transport error: transfer closed with outstanding read data remaining 基础知识背景: 1)"Expect: 100-continue"的来龙去脉: HTTP/1.1 协议里设计100 (Continue) HTTP 状态码的的目的是,在客 ... 先列出 HessianPHP 的错误提示: CURL transport error: transfer c

使用PHP的正则抓取页面中的网址

最近有一个任务,从页面中抓取页面中所有的链接,当然使用PHP正则表达式是最方便的办法.要写出正则表达式,就要先总结出模式,那么页面中的链接会有几种形式呢? 链接也就是超级链接,是从一个元素(文字.图片.视频等)链接到另一个元素(文字.图片.视频等).网页中的链接一般有三种,一种是绝对URL超链接,也就是一个页面的完整路径:另一种是相对URL超链接,一般都链接到同一网站的其他页面:还有一种是页面内的超链接,这种一般链接到同一页面内的其他位置. 搞清楚了链接的种类,就知道要抓链接,主要还是绝对URL

用PHP抓取页面并分析

在做抓取前,记得把php.ini中的max_execution_time设置的大点,不然会报错的. 一.用Snoopy.class.php抓取页面一个挺萌的类名.功能也很强大,用来模拟浏览器的功能,可以获取网页内容,发送表单等. 1)我现在要抓取一个网站的列表页的内容,我要抓取的是全国的医院信息内容,如下图: 2)我很自然的将URL地址复制下来,用Snoopy类来抓取前10页的页面内容,而且将内容放到本地来,在本地建立html文件,等下用于分析. $snoopy=new Snoopy(); /

beautifulsoup学习-抓取页面并解析

以汽车之家为例子,抓取页面并进行解析 # -*- coding=utf-8 -*- import urllib2 from BeautifulSoup import BeautifulSoup as bs3 import json import codecs #字符检测,用来检测其真实的编码格式 import chardet #save content to file def save_to_file(filename, content): f = open(filename, 'w+') as

php抓取页面的几种方式

在做一些天气预报或者RSS订阅的程序时,往往需要抓取非本地文件,一般情况下都是利用php模拟浏览器的访问,通过http请求访问url地址, 然后得到html源代码或者xml数据,得到数据我们不能直接输出,往往需要对内容进行提取,然后再进行格式化,以更加友好的方式显现出来. 下面简单说一下php抓取页面的几种方法及原理: 一. PHP抓取页面的主要方法: 1. file()函数 2. file_get_contents()函数 3. fopen()->fread()->fclose()模式 4

猜你喜欢

Intellij Idea web项目的部署配置[转]

原文地址:http://blog.csdn.net/z69183787/article/details/41416189 1.前言 2.项目配置(Project Structure) 2.1 Proj ...

街区最短路径问题

时间限制:3000 ms | 内存限制:65535 KB 难度:4 描述一个街区有很多住户,街区的街道只能为东西.南北两种方向. 住户只可以沿着街道行走. 各个街道之间的间隔相等. 用(x,y) ...

关于Spring Security的笔记

1.web.xml配置文件加载Spring Security,将DelegatingFilterProxy配置在DispatcherServlet之前. <filter> <fil ...

VC GDI双缓冲机制绘图防屏幕闪烁实现步骤

在OnDraw(CDC* pDC) 中添加如下代码 CDC MemDC; //首先定义一个显示设备对象 CBitmap MemBitmap;//定义一个位图对象 //随后建立与屏幕显示兼容的内存显示设 ...

《构建之法》读书笔记⑥

相对于软件的质量的解释有很多种,但是他们都强调了软件要符合用户以及利益相关者的需求. 软件=程序+软件工程程序的质量体现在软件外在功能的质量,衡量软件的质量基本可以用是|否来判定.软件的开发过程有三 ...

Java基础知识2

1.Java中基本数据类型有哪些?各占几个字节?Java中引用数据类型有哪些?基本数据Java中char类型用什么编码? byte字节型1字节,short短整型2字节,int整型4字节,long长整型 ...

冲刺(2)

一.昨天本来想尝试着自己写函数,不过查了好多的资料,都没有实现,最后还是调用系统函数实现的. 二.今天今天的任务是做截图完成后,图片的保存. 三.明天自动选取截屏的区域四.有图有真想

模拟实现一个ATM + 购物商城程序

作业需求: 1.额度 15000或自定义 2.实现购物商城,买东西加入购物车,调用信用卡接口结账 3.可以提现,手续费5% 4.每月22号出账单,每月10号为还款日,过期未还,按欠款总额万分之5 ...

表单和验证事件以及marquee标签

1.表单验证<form></form> (1).非空验证(去空格) (2).对比验证(跟一个值对比) (3).范围验证(根据一个范围进行判断) (4).固定格式验证:电话号码, ...

[Python] 字典推导 PEP 274 -- Dict Comprehensions

之前自己也遇到过一次,这段时间在群里也遇到过几次的一个问题用python2.7写的一段程序.里面用到了字典推导式,可是server版本号是python2.6,无法执行. 今天查了下关于Dict Co ...

动态规划背包问题洛谷P1064 金明的预算方案

P1064 金明的预算方案题目描述金明今天很开心,家里购置的新房就要领钥匙了,新房里有一间金明自己专用的很宽敞的房间.更让他高兴的是,妈妈昨天对他说:"你的房间需要购买哪些物品,怎么布置 ...

1-5 计算机执行指令的过程

一.计算机执行一条指令的主要步骤第一步:取指(Fetch) 第二步:译码(Decode) 第三步:执行(Execute) 第四步:回写(Write-Back) 二.执行指令的示例例如指令: ADD ...

Java简单类——多对多映射

1 class Item { // 父栏目 2 private int iid ; 3 private String name ; 4 private String note ; 5 private ...

升级公司confluence版本

公司使用Confluence站点作为内部wiki分享的页面.当前的版本为5.9,准备升级到6.3. 由于从版本5升级到6加入了新的"collaborative edit"功能,因此 ...

postgis 利用 php 返回geojson格式数据

直接上代码 1.db_config.php <?php /* * All database connection variables */ $host = "host=127.0.0. ...

MyBatis 配置控制台上显示sql语句（log4j.properties 之三）

### direct log messages to stdout ###log4j.appender.stdout=org.apache.log4j.ConsoleAppenderlog4j.app ...

NSNumberFormatter的使用介绍及示例

在Xcode的Foundation框架中,NSFormatter只是一个抽象类,我们平常用到的是它的两个子类:NSNumberFormatter.NSDateFormatter,本篇先介绍NSNumb ...

四则运算源程序

//四则运算程序,支持真分数运算//2016,03,04 #include<iostream>#include<stdlib.h>#include<time.h>u ...

Borg Maze(MST & bfs)

Borg Maze Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 9220 Accepted: 3087 Descrip ...

javax.lang.model Implementation Backed by Core Reflection

javax.lang.model Implementation Backed by Core Reflection 1.javax.lang.model: How do I get the type ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.023 s.