php 读取网页源码 , 导出成txt文件, 读取xls,读取文件夹下的所有文件的文件名

<?php

// 读取网页源码
$curl = curl_init();
curl_setopt($curl, CURLOPT_URL, $url);
curl_setopt($curl, CURLOPT_HEADER, 1);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);//这个是重点。
$contents = curl_exec($curl);

//导出成txt文件
$str = "abcd";
$fp=fopen("pic.txt","w");
fputs($fp,$str);
fclose($fp);

//读取表格
require_once ‘excel_reader2.php‘;
$data = new Spreadsheet_Excel_Reader();
$data->setOutputEncoding(‘UTF-8‘);
$data->read($filename);
for($i=1;$i<=$data->sheets[0]["numRows"];$i++){
for($j=1;$j<=$data->sheets[0][‘numCols‘];$j++){
[email protected]$data->sheets[0][‘cells‘][$i][$j];
}
}

//读取文件夹下的所有文件的文件名
$filedir = "C:/Users/xia/Desktop/新建文件夹/ProductInfoList/";
$rfdir= new rdfile($filedir);
$file = implode("\r\n",$rfdir->fileList);
class rdfile{
public $fileList; // 所有子文件夹的文件名
public $ftype; // 限制文件的类型
public $dirlist; // 当前文件夹下的所有文件和文件夹名称。
function __construct($path,$filetype="*"){
if(!is_dir($path)){die("这不是个目录");}
$len = strlen($path)-1;
if($path{$len} == "/"||$path{$len} == "\\"){$path = substr($path,0,-1);}
$this->ftype = $filetype;
$this->fileList = array();
$this->readypath($path);
}
public function readypath($path){
$dirList = scandir($path);
unset($dirList[0]);
unset($dirList[1]);
$this->dirlist = $dirList;
foreach($dirList as $key=>$value){
$pathfile=$path. DIRECTORY_SEPARATOR .$value;
if(is_dir($pathfile)){
$this->readypath($pathfile);
}else if(is_file($pathfile)){
if($this->ftype=="*"){
$this->fileList[] = $pathfile;
}else{
if(strrchr($pathfile,".") == ".".$this->ftype){$this->fileList[] = $pathfile;}
}
}
}
}
}

?>

时间: 2024-10-18 05:47:37

php 读取网页源码 , 导出成txt文件, 读取xls,读取文件夹下的所有文件的文件名的相关文章

&lt;&lt;&lt; Java提取网页源码

package com.sevennight; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.FileWriter; import java.io.IOException; import java.io.InputStreamReader; public class zidongwenzi { /** * @param args * @param * @throws IOException

Python3.4 获取百度网页源码并保存在本地文件中

最近学习python 版本 3.4 抓取网页源码并且保存在本地文件中 import urllib.request url='http://www.baidu.com' #上面的url一定要写明确,如果写成www.baidu.com,下一步就会报错. response=urllib.request.urlopen(url) #下一步获取html,但是是Byte格式的,我们要解码 html=response.read() html_str=html.decode('utf-8') #下面我们把get

delphi webbrowser 获取网页源码

转自 http://hi.baidu.com/delphidiary 转自 http://blog.sina.com.cn/s/blog_725fb194010150jh.html //前面要加几个pas单元uses Registry,ShellApi, WinInet,ShlObj,ComObj;//========================================删COOKIES========================== procedure DelRegCache;

获取Excel数据(或部分数据)并导出成txt文本格式

运行代码前先导入jxl架包,以下代码仅供参考: 测试excel文件(我要获取该excel的内容为省.县.乡.村.组和PH的值): ExcelTest01类代码如下: // 读取Excel的类 import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; public class ExcelT

捧腹网短笑话正则匹配-如何剔除网页源码的制表符

以捧腹网的短笑话为例,我们可以通过requests方法提取出网页的源代码,然后通过正则匹配来得到相关的短笑话 第一步,得到网页源码,使用requests的get方法,需要注意的是,网页默认编码是utf-8,我们需要指定编码格式为utf-8,才能正确显示出网页的文本信息 #-*- coding:utf-8 -*-import requestsimport re respon=requests.get('https://www.pengfu.com/xiaohua_1.html?qq-pf-to=p

httpclient下载网页源码---java基础爬虫

有关httpclient: HttpClient相比传统JDK自带的URLConnection,增加了易用性和灵活性,它不仅使客户端发送Http请求变得容易,而且也方便开发人员测试接口(基于Http协议的),提高了开发的效率,也方便提高代码的健壮性.因此熟练掌握HttpClient是很重要的必修内容,掌握HttpClient后,相信对于Http协议的了解会更加深入. org.apache.commons.httpclient.HttpClient与org.apache.http.client.H

测试使用fpm将python3的源码打包成rpm来安装

一.基础环境 1.在tvm-base的基础上,复制一个镜像为tvm-rpm来测试. 2.网络: eth0:host-only(用于虚拟内网,手动固定IP,这样从宿主机可以直接连接到这个vm) eth1:NAT(用于上外网,动态IP) [[email protected] ~]# ip a s dev eth0 |grep global     inet 192.168.56.253/24 brd 192.168.56.255 scope global eth0 [[email protected

POST教程笔记 - WinHttp获取网页源码

①.WinINet与WinHttp的异同点,为什么使用WinHttp讲解? 详情见:<WinINet与WinHttp总结>文档,已经打包给大家了. ②.WinHttp接口调用方式:微软官方地址:http://msdn.microsoft.com/en-us/ ... 84263(v=vs.85).aspxWinHttp微软提供了两种调用方式:C++调用API的版本.COM组件的版本.这里面使用的是 C++ Interface 接口的组件的方式来给大家讲解. ③.WinHttp常用命令讲解:详情

IXMLHTTPRequest获取网页源码的心得

在万一老师的博客看到一种利用IXMLHTTPRequest来获取网页源码的方法,但有2个问题没解决,自己研究了下改进了方法. 1.如果网页进行301转跳将无法获取源码 2.如果网站是gb2312编码将获取的是乱码 /////以下方法使用的是Delphi xe2编写 uses MsXML,activex; function GETHTML (const URL : string):string; // XMLHTTP接口Var XMLHTTP:IServerXMLHTTPRequest; HTML