断点续传的原理(转)

断点续传的原理(转)[@[email protected]]zt from http://www.chinajavaworld.com

(一)断点续传的原理

其实断点续传的原理很简单,就是在Http的请求上和一般的下载有所不同而已。

打个比方,浏览器请求服务器上的一个文时,所发出的请求如下:

假设服务器域名为www.sjtu.edu.cn,文件名为down.zip。

GET /down.zip HTTP/1.1

Accept:image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms-excel, application/msword, application/vnd.ms-powerpoint, */*

Accept-Language: zh-cn

Accept-Encoding: gzip, deflate

User-Agent: Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)

Connection: Keep-Alive

服务器收到请求后,按要求寻找请求的文件,提取文件的信息,然后返回给浏览器,返回信息如下:

200

Content-Length=106786028

Accept-Ranges=bytes

Date=Mon, 30 Apr 2001 12:56:11 GMT

ETag=W/"02ca57e173c11:95b"

Content-Type=application/octet-stream

Server=Microsoft-IIS/5.0

Last-Modified=Mon, 30 Apr 2001 12:56:11 GMT 

所谓断点续传,也就是要从文件已经下载的地方开始继续下载。所以在客户端浏览器传给Web服务器的时候要多加一条信息--从哪里开始。

下面是用自己编的一个"浏览器"来传递请求信息给Web服务器,要求从2000070字节开始。

GET /down.zip HTTP/1.0

User-Agent: NetFox

RANGE: bytes=2000070-

Accept: text/html, image/gif, image/jpeg, *; q=.2, */*; q=.2

仔细看一下就会发现多了一行RANGE: bytes=2000070-

这一行的意思就是告诉服务器down.zip这个文件从2000070字节开始传,前面的字节不用传了。服务器收到这个请求以后,返回的信息如下:

206

Content-Length=106786028

Content-Range=bytes 2000070-106786027/106786028

Date=Mon, 30 Apr 2001 12:55:20 GMT

ETag=W/"02ca57e173c11:95b"

Content-Type=application/octet-stream

Server=Microsoft-IIS/5.0

Last-Modified=Mon, 30 Apr 2001 12:55:20 GMT

和前面服务器返回的信息比较一下,就会发现增加了一行:

Content-Range=bytes 2000070-106786027/106786028

返回的代码也改为206了,而不再是200了。

知道了以上原理,就可以进行断点续传的编程了。

(二)Java实现断点续传的关键几点

(1)用什么方法实现提交RANGE: bytes=2000070-。

当然用最原始的Socket是肯定能完成的,不过那样太费事了,其实Java的net包中提供了这种功能。代码如下:

		URL url = new URL("http://www.sjtu.edu.cn/down.zip");
		HttpURLConnection httpConnection = (HttpURLConnection)url.openConnection ();//设置User-Agent
		httpConnection.setRequestProperty("User-Agent","NetFox");//设置断点续传的开始位置
		httpConnection.setRequestProperty("RANGE","bytes=2000070");//获得输入流
		InputStream input =httpConnection.getInputStream();

从输入流中取出的字节流就是down.zip文件从2000070开始的字节流。

大家看,其实断点续传用Java实现起来还是很简单的吧。

接下来要做的事就是怎么保存获得的流到文件中去了。

保存文件采用的方法。

我采用的是IO包中的RandAccessFile类。

操作相当简单,假设从2000070处开始保存文件,代码如下:

		RandomAccess oSavedFile = new RandomAccessFile("down.zip","rw");
		long nPos = 2000070;//定位文件指针到nPos位置
		oSavedFile.seek(nPos);
		byte[] b = new byte[1024];
		int nRead;//从输入流中读入字节流,然后写到文件中
		while((nRead=input.read(b,0,1024)) > 0){
		      oSavedFile.write(b,0,nRead);
		}

怎么样,也很简单吧。

接下来要做的就是整合成一个完整的程序了。包括一系列的线程控制等等。

(三)断点续传内核的实现主要用了6个类,包括一个测试类。

SiteFileFetch.java负责整个文件的抓取,控制内部线程(FileSplitterFetch类)。

FileSplitterFetch.java负责部分文件的抓取。

FileAccess.java负责文件的存储。

SiteInfoBean.java要抓取的文件的信息,如文件保存的目录,名字,抓取文件的URL等。

Utility.java工具类,放一些简单的方法。

TestMethod.java测试类。

下面例子的思路就是在下载的时候把一些即时信息,如已下载的文件的长度等信息存放到临时文件中,下载连接时首先判断临时文件是否存在,不存在就重新下,存在就读取临时文件中的以下载长度,然后从这个点再开始下。

下面是源程序:

SiteFileFetch.java类文件:

package nc.pub.ump.download;

import java.io.DataInputStream;
import java.io.DataOutputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.net.HttpURLConnection;
import java.net.URL;

/**
 * 传输文件线程类。
 * @author whs
 * @version 1.0
 */
public class SiteFileFetch extends Thread {
	SiteInfoBean siteInfoBean = null;
	long[] nPos;		//	文件位置指针
	long[] nStartPos;	//	开始位置
	long[] nEndPos;		//	结束位置
	FileSplitterFetch[] fileSplitterFetch;	//	子线程对象
	long nFileLength;	//	文件长度
	boolean bFirst = true;	//	是否第一次读取
	boolean bStop = false;	// 	停止标志
	File tmpFile; 			//	文件传输临时信息
	DataOutputStream output;//	输出到文件的输出流
	public SiteFileFetch(SiteInfoBean bean) throws IOException {
		siteInfoBean = bean;
		tmpFile = new File(bean.getSFilePath() + File.separator + bean.getSFileName() + ".info");
		if (tmpFile.exists()) {
			bFirst = false;
			read_nPos();
		} else {
			nStartPos = new long[bean.getNSplitter()];
			nEndPos = new long[bean.getNSplitter()];
		}
	}

	public void run() {
		try {
			if (bFirst) {
				// 获得文件长度
				nFileLength = getFileSize();
				if (nFileLength == -1) {
					System.err.println("File Length is not known");
				} else if (nFileLength == -2) {
					System.err.println("File is not access!");
				} else {
					// 分割下载文件
					for (int i = 0; i < nStartPos.length; i++) {
						nStartPos[i] = (long) (i * (nFileLength / nStartPos.length));
					}
					for (int i = 0; i < nEndPos.length - 1; i++) {
						nEndPos[i] = nStartPos[i + 1];
					}
					nEndPos[nEndPos.length - 1] = nFileLength;
				}
			}
			// 创建FileSplitterFetch类实例
			fileSplitterFetch = new FileSplitterFetch[nStartPos.length];
			// 启动FileSplitterFetch线程
			for (int i = 0; i < nStartPos.length; i++) {
				fileSplitterFetch[i] = new FileSplitterFetch(siteInfoBean.getSSiteURL(),
						siteInfoBean.getSFilePath() + File.separator + siteInfoBean.getSFileName(),
						nStartPos[i], nEndPos[i], i);
				Utility.log("Thread " + i + ",nStartPos=" + nStartPos[i] + " ,nEndPos= " + nEndPos[i]);
				fileSplitterFetch[i].start();
			}
			boolean breakWhile = false;
			// 等待子线程结束
			while (!bStop) {
				write_nPos();
				Utility.sleep(500);
				breakWhile = true;
				for (int i = 0; i < nStartPos.length; i++) {
					// 等待子线程返回
					if (!fileSplitterFetch[i].bDownOver) {
						breakWhile = false;
						break;
					}
				}
				// 是否结束while循环
				if (breakWhile)
					break;
			}
			System.out.println("文件传输结束!");
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

	/**
	 * 获得文件长度
	 * @return
	 */
	public long getFileSize() {
		int nFileLength = -1;
		try {
			// 创建与WEB服务器的连接
			URL url = new URL(siteInfoBean.getSSiteURL());
			HttpURLConnection httpConnection = (HttpURLConnection) url.openConnection();
			httpConnection.setRequestProperty("User-Agent", "sample.resumebrokentransfer");
			int responseCode = httpConnection.getResponseCode();
			if (responseCode >= 400) {
				processErrorCode(responseCode);
				// -2为WEB服务器响应错误
				return -2;
			}

			String sHeader;
			for (int i = 1;; i++) {
				sHeader = httpConnection.getHeaderFieldKey(i);
				if (sHeader != null) {
					if (sHeader.equals("Content-Length")) {
						nFileLength = Integer.parseInt(httpConnection.getHeaderField(sHeader));
						break;
					}
				} else {
					break;
				}
			}
		} catch (IOException e) {
			e.printStackTrace();
		} catch (Exception e) {
			e.printStackTrace();
		}
		Utility.log(nFileLength);
		return nFileLength;
	}

	/**
	 * 保存传输文件指针位置
	 */
	private void write_nPos() {
		try {
			output = new DataOutputStream(new FileOutputStream(tmpFile));
			output.writeInt(nStartPos.length);
			for (int i = 0; i < nStartPos.length; i++) {
				output.writeLong(fileSplitterFetch[i].nStartPos);
				output.writeLong(fileSplitterFetch[i].nEndPos);
			}
			output.close();
		} catch (IOException e) {
			e.printStackTrace();
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

	/**
	 * 读取保存的下载文件指针位置
	 */
	private void read_nPos() {
		try {
			DataInputStream input = new DataInputStream(new FileInputStream(tmpFile));
			int nCount = input.readInt();
			nStartPos = new long[nCount];
			nEndPos = new long[nCount];
			for (int i = 0; i < nStartPos.length; i++) {
				nStartPos[i] = input.readLong();
				nEndPos[i] = input.readLong();
			}
			input.close();
		} catch (IOException e) {
			e.printStackTrace();
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

	private void processErrorCode(int nErrorCode) {
		System.err.println("Error Code: " + nErrorCode);
	}

	public void siteStop() {
		bStop = true;
		for (int i = 0; i < nStartPos.length; i++)
			fileSplitterFetch[i].splitterStop();
	}
}

FileSplitterFetch.java文件类:

package nc.pub.ump.download;

import java.io.IOException;
import java.io.InputStream;
import java.net.HttpURLConnection;
import java.net.URL;
/**
 * @author whs
 * @version 1.0
 */
public class FileSplitterFetch extends Thread {
	/* 定义文件传输时使用的变量 */
	String sURL;
	/* 分段文件传输开始位置 */
	long nStartPos;
	/* 分段文件传输结束位置 */
	long nEndPos;
	/* 子线程ID */
	int nThreadID;
	/* 完成文件传输 */
	boolean bDownOver = false;
	/* 停止文件传输 */
	boolean bStop = false;
	FileAccess fileAccess = null;
	/**
	 *
	 * @param sURL
	 * @param sName
	 * @param nStart
	 * @param nEnd
	 * @param id
	 * @throws IOException
	 */
	public FileSplitterFetch(String sURL, String sName, long nStart, long nEnd, int id) throws IOException {
		this.sURL = sURL;
		this.nStartPos = nStart;
		this.nEndPos = nEnd;
		nThreadID = id;
		// 创建文件并打开
		fileAccess = new FileAccess(sName, nStartPos);
	}

	public void run() {
		while (nStartPos < nEndPos && !bStop) {
			// 创建连接
			try {
				URL url = new URL(sURL);
				HttpURLConnection httpConnection = (HttpURLConnection) url.openConnection();
				httpConnection.setRequestProperty("User-Agent", "NextFox");
				String sProperty = "bytes= " + nStartPos + "-";
				httpConnection.setRequestProperty("RANGE", sProperty);
				Utility.log(sProperty);
				// 创建输入流对象
				InputStream input = httpConnection.getInputStream();
				byte[] b = new byte[1024];
				int nRead;
				while ((nRead = input.read(b, 0, 1024)) > 0 && nStartPos < nEndPos && !bStop) {
					nStartPos += fileAccess.write(b, 0, nRead);
				}
				Utility.log("Thread " + nThreadID + "is over!");
				bDownOver = true;
			} catch (Exception e) {
				e.printStackTrace();
			}
		}
	}

	/**
	 * 处理和响应服务器头数据。
	 * @param con
	 */
	public void logResponseHead(HttpURLConnection con) {
		for (int i = 1;; i++) {
			String header = con.getHeaderFieldKey(i);
			if (header != null) {
				Utility.log(header + " : " + con.getHeaderField(header));
			} else {
				break;
			}
		}
	}

	public void splitterStop() {
		bStop = true;
	}
}

FileAccess.java负责文件的存储 文件类:

package nc.pub.ump.download;

import java.io.IOException;
import java.io.RandomAccessFile;
import java.io.Serializable;

/**
 * 定义文件访问类。
 * @author whs
 */
public class FileAccess implements Serializable {
	private static final long serialVersionUID = 1L;
	RandomAccessFile oSavedFile;
	long nPos;
	public FileAccess() throws IOException {
		this("", 0);
	}

	public FileAccess(String sName, long nPos) throws IOException {
		oSavedFile = new RandomAccessFile(sName, "rw");
		this.nPos = nPos;
		oSavedFile.seek(nPos);
	}

	public synchronized int write(byte[] b, int nStart, int nLen) {
		int n = -1;
		try {
			oSavedFile.write(b, nStart, nLen);
			n = nLen;
		} catch (IOException e) {
			e.printStackTrace();
		}
		return n;
	}
}

SiteInfoBean.java要抓取的文件的信息,如文件保存的目录,名字,抓取文件的URL等  文件类:

package nc.pub.ump.download;

/**
 * 定义获取和设置相关文件类信息。
 * @author whs
 * @version 1.0
 */
public class SiteInfoBean {
	/* 定义URL变量 */
	private String sSiteURL;
	/* 定义存文件路径变量 */
	private String sFilePath;
	/* 定义文件名变量 */
	private String sFileName;
	/* 定义传输文件计数器 */
	private int nSplitter;
	public SiteInfoBean() {
		this("", "", "", 5);
	}
	public SiteInfoBean(String sURL, String sPath, String sName, int nSplitter) {
		sSiteURL = sURL;
		sFilePath = sPath;
		sFileName = sName;
		this.nSplitter = nSplitter;
	}
	/**
	 * @return the nSplitter
	 */
	public int getNSplitter() {
		return nSplitter;
	}

	/**
	 * @param splitter
	 *            the nSplitter to set
	 */
	public void setNSplitter(int splitter) {
		nSplitter = splitter;
	}

	/**
	 * @return the sFileName
	 */
	public String getSFileName() {
		return sFileName;
	}

	/**
	 * @param fileName
	 *            the sFileName to set
	 */
	public void setSFileName(String fileName) {
		sFileName = fileName;
	}

	/**
	 * @return the sFilePath
	 */
	public String getSFilePath() {
		return sFilePath;
	}

	/**
	 * @param filePath
	 *            the sFilePath to set
	 */
	public void setSFilePath(String filePath) {
		sFilePath = filePath;
	}

	/**
	 * @return the sSiteURL
	 */
	public String getSSiteURL() {
		return sSiteURL;
	}

	/**
	 * @param siteURL
	 *            the sSiteURL to set
	 */
	public void setSSiteURL(String siteURL) {
		sSiteURL = siteURL;
	}
}

Utility.java工具类,放一些简单的方法 文件类:

package nc.pub.ump.download;

/**
 * 定义输出提示信息及线程sleep类。
 * @author whs
 */
public class Utility {

	public static void sleep(int nSecond) {
		try {
			Thread.sleep(nSecond);
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

	public static void log(String sMsg) {
		System.out.println(sMsg);
	}

	public static void log(int sMsg) {
		System.out.println(sMsg);
	}
}

TestMethod.java测试类 文件类:

package nc.pub.ump.download;
/**
 *
 * @author whs
 * @version 1.0
 */
public class TestMethod {
	/* 定义WEB地址和文件名 */
	//private String sWebAddr = "http://nczx.ufida.com.cn/Submodule/ProjectManage/Webapp/Doc/Problem/201410271357166861_1.rar";
	private String sWebAddr = "http://www.12306.cn/mormhweb/ggxxfw/wbyyzj/201106/srca12306.zip";
	//private String sWebAddr = "http://localhost:8080/FileUpload/test.rar";
	/* 定义存文件路径 */
	private String sSavePath = "E:\\whs";
	/* 定义文件名 */
	private String sSaveName = "test.rar";
	public TestMethod() {
		try {
			SiteInfoBean bean = new SiteInfoBean(sWebAddr, sSavePath, sSaveName, 5);
			SiteFileFetch fileFetch = new SiteFileFetch(bean);
			fileFetch.start();
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
	public static void main(String[] args) {
		new TestMethod();
	}
}
时间: 2024-10-07 22:48:05

断点续传的原理(转)的相关文章

PHP断点续传的原理与实现

PHP断点续传的原理与实现 断点续传主要是HTTP协议中的Content-Range报头.其理解如下: Content-Range:响应资源的范围.可以在多次请求中标记请求的资源范围,在连接断开重新连接时,客户端只请求该资源未被下载的部分,而不是重新请求整个资源,实现了断点续传.迅雷就是基于这个原理,使用多线程分段读取网络上的资源,最后合并.关于PHP使用多线程实现断点续传稍后讨论.本文只实现简单的断点续传. 代码实现: 先定义一个函数  getRange() 这个函数用来处理  header中

Java--使用多线程下载,断点续传技术原理(RandomAccessFile)

一.基础知识 1.什么是线程?什么是进程?它们之间的关系? 可以参考之前的一篇文章:java核心知识点学习----并发和并行的区别,进程和线程的区别,如何创建线程和线程的四种状态,什么是线程计时器 简单说一个进程可以由多个线程组成,一个操作系统可以多个进程,它们都是可以同时进行工作的. 2.什么是下载?如何多线程进行下载?如何断点续传? 广义上说,凡是在屏幕上看到的不属于本地计算机上的内容,皆是通过"下载"得来.狭义上人们只认为那些自定义了下载文件的本地磁盘存储位置的操作才是"

客户端HTTP断点续传的原理

其实断点续传的原理很简单,就是在Http的请求上和一般的下载有所不同而已. 打个比方,浏览器请求服务器上的一个文时,所发出的请求如下:假设服务器域名为wwww.scu.edu.cn,文件名为down.zip.GET /down.zip HTTP/1.1Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms-excel, application/msword, application/vnd.m

断点续传下载原理实现

需求背景 动态创建的文件下载的时候希望浏览器显示下载进度 动态创建的文件希望能够分段下载 HTTP断点续传报文 要实现HTTP断点续传必须要简单了解以下几个报文. Accept-Ranges 告诉客户端(浏览器..)服务器端支持断点续传 服务器端返回 Range 客户端告诉服务器端从指定的的位置/范围(这里值字节数)下载资源 客户端发出 Content-Range 服务器端告诉客户端响应的数据信息,在整个返回体中本部分的字节位置 服务器端返回 ETag 资源标识 非必须 服务器端返回 Last-

Java断点续传实现原理很简单

原理解析 在开发当中,"断点续传"这种功能很实用和常见,听上去也是比较有"逼格"的感觉.所以通常我们都有兴趣去研究研究这种功能是如何实现的? 以Java来说,网络上也能找到不少关于实现类似功能的资料.但是呢,大多数都是举个Demo然后贴出源码,真正对其实现原理有详细的说明很少. 于是我们在最初接触的时候,很可能就是直接Crtl + C/V代码,然后捣鼓捣鼓,然而最终也能把效果弄出来.但初学时这样做其实很显然是有好有坏的. 好处在于,源码很多,解释很少:如果我们肯下功

HTTP文件断点续传的原理

前几天一个同事跑过来找我说,我们在广告素材视频这块想做断点续传,就是这次某个视频缓存到一半,下次不用重头开始,可以在原来停留得位置开始继续下载.以提供更好的用户体验. 同时说需要我们支持吐素材地址的业务接口告诉终端最后修改时间/文件签名(md5),用这个用来判断我当前要下的文件有没有变化,同时告诉终端文件的Size大小. 我一细想,这个问题压根不需要通过改变现有接口提供更多的数据来做.下面从原理实现上简单说下: 关键点: 对于断点续传,关键点是两个: 1. 终端知道当前的文件和上一次加载的文件是

QT断点续传(原理:需要在HTTP请求的header中添加Rang节,告诉服务器从文件的那个位置开始传输.格式为bytes 开始传输的位置)

//功能:    根据一个URL地址将数据保存到指定路径下,支持断点续传//参数:    url            --需要访问的URL地址//         SavePath       --需要保存的路径//DownedSize 已经下载的大小// totalSize 文件总大小//返回值:  ture --成功 false --失败bool HttpGet::DownFile(const QUrl &url,const QString &SavePath,int DownedS

很简单的Java断点续传实现原理

原理解析 在开发当中,"断点续传"这种功能很实用和常见,听上去也是比较有"逼格"的感觉.所以通常我们都有兴趣去研究研究这种功能是如何实现的? 以Java来说,网络上也能找到不少关于实现类似功能的资料.但是呢,大多数都是举个Demo然后贴出源码,真正对其实现原理有详细的说明很少. 于是我们在最初接触的时候,很可能就是直接Crtl + C/V代码,然后捣鼓捣鼓,然而最终也能把效果弄出来.但初学时这样做其实很显然是有好有坏的. 好处在于,源码很多,解释很少:如果我们肯下功

Android多线程断点续传下载原理及实现

这段时间看了看工作室的工具库的下载组件,发现其存在一些问题: 1.下载核心逻辑有 bug,在暂停下载或下载失败等情况时有概率无法顺利完成下载.2.虽然原来的设计是采用多线程断点续传的设计,但打了一下日志发现其实下载任务都是在同一个线程下串行执行,并没有起到加快下载速度的作用. 考虑到原来的代码并不复杂,因此对这部分下载组件进行了重写.这里记录一下里面的多线程断点续传功能的实现. 请查看完整的PDF版(更多完整项目下载.未完待续.源码.图文知识后续上传github.)可以点击关于我联系我获取完整P