import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.StringBufferInputStream; public class 文档截取 { public static void main(String []args)throws IOException{ File f = new File("C:\\Users\\Administrator\\Desktop\\文件复制练习\\习总讲话.txt");//new 一个File类对象 FileInputStream f2=new FileInputStream("C:\\Users\\Administrator\\Desktop\\文件复制练习\\习总讲话.txt"); FileOutputStream fos=new FileOutputStream("C:\\Users\\Administrator\\Desktop\\文件复制练习\\习总讲话1.txt" ); int a=(int) f.length();//获取文件长度 byte [] b = new byte[a];//定义一个与文件同长度的数组 f2.read(b);//将数据读入数组 String str = new String (b,"UTF-8"); int c=str.indexOf("<p>央视");//确定开始字段 int d =str.indexOf("<p class=");//结束字段 String str1=new String(); str1=str.substring(c, d);//截取固定范围内字符串 //System.out.println(str1);//输出显示 //String e=str1.delete(c,d); String str2=str1.replace("<p>","");//先将<p>标签去除,成为str2 String str3=str2.replace("</p>","");//str2的基础上再去除</p>成为str3 //System.out.println(str3);//输出str3 byte[]f1 = str3.getBytes(); fos.write(f1); fos.flush(); f2.close(); fos.close(); } }
时间: 2024-11-10 00:09:37