文档截取

import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.StringBufferInputStream;

public class 文档截取 {

    public static void main(String []args)throws IOException{
        File f = new File("C:\\Users\\Administrator\\Desktop\\文件复制练习\\习总讲话.txt");//new 一个File类对象

        FileInputStream f2=new FileInputStream("C:\\Users\\Administrator\\Desktop\\文件复制练习\\习总讲话.txt");
        FileOutputStream fos=new FileOutputStream("C:\\Users\\Administrator\\Desktop\\文件复制练习\\习总讲话1.txt"     );
        int a=(int) f.length();//获取文件长度
        byte [] b = new byte[a];//定义一个与文件同长度的数组

        f2.read(b);//将数据读入数组
        String str = new String (b,"UTF-8");

        int c=str.indexOf("<p>央视");//确定开始字段
        int d =str.indexOf("<p class=");//结束字段
        String str1=new String();
        str1=str.substring(c, d);//截取固定范围内字符串
        //System.out.println(str1);//输出显示

        //String e=str1.delete(c,d);
        String str2=str1.replace("<p>","");//先将<p>标签去除,成为str2
        String str3=str2.replace("</p>","");//str2的基础上再去除</p>成为str3
        //System.out.println(str3);//输出str3

         byte[]f1 = str3.getBytes();
         fos.write(f1);
            fos.flush();

            f2.close();
            fos.close();
        }
    }
时间: 2024-11-10 00:09:37

文档截取的相关文章

ffmpeg文档26-输入设备

26 输入设备 FFmpeg中的输入设备配置元素用来启用对附加到您的系统一个多媒体设备访问数据. 当编译时,默认会支持所有的输入设备.你可以通过在配置脚本执行时附加–list-indevs了解到支持的设备. 可以通过–disable-indevs在编译时禁用所有输入设备,也可以在此基础上通过–enable-indev=INDEV允许个别设备,或者在默认支持基础上通过–disable-indev=INDEV禁用个别设备支持达到类似的目的. 在ff*工具集中,使用-devices可以获取当前支持的设

C# XML 文档注释文件格式

在编写 C# 代码时,只要在注释按照格式加入 XML 文档注释,例如: /// <summary> /// 这里是类的注释. /// </summary> public class MyClass { } 就可以通过设置项目的"属性->生成->输出->XML 文档文件",来为当前项目生成包含所有文档注释的 XML 文件.一般可用于 Visual Studio 的智能提示,或者利用 Sandcastle 等工具生成文档. 下面,我会介绍生成的 X

JAVASE02-Unit01: API文档 、 字符串基本操作

API文档 . 字符串基本操作 文档注释 package day01; /** * 文档注释只能定义在三个地方: * 类,方法,常量 * * 文档注释是功能注释,用来说明功能作用 * 在类上使用的目的是说明当前类的设计目的 * * @author adminitartor * @version 1.0 * @see java.lang.String * @since JDK1.0 * */ public class DocApiDemo { /** * sayHello方法中的问候语 */ pu

Atitit usrQBK1600 技术文档的规范标准化解决方案

1.1. Keyword关键词..展关键词,横向拓展比较,纵向抽象细化拓展知识点1 1.2. 标题必须有高大上词汇,参考文章排行榜,1 1.3. 标题带语言关键词c#.net js javascript  c++ python1 1.4. 标题最好有英文版本的,方便英文查询1 1.5. 标题atitit前缀,attilax总结结尾方便查询1 1.6. 标题后面带上版本号v2 qbf等,方便时间对比1 1.7. 正文要求 修辞好(引用典故名句,成语 等,使用修辞方法)2 1.8. 引用寓言故事 类

数组对象元素的添加,String对象,BOM对象以及文档对象的获取

数组对象的删除有三种方法: pop();        //移除最后一个元素并返回该元素值shift();      //移除最前一个元素并返回该元素值,数组中元素自动前移splice(0,2); //删除从指定位置deletePos开始的指定数量deleteCount的元素,数组形式返回所移除的元素通过这三种方法我们可以将数组中的元素按进行删除 var del = ["aa",23,345,56,34,"bb"]; var del_last = del.pop()

【VC编程技巧】窗体?3.5对单文档或者多文档程序制作启动画面

(一)概要: 文章描述了怎样通过Visual C++ 2012或者Visual C++ .NET,为单文档或者多文档程序制作启动画面.在Microsoft Visual Studio 6.0中对于单文档程序(SDI)我们可以很方便利用微软提供的组件Visual C++ Component (Splash Screen).因为在Microsoft Visual Studio 6.0以后的版本或者Visual C++ .NET没有提供这个组件,我们可以通过自定义对话框来实现Splash Screen

[Latex] Type3 PDF文档处理

提交给ACM与IEEE的论文中,除了有明确具体字体类型的Type1和TrueType字体外,经常会出现Latex不能识别的Type3字体.这种字体在印刷刊物中有可能出现印刷错误,编译为.dvi文件时也有几率发生错误,在正式文档中是需要尽量规避的. 一.Type3 文件的识别 1.整体识别 1)阅读器 用adobe/foxit 等reader打开pdf文件,"文件 -> 属性" 打开属性对话框,找到“字体”项目,可以看到pdf所包含的字体信息.通常如果有type3,会直接显示在最前

文档型信息交互设计及相关技术实现

本文信息交互是指办公和经营管理活动中所产生的公众或定向业务信息,以及在信息共享过程中,以业务规则形式衍生出的评论.评价.回复.转发等业务信息延续. 信息交互设计目标 共享业务信息,并支持限定范围 共享的业务信息,可以通过评论.评价.回复.转发等方式进行业务信息延续和推广 把发布信息.延续信息功能设计为通用功能 以信息实例为基本文档单元,衍生信息为其子文档,存储在文档型数据库中(MongoDB) 信息展现形式灵活多样,以模板形式为用提供应用选择 发布信息支持带格式文档,统一采用MarkDown编辑

Monkey、MonkeyRunner自动化测试文档

Monkey测试文档 Monkey介绍: Monkey是Android中的一个命令行工具,可以运行在模拟器里或实际设备中.它向系统发送伪随机的用户事件流(如按键输入.触摸屏输入.手势输入等),实现对正在开发的应用程序进行压力测试.Monkey测试是一种为了测试软件的稳定性.健壮性的快速有效的方法. Monkey的特征 1. 测试的对象仅为应用程序包,有一定的局限性. 2. Monky测试使用的事件流数据流是随机的,不能进行自定义. 3. 可对Test的对象,事件数量,类型,频率等进行设置. Mo