利用Lucene把文本的字体格式进行修改,然后输出到一个新的文件中

这里书中写的是charactorProcess(File file, String destFile)

这里被我改成,(String file,  String destFIle)

一个代表现有的文件和要新建的文件

代码:

package com;

import java.io.BufferedReader;

import java.io.BufferedWriter;

import java.io.File;

import java.io.FileReader;

import java.io.FileWriter;

import java.io.IOException;

import java.util.HashMap;

public class FileRead {

public static String replace(String line){

//创建一个HashMap存储全角和半角字符之间的对应关系

HashMap map = new HashMap();

map.put(",", ",");

map.put("。", ".");

map.put("〈", "<");

map.put("〉", ">");

map.put("|", "|");

map.put("《", "<");

map.put("》", ">");

map.put("[", "[");

map.put("]", "]");

map.put("?", "?");

map.put(""", "\"");

map.put(":", ":");

map.put("﹑", ",");

map.put("(", "(");

map.put(")", ")");

map.put("【", "[");

map.put("】", "]");

map.put("-", "-");

map.put(" ̄", "~");

map.put("!", "!");

map.put("`", "`");

map.put("1", "1");

map.put("2", "2");

map.put("3", "3");

map.put("4", "4");

map.put("5", "5");

map.put("6", "6");

map.put("7", "7");

map.put("8", "8");

map.put("9", "9");

int length = line.length();

for(int i = 0; i < length; i++){

String charat = line.substring(i, i + 1);

if(map.get(charat) != null){

line = line.replace(charat, (String)map.get(charat));

}

}

return line;

}

public static File charactoProcess(String string, String destFile){

try{

//创建一个输出流,用于写新文件

BufferedWriter writer = new BufferedWriter(new FileWriter(destFile));

//创建一个输入流,用于读取文件

BufferedReader reader = new BufferedReader(new FileReader(string));

String line = reader.readLine();

while(line != null){

//调用replace方法替换所有的全角字符

String newline = replace(line);

//将替换后的String写入新的文件

writer.write(newline);

//写入行分隔符

writer.newLine();

line = reader.readLine();

}

reader.close();

writer.close();

}catch(IOException e){

e.printStackTrace();

}

return new File(destFile);

}

public static void main(String[] args) {

// TODO Auto-generated method stub

FileRead b = new FileRead();

b.charactoProcess("E:\\Lucene项目\\钢铁是怎么样练成的.txt", "E:\\Lucene项目\\目标文件.txt");

}

}

时间: 2024-10-15 12:11:52

利用Lucene把文本的字体格式进行修改,然后输出到一个新的文件中的相关文章

利用Lucene把文本的字体格式进行改动,然后输出到一个新的文件里

这里书中写的是charactorProcess(File file, String destFile) 这里被我改成.(String file,  String destFIle) 一个代表现有的文件和要新建的文件 代码: package com; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.File; import java.io.FileReader; import java.io.

利用fgetc合并2个源文件的内容,到一个新的文件中

#include <stdio.h> #include <stdlib.h> //功能: 合并2个源文件的内容,到一个新的文件中 int main(int a,char *argv[]){ if(a!=4){ printf("请输入3个文件路径:%s\n", argv[0]); exit(1); } FILE *fp1,*fp2,*fp3; fp1 = fopen(argv[1],"r"); if(fp1==NULL){ printf(&qu

利用正则表达式读取txt文件中的邮箱,电话号码,url地址,手机号,将数据一行一个保存到一个新的文件中去

本人最近整合了从文本中提取信息,将之保存的新的文本中,在此处用到的是正则表达式,希望大家一起学习. 文件操作类:fileOperation.java package dyx_13; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.File; import java.io.FileOutputStream; import java.io.FileReader; import java.io.F

如何调整批注框文本的字体格式

1.依次单击"开始"选项卡→"样式"启动器按钮 2.在打开的"样式"窗格中,单击"管理样式"按钮. 3.在"管理样式"对话框中,依次"编辑"选项卡 4.在"选择要编辑的样式"内容框中选择"批注框文本",单击"修改"按钮,最后设置批注框文本的字体格式 群福利 群号码:615147109 1. Office安装程序及激活. 2. P

Winpython Spyder template.py模板日期格式的修改

WinPython中自带的Spyder编辑器默认模板文件是template.py,其中显示日期的参数是"%(date)s",创建一个新py文件时,显示的日期格式是英文的,看起来很不习惯. 通过下面的方法可以把日期格式改成"年-月-日 时:分:秒"的形式,或者其它自己喜欢的格式. 1.用文本编辑器打开C:\WinPython-64bit-3.4.3.4\python-3.4.3.amd64\Lib\site-packages\spyderlib\plugins\edi

第17章 文本和字体_17.5 设置段落格式

17.5 设置段落格式 17.5.1 设置简单的文本格式 (1)对齐方式及起始坐标:设字符串的长度为size.cx 对齐方式 文本输出的起始位置(设输出框左右边界分别为xLeft.XRight) 左对齐 xStart =xLeft; 右对齐 xStart = xRight – size.cx 中间对齐 xStart = (xLeft + xRight –size.cx) /2 两端对齐 xStart = xLeft,但要调用SetTextJustification进行调整 (2)两个重要函数 ①

利用lucene和pdfBox对PDF文本进行内容的解析

/*  * 这段代码的功能是利用PDFBox.zip的包  * 利用lucene对PDF文本进行内容的解析  * 读取pdf文件的内容.然后重新的写入到同名的.txt文件中  * */ 结果截图: package pdfbox; import java.io.File; import java.io.FileOut... songtaste.com/user/10335914/infosongtaste.com/user/10335923/infosongtaste.com/user/10335

利用lucene对PDF文本进行内容的解析

/* * 这段代码的功能是利用PDFBox.zip的包 * 利用lucene对PDF文本进行内容的解析 * 读取pdf文件的内容.然后重新的写入到同名的.txt文件中  * */ 结果截图: package pdfbox; import java.io.File; import java.io.FileOutputStream; import java.io.OutputStreamWriter; import java.io.Writer; import java.net.MalformedU

linux下利用echo命令输出带颜色以及带字体格式的字符串

echo输出颜色字体:格式 例: echo  –e  "\033[31m被改变字体颜色的字符\033[0m" 其中\033[31m开始, *其中31(3开头控制前景色)中的1是红色,将此数值替换为2是绿色,3棕色,4蓝色,5紫色,6青绿色 *背景色控制由4开头的字符串 *单字符设置字体(1为粗体:4为下划线:5为闪烁:7反转前景色.背景色) 例:36:41:1 \033[0m结束 格式如下(#号代表数字,其中3#;4#;#可以只写一项或几项!一定要有结束字符,否则终端以后显示的字符都是