文本数据的处理

今天师弟让我帮忙写一个简单的文本数据提取,简单的写了个matlab程序,记录以备后用.

数据源:几个.xls文件

文件的内容(从中提取"第一/二产业增加值"):

结果为(相当于数据的整理):

matlab程序实现(仍需改进):

[NUM1,TXT1,RAW1]=xlsread(‘name‘);
for kk=1:1:2
[NUM,TXT,RAW]=xlsread(char(RAW1(kk,1)));
filename = ‘result.xls‘;
[i,j]=size(RAW);
for m=1:1:i
    if(strcmp(RAW(m,1),‘指标‘))
        result1 = RAW(m,3:end);
    end
        if(strcmp(RAW(m,1),‘第一产业增加值‘))
            result2 = RAW(m,3:end);
        end
            if(strcmp(RAW(m,1),‘第二产业增加值‘))
            result3 = RAW(m,3:end);
            end
end
result = [result1‘ result2‘ result3‘];

[num, text, raw] = xlsread(filename);
[rowN, columnN]=size(raw);
if(rowN==1)
xlsRange=[‘B‘,num2str(rowN)];
xlsRange1=[‘A‘,num2str(rowN)];
else
   xlsRange=[‘B‘,num2str(rowN+1)];
   xlsRange1=[‘A‘,num2str(rowN+1)];
end
 xlswrite(filename,result,1,xlsRange);
 xlswrite(filename,RAW(1,1),1,xlsRange1);
end

打包下载实例+代码:

..........................

时间: 2025-01-19 15:52:03

文本数据的处理的相关文章

JAVASE02-Unit08: 文本数据IO操作 、 异常处理

Unit08: 文本数据IO操作 . 异常处理 * java.io.ObjectOutputStream * 对象输出流,作用是进行对象序列化 package day08; import java.io.FileOutputStream; import java.io.IOException; import java.io.ObjectOutputStream; import java.util.ArrayList; import java.util.List; /** * java.io.Ob

JDBC学习笔记(三)大文本数据的读写

一.用JDBC向数据库插入大文本数据 String sql = "insert into my_clob values (null, ?)"; ps = conn.prepareStatement(sql); File f = new File("D:\\BaiduNetdiskDownload\\mysql\\jdbc.sql"); Reader reader = new BufferedReader(new FileReader(f)); ps.setChara

文本数据的机器学习自动分类方法(转)

http://blog.csdn.net/jdbc/article/details/50586042 本文为第一部分,着重介绍文本预处理以及特征抽取的方法. 随着互联网技术的迅速发展与普及,如何对浩如烟海的数据进行分类.组织和管理,已经成为一个具有重要用途的研究课题.而在这些数据中,文本数据又是数量最大的一类."文本分类是指在给定分类体系下,根据文本内容自动确定文本类别的过程"(达观数据科技联合创始人,张健).文本分类有着广泛的应用场景,例如: 新闻网站包含大量报道文章,基于文章内容,

JAVASE02-Unit07: 基本IO操作 、 文本数据IO操作

基本IO操作 . 文本数据IO操作 java标准IO(input/output)操作 package day07; import java.io.FileOutputStream; import java.io.IOException; /** * java标准IO(input/output)操作 * 输入流InputStrean:用于从数据源读取数据到程序中 * 输出流OutputStream:用于将数据发送至目标 * * 流划分为:节点流,处理流 * 节点流:又叫做低级流,特点:数据源明确,

Bulk Insert:将文本数据(csv和txt)导入到数据库中

将文本数据导入到数据库中的方法有很多,将文本格式(csv和txt)导入到SQL Server中,bulk insert是最简单的实现方法 1,bulk insert命令,经过简化如下 BULK INSERT schema_name . table_name FROM 'data_file' WITH ( FIELDTERMINATOR = 'field_terminator', ROWTERMINATOR = 'row_terminator', DATAFILETYPE=‘WideChar’ )

文本数据的机器学习自动分类方法

文本数据的机器学习自动分类方法(上): http://www.infoq.com/cn/articles/machine-learning-automatic-classification-of-text-data?utm_source=tuicool&utm_medium=referral 文本数据的机器学习自动分类方法(下): http://www.infoq.com/cn/articles/machine-learning-automatic-classification-of-text-

读写文本数据

p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 17.0px Helvetica; color: #29556f } 使用其他分隔符或行终止符打印 问题: 你想使用print() 函数输出数据,但是想改变默认的分隔符或者行尾符. 解决方案: 可以使用在print() 函数中使用sep 和end 关键字参数,以你想要的方式输出.比如: 1 #正常输出 2 print('dmeon', 89 , 8, 23) 3 4 #指定分隔符, 5 print('dm

基础学习总结(三)--文本数据读写文件、SD卡

简单的文本数据写入文件不需要权限,读写SD卡在4.0版本前需要写权限.在4.0后需要读写权限 布局: 1 <LinearLayout xmlns:android="http://schemas.android.com/apk/res/android" 2 xmlns:tools="http://schemas.android.com/tools" 3 android:layout_width="match_parent" 4 android

wysiwyg富文本数据如何保存到mysql

bootstrap提供了一个叫wysiwyg的富文本组件,用来显示和编辑富文本数据,但如何将编辑后的数据保存到mysql数据库,却不得而知.另外,如何将mysql数据库中的数据显示到wysiwyg也不得而知,对于这两个问题,让我来告诉你解决方案! 一.效果展示 首先,我们先来看看效果如何: 富文本中有一张图片,还有一个数字列表 我们可以看到编辑后的数据保存成功,以及保存后对应的展示. 二.富文本 度娘对于富文本的解释如下: 富文本格式(Rich Text Format, 一般简称为RTF)是由微