如何过滤掉文本空白行?

实际工作中,我们经常需要过滤掉文本中的空白行。

方法有很多,简要记录几个常用的方法:

以a.txt文件为例,首先查看一下文件里面的内容:

法一、使用grep:grep -v  ‘^$‘  a.txt

有时候还需要将输出结果保存到原文件,这时候想到用输出重定向

文件里什么都没有了!

因为这里使用的重定向为" > " ,它会先将原文件,即a.txt内容清空!再将结果写入a.txt。显然,先一步就把内容清空了,相当于grep -v  ‘^$‘ 一个空文件,当然什么都没有!

那么,使用“>>”追加可以吗?答案是不可以的,因为追加还会保留原来的内容。所以还是先重定向到一个其它文件靠谱!

法二、使用sed:sed  ‘/^$/d‘  a.txt

时间: 2024-10-15 09:19:02

如何过滤掉文本空白行?的相关文章

JAVA实现过滤掉文本中的表情

比如我们要把微信昵称存入数据库,就需要把表情给过滤掉. package com.zjr.common.utils; import org.apache.commons.lang3.StringUtils; public class EmojiFilter { /** * 检测是否有emoji字符 * * @param source * @return 一旦含有就抛出 */ public static boolean containsEmoji(String source) { if (Strin

贝叶斯_文本分析

一.文本关键词提取 1.过滤掉文本中出现的停用词 停用词:指与文章主题不相干的词,符号等.表现在:1.文本中大量出现:2.与主旨不相关:3.对于分析文本没用处 2.TF-IDF决定关键词 (1)首先进行词频(Term Frequency,TF),IDF,TF-IDF统计 TF-IDF统计方法用于评估某字词对于一个文件集或一个语料库中的其中一份文件的重要程度.字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降.主要思想:如果某一字词在一片文章中出现的平率T

父兄子节点的获取及子节点的添加、删除、克隆操作

第一.父兄子节点的获取 1.父节点的获取 某节点的parentNode属性值即为该节点的父节点.示例: <!DOCTYPE html> <html> <head lang="en"> <meta charset="UTF-8"> <body> <div id="father"> <div id="son1"></div> </

做一个类似JQuery获取DOM对象的$()

在dom操作时,有时根据id获取单个对象.有时根据className获取多个对象.平常可能我们用两个函数来实现这两个功能.不过我将它们整合了一下,目前使用情况良好,函数如下: view source print? 01 // 根据selector获取单个或多个元素, 02 // 获取多个元素时,可以指定元素的tag类型和父元素 03 function $(selector, tag, parent) { 04     var ret = []; 05     06     //没有传递selec

mybatis oracle 分页+模糊查询

实现分页的方式有很多,但常用的是通过SQL来显示分页. 下面就来介绍mybatis 来实现Oracle分页的写法:(ps:不同数据库的写法有区别) 一.分页数据: 1 <select id="findPageByCode" parameterType="java.util.Map" resultMap="pageVO"> 2 select * from 3 ( 4 select A.* ,ROWNUM rn 5 from (selec

jQuery 源码分析(十九) DOM遍历模块详解

jQuery的DOM遍历模块对DOM模型的原生属性parentNode.childNodes.firstChild.lastChild.previousSibling.nextSibling进行了封装和扩展,用于在DOM树中遍历父元素.子元素和兄弟元素. 可以通过jQuery的实例来访问,方法如下: parent()             ;获取匹配元素的父元素 parents(selector)         ;获取匹配元素的所有祖先元素                        ;s

文本处理工具及grep

常见的文本处理工具 在日常的linux运维工作当中,我们经常要在一些文本当中抽取过滤出我们所需要的信息,从而达到我们的需求,需要特定的文本处理工具来帮我们完成此类操作 本章节主要讲解的内容有: 文件查看:cat 分页查看文本:less.more 抽取文件特定行数:head.tail 抽取文本特定列:cut 合并文本:paste 文本统计:wc 文本排序并统计:sort.uniq 比较文件:diff.patch cat:连结查看文本和输出至标准输出 -n:为每行添加行号 -A:显示所有控制符 -E

Linux文本处理三剑客之---grep

grep grep: Global search REgular expression and Print out the line 作用:文本搜索工具,根据用户指定的"模式"对目标文本逐行进行匹配检查:打印匹配到的行 模式:由正则表达式字符及文本字符所编写的过滤条件 1.命令格式 grep [OPTIONS] PATTERN [FILE...] grep root /etc/passwd grep "$USER" /etc/passwd grep '$USER'

文本处理工具与正则表达式、grep

一.文本处理工具 1.文本查看命令 cat [OPTION]- [FILE]- -n 显示行号 -b 空格行不加行号,有字符的行才加 -s  相邻的空行压缩为一行,长和-n联用 -v 处理windows中的^M -T 可以看到tab\space -A  显示所有控制符(包括windows文本中的^M,^T) -E  显示行结束符$ (回车) tac [OPTION]- [FILE]-  将每个指定文件按行倒置并写到标准输出. 效果与cat 相反 rev  将指定文件从最后一个字符开始显示到第一个