node读取文本文件时，去掉BOM

BOM: Byte Order MarkUTF-8 BOM又叫UTF-8 签名,其实UTF-8 的BOM对UFT-8没有作用,是为了支援UTF-16,UTF-32才加上的BOM,BOM签名的意思就是告诉编辑器当前文件采用何种编码,方便编辑器识别,但是BOM虽然在编辑器中不显示,但是会产生输出,就像多了一个空行,

BOM的移除

BOM用于标记一个文本文件使用Unicode编码，其本身是一个Unicode字符（"\uFEFF"），位于文本文件头部。在不同的Unicode编码下，BOM字符对应的二进制字节如下：

    Bytes      Encoding
----------------------------
    FE FF       UTF16BE
    FF FE       UTF16LE
    EF BB BF    UTF8

因此，我们可以根据文本文件头几个字节等于啥来判断文件是否包含BOM，以及使用哪种Unicode编码。但是，BOM字符虽然起到了标记文件编码的作用，其本身却不属于文件内容的一部分，如果读取文本文件时不去掉BOM，在某些使用场景下就会有问题。例如我们把几个JS文件合并成一个文件后，如果文件中间含有BOM字符，就会导致浏览器JS语法错误。因此，使用NodeJS读取文本文件时，一般需要去掉BOM。例如，以下代码实现了识别和去除UTF8 BOM的功能。

function readText(pathname) {
    var bin = fs.readFileSync(pathname);

    if (bin[0] === 0xEF && bin[1] === 0xBB && bin[2] === 0xBF) {
        bin = bin.slice(3);
    }

    return bin.toString(‘utf-8‘);
}

时间： 2024-12-27 23:26:36

node读取文本文件时，去掉BOM的相关文章

python读取文本文件数据

本文要点刚要: (一)读文本文件格式的数据函数:read_csv,read_table 1.读不同分隔符的文本文件,用参数sep 2.读无字段名(表头)的文本文件 ,用参数names 3.为文本文件制定索引,用index_col 4.跳行读取文本文件,用skiprows 5.数据太大时需要逐块读取文本数据用chunksize进行分块. (二)将数据写成文本文件格式函数:to_csv 范例如下: (一)读取文本文件格式的数据集 1.read_csv和read_table的区别: #read_cs

使用editplus等编程工具时UTF-8编码去掉BOM头方法(转载备查)

Unicode规范中有一个BOM的概念.BOM--Byte Order Mark,就是字节序标记.在这里找到一段关于BOM的说明: 在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符,它的编码是FEFF.而FFFE在UCS中是不存在的字符,所以不应该出现在实际传输中.UCS规范建议我们在传输字节流前,先传输字符"ZERO WIDTH NO-BREAK SPACE".这样如果接收者收到FEFF,就表明这个字节流是Big-Endia

c++读取文本文件

#include<iostream> #include<fstream> using namespace std; int main() { int a,b=-100000,c; cin>>c; int i; ifstream infile("f1.dat",ios::in); for(i=0;i<c;i++) { infile>>a; if(a>b) b=a; } cout<<"max number:

StreamReader 读取文本文件乱码问题

解决读取文本文件乱码问题.我采取的是读取前先判断文本文件格式. StreamReader sr = new StreamReader(fullfileName, GetFileEncodeType(fullfileName)) public System.Text.Encoding GetFileEncodeType(string filename) { System.IO.FileStream fs = new System.IO.FileStream(filename, System.IO.

解决Python读取文件时出现UnicodeDecodeError: 'gbk' codec can't decode byte...

用Python在读取某个html文件时会遇到下面问题: 出问题的代码: 1 if __name__ == '__main__': 2 fileHandler = open('../report.html', mode='r') 3 4 report_lines = fileHandler.readlines() 5 for line in report_lines: 6 print(line.rstrip()) 修改方式是在open方法指定参数encoding='UTF-8': if __nam

iOS 创建静态库文件时去掉其中的Symbols

在工程中创建静态库文件时,默认会将一些Symbols加到静态库文件中,这样做有两个缺点: 1.如果引用静态库文件的工程中发生了bug,就会直接跳转到静态库的源码. 2.静态库文件的大小会因此翻几番.本人最近做的这个静态库文件中,去掉symbols前大小为7.8MB左右,去掉以后大小为2.8MB. 要去掉Symbols,首先打开Build Settings并选中静态库的Target,然后设置下列选项: 如果有错误或遗漏,欢迎批评指正. iOS 创建静态库文件时去掉其中的Symbols,布布扣,bu

Matlab在读取图像时怎么实现手动选择图像

平时看的一些关于图像处理的文献通常要在matlab里面写一下,以便加深对这个算法的理解,当然写好以后需要图像来测试,以前我常常在 path='图像所在的路径'; img=imread(path+图像的名字); 在imread函数中进行不断修改图像的名字,以便测试不同的图像对于该算法的效果如何. 想必大家也是常常这样做实验吧,今天突然想,这样一直改名字多麻烦多浪费时间,我觉得像Matlab这么强大的软件肯定提供这样的函数给用户,因为每个软件都要考虑用户体验的哈! 在网上搜了很久没找到非常好的答案,

使用字符流读取文本文件

1.字符输入流Reader类 Reader类是读取字符流的抽象类,它提供了常用的方法. Reader rd= new FileReader("Test/xy.txt");// int b=rd.read(); //从输入流中读取单个字符// System.out.println((char)b); char[] chars = new char[10]; //从输入流中读取chars.length长度的字符 int length = rd.read(chars); System.o

读取文本文件中指定的几列

今天在论坛上看到一个问题,这个问题大概是这样的,读取文本文件中指定的几列,并存储入数据库中. Insus.NET花上些少时间,实现读取文本的功能部分.创建一个文本文件,文本添加好几行.每一行有好几列,列与列之间使用逗号分隔. adf,adfadf,adsfgads,qwer,wrt,wrey,asdfs,qwer,tryerqert6uy7,468u4,578,qewrqew,qwertwet,67u46,45676,45qer87,47857,et356y,etyedgh adsadf,adf

猜你喜欢

android socket readline（）方法读不到值的问题

在一次socket编码中,我从客户端发送一条数据到服务器, 可是在服务器我用readline()方法没取到值,也没报错. 于是我把可能发生错误的代码用输出语句包裹,到readline这一行的时候停止的 ...

协议ip

一.实验目的 1.掌握IP协议分析的方法 2.掌握TCP/IP体系结构 3.加深网络层协议的理解 4.学会使用网络分析工具二.实验要求 1.实验前下载安装Ethereal/Wireshark/S ...

Git一张图学习

从头搭建Openstack运行环境（五）--虚机添加floating ip

6.虚机添加floating ip 为虚机添加floating ip的功能是在neutron网络功能中非常重要的一项,在虚机创建完成后,如果此虚机所在的网络已经加入一个与外网的router中,那这个虚 ...

雷观(二十一)：想创业，需要刺激；去创业，需要勇气；创业成功，需要智慧

创业,是改革开放之后,尤其是最近十多年的热词. 无数当今的年轻人和曾经的年轻人,都走向了自主创业的道路.成功的很多,失败的更多. 不过,我觉得,创业成功的人数是越来越多了. 为什么这么说呢? 新中国成 ...

c# 单例模式(Single)

public class Singleton { private static Singleton _instance; private static readonly object syn = ne ...

常见排序算法的亲手实现（代码与注释）

1 package sort; 2 3 import java.util.ArrayList; 4 import java.util.Random; 5 6 public class Sort 7 { ...

cocos creater 简单的跳跃动作。

因为最近一段时间有打算做一个2D游戏的想法,就顺便学习了一下cocos,很惊异的它的脚本编写语言竟然支持js,正好以前对js有一定的了解,就临时拿起来了. 这是来自官方的一个实例,不过在参考过程中,发 ...

PHP 实现扫码二维码登录

最近在做一个扫码登录功能,为此我还在网上搜了一下关于微信的扫描登录的实现方式.当这个功能完成了后,我决定将整个实现思路整理出来,方便自己以后查看也方便其他有类似需求的程序猿些. 要实现扫码登录我们需要 ...

打包静态库.a文件的方法（ar,ranlib,nm命令介绍）

一常用脚本 1 打包脚本脚本如下,下面附上ar 和 ranlib命令参考(命令来自于网络) ALLLIB=*.aFILE=`ls *.a`#原来的库解压重命名 for F in $FILEdo ...

zz iCCP: Not recognizing known sRGB profile that has been edited错误

http://my.oschina.net/1pei/blog/479162#OSC_h3_15 http://blog.csdn.net/lzpdz/article/details/50112485 ...

重新回顾九大排序算法

最近无聊想回顾一下大一学过的排序算法.目前才写了一点...心得以后再补充吧!! 1.插入排序 //插入排序 /* * 把数组a的第n个数插入前n-1个数中,注意前n-1个数已经是排好序的了 * * ...

三个等号的题

打开是一个简单的登陆界面,查看源码: <?php if (isset($_GET['name']) and isset($_GET['password'])) { if ($_GET['name ...

9.10日黄金个股值得关注

9.10日黄金个股值得关注绝参证券侧重短线投资 ,擅长短线资金理论:大量资金铺在前,横盘整理必要看.只要资金不流出,后续拉升可期盼.调整结束第一阳,抓好买点很关键. 金亚科技300028:公司在电视 ...

苹果iOS手机暗藏间谍软件的揭秘者：扎徳尔斯基

大家知道,苹果iOS手机的短消息服务器(SMS)是用硬件加密的,看起来很安全.但是,Jonathan Zdziarski发现苹果公司有意地放进去一个"文件转发服务器"(file-r ...

黑马程序员-IO流

IO概述 IO流用来处理设备之间的数据传输,java 对数据操作的是通过流的方式 java用于操作流的对象都在IO包中. 流按操作数据分为两种:字节流与字符流流按流向分为:输入流和输出流字符流对象 ...

ansible的原理与初步使用

1.Ansible基本简介: 1 Ansible是什么? Ansible是一个适用于成百上千规模的受控节点的配置管理.应用程序部署.内部服务编排等诸多功能于一身的极为简单的IT运维自动化工具引擎,基于 ...

java EL表达式pageContext理解

内置11个对象 pageContext.pageScope .requestScope .sessionScope . applicationScope param .paramValues .he ...

关于STM32串口空闲中断的问题

1.空闲中断是接受数据后出现一个byte的高电平(空闲)状态,就会触发空闲中断.并不是空闲就会一直中断 2.关于第二点有要铺垫的三个情况,datasheet中 "当一空闲帧被检测到时,其处理 ...

LVS集群类型

一.LVS-NAT 简述:多目标的DNAT,通过Director修改请求报文中的目标地址和端口为LVS挑选出来的某RS的RIP和PORT实现转发特点: (1)RIP和DIP必须在同一网络,且应该使用 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 11 q. 0.023 s.