Linux批量转换gbk编码文件到utf8编码

欢迎访问博客:

www.findspace.name

一单个文件:

iconv -f gbk -t utf8 -c camera.c >carmera.c

二批量文件脚本:

for i in *

do

if test -f $i

then

iconv -f gbk -t utf8 $i -o /tmp/$i.new

cp /tmp/$i.new $i

rm /tmp/$i.new

fi

done

保存为run.sh文件,并加上执行权限

chmod a+x run.sh然后执行即可

时间: 2024-11-09 10:49:00

Linux批量转换gbk编码文件到utf8编码的相关文章

[Linux] 批量转换整个目录下的文件编码为UTF-8;

[Linux] 批量转换整个目录下的文件编码为UTF-8: #!/bin/bash - #===============================================================================# #          FILE: conv.sh#  #         USAGE: ./conv.sh #  #   DESCRIPTION: 一个支持把整个目录递归转换GB2312为UTF-8的脚本: #  #       OPTIONS: 

GBK编码字节流与UTF-8编码字节流的转换

import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOException; public class BianMaDemo4 { public static void main(String[] args) throws IOException, FileNotFoundException { /* * * GB

转换编码,将Unicode编码转换成可以浏览的utf-8编码

//转换编码,将Unicode编码转换成可以浏览的utf-8编码 public function unicodeDecode($name) { $pattern = '/([\w]+)|(\\\u([\w]{4}))/i'; preg_match_all($pattern, $name, $matches); if (!empty($matches)) { $name = ''; for ($j = 0; $j < count($matches[0]); $j++) { $str = $matc

GB2312、GBK、Unicode和UTF-8编码介绍

 汉字编码知识点 ASCII码是西欧编码的方式,采取7位编码,所以是2^7=128,共可以表示128个自负,包括34个字符,(如换行LF,回车CR等),其余94位为英文字母和标点符号及运算符号等.在计算机中,一个ASCII码占8位,最高位(bit7)用作奇偶校验.奇校验规则:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7补一个1:偶校验规则:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7补一个1. 为了识别双字节的字符,比如汉字或日文韩文等都是占用2个字节

linux批量替换多个文件中的字符串

一.linux sed 批量替换多个文件中的字符串 sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 例如:替换当前目录下所有文件中的log.txt为test.log sed -i "s/log.txt/test.log/g" `grep log.txt -rl /home` 二.下面这条命令: find ./ -type f 此命令是显示当前目录下所有的文件 上面的"s|ABCD|

loadrunner将参数文件转换为UTF-8编码

在使用loadrunner进行参数化的时候,对于有些信息,比如地址.人名等,很多时候需要传入中文,但是有的时候会碰到字符编码不对导致脚本出错. 下面介绍两种loadrunner中可以使用的编码转化为UTF-8的方法. Action() { //第一种方法 char tmpParam[32]; lr_convert_string_encoding((lr_eval_string("{list}")), LR_ENC_SYSTEM_LOCALE, LR_ENC_UTF8, "st

Java检测文件是否UTF8编码

介绍UTF-8编码规则 UTF-8 编码字符理论上可以最多到 6 个字节长, 然而 16 位 BMP 字符最多只用到 3 字节长. Bigendian UCS-4 字节串的排列顺序是预定的. 字节 0xFE 和 0xFF 在 UTF-8 编码中从未用到. 下列字节串用来表示一个字符. 用到哪个串取决于该字符在 Unicode 中的序号. U-00000000 - U-0000007F: 0xxxxxxx U-00000080 - U-000007FF: 110xxxxx 10xxxxxx U-0

刨根究底字符编码之十一——UTF-8编码方式与字节序标记

UTF-8编码方式与字节序标记 一.UTF-8编码方式 1. 接下来将分别介绍Unicode字符集的三种编码方式:UTF-8.UTF-16.UTF-32.这里先介绍应用最为广泛的UTF-8. 为满足基于ASCII.面向字节的字符处理的需要,Unicode标准中定义了UTF-8编码方式.UTF-8应该是目前应用最广泛的一种Unicode编码方式(但不是最早面世的,UTF-16要早于UTF-8面世).它是一种使用8位码元(即单字节码元)的变宽(即变长或不定长)码元序列的编码方式. 由于UTF-16对

批量转换gbk编码的java代码为utf8

#!/bin/bash echo $1 echo $# if [ ! $# -eq 1 ]; then     echo "usage:  ./gbk2utf8.sh src"     exit 0 fi from=$1 find $from -type d -exec mkdir -p utf8/{} \; find $from -type f -name *.java -exec iconv -f GBK -t UTF-8 {} -o utf8/{} \;