utf-8编码的中文看成2个字符，其他数字字符看成一个字符

方法一：使用正则表达式，代码如下：

function getByteLen(val) {
            var len = 0;
            for (var i = 0; i < val.length; i++) {
                var a = val.charAt(i);
                 if (a.match(/[^\x00-\xff]/ig) != null)
                {
                    len += 2;
                }
                else
                {
                    len += 1;
                }
            }
            return len;
        }

方法二：使用字符unicode判断：方法如下：

function getByteLen(val) {
            var len = 0;
            for (var i = 0; i < val.length; i++) {
               var length = val.charCodeAt(i);
               if(length>=0&&length<=128)
                {
                    len += 1;
                }
                else
                {
                    len += 2;
                }
            }
            return len;
        }

时间： 2024-11-07 16:33:02

utf-8编码的中文看成2个字符，其他数字字符看成一个字符的相关文章

获取字符长度，中文2个字符，英文数字一个字符

转自testcs_dn(微wx笑) 博客原文网址:http://blog.csdn.net/testcs_dn/article/details/21412303#comments 方法一: function strlen(str){ var len = 0; for (var i=0; i<str.length; i++) { var c = str.charCodeAt(i); //单字节加1 if ((c >= 0x0001 && c <= 0x007e) || (

字符编码、字符存储、字符转换及工程中字符的使用

字符编码.字符存储.字符转换及工程中字符的使用版本控制版本时间(北京时间) 作者备注 V1.0 2016-05-13 施小丰创建本文.第七章工程总结尚未完成一. 前言 1. 目的本文主要用于整理字符相关知识,包括字符编码.字符存储.行业标准.文件读写.工程注意事项等涉及字符相关的内容, 从而在实际工程中更好地设计和使用字符.更快地解决字符问题. 2. 适用范围本文标题是"Windows C++字符编码.存储.转换大全", 但

Unicode编码与中文的转换

1.1. 将unicode编码转换为中文 public String decodeUnicode(String src) { char[] in = src.toCharArray(); char aChar; char[] out = new char[src.length()]; int outLen = 0; int off = 0; int end = src.length(); while (off < end) { aChar = in[off++]; if (aChar == '

编码转中文

package com.util; public class Escape { private final static String[] hex = { "00","01","02","03","04","05","06","07","08","09","0A","0B&quo

CMD魔法堂：支持显示UTF8编码的中文

cmd命令行窗口显示中文乱码,多是因为cmd命令行窗口字符编码不匹配导致. 修改cmd窗口字符编码为UTF-8,命令行中执行:chcp 65001切换回中文:chcp 936这两条命令只在当前窗口生效,重启后恢复之前的编码. 切换cmd窗口字符编码有风险,例如切换过以后中文显示乱码,并且不能永久切换回原来模式,只能每次chcp 936. cmd中文显示乱码永久解决方案,以切换回中文936为例: 打开不正常的 CMD命令提示符窗口后,单击窗口左上角的图标,选择弹出的菜单中的“默认值”,切换到第一个

OC下Base64编码的中文字符编码问题

Base64是常用的编码规范之一,如网络传输中应用广泛,之前列举过base64编码的原理:<base64举例> 以及java实现的base64编码工具类. 这里,贴出OC下的base64代码,在平台之间通信过程中保证编码能通用——中间出现一个编码问题,google官方提供的base64Util包默认用的Utf-8编码,而中文之前统一用的gbk编码,以下代码修正了这个问题: 关键点:将CommonFunc的 base64StringFromText 和 textFromBase64String

PHP解码unicode编码的中文字符

问题背景:晚上在抓取某网站数据,结果在数据包中发现了这么一串编码的数据:"......\u65b0\u6d6a\u5fae\u535a......www.jinyuanbao.cn", 这其实是中文被unicode编码后了的数据,我现在就是想解码出中文来,疯狂的google之后,发现很多人贴出了如下的函数,不过我发现根本不好使....如何解码unicode编码的字符?[好使] - PHP网站开发 - [开源与分享]每日最新博客在置顶博客之后: 如何解码unicode编码的字符?[好使]

用python查看URL编码的中文

什么是URL编码呢,请看https://zh.wikipedia.org/wiki/Urlencode. 有时,我们向一些网站提交中文参数时,中文是会被编码成这种格式的 "%B1%E0%C2%EB ",它的原文是"编码",URL编码也被称为"百分号编码",是不是有很多百分号.我们常使用的"空格"的URL编码就是 "%20",但是新的标准把"空格" 替换为 "+",

中文转换成Unicode编码和 Unicode编码转换为中文

前几天,遇到一个问题,就是在浏览器地址栏传递中文时,出现乱码,考虑了一下,解决方式有很多,我还是采用了转换编码的方式,将中文转换为Unicode编码,然后再解码成中文,以下是实现的过程,非常简单! package cy.code; public class CyEncoder { private String zhStr; //中文字符串 private String unicode;//将中文字符串转换为Unicode编码存储在这个属性上. public CyEncoder(String z

一个低级错误引发Netty编码解码中文异常

前言最近在调研Netty的使用,在编写编码解码模块的时候遇到了一个中文字符串编码和解码异常的情况,后来发现是笔者犯了个低级错误.这里做一个小小的回顾. 错误重现在设计Netty的自定义协议的时候,发现了字符串类型的属性,一旦出现中文就会出现解码异常的现象,这个异常并不一定出现了Exception,而是出现了解码之后字符截断出现了人类不可读的字符.编码和解码器的实现如下: // 实体 @Data public class ChineseMessage implements Serializab

猜你喜欢

现在就报名上海ORACLE用户组2014年高峰论坛吧！

COLLABORATE 14 – SHOUG Forum 上海ORACLE用户组2014年高峰论坛报名本次活动由ORACLE ACS高级服务部门与 SHOUG 上海ORACLE用户组合办. 具体活动日 ...

js学习之函数的参数传递

我们都知道在 ECMAScript 中,数据类型分为原始类型(又称值类型/基本类型)和引用类型(又称对象类型):这里我将按照这两种类型分别对函数进行传参,看一下到底发生了什么. 参数的理解首先,我们 ...

运算符重载的一些问题集锦

1.运算符重载,可以重载为友元函数,也可以重载为成员函数,只是调用的方式不一样. (语法上没有问题,只是调用的时候不太顺手) 2.++,--有前置和后置之分,重载的方式略不相同 3.重载的运算符,其参 ...

Hdu 2874 Connections between cities

题意: 城市道路没有环不一定连通的树求两城市的最短距离设想一下就是很多小树那好办思路: lca离线算法然后有个技巧就是每次我们tarjan一棵树不是最后树的节点都访问过并且孩子全 ...

2月第1周全球域名商TOP15：DNSPod第七地位巩固

IDC评述网(idcps.com)02月25日报道:据WebHosting.info公布的最新数据显示,在2月第1周,全球域名商域名总量十五强大战中,中国成功囊括3个席位,依然是中国万网.DNSPod ...

Ember.js 的视图层

本指导会详尽阐述 Ember.js 视图层的细节.为想成为熟练 Ember 开发者准备,且包含了对于入门 Ember 不必要的细节. Ember.js 有一套复杂的用于创建.管理并渲染连接到浏览器 ...

mysql更改最大打開文件數

1. 查看内核限制 # ulimit -n 65535 2. 修改 my.cnf 限制 # vi /etc/my.cnf [mysqld] open_files_limit = 65535 3. 重启 ...

黑马程序员——java学习8（166-总结）——集合

1.集合存储对象的方式 1.1.区别于数组 (1)集合长度可变,数组长度固定 (2)集合只能存对象,数组存储基本数据类型同:存的都是地址, 1.2.CPUD 1.3.迭代器(内部类比作抓娃娃机,迭 ...

C#调用Fortran生成的DLL的方法报内存不足

最近在研究一个程序,公司给的,程序是VB写的,程序里面还有一个计算的模型,用Fortran语言写的. 在调试到这个模型里面的方法时报错,说是内存不足,于是就在网上查找方法,看了两篇博客之后问题解决了. ...

老男孩教育每日一题-第125天-显示文件oldboy.txt的第20行到30行请问如何做？

显示文件oldboy.txt的第20行到30行请问如何做? echo stu{00..40}|xargs -n1 >oldboy.txt 1. head -30 oldboy.txt|ta ...

Oracle数据库之SQL基础

主要内容:用户与表空间:表与约束:查询语句. 一.概述 Oracle安装:访问官网,下载二.用户与表空间在安装Oracle时在开始菜单里可以用sql puls登录oracle. 1.系统用户 sy ...

新一代监控平台整合telegraf、influxdb、garafana

随着容器时代到来,公司对devops等概念理解越来越深刻,业务系统架构也在不断向微服务架构调整.业务系统也不断的提供更多的api接口,实现方便灵活的调用.在这种业务背景下,感觉业务系统的监控系统(za ...

假期德国实践报告

每个人的经历都因为他的唯一性而显得宝贵.经历获得的可能性有赖于机遇,经历获得的多少则取决于一个人力求超越自己的程度.加入到国外实践队伍中去是因为心中有梦想,梦想在这个开阔.有朝气的舞台上舞出自己的青春 ...

程序员生存定律

1． “博”与“专”上的迷失假设说一个人的学习已经聚焦,并且学习的内容和自己实际参与的项目也相吻合,那么是不是就没有问题了?很不幸,答案仍然是否定的,在任何一个子领域里,仍然需要进一步去考虑“博”与 ...

LDA基本介绍以及LDA源码分析(BLEI)

基本介绍: topic model,主题模型介绍:http://www.cnblogs.com/lixiaolun/p/4455764.html 以及 (http://blog.csdn.net/h ...

使用Sublime Text 3的HTML-CSS-JS Prettify插件格式化代码

很多时候,我们想要格式化HTML-CSS-JS代码,网站上有很多实现此功能的小工具,当然,我的网站首页也有.但是,如果我们的代码编辑器上面也有这样的功能,那不是更加快速便捷?So,接下来,我们看看Su ...

文件内部写入及读取（参考疯狂安卓讲义）

参考了参考疯狂安卓讲义的内部读取,这个是标准版答案,做下备份,开始基于这个的改进: 建的工程名为FileTest,包名为com.swust.filetest activity_main.xml代码: ...

C# dynamic与var的区别

1.C#编程总结(十四)dynamic 2.var和dynamic的区别及如何正确使用dynamic?

访问url过程

过程: 1.url通过dns服务器找到指定ip 2.解析出IP之后,根据IP地址和默认端口:80,与服务器建立TCP连接 3.浏览器发出读取文件(URL 中域名后面部分对应的文件)的HTTP 请求,该 ...

hdu 4909 String （map + 状压）

题目大意: 给定一个可能含'?'的字符串.然后问这个字符串有多少个子串是含有所有的字符都只出现两次. 其中'?' 可以被替换成任意字符,也可以被remove... 思路分析: 这是bestcoder的 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.020 s.