ORACLE判别字段是否包含中文

在ORACLE数据库中如何查找那些字段里面包含中文的数据记录呢，有时候就是有这样的特殊需求，下面整理了一些判别字段中包含中文记录的几个方法

1：使用ASCIISTR函数判别

ASCIISTR函数说明：

ASCIISTR返回字符的ASCII形式的字符串。非ASCII的字符被转化为\xxxx的形式。

使用ASCIISTR函数也是根据非ASCII字符会被转化这个特性来判别中文字符，只要里面包含中文字符，则必定会有\xxx这样的字符。且简体汉字的编码范围是B0A1 - F7FE.如下例子所示

CREATE TABLE TEST

    NAME_ONE   CHAR(24)

   ,NAME_TWO   VARCHAR2(24)

   ,NAME_THR   NCHAR(24)

   ,NAME_FOR   NVARCHAR2(24)

INSERT INTO TEST

SELECT ‘abc10‘, ‘abc20‘, ‘abc30‘, ‘abc40‘         FROM DUAL UNION ALL

SELECT ‘abc11‘, ‘abc21‘, ‘abc31‘, ‘abc41‘         FROM DUAL UNION ALL

SELECT ‘abc12‘, ‘abc22‘, ‘abc32‘, ‘abc42‘         FROM DUAL UNION ALL

SELECT ‘abc1!‘, ‘abc2!‘, ‘abc3!‘, ‘abc4!‘         FROM DUAL UNION ALL

SELECT ‘abc1#‘, ‘abc2#‘, ‘abc3#‘, ‘abc4#‘         FROM DUAL UNION ALL

SELECT ‘abc1$‘, ‘abc2$‘, ‘abc3$‘, ‘abc4$‘         FROM DUAL UNION ALL

SELECT ‘ab测试1‘, ‘ab测试2‘, ‘ab测试3‘, ‘ab测试4‘ FROM DUAL;

使用 ASCIISTR(NAME_ONE) LIKE ‘%\%‘ 就能判别那些有中文的记录。如下所示：

SELECT NAME_ONE FROM TEST WHERE ASCIISTR(NAME_ONE) LIKE ‘%\%‘

但是如果字段里面的非ASCII字符不仅仅有中文，例如还有日文之类，那么这个方法就不能准确判别了，如下所示，我插入一条包含日文的记录.

INSERT INTO TEST

SELECT ‘abこんにちは1‘, ‘abこんにちは2‘, ‘abこんにちは3‘, ‘abこんにちは4‘ FROM DUAL;

COMMIT;

SQL> SELECT NAME_ONE FROM TEST WHERE ASCIISTR(NAME_ONE) LIKE ‘%\%‘;

NAME_ONE

------------------------

ab测试1

abこんにちは1

2：使用CONVERT函数判别

CONVERT函数说明：

CONVERT(inputstring,dest_charset,source_charset)

inputstring：要转换的字符串

dest_charset：目标字符集

source_charset：原字符集

SQL> SELECT * FROM NLS_DATABASE_PARAMETERS WHERE PARAMETER=‘NLS_CHARACTERSET‘;

PARAMETER                      VALUE

------------------------------ ----------------------------------------

NLS_CHARACTERSET               UTF8

SQL> SELECT NAME_ONE, NAME_TWO FROM TEST WHERE  NAME_ONE <> CONVERT(NAME_ONE, ‘ZHS16GBK‘, ‘UTF8‘);

NAME_ONE                 NAME_TWO

------------------------ ------------------------

ab测试1                  ab测试2

abこんにちは1            abこんにちは2

3:使用函数length和lengthb来判别

使用函数length与lengthb来判别，是基于中文字符占用2~4个字节，而ASCII字符占用一个字节，那么对比LENGTH与LENGTHB就会不一样。这样就能判别字段中是否包含中文字符，但是跟ASCIISTR一样，如果里面的非ASCI字符包含非中文，它一样不能判别。依然有取巧嫌疑。

SELECT NAME_ONE FROM TEST WHERE LENGTH(NAME_ONE) != LENGTHB(NAME_ONE);

关于三者的性能，基本上都差不多，并没有那个性能要快一点。当然我没有详细、大量测试过，只是就某个案例的执行计划分析而已。

参考资料：

http://www.bitscn.com/pdb/oracle/201407/240540.html

http://blog.csdn.net/yzsind/article/details/6106050

http://blog.itpub.net/9399028/viewspace-687789

时间： 2024-10-10 00:17:07

ORACLE判别字段是否包含中文的相关文章

Oracle中判断字段是否包含中文

如果要判断字段中包含中文,有个简单的方法. SQL> drop table test purge; SQL> create table test as select * from dba_objects where rownum<10; SQL> update test set object_name='中国' where rownum <3; SQL> commit; SQL> col object_name format a30 SQL> col as

mysql查询某一个字段是否包含中文字符

在使用mysql时候,某些字段会存储中文字符,或是包含中文字符的串,查询出来的方法是: SELECT col FROM table WHERE length(col)!=char_length(col) 网上搜索有很多种查询方法,但是试了很多都不行,这个是找到的可以使用的查询方法,原理其实很简单,当字符集为UTF-8,并且字符为中文时,length() 和 char_length() 两个方法返回的结果是不相同的. # 以下这两个方法查询字段中是否包含中文 SELECT country FROM

mysql 查询字段中包含中文的查询语句

工作需要:删除字段中所有包含中文的: SELECT * FROM `TableName` WHERE LENGTH(`ColumnName`)<>CHARACTER_LENGTH(`ColumnName`)

Oracle修改字段值包含&字符

昨天在更新一个表的字段时发现pl/sql弹出变量框,它认为我要改的字段值中包含未定义的变量.比如我执行一个脚本:update t_wlf_config set configvalue = 'hello&hi' where configname = 'hello'; 那么它会认为hi是个变量而提示你输入具体值. 解决方案是用chr(38)替换&,再使用||关联字符串,如上面字段值改为'hello'||chr(38)||'hi'就没问题了.

oracle中imp导入数据中文乱码问题(转)

(转自 http://blog.chinaunix.net/uid-186064-id-2823338.html) oracle中imp导入数据中文乱码问题用imp命令向oracle中导入数据后,所有查询出的中文字段都为乱码. 原则上不修改服务器端的字符集,修改服务器端的字符集会出现使用第三方工具登陆数据库出现乱码的情况(具体服务器端的字符集修改办法本文有详细介绍). 将DMP文件的字符集改成与Oracleo数据库服务器端一样之后导入可正常显示.本人的系统是RHEL 5.4 32bit 一.

数据库中判断内容中是否包含中文

SQL Server 用patindex()函数判断,例如'patindex(%[吖-做]%',字段名)>0 Oracle 用lengthb()和length()函数求字段对应内容的的长度,长度不一样则说明内容中包含汉字数据库中判断内容中是否包含中文,布布扣,bubuko.com

ElKstack-解决nginx日志url链接包含中文logstash报错问题

logstash报错现象 Trouble parsing json {:source=>"message", :raw=>"{\"@timestamp\":\"2016-05-30T14:51:27+08:00\",\"host\":\"10.139.48.166\",\"clientip\":\"180.109.110.203\",\"

Hive:把一段包含中文的sql脚本粘贴到beeline client运行中文乱码

背景: 在做项目过程中不可能hive表中都是非中文字段.在最近做的项目中就遇到需要在beeline界面上执行查询脚本,但脚本中包含中文,正常一个脚本用文本写好后,粘贴到beeline窗口运行时,发现中文是乱码,而且回车执行也抛出了错误. 解决方案: 使用"beeline -f 文件"解决问题,在我的需求中,这种方案确实解决了问题. 需要的业务语句: use x_hive_db; create table mytable as select * from allrecordstable

mysql 使用正则REGEXP匹配字段中的中文字符

1.匹配包含中文和其他字符的字段: SELECT * FROM table WHERE HEX(name) REGEXP '[[:<]]*(e[4-9][0-9a-f]{4})+.*[[:>:]]' 2.匹配只包含中文.字母.数字的字段 : SELECT * FROM table WHERE HEX(name) REGEXP '[[:<:]](e[4-9][0-9a-f]{4}|3[0-9]|4[0-9A-F]|5[0-9A]|6[0-9A-F]|7[0-9A]|5F)+[[:>: