去除字符串中的emoji字符

  对于使用utf8编码的mysql数据库来说,如果字符串中存在emoji小图像,是不能存进数据库中的,查了一下,原因大概是因为utf8编码可以存1-3个字节的字符,但是emoji是4个字节;解决方法可以把mysql的编码换成utf8mb4,需要相应版本的mysql;另外一种方法是把字符串中所有的emoji给去除掉,然后在存进数据库,具体的方法是:

public static String filterEmoji(String source,String slipStr) {
        if(isNotBlank(source)){
            return source.replaceAll("[\\ud800\\udc00-\\udbff\\udfff\\ud800-\\udfff]", slipStr);
        }else{
            return source;
        }
    }

参考链接:http://www.cnblogs.com/jeyson/p/5639791.html

     各种emoji编码

时间: 2024-10-13 16:10:13

去除字符串中的emoji字符的相关文章

计算 num 的 n 次幂、n 的阶乘、斐波那契数列、字符串的字节长度、去除字符串中的重复字符

1 //计算 num 的 n 次幂 2 function numPow(num, n) { 3 if (n == 1) { 4 return num; 5 } 6 return num * numPow(num, n - 1); 7 } 8 9 //计算 n 的阶乘 10 function nFactorial(n) { 11 if (n == 1) { 12 return 1; 13 } 14 return n * nFactorial(n - 1); 15 } 16 17 //斐波那契数列,

3.去除字符串中重复的字符

O(n^2)的解决方式: 只能用额外的两个变量,可以依次的访问数组的每个元素,每访问一个,就将从当前到末尾的重复字符(置换为 ' ') 核心代码: 1 void removeChar(char s[]) 2 { 3 int len = strlen(s); 4 if(len < 2) return; 5 int p = 0; 6 int i = 0,j = 0; 7 for(i = 0;i < len; ++i) 8 { 9 if(s[i] != '') 10 { 11 s[p++] = s[

java去除字符串中的特定字符

public static void updateFileNames(String url, String index){ File file = new File(url); //判断文件目录是否存在,且是文件目录,非文件 if(file.exists() && file.isDirectory()){ File[] childFiles = file.listFiles(); String path = file.getAbsolutePath(); for(File childFil

去除字符串中的中英文字符,用正则

import re somethings = "Rise to vote, sir." somethings=somethings.lower()somethings=re.sub("[\s+\.\!\/_,$%^*(+\"\']+|[+——!,.??.[email protected]#¥%……&*()]+", "",somethings)print(somethings) 原文地址:https://www.cnblogs.c

python_如何去除字符串中不想要的字符?

案例: 过滤用户输入中前后多余的空白字符 '    ++++abc123---    ' 过滤某windows下编辑文本中的'\r': 'hello world \r\n' 去掉文本中unicode组合字符,音调 "Zhào Qián Sūn Lǐ Zhōu Wú Zhèng Wáng" 如何解决以上问题? 去掉两端字符串: strip(), rstrip(),lstrip() #!/usr/bin/python3 s = ' -----abc123++++ ' # 删除两边空字符 p

python如何去除字符串中不想要的字符

问题: 过滤用户输入中前后多余的空白字符 ‘    ++++abc123---    ‘ 过滤某windows下编辑文本中的'\r': ‘hello world \r\n' 去掉文本中unicode组合字符,音调 "Zhào Qián Sūn Lǐ Zhōu Wú Zhèng Wáng" 如何解决以上问题? 去掉两端字符串: strip(), rstrip(),lstrip() 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 #!/usr/bin/python3

去除字符串中连续重复的字符

目的:把字符串中连续重复的字符赐除掉. 输入:序列:kkkhan888shioobo66 正确的返回结果应该是:hanshibo 思路解析 1 使用JAVA正则表达式,匹配出连续相同的字符或数字. 2 查找出匹配出来的序列,并取出来放到list里面 3 对list进行排序.把重复的序列排在前面.(该步可省略) 4找出连续重复的子序列,并把这些连续重复的子序列用空(字字符串)替换. 5 返回输出. code public class Test { public static void main(S

Java 去除字符串中的空格和其他字符

直接上代码了. <span style="font-size:18px;">import java.util.regex.Matcher; import java.util.regex.Pattern; /** * java 去除字符串中的空格和其他字符 * @author YYBJ * @date 2014-10-19 */ public class CleanString { public static String replaceBlank(String str) {

去除字符串中的空格

用C语言写一个函数,去除字符串中的空格,并返回删除的空格的个数.不允许开辟新的空间,只能申请简单类型的自动变量.时间复杂度要求为O(n). #include <bitset> #include<iostream> int deleteSpace(char * pstr); void main() { char word[]="dhkak df d fd fdjfkda dfd ff f fd da "; deleteSpace(word); std::cout&