Unified Emoji表情for Android

这个是我做Android以来碰到的最烦的东西,该死的emoji表情,恨之入骨。。无奈这个问题分配给我了。我也只能硬着头皮做。

0.吐个槽先

首先,你要明白什么是emoji表情,不知道的google,不需要支持emoji的可以绕道了。

emoji有很多不同的版本,我tm最讨厌的就是不同版本的了。Unified DoCoMo KDDI Softbank Google

因为ios5升级了,emoji编码从softbank变成unified了。所以只能Android这边改了。伤心。

我要做的工作就是把消息中含有的unified的emoji编码过滤出来,然后映射出对应的表情资源显示出来。

1.准备工作。

google下emoji表情的历史,google code上有个源码,不过是java的,那么你要把它改成java的。。(记得当初解析gif表情时也是把java改成android,可怜的我为咩总是干这活。。)

这里有个link,上面有所有的编码对应转换。Emoji for PHP

然后google code里有所有对应的编码转换的xml。叫emoji4unicode.xml. 这里是link: emoji4unicode

如果没兴趣我等下会直接贴代码的,但是最好你先自己弄明白解析的原理是什么,emoji表情一直在增加,以后要兼容你就得自己想办法了。

2.举个例子

black sun with rays unified : U+2600 softbank: U+E04A

如果以前你解析过softbank,应该很熟悉了。好歹它还有个大致得顺序,解析得时候只要判断是否在这个unicode范围内就可以了。so easy

可是unified完全是无顺序得,所以必须得自己建好映射。

因为原始的emoji.xml很大,把所有的描述信息都放里面了,我不需要,所以我写了个java把xml解析了一遍,然后重新生成了一个我需要的xml。贴个图出来大家看下。

you see , 这个原始的xml实在太大了,有162K,而且还是xml解析。。你想想多耗内存和时间。所以必须把它再转换一遍。

so 这个过程做好了,就可以进行下一步真正的解析了。。

3 解析过程。

因为emoji是有表情分组的,所以你要优先考虑解析出来的也是分好组的。

HashMap<String, ArrayList<String>> emoMap = new HashMap<String, ArrayList<String>>();

我是这么来分组的。

解析xml,然后把2600这样的字符串转换成unicode。这个很关键,映射对应不上肯定也解析不出来。要注意的一点是有的emoji是两个unicode组成的  U+1F1F0 U+1F1F7  这样。。所以么。又多了一个环节。

HashMap<List<Integer>, String> convertMap = new HashMap<List<Integer>, String>();

再定义一个map来存unicode和string字符的映射。

if (xmlpull.getName().equals("e")) {
    fromAttr = xmlpull.nextText();
    emos.add(fromAttr);
    List<Integer> fromCodePoints = new ArrayList<Integer>();
    if (fromAttr.length() > 6) {
        String[] froms = fromAttr.split("\\_");
        for (String part : froms) {
            fromCodePoints.add(Integer.parseInt(part, 16));
        }
    } else {
        fromCodePoints.add(Integer.parseInt(fromAttr, 16));
    }
    convertMap.put(fromCodePoints, fromAttr);
}

这样就把整个解析都写到内存里了。这个就做成单例咯,在程序一进来,application里初始化。

4,解析过程

这里我是把emoji表情解析出来,再改成[e]2600[/e]的形式。然后再用正则再解析一遍(为什么这样做。。因为消息里面不可能只有emoji表情的啊亲。。。你还要解析另外的表情。)

下面是过滤emoji表情的方法:

public String parseEmoji(String input) {
if (input == null || input.length() <= 0) {
return "";
}
StringBuilder result = new StringBuilder();
int[] codePoints = toCodePointArray(input);
List<Integer> key = null;
for (int i = 0; i < codePoints.length; i++) {
key = new ArrayList<Integer>()
if (i + 1 < codePoints.length) {
key.add(codePoints[i]);
key.add(codePoints[i + 1]);
if (convertMap.containsKey(key)) {
String value = convertMap.get(key);
if (value != null) {
result.append("[e]" + value + "[/e]");
}
i++;
continue;
}
}
key.clear();
key.add(codePoints[i]);
if (convertMap.containsKey(key)) {
String value = convertMap.get(key);
if (value != null) {
result.append("[e]" + value + "[/e]");
}
continue;
}
result.append(Character.toChars(codePoints[i]));
}
return result.toString();
}

看到这里,你可能觉得懵了。当时我也是卡了两三天,不停的网上找资料,反编译别人的代码。最后才找的解决方案的,代码其实没有很多,最重要的是要怎么去思考。

4.渲染成图片。

public static SpannableStringBuilder convetToHtml(String content, Context mContext) {
String regex = "\\[e\\](.*?)\\[/e\\]";
Pattern pattern = Pattern.compile(regex);
String emo = "";
Resources resources = mContext.getResources();
String unicode = EmojiParser.getInstance(mContext).parseEmoji(content);
Matcher matcher = pattern.matcher(unicode);
SpannableStringBuilder sBuilder = new SpannableStringBuilder(unicode);
Drawable drawable = null;
ImageSpan span = null;
while (matcher.find()) {
emo = matcher.group();
try {
int id = resources.getIdentifier(
"emoji_" + emo.substring(emo.indexOf("]") + 1, emo.lastIndexOf("[")),
"drawable", "package");
if (id != 0) {
drawable = resources.getDrawable(id);
drawable.setBounds(0, 0, 24, 24);
span = new ImageSpan(drawable);
sBuilder.setSpan(span, matcher.start(), matcher.end(),
Spannable.SPAN_EXCLUSIVE_EXCLUSIVE);
}
} catch (Exception e) {
break;
}
}
return sBuilder;
}

好了,成功解析出来了。但是!!你得先把图片弄到手啊,亲。而且还要我这个格式得。

贴个图

额,话说这个我也是写了个java,把之前得softbank得命名转换成unified的命名,当初我还准备一个一个手动改来着,还好我同事一语点醒梦中人额。。不然我估计就吐血身亡了。程序写多了就是这样,思维固定了。。。

5.发emoji消息。

既然能显示了,你还得发啊,亲。

直接贴代码把,一个还原过程

public static String convertToMsg(CharSequence cs, Context mContext) {
SpannableStringBuilder ssb = new SpannableStringBuilder(cs);
ImageSpan[] spans = ssb.getSpans(0, cs.length(), ImageSpan.class);
for (int i = 0; i < spans.length; i++) {
ImageSpan span = spans[i];
String c = span.getSource();
int a = ssb.getSpanStart(span);
int b = ssb.getSpanEnd(span);
if (c.contains("emoji")) {
ssb.replace(a, b, convertUnicode(c));
}
}
ssb.clearSpans();
return ssb.toString();
}
private static String convertUnicode(String emo) {
emo = emo.substring(emo.indexOf("_") + 1);
if (emo.length() < 6) {
return new String(Character.toChars(Integer.parseInt(emo, 16)));
}
String[] emos = emo.split("_");
char[] char0 = Character.toChars(Integer.parseInt(emos[0], 16));
char[] char1 = Character.toChars(Integer.parseInt(emos[1], 16));
char[] emoji = new char[char0.length + char1.length];
for (int i = 0; i < char0.length; i++) {
emoji[i]  = char0[i];
}
for (int i = char0.length; i < emoji.length; i++) {
emoji[i]  = char1[i - char0.length];
}
return new String(emoji);
}

由于时间跨度比较长了。年初得时候写得,基本都记不清了。所以尽量不要来问我额,亲们,我只提供解决方案。

代码我也会上传一份,有需要得可以拿去耍。

时间: 2024-09-27 22:48:32

Unified Emoji表情for Android的相关文章

用JS过滤Emoji表情的输入

本文为原创,转载请注明出处: cnzt       文章:cnzt-p http://www.cnblogs.com/zt-blog/p/6773854.html 在前端页面开发过程中,总会碰到不允许输入框输入emoji表情的需求,我的思路是通过编码用正则匹配表情,然后将其替换为空字符创.但是问题也是显而易见的,完整的编码集是什么呢?查阅了官方文档,发现上面并没有给出想要的答案.并且很多emoji表情除了主编码还有副编码(这是我给取的名字),举个例子: \uD83C\uDC00是一个表情,\uD

mysql兼容emoji表情存取

emoji介绍 Emoji (絵文字,词义来自日语えもじ,e-moji,moji在日语中的含义是字符)是一套起源于日本的12x12像素表情符号,由栗田穣崇(Shigetaka Kurit)创作,最早在日本网络及手机用户中流行,自苹果公司发布的iOS 5输入法中加入了emoji后,这种表情符号开始席卷全球,目前emoji已被大多数现代计算机系统所兼容的Unicode编码采纳,普遍应用于各种手机短信和社交网络中.近期,更是有不少网友用emoji图案玩猜字游戏,享受这种表情文化带来的乐趣. 关于emo

【Android】android 输入框EditText禁止输入Emoji表情符

转载地址:http://blog.csdn.net/elsdnwn/article/details/45390771 package com.liujy.ui.wiget;import android.content.Context;import android.text.Editable;import android.text.Selection;import android.text.Spannable;import android.text.TextWatcher;import andro

mysql utf8mb4与emoji表情[转]

MYSQL 5.5 之前, UTF8 编码只支持1-3个字节,只支持BMP这部分的unicode编码区, BMP是从哪到哪,到http://en.wikipedia.org/wiki/Mapping_of_Unicode_characters这里看,基本就是0000-FFFF这一区. 从MYSQL5.5开始,可支持4个字节UTF编码utf8mb4,一个字符最多能有4字节,所以能支持更多的字符集. utf8mb4 is a superset of utf8 utf8mb4兼容utf8,且比utf8

mysql utf8mb4与emoji表情

一 什么是Emoji emoji就是表情符号:词义来自日语(えもじ,e-moji,moji在日语中的含义是字符) 表情符号现已普遍应用于手机短信和网络聊天软件. emoji表情符号,在外国的手机短信里面已经是很流行使用的一种表情. 手机上如何使用emoji: 1.iphone.ipad系统:安装emoji free,再设置-通用-键盘-国际键盘-添加新的键盘,然后把emoji添加在里面即可在发短信和一些输入文本的文本框中输入表情. IOS 5用户可直接从通用中添加emoji 键盘,无需再安装em

使用php-emoji类让网页显示emoji表情

需要的材料: php-emoji类库的下载地址:https://github.com/iamcal/php-emoji 代码示例:(该代码来自官网) 1 <?php 2 include('emoji.php'); 3 4 # when you recieve text from a mobile device, convert it 5 # to the unified format. 6 //当你从移动设备里接收到信息,要将这些信息转为统一格式 7 //以下4个函数是从其他设备的格式转为统一格

微信自定义菜单设置 及 emoji表情更换

今天帮老东家改了微信自定义菜单,好久没碰有点忘了,记下 1.access_token: 先通过开发者工具-在线调试接口页面的基础支持接口:获取sccess_token 2.自定义菜单 拿到access_token后,在同页面调整接口:自定义菜单,创建接口,输入body  ->检查 ??在这可以自定义菜单查询接口查询出来的body信息 如果是按钮链接附带鉴权信息,绝对不能重用(鉴权信息部分会消失) ??menu部分不要 格式类似:{"button": [{"type&qu

3种方法轻松处理php开发中emoji表情的问题

背景 做微信开发的时候就会发现,存储微信昵称必不可少. 可这万恶的微信支持emoji表情做昵称,这就有点蛋疼了 一般Mysql表设计时,都是用UTF8字符集的.把带有emoji的昵称字段往里面insert一下就没了,整个字段变成了空字符串.这是怎么回事呢? 原来是因为Mysql的utf8字符集是3字节的,而emoji是4字节,这样整个昵称就无法存储了.这要怎么办呢?我来介绍几种方法 解决方案 1.使用utf8mb4字符集 如果你的mysql版本>=5.5.3,你大可直接将utf8直接升级为utf

django,mysql存储emoji表情,utf8mb4

今天在做后台的时候发现一个错误: Incorrect string value: '\\xF0\\x9F\\x90\\xA8' for column 'signature' at row 1 发现是参数里面是一个iOS的表情,也就是系统自带的emoji表情. 后台用的是django 1.6,数据库用的是Mysql 5.5.22,缓存用的是redis. 上网了解了一下emoji表情,原来一般的字符包括中文用utf8的话,mysql是用3个字节去存储的,而emoji表情要用4个字节的utf8,也就是