opencc 繁体简体互转 (C++示例)

繁体字通常采用BIG5编码,简体字通常采用GBK或者GB18030编码,这种情况下,直接使用iconv(linux下有对应的命令,也有对应的C API供编程调用)就行。对于默认采用utf-8编码的文件或者繁简体都并存的情况(通常采用utf-8)编码的情况,iconv这种方式就不行了。这里我们可以采用一个调用 opencc 的开源库,来实现UTF-8编码环境下的简体、繁体互转的功能。参照 https://github.com/BYVoid/OpenCC 完成opencc库的安装

下面是自己用C++程序调用相关的API来完成的繁体转简体的功能

//test.cpp

#include <iostream>
#include <opencc/opencc.h>

using namespace std;

int main ( int argc, char *argv[] )
{
    string str= "中華人民共和國反分裂國家法";
    //string str= "中华人民共和国反分裂国家法";

    //默认的是简体转繁体即OPENCC_DEFAULT_CONFIG_TRAD_TO_SIMP, opencc.h头文件中有详细介绍
    opencc_t ot = opencc_open(OPENCC_DEFAULT_CONFIG_TRAD_TO_SIMP);

    char buffer[512] = {‘\0‘};
    opencc_convert_utf8_to_buffer(ot, str.c_str(), str.size(), buffer);
    cout << "result is " << buffer << endl;

    opencc_close(ot);

    return 0;
}

编译 g++ test.cpp -o test -lopencc

时间: 2024-08-26 11:43:00

opencc 繁体简体互转 (C++示例)的相关文章

页面繁体简体互换

<%@ Page Language="C#" AutoEventWireup="true" CodeBehind="Default.aspx.cs" Inherits="Chines._Default" %> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/x

通过JS实现网站繁体简体互换

html部分 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="C

SQL简体繁体转换函数代码

--生成码表 if exists (select * from dbo.sysobjects where id = object_id(N'[codetable]') and OBJECTPROPERTY(id, N'IsUserTable') = 1) drop table [codetable] GOdeclare @j varchar(8000),@f varchar(8000) select @j=' 啊阿埃挨哎唉哀皑癌蔼矮艾碍爱隘鞍氨安俺按暗岸胺案肮昂盎凹敖熬翱袄傲奥懊澳芭捌扒叭吧笆八

Microsoft SQL Server 自定义函数整理大全

01.去除字符串中的html标记及标记中的内容 [叶子函数分享一]去除字符串中的html标记及标记中的内容 --1.创建函数 create function [dbo].[clearhtml] (@maco varchar(8000)) returns varchar(8000) as begin     declare @i int     while 1 = 1     begin        set @i=len(@maco)        set @maco=replace(@maco

SQL简繁转换函数

declare @jall nvarchar(4000),@fall nvarchar(4000) select @jall=N'啊阿埃挨哎唉哀皑癌蔼矮艾碍爱隘鞍氨安俺按暗岸胺案肮昂盎凹敖熬翱袄傲奥懊澳芭捌扒叭吧笆八疤巴拔跋靶把耙坝霸罢爸白柏百摆佰败拜稗斑班搬扳般颁板版扮拌伴瓣半办绊邦帮梆榜膀绑棒磅蚌镑傍谤苞胞包褒剥薄雹保堡饱宝抱报暴豹鲍爆杯碑悲卑北辈背贝钡倍狈备惫焙被奔苯本笨崩绷甭泵蹦迸逼鼻比鄙笔彼碧蓖蔽毕毙毖币庇痹闭敝弊必辟壁臂避陛鞭边编贬扁便变卞辨辩辫遍标彪膘表鳖憋别瘪彬斌濒滨宾摈兵冰柄丙

Python中的一些函数

1. 中文繁体/简体转换 下载 zh_wiki.py:https://github.com/skydark/nstools/blob/master/zhtools/zh_wiki.py 和 langconv.py:https://github.com/skydark/nstools/blob/master/zhtools/langconv.py 放在项目路径中,示例代码为 #!/usr/bin/python # -*- coding: utf-8 -*- #coding=utf-8 from l

Windows3.5下对维基百科语料用word2vec进行训练寻找同义词相似度

首先把需要下载的东西都列出来 1. 语料:下载地址是https://dumps.wikimedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz2,或者在这里找https://dumps.wikimedia.org/zhwiki/.这个文件只包含了标题和正文,不包含词条之间的链接信息,大小约为1.3G. 2.WikiExtractor:用于从原始的xml文件中提取出标题和正文.地址https://github.com/attardi/

Enterprise Solution 进销存管理软件 C/S架构,支持64位系统 物流,资金流,信息流全面集成

      定位  Target Customers 中小型生产制造企业,批发零售类,贸易企业 主要模块 Modules 采购.销售.库存.财务账款四大模块,包含企业运作过程中销售.采购.库存各岗位需要的全部功能,实现了部门间数据共享和企业信息一体化业务处理. 模块 主要功能 采购 申购单,采购订单,采购收货,采购验货,采购退货 销售 报价单,销售订单,送货,销售退货,销售包装 仓库 进仓,出仓,转仓,仓库调整,仓库盘点,库存分析与统计 财务 客户应收帐,供应商应付帐,借项通知书,贷项通知单,记

DNS排查技术图谱

# DNS排查技术图谱 ## 应用程序视角- 应用程序 - 浏览器 - hostname cache - ping- 操作系统 - hostname cache - 域名解析器 - dig domain- 本网DNS转发器 - 无线路由 - [email protected]_ip domain- Local DNS - [email protected] domain- 全球DNS系统 - 根root"." - 顶级域名 TLD - gTLD - ccTLD - 二级域名 SLD -