php用正则表达式截取字符串中文部分

function substr11($str)
{

    preg_match_all("/[\x{4e00}-\x{9fa5}]+/u",$str,$regs);//preg_match_all(“正则表达式”,"截取的字符串","成功之后返回的结果集(是数组)")
    $s = join(‘‘,$regs[0]);//join("可选。规定数组元素之间放置的内容。默认是 ""(空字符串)。","要组合为字符串的数组。")把数组元素组合为一个字符串
    $s=mb_substr($s,0,80,‘utf-8‘);//mb_substr用于字符串截取,可以防止中文乱码的情况
    return $s;

}
时间: 2024-10-13 20:49:53

php用正则表达式截取字符串中文部分的相关文章

用C#通过正则表达式截取字符串中符合条件的子字符串

仅仅作为简单的记录,不多说直接上代码(仅测试使用): private void Test() { Regex ConnoteA = new Regex("^[a-zA-Z]\\d{8}$"); Regex ConnoteAA = new Regex("^[a-zA-Z]{2}\\d{7,10}$"); Regex ConnoteAAA = new Regex("^[a-zA-Z]{3}\\d{5,9}$"); Regex ConnoteAAAA

Java 用正则表达式 截取字符串中的数字

package com.benywave; import java.util.regex.Matcher; import java.util.regex.Pattern; public class Test { public static void main(String[] args) { String str = "急救电话 112"; Pattern pattern = Pattern.compile("[0-9]{1,}"); Matcher matcher

用正则表达式截取字符串中的数字

用截取字符串中的数字,代码如下: double d = 0; string str = "hello8023.1314world"; //要截取的字符串 Match m = Regex.Match(str, "\\d+(\\.\\d+){0,1}"); double.TryParse(m.Groups[0].ToString(), out d); Console.WriteLine(d); Console.ReadKey(); 运行截图如下:

JAVA 正则表达式截取字符串小例子

例如:从如下字符串 营业时间: 11:30-21:30 修改 分类标签: 无线上网(8) 可以刷卡(7) 朋友聚餐(5) 家庭聚会(5) 商务宴请(4) 情侣约会(4) 可自带酒水(2) 中获取: 11:30-21:30 两个数字:两数字-两个数字:两个数字 因此 正则表达式:\\d{2}:\\d{2}-\\d{2}:\\d{2} 具体代码如下: import java.util.regex.Matcher; import java.util.regex.Pattern; public clas

正则表达式截取字符串两字符间的内容

一.问题 我有个字符串比如a="abcdanmcadedcdeefako"那么我怎么能得到一个数组,其中数组的各项是字母a和c的中间字符,即第一项是"b"第二项"nm"第三项"ded" 二.答案 下面是C#写的,java也可以适用 static void Main(string[] args) { string a = "abcdanmcadedcdeefako"; Regex reg = new Rege

网上找的JS截取字符串(含中文)

<script> /* 2007-11-28 XuJian */ //截取字符串 包含中文处理 //(串,长度,增加...) function subString(str, len, hasDot) { var newLength = 0; var newStr = ""; var chineseRegex = /[^\x00-\xff]/g; var singleChar = ""; var strLength = str.replace(chines

PHP计算中文字符串长度 、截取对应中文字符串

PHP计算字符串长度     及其   截取对应中文字符串 计算字符长度: $gouWu = '美日汇http://www.hnzyxok.com/'; echo mb_strlen($gouWu,'utf-8') ;    //输出的结果是26,里面包含了中文字母符号的计算,在该函数加上 UTF-8行  ,否则算出来的就是32(一个中文对应的长度是3) 对应截取中文: echo mb_substr($gouWu,0,10,'utf-8').;     //从$gouWu变量中对应取10个字符,

js获取(包括中文)字符串长度与截取字符串

/** * @param begin 截取开始的索引 * @param num 截取的长度 */ //截取字符串(包括中文) function SetString(str, len) { var strlen = 0; var s = ""; for (var i = 0; i < str.length; i++) { var m = str.charAt(i).match(/[^\x00-\x80]/g);//利用match方法检索出中文字符并返回一个存放中文的数 if (m!

【转载】Python使用中文正则表达式匹配指定中文字符串的方法示例

本文实例讲述了Python使用中文正则表达式匹配指定中文字符串的方法.分享给大家供大家参考,具体如下: 业务场景: 从中文字句中匹配出指定的中文子字符串 .这样的情况我在工作中遇到非常多, 特梳理总结如下. 难点: 处理GBK和utf8之类的字符编码, 同时正则匹配Pattern中包含汉字,要汉字正常发挥作用,必须非常谨慎.推荐最好统一为utf8编码,如果不是这种最优情况,也有酌情处理. 往往一个具有普适性的正则表达式会简化程序和代码的处理,使过程简洁和事半功倍,这往往是高手和菜鸟最显著的差别.