去除字符串中的中英文字符,用正则

import re

somethings = "Rise to vote, sir."

somethings=somethings.lower()somethings=re.sub("[\s+\.\!\/_,$%^*(+\"\‘]+|[+——!,。??、[email protected]#¥%……&*()]+", "",somethings)print(somethings)

原文地址:https://www.cnblogs.com/skbarcode/p/10802891.html

时间: 2024-10-15 12:26:58

去除字符串中的中英文字符,用正则的相关文章

计算 num 的 n 次幂、n 的阶乘、斐波那契数列、字符串的字节长度、去除字符串中的重复字符

1 //计算 num 的 n 次幂 2 function numPow(num, n) { 3 if (n == 1) { 4 return num; 5 } 6 return num * numPow(num, n - 1); 7 } 8 9 //计算 n 的阶乘 10 function nFactorial(n) { 11 if (n == 1) { 12 return 1; 13 } 14 return n * nFactorial(n - 1); 15 } 16 17 //斐波那契数列,

Python统计字符串中的中英文字符、数字空格,特殊字符

# -*- coding:utf8 -*- import string from collections import namedtuple def str_count(s): '''找出字符串中的中英文.空格.数字.标点符号个数''' count_en = count_dg = count_sp = count_zh = count_pu = 0 s_len = len(s) for c in s: # 英文 if c in string.ascii_letters: count_en +=

去除字符串中的emoji字符

对于使用utf8编码的mysql数据库来说,如果字符串中存在emoji小图像,是不能存进数据库中的,查了一下,原因大概是因为utf8编码可以存1-3个字节的字符,但是emoji是4个字节:解决方法可以把mysql的编码换成utf8mb4,需要相应版本的mysql:另外一种方法是把字符串中所有的emoji给去除掉,然后在存进数据库,具体的方法是: public static String filterEmoji(String source,String slipStr) { if(isNotBla

3.去除字符串中重复的字符

O(n^2)的解决方式: 只能用额外的两个变量,可以依次的访问数组的每个元素,每访问一个,就将从当前到末尾的重复字符(置换为 ' ') 核心代码: 1 void removeChar(char s[]) 2 { 3 int len = strlen(s); 4 if(len < 2) return; 5 int p = 0; 6 int i = 0,j = 0; 7 for(i = 0;i < len; ++i) 8 { 9 if(s[i] != '') 10 { 11 s[p++] = s[

java去除字符串中的特定字符

public static void updateFileNames(String url, String index){ File file = new File(url); //判断文件目录是否存在,且是文件目录,非文件 if(file.exists() && file.isDirectory()){ File[] childFiles = file.listFiles(); String path = file.getAbsolutePath(); for(File childFil

python_如何去除字符串中不想要的字符?

案例: 过滤用户输入中前后多余的空白字符 '    ++++abc123---    ' 过滤某windows下编辑文本中的'\r': 'hello world \r\n' 去掉文本中unicode组合字符,音调 "Zhào Qián Sūn Lǐ Zhōu Wú Zhèng Wáng" 如何解决以上问题? 去掉两端字符串: strip(), rstrip(),lstrip() #!/usr/bin/python3 s = ' -----abc123++++ ' # 删除两边空字符 p

python如何去除字符串中不想要的字符

问题: 过滤用户输入中前后多余的空白字符 ‘    ++++abc123---    ‘ 过滤某windows下编辑文本中的'\r': ‘hello world \r\n' 去掉文本中unicode组合字符,音调 "Zhào Qián Sūn Lǐ Zhōu Wú Zhèng Wáng" 如何解决以上问题? 去掉两端字符串: strip(), rstrip(),lstrip() 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 #!/usr/bin/python3

去除字符串中连续重复的字符

目的:把字符串中连续重复的字符赐除掉. 输入:序列:kkkhan888shioobo66 正确的返回结果应该是:hanshibo 思路解析 1 使用JAVA正则表达式,匹配出连续相同的字符或数字. 2 查找出匹配出来的序列,并取出来放到list里面 3 对list进行排序.把重复的序列排在前面.(该步可省略) 4找出连续重复的子序列,并把这些连续重复的子序列用空(字字符串)替换. 5 返回输出. code public class Test { public static void main(S

Java 去除字符串中的空格和其他字符

直接上代码了. <span style="font-size:18px;">import java.util.regex.Matcher; import java.util.regex.Pattern; /** * java 去除字符串中的空格和其他字符 * @author YYBJ * @date 2014-10-19 */ public class CleanString { public static String replaceBlank(String str) {