python每日一练:0004题

第 0004 题: 任一个英文的纯文本文件,统计其中的单词出现的个数。
import re

count = 0
with open(‘./EnglishText.txt‘,‘r‘) as f:
    temp = f.readlines()
    for i in temp:
        regList = re.findall(‘[a-zA-Z0-9]+‘,i) #找出每一行中的单词数
        count += len(regList)

print("文本EnglishText.txt中单词的个数为:{0}".format(count))


原文地址:https://www.cnblogs.com/xuxiaowen1990/p/11143001.html

时间: 2024-10-04 09:25:58

python每日一练:0004题的相关文章

Python 每日一练(3)

引言 今天的每日一练,学习了一下用Python生成四位的图像验证码,就是我们常常在登录时见到的那种(#`O′) 思路分析 正如常见的那种图像验证码,它是由数字和字母的随机组合产生的,所以我们首先的第一步就是生成这样的数字字母组合 完成第一步后,剩下的就和之前第一次练习给图片加文字一样的操作了 具体实现 生成随机验证码 def genUnit(): ascii_and_num=string.ascii_uppercase+string.digits Verification_Code=random

python每日一练:0015题

第 0015 题: 纯文本文件 city.txt为城市信息, 里面的内容(包括花括号)如下所示: { "1" : "上海", "2" : "北京", "3" : "成都" } 请将上述内容写到 city.xls 文件中,如下图所示: 代码如下: import xlwt import re workbook = xlwt.Workbook() worksheet = workbook.ad

python每日一练:0011题

第 0011 题: 敏感词文本文件 filtered_words.txt,里面的内容为以下内容,当用户输入敏感词语时,则打印出 Freedom,否则打印出 Human Rights. 北京 程序员 公务员 领导 牛比 牛逼 你娘 你妈 love sex jiangge 示例代码: inputs = input('请输入内容:') with open('filtered_words.txt','r',encoding='utf-8') as f: while True: word = f.read

Python 每日一练(6)

引言 今天的练习可以说是昨天的那个的反操作,今天要尝试将xls文件的内容写入xml文件中 所涉及到的库有xml,xlrd xls文件内容写入xml python操作excel主要用到xlrd和xlwt这两个库,即xlrd是读excel,xlwt是写excel的库(就是上一篇用到的那个库). 而今天的另一个主角xml又是一个什么呢? XML指的是可扩展标记语言eXtensible Markup Language,和json类似也是用于存储和传输数据,还可以用作配置文件.类似于HTML超文本标记语言

python每日一练之20170611

#!/usr/local/bin/python #-*- coding: UTF-8 -*- #端口扫描器 import socket import thread import time socket.setdefaulttimeout(3)  #设置了全局默认超时时间 def socket_port(ip,PORT):  #扫描开放端口     try:         if PORT>=65535:             print u"端口扫描结束0-65535"    

Python每日一练(2):找出html中的所有链接(Xpath、正则两个版本)

要在hrml文件中找出特定的内容,首先需要观察该内容是什么东西,在什么位置,这样才能找出来. 假设html的文件名称是:"1.html".href属性全都在a标签里. 正则版: #coding:utf-8 import re with open('1.html','r') as f: data = f.read() result = re.findall(r'href="(.*?)"',data) for each in result: print each Xpa

C语言每日一练——第一题

一.程序功能 程序的功能是:将大于整数m且紧靠m的k个素数存入数组xx.并把in.dat文件的内容输入到程序,并把输出结果输出道out.dat文件夹中例如:若输入17,5 则应该输入:19,23,29,31,37 1.in.dat文件内容 17 5 101 7 321 5 32 4 55 6 76 6 99 4 781 5 22 6 66 3 2.程序实现 #include <stdio.h> //判断m是否为素数 /*int isP(int m) { int i; for(i = 2; i

C语言每日一练——第二题

一.题目要求 已知数据文件in.dat中存有300个四位数,并调用读函数readDat()把这些数存入数组a中,请编制一函数jsValue(),其功能是:求出所有这些四位数是素数的个数cnt,再求出所有满足此条件的四位数平均值pjz1,以及所有不满足此条件的四位数平均数pjz2.最后main()函数调用写函数把结果cnt,pjz1,pjz2,输出到out.dat文件中 二.in.dat文件内容 7704,9774,3213,5845,7703,2902,1925,2584,7429,6646 3

Python Show-Me-the-Code 第 0004 题 统计单词

第 0004 题:任一个英文的纯文本文件,统计其中的单词出现的个数. 思路:用正则表达式匹配响应的单词和数字,然后让Counter计算单词的词频,再用most_common方法返回一个按照词频排序的包含该词语和该词语出现的次数的元组的列表. 0004.统计单词.py #!/usr/bin/env python #coding: utf-8 import re from collections import Counter FILESOURCE = '/home/bill/Desktop/test