python编程:统计文件中单词出现次数

f=open("2.txt",‘r‘)ll=f.read()‘‘‘将空格都取代为逗号,方便后面的split()‘‘‘ll=ll.replace(" ",‘,‘) ‘‘‘防止由于文档编辑不规范出现双逗号的情况‘‘‘ll=ll.replace(",,",‘,‘)l=ll.split("\n")rows=[]dic={}for i in l:    row=i.split(",")    rows.append(row)for ii in rows:    for each in ii:        if each in dic:            dic[each]=dic[each]+1        else:            dic[each]=1

#输出所有的排序:print(sorted(dic.items(),key=lambda x:x[1],reverse=True))

‘‘‘只输出最大的值‘‘‘HighValue=0HighKey=Nonefor each in dic:    if dic[each]>HighValue:        HighValue=dic[each]        HighKey=eachprint(HighKey,HighValue)

原文地址:https://www.cnblogs.com/cuihengyue/p/8847310.html

时间: 2024-12-09 10:45:22

python编程:统计文件中单词出现次数的相关文章

简单的方法来统计文件中单词和各种标点符号个数

此小程序使用最基本的方法来统计文本中英文单词的个数,想法也比较简单: (1)从文本中文本读取内容,使用BufferedReader类每次读取一行并添加到StringBuffer类型变量中, 最后StringBuffer类型变量即为文本的内容,如StringBuffer sb: (2)把sb的内容全部转化成小写字母(或大写字母): (3)统计文件中各种标点符号个数: (4)把所有标点符号统一替换成一种标点符号,如替换成逗号 (5)替换后的文本使用字符串的分割函数来获取返回的字符串数组的长度,此长度

统计文件中单词的频率,给出前N的单词

package test10; import java.io.*; import java.util.*; import java.util.Map.Entry; public class Frequency { public static int n=0;// public static void main(String[] args) { Scanner sc=new Scanner(System.in); String s; int count=0; int num=1; //作为File

python之统计字符串中字母出现次数

dic=dict() d={} s=set() s='helloworld' (1)d=dict() for x in s: if x not in d.keys(): d[x]=1 else: d[x]=d[x]+1 print(d) (2)d2=dict() for x in s: d2[x]=d2.get(x,0)+1 print(d2) (3)d3=dict() for x in s: d3[x]=s.count(x) print(d3) 上面一共给出了三种方法,均是以字典的形式输出,但

Linux统计文件中单词出现的次数

grep -E "\b[[:alpha:]]+\b"  /etc/fstab  -o | sort | uniq -c -E 使用正则进行匹配 \b : backspace 退格 print 参数 表示每行匹配完了回车 [[:alpha:]] : 代表所有字符 sort 去重 uniq -c 排序 -c 行首加出现的次数 原文地址:https://www.cnblogs.com/S--S/p/10224417.html

统计文件中单词个数

import sys import string #import collections if len(sys.argv) == 1 or sys.argv[1] in {"-h", "--help"}: print("usage: uniqueword filename_1 filename_2 ... filename_n") sys.exit() else: words = {} # words = collections.defaultd

统计文件中制定词汇出现的次数

统计文件中"牛客"出现的次数: grep -o "查找单词" "查找的文件"| wc -l grep -o "查找单词" "查找的文件": -o 表示精确匹配,没有-o,只会显示要查找单词所出现的那一行 来自为知笔记(Wiz)

使用IndexOf统计文件中某一词语出现次数

1 #region 统计文件中某一词语出现次数. 2 3 while (true) { 4 Console.WriteLine("请输入要查询的词语:"); 5 string word = Console.ReadLine(); 6 string[] novelArr = File.ReadAllLines("xiyou.txt", Encoding.Default); 7 int count = 0;//计数变量 8 int index = 0;//每行的 初始索

第0004道练习题_Python统计文本里单词出现次数

Python练习题第 0004 题 https://github.com/Show-Me-the-Code/show-me-the-code 第 0004 题:任一个英文的纯文本文件,统计其中的单词出现次数. Talk is cheap, show you my code. #! /usr/bin/env python #! -*- coding: utf-8 -*- from collections import OrderedDict __author__ = 'Sophie' class

利用python 提取log 文件中的关键句子,并进行统计分析

利用python开发了一个提取sim.log 中的各个关键步骤中的时间并进行统计的程序: #!/usr/bin/python2.6 import re,datetime file_name='/home/alzhong/logs/qtat1/R2860.01.13/sim-applycommitrollback-bld1.log' file=open(file_name,'r') acnum=[];time_res=[];lnum=0 def trans_time(time): t1=datet