统计一篇英文文章内每个单词出现频率,并返回出现频率最高的前10个单词及其出现次数

统计一篇英文文章内每个单词出现频率,并返回出现频率最高的前10个单词及其出现次数
from collections import Counter
import re

with open(‘a.txt‘, ‘r‘, encoding=‘utf-8‘) as f:
    txt = f.read()
c = Counter(re.split(‘\W+‘,txt))  #取出每个单词出现的个数
print(c)
ret = c.most_common(10)   #取出频率最高的前10个
print(ret)

原文地址:https://www.cnblogs.com/jiangshanduojiao/p/9381306.html

时间: 2024-10-05 22:33:04

统计一篇英文文章内每个单词出现频率,并返回出现频率最高的前10个单词及其出现次数的相关文章

js查找一篇英文文章中出现频率最高的单词

下面这个函数是js查找一篇英文文章中出现频率最高的单词(由26个英文字母大小写构成),输出该单词及出现次数,不区分大小写,主要是正则的运用: function counts(article){ article = article.trim().toUpperCase(); var array = article.match(/[A-z]+/g); article = " "+array.join(" ")+" "; var max = 0,wor

老男孩教育每日一题-2017年4月5日-统计你的linux系统的history历史记录,得出你最喜欢使用的前10个命令

统计你的linux系统的history历史记录,得出你最喜欢使用的前10个命令 方法一:awk数组方法 [[email protected] ~]# history |awk '{h[$2]++}END{for(key in h)printkey,h[key]}' |sort -rnk2|head awk 279 ll 78 cat 66 cd 41 ls 34 find 32 echo 32 man 30 sed 27 vim 26 #优雅的显示可以加上 |column -t  即可  [[e

英文文章

对任意一篇英文文章,统计其中每个单词分别出现了多少次,并可替换指定的单词.[功能要求](1)英文文章以文件形式输入.(2)统计结果保存为文件.(3)对单词进行替换时,允许用户选择全部替换,或逐个替换.替换完成后,将文章存盘. 1 #include<stdlib.h> 2 #include<stdio.h> 3 #include<vector> 4 #include<fstream> 5 #include<string> 6 using names

PHP:计算文件或数组中单词出现频率

一:如果是小文件,可以一次性读入到数组中,使用方便的数组计数函数进行词频统计(假设文件中内容都是空格隔开的单词): <?php $str = file_get_contents("/path/to/file.txt"); //get string from file preg_match_all("/\b(\w+[-]\w+)|(\w+)\b/",$str,$r); //place words into array $r - this includes hyp

统计英文文章单词数相关内容

问题描述: 统计英文文单词数,具体要求:对于给定的一片英文文章,统计单词的个数.关键词的个数.空格的个数 标点符号的个数,同时还能将原来的关键词替换成新的词语 1 #include<iostream> 2 #include<vector> 3 #include<fstream> 4 #include<string> 5 using namespace std; 6 7 //关键词 8 #define keyword 11 9 string k[keyword

转载一篇好文章

作者:熊 辉美国罗格斯-新泽西州立大学 记得我刚开始写英文论文的时候,感觉很棘手,效率也低,常常一个摘要就要写上两三天.现在我当了 8 年教授,写了一百多篇论文,逐渐可以快写这种“八股文”了.由于我现在身份转换了,也因为身为老师,要经常修改学生的英文论文,为了不让自己在修改论文时太痛苦,就常常思考该如何训练学生写好英文论文. 其实,发表出来的文章基本可分为两种:一种是属于看上去很美,但不能细看,细看就会发现一些问题:另一种是看上去很美,也真的很美,而且很耐读.如何写成第二种呢?学生写英文论文经常

前段时间一直不知道怎么学习,在网上找到一篇好文章分享给在路上的产品经理

如果你也是一枚刚入门的交互设计师,是不是常有这样一种感觉:不知从何下手,闷头读了一大堆书.学了一大堆软件.画了一大堆图之后还是感觉心里不踏实,总害怕自己还缺点什么,恨不得要有本<交互设计学习大纲>就好了.出现这个问题有两个原因,一是交互设计师没有可视性强的产物,交互设计师的产物一般是线框图.流程图.信息架构图.说明文档等等,但这些东西既不如视觉设计稿华丽精美,也不如程序代码高贵冷艳,在外行人看来初级交互设计师和高级交互设计师画的好像都差不多,轻易看不出你修炼到了几层功力;第二个原因是交互设计是

Windows系统CPU内存网络性能统计第一篇 内存

最近翻出以前做过的Windows系统性能统计程序,这个程序可以统计系统中的CPU使用情况,内存使用情况以及网络流量.现在将其整理一下(共有三篇),希望对大家有所帮助. 目录如下: 1.<Windows系统CPU内存网络性能统计第一篇 内存> 2.<Windows系统CPU内存网络性能统计第二篇 CPU> 3.<Windows系统CPU内存网络性能统计第三篇网络流量> 本篇将介绍统计系统内存使用情况,包括内存使用率.总物理内存大小.可用物理内存大小.总虚拟内存大小,可用虚

WORD文档怎样在线从整篇英文翻译成中文的

WORD文档怎样在线从整篇英文翻译成中文的,虽然有的时候机翻不是很准确,但是在追求快速翻译来达到快速阅读的时候,可以尝试用"迅捷PDF在线转换器"进行在线翻译的操作.第一步:将需要翻译的word文件准备至桌面上,并进入浏览器内,在百度首页搜索关键词"迅捷pdf在线转换器".第二步:进入在线转换器的首页后,可以看到页面上很多关于PDF转换以及文档处理等功能选项(有需要的可以了解一下) 选择文档处理,然后再弹出的下拉框内选择"word在线翻译".第三