python sorted() count() set(list)-去重

2、用python实现统计一篇英文文章内每个单词的出现频率，并返回出现频率最高的前10个单词及其出现次数，并解答以下问题？（标点符号可忽略）

（1）创建文件对象f后，解释f的readlines和xreadlines方法的区别？

（2）追加需求：引号内元素需要算作一个单词，如何实现？

cat /root/text.txt

hello world 2018 xiaowei,good luck
hello kitty 2017 wangleai,ha he
hello kitty ,hasd he
hello kitty ,hasaad hedsfds

#我的脚本

#!/usr/bin/python
#get [‘a‘,‘b‘,‘c‘]
import re
with open(‘/root/text.txt‘) as f:
　　openfile = f.read()

def get_list_dict():
　　word_list = re.split(‘[0-9\W]+‘,openfile)
　　list_no_repeat = set(word_list)
　　dict_word = {}
　　for each_word in list_no_repeat:
　　　　dict_word[each_word] = word_list.count(each_word)
　　del dict_word[‘‘]
　　return dict_word

#{‘a‘:2,‘c‘:5,‘b‘:1} => {‘c‘:5,‘a‘:2,‘b‘:1}
def sort_dict_get_ten(dict_word):
　　list_after_sorted = sorted(dict_word.items(),key=lambda x:x[1],reverse=True)
　　print list_after_sorted
　　for i in range(3):
　　print list_after_sorted[i][0],list_after_sorted[i][1]

def main():

dict_word = get_list_dict()
sort_dict_get_ten(dict_word)

if __name__ == ‘__main__‘:

main()

[(‘hello‘, 4), (‘kitty‘, 3), (‘he‘, 2), (‘good‘, 1), (‘hasd‘, 1), (‘wangleai‘, 1), (‘hasaad‘, 1), (‘xiaowei‘, 1), (‘hedsfds‘, 1), (‘luck‘, 1), (‘world‘, 1), (‘ha‘, 1)]
hello 4
kitty 3
he 2

原文地址：https://www.cnblogs.com/hixiaowei/p/9122280.html

时间： 2024-11-05 11:43:36

python sorted() count() set(list)-去重的相关文章

python sorted排序

python sorted排序 Python不仅提供了list.sort()方法来实现列表的排序,而且提供了内建sorted()函数来实现对复杂列表的排序以及按照字典的key和value进行排序. sorted函数原型 sorted(data, cmp=None, key=None, reverse=False) #data为数据 #cmp和key均为比较函数 #reverse为排序方向,True为倒序,False为正序基本用法对于列表,直接进行排序 >>> sorted([5, 2

Python练习题4（列表去重）：[5,3,4,'ok',4,3,'abc',8,52,'ok']去除列表中重复内容方法一：使用set 方法二：不使用set，自己写方法

方法一:利用集合去重 1 list1 = [5,3,4,'ok',4,3,'abc',8,52,'ok'] 2 list1=list(set(list1)) 3 print(list1) 方法二:此方法略微冗余,先判断元素是否重复,再将重复元素提取并保存到新列表中,再for 新建的列表元素,删除原列表 1 def list_dup(ls): 2 list2 = [] 3 length = len(ls) #获取列表元素个数 4 for i in range(0,length-1): 5 for

python sorted

http://www.cnblogs.com/65702708/archive/2010/09/14/1826362.html python sorted 我们需要对List进行排序,Python提供了两个方法对给定的List L进行排序,方法1.用List的成员函数sort进行排序方法2.用built-in函数sorted进行排序(从2.4开始) --------------------------------sorted------------------------------------

Python List count()方法

Python List count()方法描述 count() 方法用于统计某个元素在列表中出现的次数. 语法 count()方法语法: list.count(obj) 参数 obj -- 列表中统计的对象. 返回值返回元素在列表中出现的次数. 实例以下实例展示了 count()函数的使用方法: #!/usr/bin/python aList = [123, 'xyz', 'zara', 'abc', 123]; print "Count for 123 : ", aList.c

Python sorted list的实现

Python sorted list的实现具体思路是用二分保list有序+插入 class SortedList(list): K = -1 def __init__(self, K=-1): list.__init__(self) if K != -1: self.K = K def append(self, x): bisect.insort(self, x) if self.K != -1: if len(self)==self.K+1: self.pop(0) 这里还有一个限size的

Python sorted 函数

Python sorted 函数 sorted 可以对所有可迭代的对象进行排序操作,sorted 方法返回的是一个新的 list,而不是在原来的基础上进行的操作.从新排序列表. sorted 语法: sorted(iterable[, cmp[, key[, reverse]]]) 参数说明: # 可迭代对象. iterable # 比较的函数,这个具有两个参数,参数的值都是从可迭代对象中取出,此函数必须遵守的规则为,大于则返回1,小于则返回-1,等于则返回0. cmp # 主要是用来进行比较的

Python List count()方法-用于统计某个元素在列表中出现的次数

描述 count() 方法用于统计某个元素在列表中出现的次数. 语法 count()方法语法: list.count(obj) 参数 obj -- 列表中统计的对象. 返回值返回元素在列表中出现的次数. 实例以下实例展示了 count()函数的使用方法: #!/usr/bin/python aList = [123, 'xyz', 'zara', 'abc', 123]; print "Count for 123 : ", aList.count(123); print "

(LeetCode)Remove Duplicates from Sorted Array --- 有序列表去重

Given a sorted array, remove the duplicates in place such that each element appear only once and return the new length. Do not allocate extra space for another array, you must do this in place with constant memory. For example, Given input array nums

[leetcode]83. Remove Duplicates from Sorted List有序链表去重

Given a sorted linked list, delete all duplicates such that each element appear only once. Example 1: Input: 1->1->2 Output: 1->2 Example 2: Input: 1->1->2->3->3 Output: 1->2->3 题意: 有序链表去重思路: 代码: 1 class Solution { 2 public Lis

猜你喜欢

2017全民直播时代的终结还是来了？

互联网时代,总是能够催生出各种名目繁多的浪潮或者"新时代".只有在一股脑的蜂拥而上劲头过后,才能看到其本质.此前的全民做电商时代,最终是个人小店被淘汰出局,只剩下资本雄厚的品牌大鳄 ...

关系型数据库之mysql-proxy实现读写分离

简要: mysql-proxy作为mysql测试项目,可以实现读写分离架构,具有开发能力的公司通过二次开发的方式去完善bug应用在生产环境中,下面我们通过案例使用mysql-proxy实现读写分离. ...

说实在的,因为之前听过以前的一些学长们的讲述,在今年上软件工程课之前,一直把这门课当成了计算机的政治课,为什么呢,说白了就是感觉都是概念,实际上的操作没有,考试背背就可以了,都没什么计算,今年学了一个 ...

mysql exists 和 in的效率比较

这条语句适用于a表比b表大的情况 select * from ecs_goods a where cat_id in(select cat_id from ecs_category); 这条语句适用于 ...

shell内部命令和外部命令

区别: 内部命令:内部命令被构建在shell之中.当执行shell命令时,内部命令的执行速度非常快.这是因为没有其他的进程因为执行这条命令而被创建.比如说,当我们执行"cd"命令时 ...

Go - 类型与变量

类型 Go 语言中的类型与其他语言类似,比较特殊的有以下几个: bool 类型 - 它的值只能是 true 与 false. int / uint - 它们的长度会根据操作系统的不同(32/64 bi ...

页面优化

影响用户访问的最大部分是前端的页面.网站的划分一般为二:前端和后台.我们可以理解成后台是用来实现网站的功能的,比如:实现用户注册,用户能够为文章发表评论等等. 前端的页面主要包括xhtml,css,j ...

第一次做项目的感想

本周,我开始了自己的第一个项目,做一个电影的网页端和app端的页面.做的过程也是遇到了很多问题,例如一些之前自以为熟知的标签,在项目使用的时候竟发现显示的效果和自己想的完全不一样,所以还是印证了一句古 ...

JQuery实现无刷新下拉加载图片

最近做的一个项目需要做页面无刷新下拉加载图片,调研了一番,大多都采用检测滚动条达到底部,然后利用ajax加载下一页数据对页面数据进行添加,根据这一逻辑,自己写了一个,具体代码如下: JQu ...

maven父子工程

一.创建父工程创建"Maven Project",选择创建"simple project". 填写"Id"和版本号,打包类型一定选择&qu ...

三次交换机如何配置生成树协议----STP

实验 STP 实验目标在两台三次交换机上配置STP,设置switch1为vlan1的根网桥,switch2为vlan1的次根网桥,switch1为vlan2的次根网桥,switch2为vlan2的根网 ...

UVA 1575 Factors

https://vjudge.net/problem/UVA-1575 题意: 令f(k)=n 表示有n种方式,可以把正整数k表示成几个数的乘积的形式. 例 10=2*5=5*2,所以f(10)=2 ...

.Net 乱序方法

前两天开发一个奇葩的功能,突然间想到了用打乱顺序的方式解决.记录代码如下: /// <summary> /// 把收集回来的列表打乱顺序之后返回 /// </summary> ...

释放Android的函数式能量（I）：Kotlin语言的Lambda表达式

原文标题:Unleash functional power on Android (I): Kotlin lambdas 原文链接:http://antonioleiva.com/operator-o ...

如何使用Linux的Crontab定时执行PHP脚本的方法

我们的PHP程序有时候需要定时执行,我们可以使用ignore_user_abort函数或是在页面放置js让用户帮我们实现.但这两种方法都不太可靠,不稳定.我们可以借助Linux的Crontab工具来稳 ...

数据清洗小记：全角数字转换半角数字

原创作品,出自 "深蓝的blog" 博客,欢迎转载,转载时请务必注明出处,否则有权追究版权法律责任. 深蓝的blog:http://blog.csdn.net/huangyanlo ...

12、C#基础整理（结构体）

结构体 1.概念: 结构体是写在main函数外的数据结构,由不同类型的数据组合成一个整体,这些组合在一个整体中的数据是互相联系的 2.声明方式: struct 结构体名 { 成员变量(由类型名+成员名 ...

android 下滤镜效果的实现

滤镜过滤颜色已实现,简单版本可通过下面代码的3个参数实现黑白.红.绿...等7种过滤(RGB的7种组合). 理论上讲可以过滤为任意颜色.调整混合结果的比值就行了. public void drawBi ...

面向对象3大特性之一：继承

继承继承表示一个类型(子类)派生自(继承于)一个基类型(父类),该类型将拥有基类型的所有成员字段和函数(不包括构造函数和析构函数). 注意: 派生类继承基类的所有成员,不管是public.priva ...

android canvas rotate 旋转的一些总结（旋转的一些注意点）

在自定义控件和利用surfaceview时候利用serfaceHolder锁定画布画图做游戏的时候,在绘制tank的图片的时候需要根据tank的方向来绘制,因此就用到canvas的rotate(flo ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.025 s.