[PY3]——找出一个序列中出现次数最多的元素/collections.Counter 类的用法

问题

怎样找出一个序列中出现次数最多的元素呢?

解决方案

collections.Counter 类就是专门为这类问题而设计的, 它甚至有一个有用的 most_common() 方法直接给了你答案

collections.Counter 类

1. most_common(n)统计top_n

from collections import Counter
words = [
    ‘look‘, ‘into‘, ‘my‘, ‘eyes‘, ‘look‘, ‘into‘, ‘my‘, ‘eyes‘,
    ‘the‘, ‘eyes‘, ‘the‘, ‘eyes‘, ‘the‘, ‘eyes‘, ‘not‘, ‘around‘, ‘the‘,
    ‘eyes‘, "don‘t", ‘look‘, ‘around‘, ‘the‘, ‘eyes‘, ‘look‘, ‘into‘,
    ‘my‘, ‘eyes‘, "you‘re", ‘under‘
]
#创建Counter对象
word_counts=Counter(words)

#most_common(n)函数可直接统计top-n
top_three=word_counts.most_common(3)

print(type(top_three))
<class ‘list‘>

print(top_three)
[(‘eyes‘, 8), (‘the‘, 5), (‘look‘, 4)]

2. 统计任意元素出现的次数

Counter 对象可以接受任意的由可哈希(hashable)元素构成的序列对象

在底层实现上,一个 Counter 对象就是一个字典,将元素映射到它出现的次数上

print(word_counts[‘look‘])
4
print(word_counts["you‘re"])
1

3. 两个Counter对象之间可以互相使用数学运算符,从而叠加/叠减统计

word1 = [
    ‘look‘, ‘into‘, ‘my‘, ‘eyes‘, ‘look‘, ‘into‘, ‘my‘, ‘eyes‘,
    ‘the‘, ‘eyes‘, ‘the‘, ‘eyes‘, ‘the‘, ‘eyes‘, ‘not‘, ‘around‘, ‘the‘,
    ‘eyes‘, "don‘t", ‘look‘, ‘around‘, ‘the‘, ‘eyes‘, ‘look‘, ‘into‘,
    ‘my‘, ‘eyes‘, "you‘re", ‘under‘
]
word2 = [‘why‘,‘are‘,‘you‘,‘not‘,‘looking‘,‘in‘,‘my‘,‘eyes‘]

a=Counter(word1)
b=Counter(word2)
print(a)
Counter({‘eyes‘: 8, ‘the‘: 5, ‘look‘: 4, ‘into‘: 3, ‘my‘: 3, ‘around‘: 2, ‘not‘: 1, ‘under‘: 1, "you‘re": 1, "don‘t": 1})

print(b)
Counter({‘eyes‘: 1, ‘not‘: 1, ‘are‘: 1, ‘you‘: 1, ‘in‘: 1, ‘why‘: 1, ‘my‘: 1, ‘looking‘: 1})

print(a+b)
Counter({‘eyes‘: 9, ‘the‘: 5, ‘my‘: 4, ‘look‘: 4, ‘into‘: 3, ‘around‘: 2, ‘not‘: 2, ‘under‘: 1, ‘looking‘: 1, ‘you‘: 1, ‘why‘: 1, ‘in‘: 1, ‘are‘: 1, "you‘re": 1, "don‘t": 1})

print(a-b)
Counter({‘eyes‘: 7, ‘the‘: 5, ‘look‘: 4, ‘into‘: 3, ‘around‘: 2, ‘my‘: 2, ‘under‘: 1, "you‘re": 1, "don‘t": 1})
时间: 2024-10-21 04:45:38

[PY3]——找出一个序列中出现次数最多的元素/collections.Counter 类的用法的相关文章

1152: 零起点学算法59——找出一个数组中出现次数最多的那个元素

1152: 零起点学算法59--找出一个数组中出现次数最多的那个元素 Time Limit: 1 Sec  Memory Limit: 64 MB   64bit IO Format: %lldSubmitted: 990  Accepted: 532[Submit][Status][Web Board] Description 找出一个数组中出现次数最多的那个元素 Input 第一行输入一个整数n(不大于20) 第二行输入n个整数 多组数据 Output 找出n个整数中出现次数最多的那个整数(

找出一个数组中出现次数最多的那个元素

#include <stdio.h> int main() { int n,a[20],i,j,flag=0,max; int b[20]={0}; while(scanf("%d",&n)==1){ if(n==0) break; for(i=0;i<n;i++) scanf("%d",&a[i]); for(i=0;i<n-1;i++) for(j=i+1;j<n;j++) if(a[i]==a[j]) b[i]++

【python cookbook】【数据结构与算法】12.找出序列中出现次数最多的元素

问题:找出一个元素序列中出现次数最多的元素是什么 解决方案:collections模块中的Counter类正是为此类问题所设计的.它的一个非常方便的most_common()方法直接告诉你答案. # Determine the most common words in a list words = [ 'look', 'into', 'my', 'eyes', 'look', 'into', 'my', 'eyes', 'the', 'eyes', 'the', 'eyes', 'the', '

算法试题 - 找出一个序列中出现频率最高的三个数

题目 找出一个序列中出现频率最高的三个数 解析 思路一 创建一个新字典, k 为 序列的值, 然后 v 的初始值 0, 然后循环序列进行计数, 然后进行新字典的处理..... 不行, 不好处理了. 此思路不行 思路二 利用 colletctions 的 Counter 模块, 内部有个方法可以解决 k 值问题 答案 答案一 可以往下继续实现, 但是有点麻烦了 li = [2, 5, 3, 4, 1, 8, 1, 2, 6, 6, 1, 5, 1, 5] d = dict.fromkeys(li,

找出该字符串中出现次数最多的那个字符

/*时间限制 C/C++ 3s 其他 6s, 空间限制 C/C++ 32768k 其他 65535k 题目描述     给定一个长度不限的字符串,请找出该字符串中出现次数最多的那个字符,并打印出该字符及其出现次数; 如果多个字符的出 现次数相同,只打印首个字符;输出字符的大小写格式要与输 入保持一致,大小写不敏感模式下, 输出字符的大小写格式与该 字符首次出现时的大小写格式一致.实现时无需考虑非法输. 输入描述     输入为 字符串大小写敏感标记 其中"大小写敏感标记"为可选参数,取

python之Counter类:计算序列中出现次数最多的元素

Counter类:计算序列中出现次数最多的元素 1 from collections import Counter 2 3 c = Counter('abcdefaddffccef') 4 print('完整的Counter对象:', c) 5 6 a_times = c['a'] 7 print('元素a出现的次数:', a_times) 8 9 c_most = c.most_common(3) 10 print('出现次数最多的三个元素:', c_most) 11 12 times_dic

返回(统计)一个列表中出现次数最多的元素

首先定义一个函数 函数内逐行依次解释为: #定义一个函数def max1(lt): dict1 = {} #建立一个空字典 s = set(lt) #列表去重 for i in s: #遍历集合(也可以遍历列表,上面一行改成s = list(set(lt))即可) ct = lt.count(i) #检测i元素在lt列表中的次数(count函数) dict1[i] = ct #将i元素作为字典键+i元素的次数值作为值存到字典中 '''下面这一行代码:用max(dict1,key=dict1.ge

笔试:找出一个字符串中字符出现最多的次数和该字符

我用的是js, 每次取出字符串的第一个字母,然后把和它相同的字符利用“”替换掉,然后来比较替换前和替换后的字符串长度相差多少, 那么差值就是就是里面该字符的个数,找出这个差值最大的就是和所对应的替换字符. var str ="djlxsdjlxs"; //命名一个变量放置给出的字符串 var maxLength = 0; //命名一个变量放置字母出现的最高次数并初始化为0 var result = ''; //命名一个变量放置结果输入 while( str != '' ){ //循环迭

在线性级别时间内找出无序序列中的第k个元素

在一个无序序列中找出第k个元素,对于k很小或者很大时可以采取特殊的方法,比如用堆排序来实现 .但是对于与序列长度N成正比的k来说,就不是一件容易的事了,可能最容易想到的就是先将无序序列排序再遍历即可找出第k个元素.由于任何基于比较的排序算法不可能用少于Θ(N lgN)次比较来实现将所有元素排序,所以采用排序的方法的时间复杂度是线性对数级别的. 我们可以借鉴快速排序中将序列划分的思想来实现平均情况下线性级别的算法,算法实现如下: 1 public class KthElement { 2 3 pr