Python面试题 —— 计算列表中出现最多次的字符

给你一个其中包含不同的英文字母和标点符号的文本,你要找到其中出现最多的字母,返回的字母必须是小写形式, 当检查最想要的字母时,不区分大小写,所以在你的搜索中 "A" == "a"。 请确保你不计算标点符号,数字和空格,只计算字母。

如果你找到 两个或两个以上的具有相同的频率的字母, 返回那个先出现在字母表中的字母。 例如 -- “one”包含“o”,“n”,“e”每个字母一次,因此我们选择“e”。

输入: 用于分析的文本 (str, unicode).

输出: 最常见的字母的小写形式。

范例:

1 get_max_value("Hello World!") == "l"
2 get_max_value("How do you do?") == "o"
3 get_max_value("One") == "e"
4 get_max_value("Oops!") == "o"
5 get_max_value("AAaooo!!!!") == "a"
6 get_max_value("abe") == "a"

如何使用: 对于大多数的解密任务,你需要知道各种字母出现在一段文字的频率。例如:如果我们知道在哪个字母出现的频率,我们可以很容易地破解一个简单的加法密码或替换密码。这是语言专家有趣的事情!

前提:密码只包含ASCII码符号 0 < len(text) ≤ 105

普通方法:

利用collections工具中的Counter,对列表中元素出现频率进行排序。Counter返回值是一个按元素出现频率降序排列的Counter对象,它是字典的子类,因此可以使用字典的方法。

 1 import re
 2 from collections import Counter
 3
 4 def get_max_value(text):
 5     text = text.lower()
 6     result = re.findall(‘[a-zA-Z]‘, text)  # 去掉列表中的符号符
 7     count = Counter(result)  # Counter({‘l‘: 3, ‘o‘: 2, ‘d‘: 1, ‘h‘: 1, ‘r‘: 1, ‘e‘: 1, ‘w‘: 1})
 8     count_list = list(count.values())
 9     max_value = max(count_list)
10     max_list = []
11     for k, v in count.items():
12         if v == max_value:
13             max_list.append(k)
14     max_list = sorted(max_list)
15     return max_list[0]

精简方法:

同样是使用Counter,但是通过列表推导式,可以使函数更加精炼。这就是列表推导式的好处。

1 from collections import Counter
2 ?
3 def get_max_value(text):
4     count = Counter([x for x in text.lower() if x.isalpha()])
5     m = max(count.values())
6     return sorted([x for (x, y) in count.items() if y == m])[0]

最佳方法:

不得不称赞这种方法,实在是干脆利落。它巧妙的使用了max()函数。

1 import string
2
3 def get_max_value(text):
4     text = text.lower()
5     return max(string.ascii_lowercase, key=text.count)

利用了max()函数的key参数,巧妙的将出现次数最多的字符提取出来。

1 max(arg1, arg2, *args, *[, key=func]) -> value

我来为大家解释一下max(string.ascii_lowercase, key=text.count)这句代码的原理。

string.ascii_lowercase 等价于 ‘abcdefghijklmnopqrstuvwxyz‘ 而max()函数key参数的作用是:筛选符合key函数的返回值的最大值,如果有多个符合条件的值,则选取第一个。

max(range(6), key = lambda x : x>2)
>>> 3
# 带入key函数中,各个元素返回布尔值,相当于[False, False, False, True, True, True]
# key函数要求返回值为True,有多个符合的值,则挑选第一个。

max([3,5,2,1,4,3,0], key = lambda x : x)
>>> 5
# 带入key函数中,各个元素返回自身的值,最大的值为5,返回5.

max(‘ah‘, ‘bf‘, key=lambda x: x[1])
>>> ‘ah‘
# 带入key函数,各个字符串返回最后一个字符,其中‘ah‘的h要大于‘bf‘中的f,因此返回‘ah‘

max(‘ah‘, ‘bf‘, key=lambda x: x[0])
>>> ‘bf‘
# 带入key函数,各个字符串返回第一个字符,其中‘bf‘的b要大于‘ah‘中的a,因此返回‘bf‘

max(‘abcdefghijklmnopqrstuvwxyz‘, key=text.count) # text = ‘Hello World‘
>>> ‘l‘
# 带入key函数,返回各个字符在‘Hello World‘中出现的次数,出现次数最多的字符为‘l‘,因此输出‘l‘

这样大家就理解为什么通过max()函数的key参数就可以求得出现次数最多,且符合字母表排序的字符了吧!让我们再一次为写出该函数作者的脑洞点赞!

时间: 2024-10-14 13:22:25

Python面试题 —— 计算列表中出现最多次的字符的相关文章

python之使用heapq()函数计算列表中数值大小

# heapq函数:计算列表最大几个值和最小几个值 # 语法:heapq.nlargest(n, list,[key]) # n表示最大或最小的几个: list为分析的对象: key为排序关键字,非必填 import heapq list_num = [1, 4, 3, 2, 5] print("最大的一个:", max(list_num)) # 求列表最大的两个 list_temp = heapq.nlargest(2, list_num) print("最大的两个:&qu

Python面试题 —— 获取列表中位数

中位数是一个可将数值集合划分为相等的上下两部分的一个数值.如果列表数据的个数是奇数,则列表中间那个数据就是列表数据的中位数:如果列表数据的个数是偶数,则列表中间那2个数据的算术平均值就是列表数据的中位数.在这个任务里,你将得到一个含有自然数的非空数组(X).你必须把它分成上下两部分,找到中位数. 输入: 一个作为数组的整数(int)列表(list)的. 输出: 数组的中位数(int, float). 范例: get_median([1, 2, 3, 4, 5]) == 3 get_median(

Python面试题整理-更新中

几个链接: 编程零基础应当如何开始学习 Python ? - 路人甲的回答 网易云课堂上有哪些值得推荐的 Python 教程? - 路人甲的回答 怎么用最短时间高效而踏实地学习 Python? - 路人甲的回答 如何学习Python爬虫[入门篇] - 学习编程 - 知乎专栏 Python常用库整理 - 学习编程 - 知乎专栏 学好Python的11个优秀资源 - 学习编程 - 知乎专栏 在开头依然推荐一个Python面试题整理比较好的网站:GitHub : 关于Python的面试题.同样推荐几道

Python算法题----在列表中找到和为s的两个数字

列表data的值为[1, 3, 4, 5, 8, 9, 11],找出这个列表中和为13的两个数字的所有组合.这个好找,上过幼儿园大班的,估计都能找出来.4+9=13, 5+8=13.如何用python写一个函数来实现呢. 解法一: 超级大循环 最容易想到的就是遍历啊.嵌套循环,外层循环遍历全部列表,内层循环遍历当前元素位置之后的所有元素.内层循环中将两个数字相加,等于13就break.妥妥找到. def equalSum01(data=None, twosum=13):     result =

python文本联系--计算字符串中各个字符的数量

1 #!/usr/bin/python3 2 #-*- coding:utf-8 -*- 3 #计算字符串中,各个字符串的含量 4 str='adfadfafdfaafasdfasdcadf' 5 from collections import Counter 6 str1=Counter(str) 7 keys=sorted(str1) #可以返回str中的唯一值,且按照字母排序 8 #keys ['a', 'c', 'd', 'f', 's'] 9 values=str1.values()

python 判断两个列表中相同和不同的元素

背景: 在做接口自动化时,通常会判断接口返回中的数据信息,与数据库中返回的数据信息是否一致,比如:将接口返回信息的用户姓名存放到一个列表中,将数据库返回的用户姓名存放到另一个列表中,这时需要判断两个列表是否一致,如果不一致,将不同的元素信息分别回写到excel文件中,可以一目了然的看出哪些信息返回的不正确. 下列代码中直接存放列表信息,比较如下: 1 #接口返回值 2 list1 = ['张三', '李四', '王五', '老二'] 3 #数据库返回值 4 list2 = ['张三', '李四'

python基础之取列表中最大值的索引值

''' 取列表中最大值的索引值 www.pythontutor.com ''' list_group = [5,90,59,132,54] max_index = 0 list_index = 0 for num in list_group: if num > list_group[max_index]: max_index = list_index list_index += 1 print(max_index) 原文地址:https://blog.51cto.com/9237101/2440

python计算列表中素数的个数

1 #!/usr/bin/env python 2 # Gets the number of primes in the list 3 4 list1 = [2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 29] 5 # Get prime function . 6 def get_num(n): 7 count = False 8 for x in range(2,n-1): 9 if n % x == 0: 10 count = True 11 break 12 if not

python实现获取文件列表中每个文件出现频率最高的词汇

功能描述: 获取某个路径下的所有文件,提取出每个文件中出现频率最高的前300个字.保存在数据库当中. 前提,你需要配置好nltk #!/usr/bin/python #coding=utf-8 ''' function : This script will create a database named mydb then abstract keywords of files of privacy police. author : Chicho date : 2014/7/28 running