Python 批量生成中文姓名(百家姓)

  最近需要造一部分数据,需要用到人名,与其用脚本生成一些随机组合的汉字,不如在网上爬一些看似真实的姓名,所以找来了姓氏大全的网站,网址:http://www.resgain.net/xsdq.html

上图可以看到有很多不同的姓氏,每个姓氏(又是一个网页)里边有很多名字,这样轻轻松松就可以搞定一些真实的数据了,

此时只需要获取名字即可。

  用到的库有urllib2 bs4,首先就是用urllib2获取请求,然后用beautifulsoup将请求内容生成可分析对象,然后查找标签即可,很简单,上代码好了。

# -*- coding: utf-8 -*-

import urllib2import sysfrom bs4 import BeautifulSoupreload(sys)sys.setdefaultencoding("utf-8")

def get_name(url):    name_list = []    request = urllib2.Request(url)  # 创建对名字大全网站get请求    result = urllib2.urlopen(request)  # 发出请求    soup = BeautifulSoup(result.read(), ‘html.parser‘)  # 生成可分析对象    if soup.find_all("a",class_="btn btn2"):        for name in soup.find_all("a",class_="btn btn2")[:15]:  # 遍历所有的姓氏链接,此处只获取前15个姓氏            url = ‘http:‘ + name.attrs[‘href‘]  #找到姓氏链接,再次返回此函数            get_name(url)    elif soup.find_all(‘a‘,class_=‘btn btn-link‘):        for name in soup.find_all(‘a‘,class_=‘btn btn-link‘)[:10]:  #找到不同姓氏的名字,此处只获取每个姓氏的前10个            name_list.append(name.text)            # print name.text

return name_list

if __name__ == ‘__main__‘:    url = "http://www.resgain.net/xsdq.html"    get_name(url)

原文地址:https://www.cnblogs.com/bettywang/p/9201679.html

时间: 2024-10-12 15:36:05

Python 批量生成中文姓名(百家姓)的相关文章

Java 随机生成中文姓名,手机号,邮编,住址

package lovo; import java.util.HashMap; import java.util.Map; /** * 随机生成中文姓名,性别,Email,手机号,住址 * @author Quentin */ public class SuperRandom { public static String base = "abcdefghijklmnopqrstuvwxyz0123456789"; private static String firstName=&quo

1 批量生成虚拟姓名

1 import random 2 3 firstname = '赵钱孙李周吴郑王冯陈褚卫蒋沈韩杨朱秦尤许' 4 second = '中万斯近元伟丽利国士文连百宏可立成海友南广云基' 5 third = '隆智渝顺乐天杰夫煜兵思霆炜祺亮剀炫翔维瑞韬嘉林庆玮勤栋源路焕霖彩明邦闻朵皓瀚荣奕涓艺' 6 7 namelist = [] 8 many = input('请输入需要生成姓名的数量:\n')') 9 for i in range(int(many)): 10 data = [2,3] 11 n

Python PIL模块随机生成中文验证码

PIL是Python Imaging Library的简称,PIL是一个Python处理图片的库,提供了一系列模块和方法,比如:裁切,平移,旋转,改变尺寸等等.已经是Python平台事实上的图像处理标准库了.PIL功能非常强大,但API却非常简单易用. PIL有如下几个模块:Image模块.ImageChops模块.ImageCrackCode模块.ImageDraw模块.ImageEnhance模块.ImageFile模块.ImageFileIO模块.ImageFilter模块.ImageFo

PIL模块与随机生成中文验证码

今天我们要学习的内容是如何利用Python生成一个随机的中文验证码,并将图片保存为.jpeg格式. 在这之前,你首先得了解Python中的PIL库.PIL是Python Imaging Library的简称,PIL是一个Python处理 图片的库,提供了一系列模块和方法,比如:裁切,平移,旋转,改变尺寸等等.在PIL库中,任何一个图像都是用 Image对象来表示的,所以要加载一张图片,最简单的形式如下: from PIL import Image image = Image.open("1.jp

用python随机生成数据,再插入到postgresql中

用python随机生成学生姓名,三科成绩和班级数据,再插入到postgresql中. 模块用psycopg2 random import random import psycopg2 fname=['金','赵','李','陈','许','龙','王','高','张','侯','艾','钱','孙','周','郑'] mname=['玉','明','玲','淑','偑','艳','大','小','风','雨','雪','天','水','奇','鲸','米','晓','泽','恩','葛','玄'

python脚本批量生成数据

在平时的工作中,经常会遇到造数据,特别是性能测试的时候更是需要大量的数据.如果一条条的插入数据库或者一条条的创建数据,效率未免有点低.如何快速的造大量的测试数据呢?在不熟悉存储过程的情况下,今天给大家介绍一种方法,很简单的也很实用.思路是用python代码写一段小程序,生成一定数量的SQL语句,再把这些SQL语句拷贝黏贴到数据库工具执行SQL即可. 假如有个联系人的学生表student,其表结构为姓名name.学校school.电话telphone.邮箱email. 以Mysq为例子,sql语句

做U3d编辑器xlsx批量生成csv和python批量转

做U3d编辑器xlsx批量生成csvxlsx编辑就是用强大的office Excel 2013 ,  也就是说 不管是程序还是美术只需要维护这个Excel就够了,然后一键批量转化为csv文件即可! 打包不会打包Excel,游戏中也不用这个!然后来到Unity3d的编辑器菜单.在Unity的Editor文件夹下面需要这四个文件: 参考了:http://www.codeproject.com/Articles/246772/Convert-xlsx-xls-to-csv 的window窗口程序. 游

jinja2批量生成python脚本

? 在使用airflow的过程中需要大量的dag脚本进行性能测试,如果一个个去编写dag脚本未免太过麻烦,于是想到用python的jinja2模板引擎实现批量脚本生成. 先通过pip命令安装jinja2模块: $ pip install jinja2 然后创建模板文件(模板可以是任何形式的文本格式,没有特定扩展名,甚至可以不要扩展名): dag_template from datetime import timedelta, datetime import pytz from airflow.o

python+jinja2实现接口数据批量生成工具

在做接口测试的时候,我们经常会遇到一种情况就是要对接口的参数进行各种可能的校验,手动修改很麻烦,尤其是那些接口参数有几十个甚至更多的,有没有一种方法可以批量的对指定参数做生成处理呢. 答案是肯定的! python的jinja2模板库可以很好的满足我们的需求,通过维护一个原始数据模板,将我们想要动态生成的变量模板化,就可以实现需求. 现在我们有这样的一个请求数据 { "abc":"123", "p2p":"123", "