淘宝爬取个人资料、微博绑定、收货地址、支付宝绑定设置、安全设置等信息

登录采用浏览器登录,或者直接记住cookie两种方式。usecookie=1使用cookie,broser支持三种浏览器。

#coding=utf-8
import time,random,requests,json,re

from selenium import webdriver
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities

from lxml import etree
from area import dict_area

class Taobao(object):

    def __init__(self,name,password,browser,use_cookie):
        self.name=name
        self.password=password
        self.login_url=‘https://login.taobao.com/member/login.jhtml?redirectURL=https%3A%2F%2Fwww.taobao.com%2F‘
        self.order_url=‘https://buyertrade.taobao.com/trade/itemlist/asyncBought.htm?action=itemlist/BoughtQueryAction&event_submit_do_query=1&_input_charset=utf8‘
        self.num=0
        self.cost=0
        self.browser=browser
        self.use_cookiex=use_cookie

        if self.use_cookiex==0:
            dcap = dict(DesiredCapabilities.PHANTOMJS)
            dcap["phantomjs.page.settings.userAgent"] = (‘Mozilla/5.0(WindowsNT6.1;WOW64) AppleWebKit/537.36(KHTML, likeGecko) Chrome/59.0.3071.115Safari/537.36x-requested-with:XMLHttpRequest‘)#(random.choice(agents))
            dcap["phantomjs.page.settings.loadImages"] = True
            if self.browser==0:
                self.driver = webdriver.PhantomJS(executable_path=‘C:\\Python27\\phantomjs.exe‘,desired_capabilities=dcap)
            if self.browser==1:
                self.driver=webdriver.Chrome()
            if self.browser==2:
                self.driver=webdriver.Firefox()

            self.login()
            print self.cookies

    def login(self):

        self.driver.get(self.login_url)
        self.driver.find_element_by_id(‘J_Quick2Static‘).click()

        WebDriverWait(self.driver, 30, 0.5).until(EC.presence_of_element_located((By.ID, ‘TPL_username_1‘)))
        self.driver.find_element_by_id(‘TPL_username_1‘).send_keys(self.name)
        self.driver.save_screenshot(‘1.jpg‘)
        self.driver.find_element_by_id(‘TPL_password_1‘).send_keys(self.password)
        self.driver.save_screenshot(‘2.jpg‘)
        self.driver.find_element_by_id(‘J_SubmitStatic‘).click()
        time.sleep(5)
        self.driver.save_screenshot(‘3.jpg‘)
        self.cookies={}
        for dictx in self.driver.get_cookies():
            self.cookies[dictx[‘name‘]]=dictx[‘value‘]

        #driver.quit()

    def get_orders(self,p,flag):
        if flag==0:
            print ‘\n订单列表‘,‘#‘*100
            pass
            #print self.cookies
        datax={‘pageNum‘:p+1,
                ‘pageSize‘:15,
               ‘prePageNo‘:p,
               }
        header = {‘origin‘: ‘https://buyertrade.taobao.com‘,
                ‘referer‘:‘https://buyertrade.taobao.com/trade/itemlist/list_bought_items.htm‘,
                ‘user-agent‘:‘Mozilla/5.0(WindowsNT6.1;WOW64) AppleWebKit/537.36(KHTML, likeGecko) Chrome/59.0.3071.115Safari/537.36x-requested-with:XMLHttpRequest‘,
                  #‘cookie‘:‘miid=387872062667523128; thw=cn;xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx.....‘,
                  }
        resp=requests.post(self.order_url,data=datax,cookies=self.cookies,headers=header)
        #resp=requests.post(self.order_url,data=datax,headers=header)
        #print resp.content.decode(‘gbk‘)
        orders_dictx = json.loads(resp.content.decode(‘gbk‘))
        pages=orders_dictx[‘page‘][‘totalPage‘]
        for order in orders_dictx[‘mainOrders‘]:
            self.num+=1

            self.cost+=float(order[‘payInfo‘][‘actualFee‘])
            print self.num,‘ ‘,order[‘subOrders‘][0][‘itemInfo‘][‘title‘],‘    价格是: ‘,order[‘payInfo‘][‘actualFee‘],‘元 交易状态是:‘,order[‘statusInfo‘][‘text‘],self.cost

        if flag==0:
            for p in range(1,pages+1):
                self.get_orders(p,1)

    def get_userinfo(self):
        url=‘https://i.taobao.com/user/baseInfoSet.htm‘

        # self.driver.get(url)
        # time.sleep(3)
        # contentx2=self.driver.page_source
        contentx=requests.get(url,cookies=self.cookies).content.decode(‘gbk‘)
        selector=etree.HTML(contentx)
        self.userinfo_page_content=contentx
        print ‘\n个人资料‘,‘#‘*100
        print ‘用户名:‘,selector.xpath(‘//input[@id="J_uniqueName-mask"]/@value‘)[0]
        print ‘性别:‘,re.findall(u‘name="_fm.b._0.g" value="0"  checked="checked" />(.*?)</label>‘,contentx)[0]
        print ‘真实姓名:‘,selector.xpath(‘//input[@id="J_realname-mask"]/@value‘)[0]
        yearx=int(selector.xpath(‘//select[@id="J_Year"]//option[@selected="selected"]/text()‘)[0])
        print ‘生日:年‘,yearx
        monthx=int(selector.xpath(‘//select[@id="J_Month"]//option[@selected="selected"]/text()‘)[0])
        print ‘生日:月‘,monthx
        dayx=int(selector.xpath(‘//select[@id="J_Date"]//option[@selected="selected"]/text()‘)[0])
        print ‘生日:日‘,dayx

        divisionCode=selector.xpath(‘//input[@id="divisionCode"]/@value‘)[0]
        print ‘divisionCode:‘,divisionCode
        if divisionCode[0:2]!=‘00‘:
            print ‘省份:‘, dict_area[‘%s0000‘%divisionCode[0:2]][0]                             #re.findall(u‘<option value="%s0000">(.*?)</option>‘%divisionCode[0:2],contentx)[0]
        else:
            print ‘省份:‘,‘无省份‘
        if divisionCode[2:4]!=‘00‘:
            print ‘城市:‘, dict_area[‘%s00‘%divisionCode[0:4]][0]
        else:
            print ‘城市:‘,‘无城市‘
        if divisionCode[4:6]!=‘00‘:
            print ‘区县:‘, dict_area[‘%s‘%divisionCode][0]
        else:
            print ‘区县:‘,‘无区县‘

        def chinese_zodiac(year):
            return u‘猴鸡狗猪鼠牛虎兔龙蛇马羊‘[year%12]

        def zodiac(month, day):
            n = (u‘摩羯座‘,u‘水瓶座‘,u‘双鱼座‘,u‘白羊座‘,u‘金牛座‘,u‘双子座‘,
                 u‘巨蟹座‘,u‘狮子座‘,u‘处女座‘,u‘天秤座‘,u‘天蝎座‘,u‘射手座‘)
            d = ((1,20),(2,19),(3,21),(4,21),(5,21),(6,22),(7,23),(8,23),(9,23),(10,23),(11,23),(12,23))
            return n[len(filter(lambda y:y<=(month,day), d))%12]

        print ‘星座:‘,zodiac(monthx,dayx)

        liveDivisionCode=selector.xpath(‘//input[@id="liveDivisionCode"]/@value‘)[0]
        print ‘liveDivisionCode:‘,liveDivisionCode
        if liveDivisionCode[0:2]!=‘00‘:
            print ‘家乡省份:‘, dict_area[‘%s0000‘%liveDivisionCode[0:2]][0]                             #re.findall(u‘<option value="%s0000">(.*?)</option>‘%divisionCode[0:2],contentx)[0]
        else:
            print ‘家乡省份:‘,‘无省份‘
        if liveDivisionCode[2:4]!=‘00‘:
            print ‘家乡城市:‘, dict_area[‘%s00‘%liveDivisionCode[0:4]][0]
        else:
            print ‘家乡城市:‘,‘无城市‘
        if liveDivisionCode[4:6]!=‘00‘:
            print ‘家乡区县:‘, dict_area[‘%s‘%liveDivisionCode][0]
        else:
            print ‘家乡区县:‘,‘无区县‘

    def get_weibo(self):
        url=‘http://member1.taobao.com/member/fresh/weibo_bind_management.htm‘
        contentx=requests.get(url,cookies=self.cookies).content.decode(‘gbk‘)
        #print contentx
        print ‘\n微博信息‘,‘#‘*100
        print ‘微博账号:‘,re.findall(u‘<li><span class="label">帐号:</span>(.*?)</li>‘,contentx)[0]
        print ‘微博名称:‘,re.findall(u‘<li><span class="label">会员名:</span>([\s\S]*?)</li>‘,contentx)[0]

    def get_deliver_address(self):
        url=‘http://member1.taobao.com/member/fresh/deliver_address.htm‘
        contentx=requests.get(url,cookies=self.cookies).content.decode(‘gbk‘)
        print ‘\n收货地址列表‘,‘#‘*100
        selector=etree.HTML(contentx)
        all_addres=selector.xpath(‘//tr[contains(@class,"thead-tbl-address")]‘)
        for addres in all_addres:
            print ‘收货人:‘,addres.xpath(‘.//td[1]/text()‘)[0]
            print ‘所在地区:‘,addres.xpath(‘.//td[2]/text()‘)[0]
            print ‘详细地址:‘,addres.xpath(‘.//td[3]/text()‘)[0]
            print ‘邮编:‘,addres.xpath(‘.//td[4]/text()‘)[0]
            print ‘手机:‘,re.findall(‘(\d+)‘,addres.xpath(‘.//td[5]/text()‘)[0])[0]
            print ‘*************‘*3

    def get_zhifubao(self):
        url=‘http://member1.taobao.com/member/fresh/account_management.htm‘
        contentx=requests.get(url,cookies=self.cookies).content.decode(‘gbk‘)
        selector=etree.HTML(contentx)
        print ‘\n支付宝信息‘,‘#‘*100
        print ‘绑定的支付宝账号:‘,selector.xpath(‘//h3[@class="ui-tipbox-title"]/span/text()‘)[0]
        print ‘支付宝邮箱:‘,re.findall(u‘<th>邮箱</th>[\s\S]*?<td>\s*?(\S*?)\s*?</td>‘,contentx)[0]
        print ‘支付宝手机:‘,re.findall(u‘<th>绑定手机</th>[\s\S]*?<td>\s*?(\S*?)\s*?</td>‘,contentx)[0]
        print ‘支付宝账户类型:‘,re.findall(u‘<th>账户类型</th>[\s\S]*?<td>\s*?(\S*?)\s*?</td>‘,contentx)[0]
        print ‘支付宝实名认证:‘,re.sub(‘&nbsp;‘,‘  ‘,re.findall(u‘<th>实名认证</th>[\s\S]*?<td>\s*?(\S*?)\s*?</td>‘,contentx)[0])

    def get_renzheng(self):
        url=‘http://member1.taobao.com/member/fresh/certify_info.htm‘
        contentx=requests.get(url,cookies=self.cookies).content.decode(‘gbk‘)
        selector=etree.HTML(contentx)

        #print ‘\n身份认证‘,‘#‘*100
        self.renzhen_info={
        u‘认证渠道‘:re.findall(u‘<div class="explain-info"><span>认证渠道:</span> <div class="left">(.*?)</div></div>‘,contentx)[0],
        u‘认证通过时间‘:re.findall(u‘<div class="explain-info"><span>认证通过时间:</span> <div class="left">(.*?)</div></div>‘,contentx)[0],
        u‘认证姓名‘:re.findall(u‘<div class="explain-info">\s*?<span>姓名:</span>\s*?<div class="left">(.*?)</div>‘,contentx)[0],
        u‘认证身份证号‘:re.findall(u‘<div class="explain-info">\s*?<span>18位身份证号:</span>\s*?<div class="left">(.*?)</div>‘,contentx)[0],
         u‘认证身份证有效期‘:re.findall(u‘<div class="explain-info">\s*?<span>身份证有效期:</span>\s*?<div class="left">(.*?)</div>‘,contentx)[0],
        }

if __name__=="__main__":
    pass
    use_cookie=1
    tb=Taobao(‘[email protected]‘,‘123456‘,1,use_cookie)
    if use_cookie==1:
        tb.cookies={u‘_umdata‘: u‘xxxxxxxxxxxxxxxxB175EE499FED3B3DB41256484B8FBF58099DD458D29468A7AFECD43AD3E795C914C1B678C6F1F0D0C087770B1F894F15899‘, u‘_cc_‘: u‘xxxx3xSw%3D%3D‘, u‘skt‘: u‘751ffb46795bad03‘, u‘_tb_token_‘: u‘xxxxxx3ae5‘, u‘cookie17‘: u‘VvlwxxxxuReh‘, u‘uss‘: u‘VWooAnygozL9eeP1O0VHsDIgLwkjUFL3Pm%2BgaeJYZMGg9XDPDG4OXKk3BFM%3D‘, u‘cna‘: u‘Ol/4ESakOQYCAdoRzmJ1JWwE‘, u‘tg‘: u‘0‘, u‘tracknick‘: u‘ydxxx‘, u‘cookie1‘: u‘UtQxxxrIiRm6r2E%2FHolRxkGbXug%2FaJO2tWYm4Kxs7s%3D‘, u‘cookie2‘: u‘1baa9a096afba9112378bfd5d9bd08b8‘, u‘uc3‘: u‘sg2=BYTq6utDySfPSlYSUQkhG733K%2B4teufAzgD%2B%2BwEcUgA%3D&nk2=Ggxxxx&id2=VvlwnNFwuReh&vt3=F8dBzWOeW1bwMAMnSM4%3D&lg2=VT5L2FSpMGV7TQ%3D%3D‘, u‘uc1‘: u‘cookie16=URm48syIJ1yk0MX2J7mAAEhTuw%3D%3D&cookie21=U%2BGCWk%2F7pY%2FF&cookie15=VT5L2FSpMGV7TQ%3D%3D&existShop=false&pas=0&cookie14=UoTcDzxxxxQ%3D%3D&tag=8&lng=zh_CN‘, u‘lgc‘: u‘ydfxxxx‘, u‘_nk_‘: u‘ydfxxxx‘, u‘_l_g_‘: u‘Ug%3D%3D‘, u‘existShop‘: u‘MTUwMDYwNjc4OA%3D%3D‘, u‘_lastvisited‘: u‘Ol%2F4ESakOQYCAdoRzmJ1JWwE%2C%2COl4ESakOQYCAdoRzmJ1JWwEn0hVL8JYZ%2Cj5dajk9u%2Cj5dajk9u%2C1%2C8c84e1b0%2COl%2F4ESakOQYCAdoRzmJ1JWwE%2Cj5dajk9v‘, u‘thw‘: u‘cn‘, u‘isg‘: u‘AuvrvnMzNkMYEmqXPMgCBf9weg_fAfqtmvNARV1oxyqB_Ate5dCP0onWIAto‘, u‘mt‘: u‘ci=11_1‘, u‘unb‘: u‘57xxx4‘, u‘t‘: u‘099e66xxxxx256ef‘, u‘v‘: u‘0‘, u‘sg‘: u‘942‘, u‘_med‘: u‘dw:1920&dh:1080&pw:1920&ph:1080&ist:0‘}      ###这是slenium转换出来的,或者用header的cookie字符串用正则转字典,反正不是手写的。

    tb.get_orders(0,0)
    tb.get_userinfo()
    #print tb.userinfo_page_content
    tb.get_weibo()
    tb.get_deliver_address()
    tb.get_zhifubao()
    tb.get_renzheng()
    print ‘\n身份认证‘,‘#‘*100
    print tb.renzhen_info
    print json.dumps(tb.renzhen_info,ensure_ascii=False)

运行结果是这样的:

C:\Python27\python.exe D:/pywjj/taobao/taobao.py

订单列表 ####################################################################################################
1 【广东联通官方旗舰店】 100元话费充值 广东联通100元面值自助充 价格是: 99.80 元 交易状态是: 交易成功 99.8
2 【广东联通官方旗舰店】 100元话费充值 广东联通100元面值自助充 价格是: 99.80 元 交易状态是: 交易成功 199.6
3 广东联通100元手机话费充值 联通话费充值自动直充 价格是: 99.40 元 交易状态是: 交易成功 299.0
4 江西 移动 手机充值 200元 快充直充 24小时自动充 快速到账 价格是: 199.60 元 交易状态是: 交易成功 498.6
5 标准双人 价格是: 198.00 元 交易状态是: 交易成功 696.6
6 北京 移动手机话费充值50元 快充直充 24小时自动充 快速到帐 价格是: 49.95 元 交易状态是: 交易成功 746.55
7 【广东联通官方旗舰店】 50元 话费充值 广东联通 50元面值自助充 价格是: 49.90 元 交易状态是: 交易关闭 796.45
8 《速度与激情8》深圳中影星美国际影城电影票 价格是: 111.60 元 交易状态是: 交易成功 908.05
9 【广东联通旗舰店】3g上网卡/话费充值 广东联通 200元面值自助充 价格是: 199.60 元 交易状态是: 交易成功 1107.65
10 《西游伏妖篇》麦希中影南方抚州店电影票 价格是: 125.20 元 交易状态是: 交易成功 1232.85
11 《湄公河行动》深圳中影星美国际影城电影票 价格是: 75.60 元 交易状态是: 交易成功 1308.45
12 《惊天魔盗团2》深圳中影星美国际影城电影票 价格是: 113.60 元 交易状态是: 交易成功 1422.05
13 《幻体:续命游戏》东莞厚街万达影城电影票 价格是: 70.00 元 交易状态是: 交易成功 1492.05
14 《蚁人》深圳中影星美国际影城电影票 价格是: 82.00 元 交易状态是: 交易成功 1574.05
15 《九层妖塔》深圳中影星美国际影城电影票 价格是: 82.00 元 交易状态是: 交易成功 1656.05
16 【广东联通官方旗舰店】 100元话费充值 广东联通100元面值自助充 价格是: 99.80 元 交易状态是: 交易成功 1755.85
17 牛津布搬家袋子特大加厚防水行李袋帆布蛇皮编织打包袋超大号包裹 价格是: 9.60 元 交易状态是: 交易成功 1765.45
18 Midea/美的 WQS50F3电压力锅正品智能预约家用双胆高压锅饭煲5L 价格是: 339.00 元 交易状态是: 交易成功 2104.45
19 广东联通全国流量500M自动充值 即时生效 当月有效 价格是: 27.00 元 交易状态是: 交易成功 2131.45
20 联通流量充值500M流量卡全国3g/4g流量叠加包限广东联通GD500 价格是: 26.00 元 交易状态是: 交易关闭 2157.45
21 广东联通流量300M 全国流量充值2g3G4G通用手机上网联通流量包 价格是: 18.00 元 交易状态是: 交易关闭 2175.45
22 广东联通手机流量充值200M 流量卡 加油包 全国通用当月有效 价格是: 13.00 元 交易状态是: 交易关闭 2188.45
23 广东联通国内100M 流量充值联通全国通用流量叠加油包 100兆 价格是: 8.00 元 交易状态是: 交易成功 2196.45
24 广东联通 流量包100M 本地流量 本省使用 当月失效 价格是: 6.00 元 交易状态是: 交易关闭 2202.45
25 【广东联通旗舰店】3g上网卡/话费充值 广东联通 200元面值自助充 价格是: 199.60 元 交易状态是: 交易成功 2402.05
26 江西移动手机话费即时到账自动直充200元 秒冲 价格是: 199.90 元 交易状态是: 交易成功 2601.95
27 【广东联通旗舰店】3g上网卡/话费充值 广东联通 200元面值自助充 价格是: 199.60 元 交易状态是: 交易关闭 2801.55
28 江西移动20元充值 快充 即时到帐 闪电充值 秒冲快冲 价格是: 20.00 元 交易状态是: 交易成功 2821.55
29 自动充值 广东联通话费20元手机充值20元快充20元 及时到账 价格是: 19.94 元 交易状态是: 交易关闭 2841.49
30 【天猫超市】百草味 麻辣味牛板筋125g 零食牛肉干小包装牛筋 价格是: 89.70 元 交易状态是: 交易成功 2931.19
31 【天猫超市】三只松鼠 巴旦木仁235g办公室零食坚果特产扁桃仁 价格是: 80.60 元 交易状态是: 交易关闭 3011.79
32 【广东联通官方旗舰店】 100元话费充值 广东联通100元面值自助充 价格是: 99.80 元 交易状态是: 交易成功 3111.59
33 【广东联通官方旗舰店】 100元话费充值 广东联通100元面值自助充 价格是: 99.80 元 交易状态是: 交易关闭 3211.39
34 【1212年终盛典】七匹狼男士钱包长款真皮 头层牛皮皮夹钱夹 男款钱包商务青年日韩 价格是: 129.00 元 交易状态是: 交易成功 3340.39
35 香港澳门 团签L签 过关 通行证送关 蛇口拱北 罗湖福田深圳湾口岸 价格是: 4.04 元 交易状态是: 交易成功 3344.43
36 香港八达通卡香港地铁卡成人交通旅游便利店通用香港公交卡交通卡 价格是: 139.90 元 交易状态是: 交易成功 3484.33
37 香港八达通卡香港地铁卡成人交通旅游便利店通用香港公交卡交通卡 价格是: 139.90 元 交易状态是: 交易关闭 3624.23
38 【广东联通官方旗舰店】 100元话费充值 广东联通100元面值自助充 价格是: 99.80 元 交易状态是: 交易成功 3724.03
39 【广东联通官方旗舰店】 100元话费充值 广东联通100元面值自助充 价格是: 99.80 元 交易状态是: 交易成功 3823.83
40 【广东联通官方旗舰店】 100元话费充值 广东联通100元面值自助充 价格是: 99.80 元 交易状态是: 交易成功 3923.63
41 【广东联通官方旗舰店】 100元话费充值 广东联通100元面值自助充 价格是: 99.80 元 交易状态是: 交易成功 4023.43
42 罗湖福田深圳湾皇岗口岸团签送关 通关香港过关服务通行证L签旅游 价格是: 5.00 元 交易状态是: 交易成功 4028.43
43 【广东联通旗舰店】3g上网卡/话费充值 广东联通 200元面值自助充 价格是: 199.60 元 交易状态是: 交易成功 4228.03
44 【广东联通官方旗舰店】 100元话费充值 广东联通100元面值自助充 价格是: 99.80 元 交易状态是: 交易成功 4327.83
45 【广东联通官方旗舰店】 100元话费充值 广东联通100元面值自助充 价格是: 99.80 元 交易状态是: 交易成功 4427.63
46 【广东联通官方旗舰店】 100元话费充值 广东联通100元面值自助充 价格是: 99.50 元 交易状态是: 交易成功 4527.13
47 【广东联通官方旗舰店】 100元话费充值 广东联通100元面值自助充 价格是: 99.50 元 交易状态是: 交易关闭 4626.63
48 【广东联通官方旗舰店】 100元话费充值 广东联通100元面值自助充 价格是: 99.50 元 交易状态是: 交易成功 4726.13
49 【广东联通官方旗舰店】 100元话费充值 广东联通100元面值自助充 价格是: 99.50 元 交易状态是: 交易成功 4825.63
50 【广东联通官方旗舰店】 100元话费充值 广东联通100元面值自助充 价格是: 99.50 元 交易状态是: 交易成功 4925.13
51 【天猫中秋月】五芳斋中秋月饼礼盒装 五芳韵味台式8口味椰蓉紫薯月饼团购批发 价格是: 59.00 元 交易状态是: 交易成功 4984.13
52 【广东联通官方旗舰店】 100元话费充值 广东联通100元面值自助充 价格是: 99.50 元 交易状态是: 交易成功 5083.63
53 正品包邮 VICTOR/威克多羽毛球拍 胜利球拍 探险家EXP6550 碳纤维 价格是: 169.00 元 交易状态是: 交易成功 5252.63
54 【广东联通官方旗舰店】 100元话费充值 广东联通100元面值自助充 价格是: 99.50 元 交易状态是: 交易成功 5352.13
55 【广东联通官方旗舰店】 100元话费充值 广东联通100元面值自助充 价格是: 99.50 元 交易状态是: 交易成功 5451.63
56 【广东联通官方旗舰店】 100元话费充值 广东联通100元面值自助充 价格是: 99.50 元 交易状态是: 交易成功 5551.13
57 paperpass 论文检测 本科硕士博士毕业论文检测 论文查重 价格是: 15.00 元 交易状态是: 交易成功 5566.13
58 【广东联通官方旗舰店】 50元 话费充值 广东联通 50元面值自助充 价格是: 49.75 元 交易状态是: 交易成功 5615.88
59 江西 移动 手机充值 100元 快充直充 24小时自动充 即时到账 价格是: 98.50 元 交易状态是: 交易成功 5714.38
60 江西 移动 手机充值 100元 快充直充 24小时自动充 即时到账 价格是: 98.50 元 交易状态是: 交易成功 5812.88
61 山西移动 手机 话费充值 50元 快充直充24小时自动充值即时到帐 价格是: 49.50 元 交易状态是: 交易成功 5862.38
62 江西 移动 手机充值 100元 快充直充 24小时自动充 即时到账 价格是: 98.50 元 交易状态是: 交易关闭 5960.88
63 舒适家居服女夏条纹睡衣性感蕾丝背心睡裙女夏吊带莫代尔包邮 价格是: 78.00 元 交易状态是: 交易成功 6038.88
64 正品身体乳 韩伊Olive橄榄深层保湿乳270ml润肤乳液 美白保湿滋润 价格是: 32.00 元 交易状态是: 交易成功 6070.88
65 高倩 益肤霜护肤套装 男女士去痘印祛痘套装祛痘产品前五强 包邮 价格是: 68.00 元 交易状态是: 交易成功 6138.88
66 春装男士衬衫男韩版修身 白衬衫白色男青少年男衬衣长袖潮男衬衫 价格是: 39.00 元 交易状态是: 交易成功 6177.88
67 特贝凡西 春短袖T恤男韩版修身男士半袖t恤男短袖潮夏装秋男装T恤 价格是: 29.90 元 交易状态是: 交易成功 6207.78
68 VIDYA男装2013新款秋装男士长袖衬衫 韩版休闲加厚磨毛格子衬衣潮 价格是: 59.00 元 交易状态是: 交易成功 6266.78
69 未时优秋冬加厚毛衣针织衫男士高领半开衫毛衣宽松大码衫 价格是: 35.00 元 交易状态是: 交易成功 6301.78
70 笛凡 假两件男士毛衣针织衫韩版修身线衫外套 秋装套头薄毛衣男装 价格是: 63.00 元 交易状态是: 交易成功 6364.78
71 白衬衫 男 长袖凯迪文纯色免烫正装职业男士商务衬衫 衬衣男长袖 价格是: 69.90 元 交易状态是: 交易成功 6434.68
72 宅族部落秋季男士韩版潮鞋帆布鞋男鞋百搭板鞋休闲鞋男懒人鞋潮流 价格是: 66.00 元 交易状态是: 交易成功 6500.68
73 宅族部落秋季男士韩版潮鞋帆布鞋男鞋百搭板鞋休闲鞋男懒人鞋潮流 价格是: 66.00 元 交易状态是: 交易关闭 6566.68
74 特卖361度官方男款耐磨防滑运动鞋潮流休闲板鞋 7246652 价格是: 119.00 元 交易状态是: 交易关闭 6685.68
75 B&amp;L夏装衣服男士短袖t恤 翻领T恤男短袖韩版潮兰博基尼polo衫情侣 价格是: 78.00 元 交易状态是: 交易成功 6763.68
76 男装夏装新款潮流男裤子春款韩版修身时尚小脚长裤男士薄款休闲裤 价格是: 60.50 元 交易状态是: 交易成功 6824.18
77 花花公子 钱包 男士 短款 正品 韩版 真皮 钱夹 潮 休闲 牛皮皮夹 价格是: 49.50 元 交易状态是: 交易成功 6873.68
78 虞文萱金盏花水爽肤水 保湿补水美白收缩毛孔紧致护肤紧肤化妆水 价格是: 63.00 元 交易状态是: 交易成功 6936.68
79 包邮 电音DT-371耳机 头戴式 潮 游戏语音电脑耳麦 带麦克风 话筒 价格是: 19.00 元 交易状态是: 交易成功 6955.68
80 春装2013 薄款男士夹克男韩版潮修身夹克衫 休闲男装外套男春秋装 价格是: 79.00 元 交易状态是: 交易成功 7034.68
81 TOPOT 新品纯棉精品百搭格子衬衫 长袖男士格子衬衣 男装时尚休闲 价格是: 69.00 元 交易状态是: 交易成功 7103.68
82 友安米春季 男士衬衫 韩版长袖休闲衬衫 男士格子衬衫 修身男衬衣 价格是: 58.00 元 交易状态是: 交易成功 7161.68
83 八哥2013新款春季板鞋 男式韩版透气运动鞋 潮玩休闲鞋 正品白色 价格是: 119.10 元 交易状态是: 交易成功 7280.78
84 SXLONG正品春夏男士运动鞋旅游鞋跑步鞋子休闲透气慢跑鞋网鞋男鞋 价格是: 88.00 元 交易状态是: 交易成功 7368.78
85 特价!新款男装韩版加绒卫衣男 冬装男加厚外套保暖衣服男 卫衣潮 价格是: 145.00 元 交易状态是: 交易成功 7513.78
86 秋装磨毛格子衬衫男士长袖保暖衬衣英伦休闲男士保暖衬衫 价格是: 50.40 元 交易状态是: 交易成功 7564.18
87 1万好评 磨毛休闲格子衬衫 男士长袖衬衫 加厚衬衣潮男装韩版寸衫 价格是: 59.00 元 交易状态是: 交易关闭 7623.18

个人资料 ####################################################################################################
用户名: 署之蓝
性别: 男
真实姓名: 永
生日:年 1993
生日:月 8
生日:日 22
divisionCode: 360000
省份: 江西省
城市: 无城市
区县: 无区县
星座: 狮子座
liveDivisionCode:
家乡省份: 无省份
家乡城市: 无城市
家乡区县: 无区县

微博信息 ####################################################################################################
微博账号: 没有绑定微博

收货地址列表 ####################################################################################################
收货人: 罗先生
所在地区: 广东省 佛山市 顺德区 北滘镇
详细地址: 广东省 佛山市 顺德区 北窖镇 林头太平沙
邮编: 528300
手机: 18
***************************************
收货人: 李泽华
所在地区: 江西省 抚州市 临川区
详细地址: 江西省 抚州市 临川区 展坪乡 占源村
邮编: 344113
手机: 18779883669
***************************************
收货人: 李泽华
所在地区: 江西省 南昌市 经济技术开发区
详细地址: 江西省 南昌市 经济技术开发区 志敏大道1101号 江西农业大学
邮编: 330045
手机: 18779883669
***************************************
收货人: 李泽华
所在地区: 广东省 深圳市 南山区 粤海街道
详细地址: 科技中三路5号国人通信大厦B栋1F层208
邮编: 000000
手机: 86
***************************************
收货人: 李泽华
所在地区: 广东省 深圳市 宝安区
详细地址: 坪洲地铁站劳动路44号
邮编: 518101
手机: 18565750665
***************************************
收货人: 李泽华
所在地区: 江西省 抚州市 临川区
详细地址: 江西省 抚州市 临川区 展坪乡 占源村
邮编: 344113
手机: 18779883669
***************************************
收货人: 李泽华
所在地区: 广东省 深圳市 南山区 南山街道
详细地址: 深圳市南山区科园路航天卫星大厦1501室深圳市人人聚财金融信息服务有限公司
邮编: 518052
手机: 18565750665
***************************************
收货人: 李泽华
所在地区: 广东省 深圳市 南山区 粤海街道
详细地址: 广东深圳市南山区广东深圳市南山区深圳南山区高新科技园中区科苑路15号科兴科学园B3-508
邮编: 518055
手机: 18779883669
***************************************
收货人: 李泽华
所在地区: 广东省 深圳市 南山区
详细地址: 南山区松坪山一号路天明科技大厦
邮编: 518052
手机: 18565750665
***************************************

支付宝信息 ####################################################################################################
绑定的支付宝账号: 185*****665
支付宝邮箱:
支付宝手机: 185*****665
支付宝账户类型: 个人账户
支付宝实名认证: 李** | 3****************0 已认证

身份认证 ####################################################################################################
{u‘\u8ba4\u8bc1\u901a\u8fc7\u65f6\u95f4‘: u‘‘, u‘\u8ba4\u8bc1\u8eab\u4efd\u8bc1\u6709\u6548\u671f‘: u‘‘, u‘\u8ba4\u8bc1\u6e20\u9053‘: u‘\u652f\u4ed8\u5b9d\u5b9e\u540d\u8ba4\u8bc1\uff08\u8eab\u4efd\u8bc1\u4ef6\u5df2\u4e0a\u4f20\uff09‘, u‘\u8ba4\u8bc1\u59d3\u540d‘: u‘\u674e**‘, u‘\u8ba4\u8bc1\u8eab\u4efd\u8bc1\u53f7‘: u‘3****************0‘}
{"认证通过时间": "", "认证身份证有效期": "", "认证渠道": "支付宝实名认证(身份证件已上传)", "认证姓名": "李**", "认证身份证号": "3****************0"}

Process finished with exit code 0

时间: 2024-11-10 15:19:24

淘宝爬取个人资料、微博绑定、收货地址、支付宝绑定设置、安全设置等信息的相关文章

淘宝爬取某人的所有购物订单

做风险控制和个人征信,需要做数据挖掘,第一步就是要爬到消费记录,当然还有很多其他项包括收货地址 宝贝收藏 快速退款额度 芝麻信用 绑定的手机等等,先要爬到数据才能分析. 淘宝直接请求登录接口不可行,不知道post参数加密规则,(大公司安全就是做得好),用selenium操作浏览器来登录得到driver的cookie,然后requests携带cookie去爬订单.如果全部都由selenium爬取无疑很慢,所以selenium负责登录就行. 上代码. #coding=utf-8 import tim

淘宝抓取数据

using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Data;using Stock.BLL;using System.Text.RegularExpressions;using System.Xml;using System.Data.SqlClient;using System.Web; namespace Stock.DAL{ public class

Python 爬虫 ajax爬取马云爸爸微博内容

ajax爬取情况 有时候我们在用 Requests 抓取页面的时候,得到的结果可能和在浏览器中看到的是不一样的,在浏览器中可以看到正常显示的页面数据,但是使用 Requests 得到的结果并没有,这其中的原因是 Requests 获取的都是原始的 HTML 文档,而浏览器中的页面则是页面又经过 JavaScript 处理数据后生成的结果,这些数据的来源有多种,可能是通过 Ajax 加载的,可能是包含在了 HTML 文档中的,也可能是经过 JavaScript 经过特定算法计算后生成的 项目代码如

python爬虫:爬取百度云盘资料,保存下载地址、链接标题、链接详情

在网上看到的教程,但是我嫌弃那个教程写的乱(虽然最后显示我也没高明多少,哈哈),就随手写了一个 主要是嫌弃盘搜那些恶心的广告,这样直接下载下来,眼睛清爽多了. 用pyinstall 打包成EXE文件,就可以安安静静的下载东西了.... #refer:http://upvup.com/html/python/2015-12-13/21.html #!/usr/bin/python# -*- encoding:utf-8 -*- import requestsfrom bs4 import Beau

爬取搜索出来的电影的下载地址并保存到excel

一.背景 利用Requests模块获取页面,BeautifulSoup来获取需要的内容,最后利用xlsxwriter模块讲内容保存至excel,首先通过讲关键字收拾出来的页面获取到子页面的url,然后再次去抓取获取到子页面的信息保存到excel 二.代码 编写了两个模块,geturldytt和getexceldytt,最后在main内调用 geturldyttd代码如下: #!/bin/env python # -*- coding:utf-8 -*- from urllib import pa

vue mint-ui 实现省市区街道4级联动(仿淘宝京东收货地址4级联动)

先去下载一个“省份.城市.区县.乡镇” 四级联动数据,然后 引入 import { Picker } from 'mint-ui'; //前提是npm install mint-ui -S Vue.component(Picker.name, Picker); 组件使用 <mt-picker :slots="addressSlots" class="picker" @change="onAddressChange" :visible-ite

使用python爬取淘宝商品名称和价格

最近在家闲得无聊,由于家里开网点,妈妈对于起商品标题感到很头痛,所以我就想在淘宝爬取一些信息. 小破站找了个学习视频,跟一遍发现视频是2018年的,而淘宝在2019年可能加入了反爬取机制,使用正常的方法爬不到结果. 但是有一种方式可以爬取,要先登陆淘宝网页版,然后去搜索,获取cookie和user-agent. 代码如下: import requests import re def getHTMLText(url): kv = {'cookie':'cna=54y8Fm+TyioCATzcP+B

python 爬虫实战4 爬取淘宝MM照片

本篇目标 抓取淘宝MM的姓名,头像,年龄 抓取每一个MM的资料简介以及写真图片 把每一个MM的写真图片按照文件夹保存到本地 熟悉文件保存的过程 1.URL的格式 在这里我们用到的URL是 http://mm.taobao.com/json/request_top_list.htm?page=1,问号前面是基地址,后面的参数page是代表第几页,可以随意更换地址.点击开之后,会发现有一些淘宝MM的简介,并附有超链接链接到个人详情页面. 我们需要抓取本页面的头像地址,MM姓名,MM年龄,MM居住地,

图片抓取,根据关键字爬取淘宝或百度前4张图片

通过关键字查询淘宝网或者百度图片,并下载到本地前四张图片 1 private new string Capture(string productTitle) 2 { 3 string result = string.Empty; 4 try 5 { 6 string url = string.Empty; 7 //汉子转码 8 string contant = HttpUtility.UrlEncode(productTitle); 9 url = string.Format(@"https:/