《深入浅出Python》与《Python网络数据采集》读后感

本学期在课程之外,自主计划学习Python语言以及爬虫知识。书籍方面,采用了O`Reilly的《深入浅出Python》与《Python网络数据采集》。前者用于Python语法的学习,后者则作为爬虫知识的详解。

与我们日常使用的教材不同的是,《深入》像是一个老鸟,在一步一步通过对话的形式手把手地教你。个人体会,该书作为入门教材,十分妥当,但是深入理解还需另辟蹊径。全书从文本处理出发讲解基础语法,再设计背景,随着假设要求不断扩展,将Python语言在web开发、Android应用开发等领域的作用通过示例的形式展现出来。同时,留下大量空白,要求读者自己动手,尝试写出代码。但是,该书在引导学习的方面有一定问题,就是当读者只用这一本书时,会由于语法使用较少而在后面的学习中难以读懂程序含义。因此,在读该书的时候,可以尝试跟其他书籍一同阅读,如:《Python核心编程》。《核心编程》与其说是教材,不如说是本工具书,配合《深入》使用更佳。总的来说,《深入》是一本介绍性为主的书籍,书的后部分的应用介绍,提供了很多模板,在本学期的课内实验中,我采用了相关的技术。但是,语言归语言,《深入》对于功能的介绍并不算很深入,当有一定基础之后,再看该书,又有点鸡肋的感觉。

而《网络数据采集》则更贴近与我们平时使用的教材,从基础的数据采集,到高级的数据处理,同样是用功能的实现来体现技术。在阅读该书之前,我便已经开始从网上查找资料、学习视频学习爬虫技术了。本学期,程序设计课程,我便利用爬虫技术,完成了作业设计功能。但是,随着程序的功能不断扩充,更为规范高效的爬虫技术,成了我的瓶颈。因此我才购入此书,以求获得技术上的提升。该书篇幅不大,内容较精,但是随着时间进入到期末,不得不停下来,因此现在还没有看完。总的感受是,该书所提供的方法,跟网上的教程相比,突出的特点是编码的规范化,和方法的精练。而未能读完的后半部分则偏向于处理更难的问题。

人生苦短,我用Python。在读了两本书之后,感受到一个良好的语言社区是多么的重要。当然,也导致了我现在一看超过百行的代码就眼花。

时间: 2024-10-29 19:07:18

《深入浅出Python》与《Python网络数据采集》读后感的相关文章

笔记之Python网络数据采集

笔记之Python网络数据采集 非原创即采集 一念清净, 烈焰成池, 一念觉醒, 方登彼岸 网络数据采集, 无非就是写一个自动化程序向网络服务器请求数据, 再对数据进行解析, 提取需要的信息 通常, 有api可用, api会比写网络爬虫程序来获取数据更加方便. Part1 创建爬虫 Chapter1 初建网络爬虫 一旦你开始采集网络数据, 就会感受到浏览器为我们所做的所有细节, 它解释了所有的html, css, JavaScript 网络浏览器是一个非常有用的应用, 它创建信息的数据包, 发送

Python网络数据采集pdf

下载地址:网盘下载 内容简介  · · · · · · 本书采用简洁强大的Python语言,介绍了网络数据采集,并为采集新式网络中的各种数据类型提供了全面的指导.第一部分重点介绍网络数据采集的基本原理:如何用Python从网络服务器请求信息,如何对服务器的响应进行基本处理,以及如何以自动化手段与网站进行交互.第二部分介绍如何用网络爬虫测试网站,自动化处理,以及如何通过更多的方式接入网络. 作者简介  · · · · · · Ryan Mitchell 数据科学家.软件工程师,目前在波士顿Link

《python 网络数据采集》代码更新

<python 网络数据采集>这本书中会出现很多这一段代码: 1 from urllib.request import urlopen 2 from bs4 import BeautifulSoup 3 html = urlopen(url) 4 bsobj = BeautifulSoup(html) 我也跟着输入这一段代码,但会出现提示: UserWarning: No parser was explicitly specified, so I'm using the best availa

(数据科学学习手札47)基于Python的网络数据采集实战(2)

一.简介 马上大四了,最近在暑期实习,在数据挖掘的主业之外,也帮助同事做了很多网络数据采集的内容,接下来的数篇文章就将一一罗列出来,来续写几个月前开的这个网络数据采集实战的坑. 二.马蜂窝评论数据采集实战 2.1 数据要求 这次我们需要采集的数据是知名旅游网站马蜂窝下重庆区域内所有景点的用户评论数据,如下图所示: 思路是,先获取所有景点的poi ID,即每一个景点主页url地址中的唯一数字: 这一步和(数据科学学习手札33)基于Python的网络数据采集实战(1)中做法类似,即在下述界面: 翻页

学习爬虫:《Python网络数据采集》中英文PDF+代码

适合爬虫入门的书籍<Python网络数据采集>,采用简洁强大的Python语言,介绍了网络数据采集,并为采集新式网络中的各种数据类型提供了全面的指导.第一部分重点介绍网络数据采集的基本原理:如何用Python从网络服务器请求信息,如何对服务器的响应进行基本处理,以及如何以自动化手段与网站进行交互.第二部分介绍如何用网络爬虫测试网站,自动化处理,以及如何通过更多的方式接入网络. <Python网络数据采集>高清中文PDF,224页,带目录和书签,能够复制:高清英文PDF,255页,带

python学习之爬虫网络数据采集

Python 给人的印象是抓取网页非常方便,提供这种生产力的,主要依靠的就是urllib.requests这两个模块. 网络数据采集之urllib urllib库官方文档地址:https://docs.python.org/3/library/urllib.htmlurllib库是python的内置HTTP请求库,包含以下各个模块内容:(1)urllib.request:请求模块(2)urllib.error:异常处理模块(3)urllib.parse:解析模块(4)urllib.robotpa

下载大数据实战课程第一季Python基础和网络爬虫数据分析

python语言近年来越来越被程序相关人员喜欢和使用,因为其不仅简单容易学习和掌握,而且还有丰富的第三方程序库和相应完善的管理工具:从命令行脚本程序到gui程序,从B/S到C/S,从图形技术到科学计算,软件开发到自动化测试,从云计算到虚拟化,所有这些领域都有python的身影:python已经深入到程序开发的各个领域,并且会越来越多的人学习和使用. 大数据实战课程第一季Python基础和网络爬虫数据分析,刚刚入手,转一注册文件,视频的确不错,可以先下载看看:链接:http://pan.baidu

Python中的网络扫描大杀器Scapy初探

Python中的网络扫描大杀器Scapy初探     最近经历了Twisted的打击,这个网络编程实在看不懂,都摸不透它的内在逻辑,看来网络编程不是那么好弄的.还好,看到了scapy,这种网络的大杀器,让我一看就爱不释手,这才是我需要的网络工具啊.Scapy的功能如此之多,以至于...我到现在还是没看懂.在官方网站也介绍的不多,后来搜了一下,有一本书Security Power Tools一书中,第六章介绍了Scapy,虽然简单,但是还是不明白,这两天一直在忙活着看Scapy.看了几个应用,比较

Python 基础学习 网络小爬虫

<span style="font-size:18px;"># # 百度贴吧图片网络小爬虫 # import re import urllib def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getImg(html): reg = r'src="(.+?\.jpg)" pic_ext' imgre = re.compile(reg) imgli