Python爬虫基础——HTML、CSS、JavaScript、JQuery网页前端技术

一、HTML

HTML是Hyper Text Markup Language（超文本标记语言）的缩写。
HTML不是一种编程语言，而是标记语言。

HTML的语法

双标签：
<标签名></标签名>
单标签：
<标签名/>

HTML的元素和属性

<标签名属性名=属性值>元素</标签名>
<标签名属性名=属性值/>

HTML的结构

<!DOCTYPE html>————文件为html文件
<html lang="en">————语言类型：英语
<head></head>————头
<body></body>————主体
</html>

HTML的常用标签

1.浏览器标题

<head>
    <title>浏览器标题</title>
</head>

2.标题与段落

<head>
    <title>标题与段落</title>
</head>
<body>
<h1>一级标题h1</h1>
<h2>二级标题h2</h2>
<h3>三级标题h3</h3>
<h4>四级标题h4</h4>
<h5>五级标题h5</h5>
<h6>六级标题h6</h6>
<p>段落标签p</p>
</body>

3.水平线与换行符

<hr/>
<br/>

4.常见的转义符

空格：&nbsp;
大于号：&gt;
小于号:&lt;

5.链接

<a href="//www.baidu.com">点击我，本窗口访问百度</a>
<a href="//www.baidu.com" target="_blank">点击我，新窗口访问百度</a>

6.图片标签

<img src="1.png" alt="如果图片加载失败，显示的文字">

7.表格

    <!--
        table标签:
            border      边框
            width       宽度
            tr          行
            th          表头
            th          普通列
    -->
    <table border="1px" width="300px">
        <tr>
            <th>表头th</th>
            <th>表头th</th>
        </tr>
        <tr>
            <td>普通列td</td>
            <td>普通列td</td>
        </tr>
    </table>

8.列表

    <ul>
        <li>无序列表项1</li>
        <li>无序列表项2</li>
    </ul>
    <ol>
        <li>有序列表项1</li>
        <li>有序列表项2</li>
    </ol>

9.常见的无意义标签

    <!--
        div     占用整行
        span    不占用整行，长度取决于内部元素的长度
    -->
    <div>div标签</div>
    <span>span标签</span>

10.表单

表单一：

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>10.表单1</title>
</head>
<body>
    <!--
        form标签
            action      提交地址
            method      请求方式(get或post,默认get)
            	get		提交的数据参数在url中，不安全
            	post	提交的数据被加密，url中无法看到，在action中
            enctype="multipart/form-data"   如果提交文件，需要添加这个参数
    -->
    <form action="#" method="post" enctype="multipart/form-data">

    </form>
</body>
</html>

表单二：

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>10.表单2</title>
</head>
<body>
    <!--
        input标签
            1.文本框   type="text"
            2.密码框   type="password"
            3.单选框   type="radio"
            4.复选框   type="checkbox"
            5.文件框   type="file"
            6.按钮     type="button"
            7.提交     type="submit"
            8.重置     type="reset"
    -->
    <form action="#" method="post" enctype="multipart/form-data">
        1.用户名（文本框text）:
            <input type="text" name="username">
        <hr/>
        2.密码（密码框password）：<input type="password" name="password" value="">
        <hr/>
        3.性别（单选框radio）：
            男<input type="radio" name="gender" value="0">
            女<input type="radio" name="gender" value="1">
        <hr/>
        4.爱好（复选框checkbox）：
            学Web<input type="checkbox" name="hobby" value="web">
            学爬虫<input type="checkbox" name="hobby" value="spider">
        <hr/>
        5.上传头像（文件框file）：
            <input type="file" name="img">
        <hr/>
        6.按钮（button）:
            <input type="button" value="空按钮">
        <hr/>
        7.提交（submit）:
            <input type="submit" value="提交按钮">
        <hr/>
        8.重置（reset）:
        <input type="reset" value="重置按钮">
        <hr/>
    </form>
</body>
</html>

表单三：

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>10.表单3</title>
</head>
<body>
    <!--
        下拉框：select和option
        大文本：textarea
            cols    列数
            rows    行数
    -->
    <form action="#" method="post" enctype="multipart/form-data">
        <select name="year">
            <option value="2019">2019</option>
            <option value="2018">2018</option>
        </select>
        <textarea name="comment" cols="30" rows="10"></textarea>
    </form>
</body>
</html>

二、CSS

CSS是Cascading Style Sheets（层叠样式表）的缩写。
CSS不仅可以静态地修饰网页，还可以配合各种脚本语言动态地对网页各元素进行格式化。

CSS的语法

格式：
属性：属性值；
例如：
设置背景颜色为蓝色：
background-color:blue；

CSS的引入方式

内嵌式：

<div style="background-color: blue"></div>

内部式：

<style type="text/css">
	/* css代码 */
</style>

外部式：

<link rel="stylesheet" type="text/css" href="css文件地址">

CSS的选择器

    <style type="text/css">
    	/*
    		标签选择器：【标签名】 {};
			ID选择器：#【ID值】{}；
			类选择器：.【类名】{}；
		*/
        body{
            /*background-color: grey;*/
            background-image: url("1.png");
            background-repeat: no-repeat;
        }
        #div_id1{
            background-color: red;
            font-size: 72px;
            font-weight: lighter;
        }
        .div_class1{
            background-color: green;
            border:solid 1px yellow;
        }
    </style>

CSS的常用样式

背景颜色：backgroud-color:颜色；
背景图片：background-image:url（图片地址）；
图片平铺：background-repeat：
- repeat 水平垂直都平铺（默认）
- repeat-x 水平平铺
- repeat-y 垂直平铺
- no-repeat 不平铺
边框：border:边框类型，尺寸，颜色;

三、JavaScript

JavaScript一种直译式脚本语言，是一种动态类型、弱类型、基于原型的语言，内置支持类型。它的解释器被称为JavaScript引擎，为浏览器的一部分，广泛用于客户端的脚本语言，最早是在HTML网页上使用，用来给HTML网页增加动态功能。

JavaScript的引入方式

内嵌式：

<script type="text/javascript">
	/*
		js代码
	*/
	// alert(【对话框内容】);
	alert(‘你好，JavaScript‘);
</script>

外部式：

<script type="text/javascript" src="myjs.js"></script>

四、JQuery

JQuery的引入

从官方网站下载JQuery，然后引入：

<head>
<script type="text/javascript" src="【本地JQuery地址】"></script>
</head>

JQuery的选择器

JQuery的对象

JQuery对象习惯性采用$开口，例如：

	$div = $("div");

JQuery对象的格式是[Object]

	jsObject = $jqueryObject[0];
	jsObject = $jqueryObject.get(0);

JQuery对象转JS对象

	$jqueryObject = $(jsObject);

JQuery事件

<body>
    <input type="button" value="按钮" id="button_id">
    <script type="text/javascript">
        //1.得到按钮对象
        $buttonElement = $(‘#button_id‘);
        //2.绑定点击事件
        // $buttonElement.click(function(){
        //     alert(‘按钮被点击了‘)
        // });
        $buttonElement.click(function(){
            alert(‘按钮被点击了‘);
        });
    </script>
</body>

JQuery动画

<body>
    <input type="button" value="隐藏" id="button_hide">
    <input type="button" value="显示" id="button_show">

    <ul id="ul_id">
        <li>Python</li>
        <li>Java</li>
    </ul>

    <script type="text/javascript">
        // 1.得到两个按钮对象
        $button_hide = $(‘#button_hide‘);
        $button_show = $(‘#button_show‘);
        // 2.得到ul对象
        $ul = $(‘#ul_id‘);

        // 隐藏
        $button_hide.click(function(){
            $ul.hide("slow");
        });

        // 显示
        $button_show.click(function(){
            $ul.show("slow");
        });

    </script>
</body>

注意：speed:slow、normal、fast

原文地址：https://www.cnblogs.com/WoLykos/p/12069947.html

时间： 2024-10-10 23:02:29

Python爬虫基础——HTML、CSS、JavaScript、JQuery网页前端技术的相关文章

python爬虫（二）：向网页提交数据

python爬虫(二):向网页提交数据回忆一下,我们有的时候在看一些网站的时候,是否遇见过一些网站里面的信息开始显示一部分,然后当我们把鼠标滑轮向下拉动后,又显示出一些信息.这就是异步加载.我的上一篇文章python爬虫百度贴吧标题数据爬取的所有标题都是页面已经加载好的.但是对于这种开始没有加载好的数据我们应该如何爬取呢? 接下来我们先介绍下一些概念: 异步加载:举个简单的例子就是说,假如老师判作业,有两种情况,第一种就是无论哪个学生先写完,都等待到所有的同学全部写完,老师讲所有的作业都收齐后

python爬虫-基础入门-爬取整个网站《3》

python爬虫-基础入门-爬取整个网站<3> 描述: 前两章粗略的讲述了python2.python3爬取整个网站,这章节简单的记录一下python2.python3的区别 python2.x 使用类库: >> urllib 库 >> urllib2 库 python3.x 使用的类库: >> urllib 库变化: -> 在python2.x中使用import urllib2 ----- 对应的,在python3.x 中会使用import url

Python爬虫基础之requests

一.随时随地爬取一个网页下来怎么爬取网页?对网站开发了解的都知道,浏览器访问Url向服务器发送请求,服务器响应浏览器请求并返回一堆HTML信息,其中包括html标签,css样式,js脚本等.我们之前用的是Python标准基础库Urllib实现的, 现在我们使用Python的Requests HTTP库写个脚本开始爬取网页.Requests的口号很响亮“让HTTP服务人类“,够霸气. 二.Python Requests库的基本使用 1.GET和POST请求方式 GET请求 1 import re

Python 爬虫基础

下面是一个 Python 爬虫最简单的例子,使用网络库 urllib2 和正则表达式库 re,模拟浏览器的 User-Agent. #!/usr/bin/env python # -*- coding: utf-8 -*- #引入基础网络库 import urllib2 #引入正则表达式模块 import re #模拟User-Agent headers = {'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWe

Java(随笔)——利用HTML,CSS,JavaScript,JQuery编写的简易计算器

一．利用刚学过的前端知识做一个简易的计算器里边使用到了HTML,CSS,JavaScript以及JQuery的知识代码如下:(1)利用CSS设计了计算器外形样式:(2)利用JavaScript实现了建议计算器的功能:代码: <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>简易计算器</title> <link rel="styl

Python爬虫基础知识及前期准备

学习爬虫有一小段时间了,于是决定把自己学爬虫时所学的,写过的代码以及看过的文档记录下来,权当小结.第一次写这些,如果有错误,请多指教. 首先我们需要了解一下什么是爬虫. 根据百度百科上给出的定义," 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本."简单来说,爬虫类似手动下载网页信息,比如小说.歌曲.说到这,或许会有疑问,既然这样,干嘛还去敲代码,直接人工处理不好吗?话是这么说,但如果下载的

Python爬虫基础知识入门一

一.什么是爬虫,爬虫能做什么爬虫,即网络爬虫,大家可以理解为在网络上爬行的一直蜘蛛,互联网就比作一张大网,而爬虫便是在这张网上爬来爬去的蜘蛛咯,如果它遇到资源,那么它就会抓取下来.比如它在抓取一个网页,在这个网中他发现了一条道路,其实就是指向网页的超链接,那么它就可以爬到另一张网上来获取数据. 爬虫可以抓取的某个网站或者某个应用的内容,提取有用的价值.也可以模拟用户在浏览器或者App应用上的操作,实现自动化的程序.以下行为都可以用爬虫实现: 咨询报告(咨询服务行业) 抢票神器投票神器预测(

selenium使用Xpath+CSS+JavaScript+jQuery的定位方法（治疗selenium各种定位不到，点击不了的并发症）

[第一部分]开篇:先认识Xpath的4种定位方法跟你说,你总是靠那个firebug,chrome的F12啥的右击复制xpath绝对总有一天踩着地雷炸的你死活定位不到,这个时候就需要自己学会动手写xpath,人脑总比电脑聪明,开始把xpath语法给我学起来! 第1种方法:通过绝对路径做定位(相信大家不会使用这种方式) By.xpath("html/body/div/form/input") By.xpath("//input") 第2种方法:通过元素索引定位 By.

python爬虫基础02-urllib库

Python网络请求urllib和urllib3详解 urllib是Python中请求url连接的官方标准库,在Python2中主要为urllib和urllib2,在Python3中整合成了urllib. 官方文档链接为:https://docs.python.org/3/library/urllib.html 而urllib3则是增加了连接池等功能,两者互相都有补充的部分. urllib 它是 Python 内置的 HTTP 请求库,也就是说我们不需要额外安装即可使用,基本上涵盖了基础的网络请