Python爬虫基础——HTML、CSS、JavaScript、JQuery网页前端技术

一、HTML

HTML是Hyper Text Markup Language(超文本标记语言)的缩写。
HTML不是一种编程语言,而是标记语言。

HTML的语法

  • 双标签:
    <标签名></标签名>
  • 单标签:
    <标签名/>

HTML的元素和属性

  • <标签名 属性名=属性值>元素</标签名>
  • <标签名 属性名=属性值/>

HTML的结构

<!DOCTYPE html>————文件为html文件
<html lang="en">————语言类型:英语
<head></head>————头
<body></body>————主体
</html>

HTML的常用标签

1.浏览器标题
<head>
    <title>浏览器标题</title>
</head>
2.标题与段落
<head>
    <title>标题与段落</title>
</head>
<body>
<h1>一级标题h1</h1>
<h2>二级标题h2</h2>
<h3>三级标题h3</h3>
<h4>四级标题h4</h4>
<h5>五级标题h5</h5>
<h6>六级标题h6</h6>
<p>段落标签p</p>
</body>
3.水平线与换行符
<hr/>
<br/>
4.常见的转义符
空格:&nbsp;
大于号:&gt;
小于号:&lt;
5.链接
<a href="//www.baidu.com">点击我,本窗口访问百度</a>
<a href="//www.baidu.com" target="_blank">点击我,新窗口访问百度</a>
6.图片标签
<img src="1.png" alt="如果图片加载失败,显示的文字">
7.表格
    <!--
        table标签:
            border      边框
            width       宽度
            tr          行
            th          表头
            th          普通列
    -->
    <table border="1px" width="300px">
        <tr>
            <th>表头th</th>
            <th>表头th</th>
        </tr>
        <tr>
            <td>普通列td</td>
            <td>普通列td</td>
        </tr>
    </table>
8.列表
    <ul>
        <li>无序列表项1</li>
        <li>无序列表项2</li>
    </ul>
    <ol>
        <li>有序列表项1</li>
        <li>有序列表项2</li>
    </ol>
9.常见的无意义标签
    <!--
        div     占用整行
        span    不占用整行,长度取决于内部元素的长度
    -->
    <div>div标签</div>
    <span>span标签</span>
10.表单

表单一:

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>10.表单1</title>
</head>
<body>
    <!--
        form标签
            action      提交地址
            method      请求方式(get或post,默认get)
            	get		提交的数据参数在url中,不安全
            	post	提交的数据被加密,url中无法看到,在action中
            enctype="multipart/form-data"   如果提交文件,需要添加这个参数
    -->
    <form action="#" method="post" enctype="multipart/form-data">

    </form>
</body>
</html>

表单二:

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>10.表单2</title>
</head>
<body>
    <!--
        input标签
            1.文本框   type="text"
            2.密码框   type="password"
            3.单选框   type="radio"
            4.复选框   type="checkbox"
            5.文件框   type="file"
            6.按钮     type="button"
            7.提交     type="submit"
            8.重置     type="reset"
    -->
    <form action="#" method="post" enctype="multipart/form-data">
        1.用户名(文本框text):
            <input type="text" name="username">
        <hr/>
        2.密码(密码框password):<input type="password" name="password" value="">
        <hr/>
        3.性别(单选框radio):
            男<input type="radio" name="gender" value="0">
            女<input type="radio" name="gender" value="1">
        <hr/>
        4.爱好(复选框checkbox):
            学Web<input type="checkbox" name="hobby" value="web">
            学爬虫<input type="checkbox" name="hobby" value="spider">
        <hr/>
        5.上传头像(文件框file):
            <input type="file" name="img">
        <hr/>
        6.按钮(button):
            <input type="button" value="空按钮">
        <hr/>
        7.提交(submit):
            <input type="submit" value="提交按钮">
        <hr/>
        8.重置(reset):
        <input type="reset" value="重置按钮">
        <hr/>
    </form>
</body>
</html>

表单三:

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>10.表单3</title>
</head>
<body>
    <!--
        下拉框:select和option
        大文本:textarea
            cols    列数
            rows    行数
    -->
    <form action="#" method="post" enctype="multipart/form-data">
        <select name="year">
            <option value="2019">2019</option>
            <option value="2018">2018</option>
        </select>
        <textarea name="comment" cols="30" rows="10"></textarea>
    </form>
</body>
</html>

二、CSS

CSS是Cascading Style Sheets(层叠样式表)的缩写。
CSS不仅可以静态地修饰网页,还可以配合各种脚本语言动态地对网页各元素进行格式化。

CSS的语法

格式:
属性:属性值;
例如:
设置背景颜色为蓝色:
background-color:blue;

CSS的引入方式

  • 内嵌式:
<div style="background-color: blue"></div>
  • 内部式:
<style type="text/css">
	/* css代码 */
</style>
  • 外部式:
<link rel="stylesheet" type="text/css" href="css文件地址">

CSS的选择器

    <style type="text/css">
    	/*
    		标签选择器:【标签名】 {};
			ID选择器:#【ID值】{};
			类选择器:.【类名】{};
		*/
        body{
            /*background-color: grey;*/
            background-image: url("1.png");
            background-repeat: no-repeat;
        }
        #div_id1{
            background-color: red;
            font-size: 72px;
            font-weight: lighter;
        }
        .div_class1{
            background-color: green;
            border:solid 1px yellow;
        }
    </style>

CSS的常用样式

  • 背景颜色:backgroud-color:颜色;
  • 背景图片:background-image:url(图片地址);
  • 图片平铺:background-repeat:
    • repeat 水平垂直都平铺(默认)
    • repeat-x 水平平铺
    • repeat-y 垂直平铺
    • no-repeat 不平铺
  • 边框:border:边框类型,尺寸,颜色;

三、JavaScript

JavaScript一种直译式脚本语言,是一种动态类型、弱类型、基于原型的语言,内置支持类型。它的解释器被称为JavaScript引擎,为浏览器的一部分,广泛用于客户端的脚本语言,最早是在HTML网页上使用,用来给HTML网页增加动态功能。

JavaScript的引入方式

  • 内嵌式:
<script type="text/javascript">
	/*
		js代码
	*/
	// alert(【对话框内容】);
	alert(‘你好,JavaScript‘);
</script>
  • 外部式:
<script type="text/javascript" src="myjs.js"></script>

四、JQuery

JQuery的引入

官方网站下载JQuery,然后引入:

<head>
<script type="text/javascript" src="【本地JQuery地址】"></script>
</head>

JQuery的选择器

JQuery的对象

  • JQuery对象习惯性采用$开口,例如:
	$div = $("div");
  • JQuery对象的格式是[Object]
	jsObject = $jqueryObject[0];
	jsObject = $jqueryObject.get(0);
  • JQuery对象转JS对象
	$jqueryObject = $(jsObject);

JQuery事件

<body>
    <input type="button" value="按钮" id="button_id">
    <script type="text/javascript">
        //1.得到按钮对象
        $buttonElement = $(‘#button_id‘);
        //2.绑定点击事件
        // $buttonElement.click(function(){
        //     alert(‘按钮被点击了‘)
        // });
        $buttonElement.click(function(){
            alert(‘按钮被点击了‘);
        });
    </script>
</body>

JQuery动画

<body>
    <input type="button" value="隐藏" id="button_hide">
    <input type="button" value="显示" id="button_show">

    <ul id="ul_id">
        <li>Python</li>
        <li>Java</li>
    </ul>

    <script type="text/javascript">
        // 1.得到两个按钮对象
        $button_hide = $(‘#button_hide‘);
        $button_show = $(‘#button_show‘);
        // 2.得到ul对象
        $ul = $(‘#ul_id‘);

        // 隐藏
        $button_hide.click(function(){
            $ul.hide("slow");
        });

        // 显示
        $button_show.click(function(){
            $ul.show("slow");
        });

    </script>
</body>


注意:speed:slow、normal、fast

原文地址:https://www.cnblogs.com/WoLykos/p/12069947.html

时间: 2024-10-10 23:02:29

Python爬虫基础——HTML、CSS、JavaScript、JQuery网页前端技术的相关文章

python爬虫(二):向网页提交数据

python爬虫(二):向网页提交数据 回忆一下,我们有的时候在看一些网站的时候,是否遇见过一些网站里面的信息开始显示一部分,然后当我们把鼠标滑轮向下拉动后,又显示出一些信息.这就是异步加载.我的上一篇文章python爬虫百度贴吧标题数据爬取的所有标题都是页面已经加载好的.但是对于这种开始没有加载好的数据我们应该如何爬取呢? 接下来我们先介绍下一些概念: 异步加载:举个简单的例子就是说,假如老师判作业,有两种情况,第一种就是无论哪个学生先写完,都等待到所有的同学全部写完,老师讲所有的作业都收齐后

python爬虫-基础入门-爬取整个网站《3》

python爬虫-基础入门-爬取整个网站<3> 描述: 前两章粗略的讲述了python2.python3爬取整个网站,这章节简单的记录一下python2.python3的区别 python2.x 使用类库: >> urllib 库 >> urllib2 库 python3.x 使用的类库: >> urllib 库 变化: -> 在python2.x中使用import urllib2 ----- 对应的,在python3.x 中会使用import url

Python爬虫基础之requests

一.随时随地爬取一个网页下来 怎么爬取网页?对网站开发了解的都知道,浏览器访问Url向服务器发送请求,服务器响应浏览器请求并返回一堆HTML信息,其中包括html标签,css样式,js脚本等.我们之前用的是Python标准基础库Urllib实现的, 现在我们使用Python的Requests HTTP库写个脚本开始爬取网页.Requests的口号很响亮“让HTTP服务人类“,够霸气. 二.Python Requests库的基本使用 1.GET和POST请求方式 GET请求 1 import re

Python 爬虫基础

下面是一个 Python 爬虫最简单的例子,使用网络库 urllib2 和正则表达式库 re,模拟浏览器的 User-Agent. #!/usr/bin/env python # -*- coding: utf-8 -*- #引入基础网络库 import urllib2 #引入正则表达式模块 import re #模拟User-Agent headers = {'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWe

Java(随笔)——利用HTML,CSS,JavaScript,JQuery编写的简易计算器

一.利用刚学过的前端知识做一个简易的计算器里边使用到了HTML,CSS,JavaScript以及JQuery的知识代码如下:(1)利用CSS设计了计算器外形样式:(2)利用JavaScript实现了建议计算器的功能:代码: <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>简易计算器</title> <link rel="styl

Python爬虫基础知识及前期准备

学习爬虫有一小段时间了,于是决定把自己学爬虫时所学的,写过的代码以及看过的文档记录下来,权当小结.第一次写这些,如果有错误,请多指教. 首先我们需要了解一下什么是爬虫. 根据百度百科上给出的定义," 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本."简单来说,爬虫类似手动下载网页信息,比如小说.歌曲.说到这,或许会有疑问,既然这样,干嘛还去敲代码,直接人工处理不好吗?话是这么说,但如果下载的

Python爬虫基础知识入门一

一.什么是爬虫,爬虫能做什么 爬虫,即网络爬虫,大家可以理解为在网络上爬行的一直蜘蛛,互联网就比作一张大网,而爬虫便是在这张网上爬来爬去的蜘蛛咯,如果它遇到资源,那么它就会抓取下来.比如它在抓取一个网页,在这个网中他发现了一条道路,其实就是指向网页的超链接,那么它就可以爬到另一张网上来获取数据. 爬虫可以抓取的某个网站或者某个应用的内容,提取有用的价值.也可以模拟用户在浏览器或者App应用上的操作,实现自动化的程序.以下行为都可以用爬虫实现: 咨询报告(咨询服务行业) 抢票神器 投票神器 预测(

selenium使用Xpath+CSS+JavaScript+jQuery的定位方法(治疗selenium各种定位不到,点击不了的并发症)

[第一部分]开篇:先认识Xpath的4种定位方法 跟你说,你总是靠那个firebug,chrome的F12啥的右击复制xpath绝对总有一天踩着地雷炸的你死活定位不到,这个时候就需要自己学会动手写xpath,人脑总比电脑聪明,开始把xpath语法给我学起来! 第1种方法:通过绝对路径做定位(相信大家不会使用这种方式) By.xpath("html/body/div/form/input") By.xpath("//input") 第2种方法:通过元素索引定位 By.

python爬虫基础02-urllib库

Python网络请求urllib和urllib3详解 urllib是Python中请求url连接的官方标准库,在Python2中主要为urllib和urllib2,在Python3中整合成了urllib. 官方文档链接为:https://docs.python.org/3/library/urllib.html 而urllib3则是增加了连接池等功能,两者互相都有补充的部分. urllib 它是 Python 内置的 HTTP 请求库,也就是说我们不需要额外安装即可使用,基本上涵盖了基础的网络请