BeautifulSoup的成员结构

>>> dir(soup)
[‘ASCII_SPACES‘, ‘DEFAULT_BUILDER_FEATURES‘, ‘HTML_FORMATTERS‘, ‘ROOT_TAG_NAME‘,
‘XML_FORMATTERS‘, ‘__bool__‘, ‘__call__‘, ‘__class__‘, ‘__contains__‘, ‘__delat
tr__‘, ‘__delitem__‘, ‘__dict__‘, ‘__dir__‘, ‘__doc__‘, ‘__eq__‘, ‘__format__‘,
‘__ge__‘, ‘__getattr__‘, ‘__getattribute__‘, ‘__getitem__‘, ‘__gt__‘, ‘__hash__‘
, ‘__init__‘, ‘__iter__‘, ‘__le__‘, ‘__len__‘, ‘__lt__‘, ‘__module__‘, ‘__ne__‘,
‘__new__‘, ‘__reduce__‘, ‘__reduce_ex__‘, ‘__repr__‘, ‘__setattr__‘, ‘__setitem
__‘, ‘__sizeof__‘, ‘__str__‘, ‘__subclasshook__‘, ‘__unicode__‘, ‘__weakref__‘,
‘_all_strings‘, ‘_attr_value_as_string‘, ‘_attribute_checker‘, ‘_feed‘, ‘_find_a
ll‘, ‘_find_one‘, ‘_formatter_for_name‘, ‘_is_xml‘, ‘_lastRecursiveChild‘, ‘_las
t_descendant‘, ‘_most_recent_element‘, ‘_popToTag‘, ‘_select_debug‘, ‘_selector_
combinators‘, ‘_should_pretty_print‘, ‘_tag_name_matches_and‘,
‘append‘, ‘attribselect_re‘, ‘attrs‘, ‘builder‘, ‘can_be_empty_element‘, ‘childGenerator‘, ‘children‘, ‘clear‘, ‘contains_replacement_characters‘, ‘contents‘, ‘currentTag‘,
‘current_data‘, ‘declared_html_encoding‘, ‘decode‘, ‘decode_contents‘, ‘decompose‘,‘descendants‘, ‘encode‘, ‘encode_contents‘, ‘endData‘, ‘extract‘, ‘fetchNextSiblings‘,
‘fetchParents‘, ‘fetchPrevious‘, ‘fetchPreviousSiblings‘, ‘find‘, ‘findAll‘, ‘findAllNext‘, ‘findAllPrevious‘, ‘findChild‘, ‘findChildren‘, ‘findNext‘,
‘findNextSibling‘, ‘findNextSiblings‘, ‘findParent‘, ‘findParents‘, ‘findPrevious‘, ‘findPreviousSibling‘, ‘findPreviousSiblings‘, ‘find_all‘, ‘find_all_next‘,
‘find_all_previous‘, ‘find_next‘, ‘find_next_sibling‘, ‘find_next_siblings‘, ‘find_parent‘, ‘find_parents‘, ‘find_previous‘, ‘find_previous_sibling‘, ‘find_previous_siblings‘,
‘format_string‘, ‘get‘, ‘getText‘, ‘get_text‘, ‘handle_data‘, ‘handle_endtag‘, ‘handle_starttag‘, ‘has_attr‘, ‘has_key‘, ‘hidden‘, ‘index‘, ‘insert‘, ‘insert_after‘,
‘insert_before‘, ‘isSelfClosing‘, ‘is_empty_element‘, ‘is_xml‘, ‘markup‘, ‘name‘, ‘namespace‘, ‘new_string‘, ‘new_tag‘, ‘next‘, ‘nextGenerator‘, ‘nextSibling‘, ‘nextSiblingGenerator‘,
‘next_element‘, ‘next_elements‘, ‘next_sibling‘, ‘next_siblings‘, ‘object_was_parsed‘, ‘original_encoding‘, ‘parent‘, ‘parentGenerator‘, ‘parents‘, ‘parse_only‘, ‘parserClass‘,
‘parser_class‘, ‘popTag‘, ‘prefix‘, ‘preserve_whitespace_tag_stack‘, ‘prettify‘, ‘previous‘, ‘previousGenerator‘, ‘previousSibling‘, ‘previousSiblingGenerator‘, ‘previous_element‘,
‘previous_elements‘, ‘previous_sibling‘, ‘previous_siblings‘, ‘pushTag‘, ‘recursiveChildGenerator‘, ‘renderContents‘, ‘replaceWith‘, ‘replaceWithChildren‘, ‘replace_with‘,
‘replace_with_children‘, ‘reset‘, ‘select‘, ‘setup‘, ‘string‘, ‘strings‘, ‘stripped_strings‘, ‘tagStack‘, ‘tag_name_re‘, ‘text‘, ‘unwrap‘, ‘wrap‘]

 
时间: 2024-11-05 23:24:21

BeautifulSoup的成员结构的相关文章

BeautifulSoup学习 之结构

Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种: Tag NavigableString BeautifulSoup Comment ()1).Tag 就是html中的标签,如图所示 代码: html '<title>The Dormouse\'s story</title> <a class="sister" href="http://example.com/elsi

cdev成员结构体file_operations文件操作结构的分析

struct file_operations{ struct module *owner; // 指向拥有该结构的模块的指针,避免正在操作时被卸载,一般为初始化为THIS_MODULES loff_t (*llseek) (struct file *, loff_t, int); // llseek用来修改文件当前的读写位置,返回新位置 // loff_t为一个”长偏移量”.当此函数指针为空,seek调用将会以不可预期的方式修改file结构中的位置计数器. ssize_t (*read) (st

Confluence 6 LDAP 成员结构设置

用户组成员属性(Group Members Attribute) 这个属性字段将在载入用户组成员的时候使用.例如: member 用户成员属性(User Membership Attribute) 这个属性字段将在载入用户组的时候使用.例如: memberOf 当找到用户组成员的时候,使用用户成员属性(Use the User Membership Attribute, when finding the user's group membership) 如果你的目录服务器为用户支持组成员属性的话

c语言中的结构体指针类型的cast

1.我们在c语言中会经常碰到强制类型转换. 在这,我介绍一种结构pointer类型转换,但是有前提(有点类似于c++中的继承中的子父对象的cast). 简单的介绍一下: 首先我们要知道一个结构的指针,并且 在这个结构体中,第一个结构成员必须也是一个结构体(最好是结构体类型). 那么我们可以这个结构体指针转换为指向这个结构体中第一个成员结构体的指针. 直接看代码: ************************************ /* struct transform for struct

20170908_郝斌C结构体

为什么要结构体 结构体知识点 1 结构体的赋值和初始化 Struct Student { int age; char gender; float score; }; 2    取出结构体中的每一个成员 结构体.成员 结构体指针变量名->成员 3  结构体变量和结构体指针变量作为函数参数传递时的问题 建议使用结构体指针变量作为函数参数传递 4 结构体变量的运算 相同结构体的不同变量只保留了赋值运算符 st1 = st2 ===============动态学生管理系统============= 链表

C 开发学习 - 结构类型(枚举/结构/类型定义)

一.枚举 定义:枚举是 一种用户定义的数据类型,它用的关键字 enum 枚举类型名字通常并不真的使用,要用的是在大括号里地名字,因为它们就是常量符合,它们的类型是int,值则依次从0到n. enum colors {red, yellow, green} 语法:enum 枚举类型名称{名字0m, ..., 名字n}; 案例一:自动计数的枚举 // // main.c // enum // // Created by liuxinming on 15/4/26. // Copyright (c)

python学习之----BeautifulSoup小示例

BeautifulSoup 库最常用的对象恰好就是BeautifulSoup 对象. from urllib.request import urlopen from bs4 import BeautifulSoup html = urlopen("http://www.pythonscraping.com/pages/page1.html") bsObj = BeautifulSoup(html.read()) print(bsObj.h1) bsObj.tagname只能获取页面中的

[C语言]进阶|结构类型: 枚举, 结构, 类型定义

--------------------------------------------------------------------- 枚举: // main.c #include <stdio.h> const int red = 0; const int yellow = 1; const int green = 2; int main(int argc, const char * argv[]) { /* 常量符号化:用符号而不是具体的数字来表示程序中的数字; 这样看到符号才能知道背

C语言中的结构体,结构体数组

C语言中的结构体是一个小难点,下面我们详细来讲一下:至于什么是结构体,结构体为什么会产生,我就不说了,原因很简单,但是要注意到是结构体也是连续存储的,但要注意的是结构体里面类型各异,所以必然会产生内存对齐的问题.也就是内存里面会有空档. 1.结构体的定义和赋值 结构体是可以直接初始化的,在定义的时候,就可以初始化,而且如果你的结构体中恰好有字符数组的话,这个时候初始化是不错的选择,原因很简单,字符数组只能定义的时候直接初始化 后来就不可以了,后来你就只能用strcpy函数来拷贝初始化了. str