文档章节

BeatifulSoup学习

Smithermin
 Smithermin
发布于 2017/05/27 20:54
字数 199
阅读 1
收藏 0

Tag对象

soup = BeautifulSoup('<b class="boldest">Extremely bold</b>')
tag = soup.b
type(tag)
# <class 'bs4.element.Tag'>

b就是一个tag

tag.name
>>>u'b'
tag.name = "blockquote"
tag.nmae 
>>>u'blockquote'

一个tag可能有很多个属性. tag <b class="boldest"> 有一个 “class” 的属性,值为 “boldest” . tag的属性的操作方法与字典相同:

tag['class']
# u'boldest'

也可以直接”点”取属性, 比如: .attrs :

tag.attrs
# {u'class': u'boldest'}

tag的属性可以被添加,删除或修改. 再说一次, tag的属性操作方法与字典一样

tag['class'] = 'verybold'
tag['id'] = 1
tag
# <blockquote class="verybold" id="1">Extremely bold</blockquote>

del tag['class']
del tag['id']
tag
# <blockquote>Extremely bold</blockquote>

tag['class']
# KeyError: 'class'
print(tag.get('class'))
# None

多值属性

在htlm中

css_soup = BeautifulSoup('<p class="body strikeout"></p>')
css_soup.p['class']
# ["body", "strikeout"]

css_soup = BeautifulSoup('<p class="body"></p>')
css_soup.p['class']
# ["body"]

在xml中却是

xml_soup = BeautifulSoup('<p class="body strikeout"></p>', 'xml')
xml_soup.p['class']
# u'body strikeout'

本文转载自:https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html

Smithermin
粉丝 0
博文 4
码字总数 0
作品 0
武汉
私信 提问
ubuntu12.04 安装BeautifulSoup遇到的问题

root@ubuntu :/home/chris# apt-get install python-setuptools Reading package lists... Done Building dependency tree Reading state information... Done The following packages were ......

durban
2012/05/18
1K
0
python---easy_install 安装软件 及BeautifulSoup 中文乱码

安装easyinstall工具 使用ezsetup.py脚本方便安装: 安装Mechanize 和 BeautifulSoup,可以执行如下命令,系统会自动在pypi网站列表里查找相关软件包: easyinstall Mechanize easyinstall ...

durban
2012/04/10
991
0
用23行代码爬取豆瓣音乐top250

学习.png 网上有各种爬取豆瓣电影top250的教程,虽然豆瓣音乐top250和豆瓣电影top250的爬取十分类似,但是我大致对比了一下,我这种方法应该是最简单的,仅需要23行代码。 豆瓣对于爬虫十分友...

爱吃西瓜的番茄酱
2017/12/19
0
0
python利用beautifulsoup+selenium自动翻页抓取网页内容

python利用beautifulsoup+selenium自动翻页抓取网页内容 Uncle Chen2016-12-11446 阅读 python技术爬虫 一、背景 记录一次周末在家速成的爬虫实现之旅。受人之托,想要把这个页面 http://bai...

Uncle Chen
2016/12/11
0
0
你是如何开始能写python爬虫?

忘记写id了 再编辑一下 镇楼图id=58504168)动机十分简单!因为想下载p站的图片!!!python以前学过没用起来,然后为了实现这个目标又把python的教程全部看了一遍(哭)期间熟练了py,get到...

红牛王
2017/05/24
259
0

没有更多内容

加载失败,请刷新页面

加载更多

mysql概览

学习知识,首先要有一个总体的认识。以下为mysql概览 1-架构图 2-Detail csdn |简书 | 头条 | SegmentFault 思否 | 掘金 | 开源中国 |

程序员深夜写bug
今天
9
0
golang微服务框架go-micro 入门笔记2.2 micro工具之微应用利器micro web

micro web micro 功能非常强大,本文将详细阐述micro web 命令行的功能 阅读本文前你可能需要进行如下知识储备 golang分布式微服务框架go-micro 入门笔记1:搭建go-micro环境, golang微服务框架...

非正式解决方案
今天
6
0
前端——使用base64编码在页面嵌入图片

因为页面中插入一个图片都要写明图片的路径——相对路径或者绝对路径。而除了具体的网站图片的图片地址,如果是在自己电脑文件夹里的图片,当我们的HTML文件在别人电脑上打开的时候图片则由于...

被毒打的程序猿
今天
8
0
Flutter 系列之Dart语言概述

Dart语言与其他语言究竟有什么不同呢?在已有的编程语言经验的基础上,我们该如何快速上手呢?本篇文章从编程语言中最重要的组成部分,也就是基础语法与类型变量出发,一起来学习Dart吧 一、...

過愙
今天
5
0
rime设置为默认简体

转载 https://github.com/ModerRAS/ModerRAS.github.io/blob/master/_posts/2018-11-07-rime%E8%AE%BE%E7%BD%AE%E4%B8%BA%E9%BB%98%E8%AE%A4%E7%AE%80%E4%BD%93.md 写在开始 我的Arch Linux上......

zhenruyan
今天
5
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部