PyQuery是一个类似于jQuery的Python库,它提供了一种可用于解析和操作HTML文档的强大工具。下面是使用PyQuery库的详细说明:
安装PyQuery
PyQuery库可以通过pip安装。在终端中运行以下命令即可安装:
pip install pyquery
导入PyQuery
要使用PyQuery,需要导入该库。可以使用以下代码导入PyQuery:
from pyquery import PyQuery as pq
获取HTML文档
使用pq()
函数初始化HTML文档,可以从以下几种不同的来源获取HTML文档:
- URL
- 文件
- 字符串
以下是示例:
从URL获取HTML文档
doc = pq(url='http://www.baidu.com')
print(doc('title'))
从文件获取HTML文档
doc = pq(filename='example.html')
print(doc('title'))
从字符串获取HTML文档
doc = pq('<html><head><title>PyQuery Example</title></head><body><h1>Hello, world!</h1></body></html>')
print(doc('title'))
使用PyQuery选择器
可以使用PyQuery选择器在HTML文档中找到所需的内容。选择器类似于jQuery选择器。以下是一些示例:
标签选择器
doc = pq('<html><head><title>PyQuery Example</title></head><body><h1>Hello, world!</h1></body></html>')
print(doc('h1'))
类选择器
doc = pq('<html><head><title>PyQuery Example</title></head><body><h1 class="title">Hello, world!</h1></body></html>')
print(doc('.title'))
ID选择器
doc = pq('<html><head><title>PyQuery Example</title></head><body><h1 id="main-title">Hello, world!</h1></body></html>')
print(doc('#main-title'))
属性选择器
doc = pq('<html><head><title>PyQuery Example</title></head><body><a href="http://www.baidu.com">Baidu</a></body></html>')
print(doc('a[href="http://www.baidu.com"]'))
操作HTML文档
PyQuery也可以用来修改HTML文档。以下是一些示例:
获取文本
doc = pq('<html><head><title>PyQuery Example</title></head><body><h1>Hello, world!</h1></body></html>')
print(doc('h1').text())
获取属性
doc = pq('<html><head><title>PyQuery Example</title></head><body><a href="http://www.baidu.com">Baidu</a></body></html>')
print(doc('a').attr('href'))
添加元素
doc = pq('<html><head><title>PyQuery Example</title></head><body><h1>Hello, world!</h1></body></html>')
doc('body').append('<p>This is a paragraph.</p>')
print(doc)
删除元素
doc = pq('<html><head><title>PyQuery Example</title></head><body><h1>Hello, world!</h1><p>This is a paragraph.</p></body></html>')
doc('p').remove()
print(doc)
以上是PyQuery库的使用攻略。
本文链接:https://my.lmcjl.com/post/13827.html
展开阅读全文
4 评论