怎么使用BeautifulSoup处理HTML中的微格式 - 问答

要处理HTML中的微格式，可以使用BeautifulSoup库解析HTML文档，并使用其提供的方法来提取所需的微格式信息。

以下是一个简单的示例，演示如何使用BeautifulSoup处理HTML中的微格式：

from bs4 import BeautifulSoup

# 假设HTML文档为以下内容
html = """
<html>
<head>
<title>示例微格式</title>
</head>
<body>
<div class="vcard">
  <span class="fn">张三</span>
  <span class="org">ABC 公司</span>
  <span class="tel">1234567890</span>
</div>
</body>
</html>
"""

# 使用BeautifulSoup解析HTML文档
soup = BeautifulSoup(html, 'html.parser')

# 查找class为vcard的div标签
vcard = soup.find('div', class_='vcard')

# 提取微格式信息
name = vcard.find('span', class_='fn').text
company = vcard.find('span', class_='org').text
tel = vcard.find('span', class_='tel').text

# 输出微格式信息
print("姓名: ", name)
print("公司: ", company)
print("电话: ", tel)

在上面的示例中，我们首先使用BeautifulSoup解析HTML文档，然后通过查找具有相应类名的元素来提取微格式信息。最后，我们打印出提取的微格式信息。

通过这种方法，您可以轻松地处理HTML中的微格式信息，并将其用于您的项目中。

0 赞

0 踩