BeautifulSoup

BeautifulSoup如何解析XML文档中的XML NMTOKEN属性

小樊
82
2024-05-15 14:36:19
栏目: 编程语言

要解析XML文档中的XML NMTOKEN属性,可以使用BeautifulSoup库中的find()或find_all()方法来查找具有特定属性的标签,并使用get()方法来获取该属性的值。

例如,假设XML文档如下所示:

<bookstore>
  <book id="1" title="Python Programming">
    <author>Nicole Smith</author>
  </book>
  <book id="2" title="JavaScript Basics">
    <author>John Doe</author>
  </book>
</bookstore>

要找到所有具有id属性的book标签,可以使用以下代码来解析XML文档并获取id属性的值:

from bs4 import BeautifulSoup

xml_doc = """
<bookstore>
  <book id="1" title="Python Programming">
    <author>Nicole Smith</author>
  </book>
  <book id="2" title="JavaScript Basics">
    <author>John Doe</author>
  </book>
</bookstore>
"""

soup = BeautifulSoup(xml_doc, 'xml')
books = soup.find_all('book')

for book in books:
    book_id = book.get('id')
    print(f"Book ID: {book_id}")

运行上述代码将输出:

Book ID: 1
Book ID: 2

这样就可以成功解析XML文档中的XML NMTOKEN属性。

0
看了该问题的人还看了