BeautifulSoup如何解析XML文档中的XML NMTOKEN属性 - 问答

要解析XML文档中的XML NMTOKEN属性，可以使用BeautifulSoup库中的find()或find_all()方法来查找具有特定属性的标签，并使用get()方法来获取该属性的值。

例如，假设XML文档如下所示：

<bookstore>
  <book id="1" title="Python Programming">
    <author>Nicole Smith</author>
  </book>
  <book id="2" title="JavaScript Basics">
    <author>John Doe</author>
  </book>
</bookstore>

要找到所有具有id属性的book标签，可以使用以下代码来解析XML文档并获取id属性的值：

from bs4 import BeautifulSoup

xml_doc = """
<bookstore>
  <book id="1" title="Python Programming">
    <author>Nicole Smith</author>
  </book>
  <book id="2" title="JavaScript Basics">
    <author>John Doe</author>
  </book>
</bookstore>
"""

soup = BeautifulSoup(xml_doc, 'xml')
books = soup.find_all('book')

for book in books:
    book_id = book.get('id')
    print(f"Book ID: {book_id}")

运行上述代码将输出：

Book ID: 1
Book ID: 2

这样就可以成功解析XML文档中的XML NMTOKEN属性。

0 赞

0 踩