20. 结构化标记处理工具¶
Python 支持各种模块,以处理各种形式的结构化数据标记。 这包括使用标准通用标记语言(SGML)和超文本标记语言(HTML)的模块,以及使用可扩展标记语言(XML)的几个接口。
- 20.1.
html
— 超文本标记语言支持 - 20.2.
html.parser
— 简单的 HTML 和 XHTML 解析器 - 20.3.
html.entities
— HTML 一般实体的定义 - 20.4. XML处理模块
- 20.5.
xml.etree.ElementTree
— The ElementTree XML API - 20.6.
xml.dom
— The Document Object Model API- 20.6.1. 模块内容
- 20.6.2. Objects in the DOM
- 20.6.2.1. DOMImplementation Objects
- 20.6.2.2. Node Objects
- 20.6.2.3. NodeList Objects
- 20.6.2.4. DocumentType Objects
- 20.6.2.5. Document Objects
- 20.6.2.6. Element Objects
- 20.6.2.7. Attr Objects
- 20.6.2.8. NamedNodeMap Objects
- 20.6.2.9. Comment Objects
- 20.6.2.10. Text and CDATASection Objects
- 20.6.2.11. ProcessingInstruction Objects
- 20.6.2.12. 异常
- 20.6.3. Conformance
- 20.7.
xml.dom.minidom
— Minimal DOM implementation - 20.8.
xml.dom.pulldom
— Support for building partial DOM trees - 20.9.
xml.sax
— Support for SAX2 parsers - 20.10.
xml.sax.handler
— Base classes for SAX handlers - 20.11.
xml.sax.saxutils
— SAX Utilities - 20.12.
xml.sax.xmlreader
— Interface for XML parsers - 20.13.
xml.parsers.expat
— Fast XML parsing using Expat