XPath
XPath 是 什么?
XPath(XML Path Language)是一种用于在 XML 文档中定位和提取数据的语言。它是 W3C 的标准,常用于处理和查询 XML 或类似结构化文档(例如 HTML)。
XPath 的主要功能
- 导航:可以通过路径表达式定位 XML 文档中的节点,比如元素、属性或文本内容。
- 查询:支持条件筛选(通过谓词
[]
)、逻辑运算、函数等,用于提取特定数据。 - 灵活性:可以应用于 XML 解析器、HTML 文档(与一些工具如 Selenium 配合使用),或者结合 XSLT 和 XQuery 等技术。
XPath 的常见语法
/
:绝对路径,从根节点开始。- 示例:
/bookstore/book
查找<bookstore>
下的所有<book>
节点。
- 示例:
//
:相对路径,选择文档中符合条件的所有节点。- 示例:
//title
查找所有<title>
节点。
- 示例:
@
:选择属性。- 示例:
//book[@category='fiction']
查找category
属性值为fiction
的<book>
节点。
- 示例:
*
:通配符,选择任意节点。- 示例:
//book/*
查找<book>
节点下的所有子节点。
- 示例:
使用场景
- Web 自动化测试:配合 Selenium 定位 HTML 元素。
- 数据提取:解析 XML 或 HTML,提取目标数据。
- 配置文件解析:读取基于 XML 的配置文件,如 Maven 的
pom.xml
。