跳到主要内容

XPath

XPath 是什么?

XPath(XML Path Language)是一种用于在 XML 文档中定位和提取数据的语言。它是 W3C 的标准,常用于处理和查询 XML 或类似结构化文档(例如 HTML)。

XPath 的主要功能

  1. 导航:可以通过路径表达式定位 XML 文档中的节点,比如元素、属性或文本内容。
  2. 查询:支持条件筛选(通过谓词[])、逻辑运算、函数等,用于提取特定数据。
  3. 灵活性:可以应用于 XML 解析器、HTML 文档(与一些工具如 Selenium 配合使用),或者结合 XSLT 和 XQuery 等技术。

XPath 的常见语法

  • /:绝对路径,从根节点开始。
    • 示例:/bookstore/book 查找 <bookstore> 下的所有 <book> 节点。
  • //:相对路径,选择文档中符合条件的所有节点。
    • 示例://title 查找所有 <title> 节点。
  • @:选择属性。
    • 示例://book[@category='fiction'] 查找 category 属性值为 fiction<book> 节点。
  • *:通配符,选择任意节点。
    • 示例://book/* 查找 <book> 节点下的所有子节点。

使用场景

  • Web 自动化测试:配合 Selenium 定位 HTML 元素。
  • 数据提取:解析 XML 或 HTML,提取目标数据。
  • 配置文件解析:读取基于 XML 的配置文件,如 Maven 的 pom.xml