【爬虫】元素定位(xpath、css)

2022-07-29,,,,

1.xpath选择
表达式 说明 举例
nodeName 按节点名选取 form,选取form节点
/ 从根节点选取(绝对路径) /html/body/form/input,选取input节点
// 从任意节点选取(相对路径) //form/input,选取input节点
form//input,选择form元素的后代的所有 input 元素
@ 元素属性 //form/input[@name],选取带有name属性的input节点;
//input[@name=‘username’] ,选取所有name属性为username的input节点;
//input[@*]选择有任何属性的input节点
. 选取当前节点
.. 选取父节点 //input/..
[ ] 如果有多个元素,可以进行筛选 /form/input[1],选择第一个元素
/form/input[2],选择第2个元素
/form/input[last()],选择最后一个元素
/form/input[last()-1],选择倒数第二个元素
* 选择任何节点 /form/*,选择form之后的所有节点
| 或者 //form | //a,选择所有的input和a节点

2.css选择

表达式 说明 举例
#id 通过id选择元素 #username,选择id为username的元素
.class 通过类选择元素 .container ,选择class为container的元素
element 通过元素名选择元素 input,选择所有input元素
[attribute] 通过属性选择元素,选择具有attribute属性的元素
[attribute=value] 通过属性选择元素 [type=“password”],选择type属性为password的元素
a:link,a:visited 选择未被访问、已被访问过的元素
p:empty 选择没有子元素的p元素

本文地址:https://blog.csdn.net/qq_39147299/article/details/109263051

《【爬虫】元素定位(xpath、css).doc》

下载本文的Word格式文档,以方便收藏与打印。