【python爬虫学习笔记】selenium 的简单使用
selenium 的简单使用 selenium文档地址:https://selenium-python.readthedocs.io/installation.html 声明 from selenium import webdriver ...
selenium 的简单使用 selenium文档地址:https://selenium-python.readthedocs.io/installation.html 声明 from selenium import webdriver ...
selenium常用的一些启动参数如下 from selenium import webdriver # 创建对象 chrome_options = ChromeOptions() # 添加启动参数 chrome_options.add_a...
MongoDB安装过程中的几个命令 启动命令 net start MongoDB 安装命令,会生成MongoDB的服务 mongod –dbpath “D:\MongoDB\data\db” –...
查找子节点 from pyquery import PyQuery as pq #需要安装 pyquery 库 doc = pq(html) items = doc('.list') print(type(items)) print(ite...
模 式 描 述 \w 匹配字母、数字及下划线 \W 匹配不是字母、数字及下划线的字符 \s 匹配任意空白字符,等价于 [\t\n\r\f] \S 匹配任意非空字符 \d 匹配任意数字,等价于 [0~9] \D 匹配任意非数字的字符 \A...
注:以下为崔庆才的《52讲轻松搞定网络爬虫》拉钩课程的笔记 发送GET请求,无参数 import requests r = requests.get('http://httpbin.org/get') print(r.text) 发送GET...
以下是Requests提供的内置状态码: 信息性状态码 100: (‘continue’,), 101: (‘switching_protocols’,), 102: (‘proc...
Session Session 在服务端,Session 对象用来存储特定用户 Session 所需的属性及配置信息; Cookies Cookies 指某些网站为了辨别用户身份、进行 Session 跟踪而存储在用户本地终端上的数据。 C...
记录下学习python爬虫的笔记,摘自:崔庆才的《52讲轻松搞定网络爬虫》 打开网页,F12开发者模式下,NetWork列表里面的各列的含义: Name:请求的名称。 Status:响应的状态码。 Type:请求的文档类型。 Initiat...