广州北大青鸟计算机职业培训学校
互联网技术培训、软件技术培训、大数据培训、云计算培训、数据分析培训信息网
当前位置:网站首页 > 软件教程 > Python技术 > 正文

Python urllib库使用详解_惠州Python培训

作者:黄君发布时间:2020-12-19分类:Python技术浏览:909


导读:urllib 是 Python 的标准库模块,它可以处理客户端的请求和服务器端的响应,还可以解析 URL 地址。常用的模块为 request 和 parse。

urllib 是 Python 的标准库模块,它可以处理客户端的请求和服务器端的响应,还可以解析 URL 地址。常用的模块为 request 和 parse。

request 模块是使用 socket 读取网络数据的接口,支持 HTTP、FTP 及 gopher 等连接。

1. request.urlopen()

要读取一个网页文件,可以使用 urlopen() 方法。其语法如下:

urllib.request.urlopen(url [, data])

其中,参数 url 是一个 URL 字符串;参数 data 用来指定一个 GET 请求。

urlopen() 方法返回一个 stream 对象(流式对选哪个),可以使用 file 对象的方法来操作此 stream 对象。


2. urllib.parse解析模块

parse 模块解析 URL 字符串并返回一个元组:(addressing scheme, netword location, path,parameters, query, fragment identifier)。parse 模块可以将 URL 分解成数个部分,并能组合回来,还可以将相对地址转换为绝对地址。

parse 模块的方法列表如下:

1) urlparse(urlstring [, default_scheme [, allow_fragments]])

将一个 URL 字符串分解成 6 个元素,即 addressing scheme、netword location、path、parameters、query、fragment identifier。若设置 default_scheme 数,则指定 addressing scheme;若设置参数 allow_fragments 为 0,则不允许 fragment identifier。


2) urlunparse(tuple)

使用 tuple 创建一个 URL 字符串。


3) urljoin(base, url [, allow_fragments])

使用 base 与 url 创建一个绝对 URL 地址。


3. urllib库的其他方法

urllib 模块的方法列表如下:

1) urlretrieve(url [, filename [, reporthook [, data]]])

将一个网络对象 url 复制到本机文件 filename上。其中,参数 reporthook 是一个 hook 函数,在网络连接完成时,会调用此 hook 函数一次,在每读取一个区块后,也会调用此 hook 函数一次;参数 data 必须是 application/x-www-form-urlencoded 格式。


2) urlcleanup()

清除 urlretrieve() 方法所使用的高速缓存。


3) quote(string [, safe])

将字符串 string 中的特殊字符用 %xx 码取代。参数 safe 设置要引用的额外字符。


4) quote_plus(string [, safe])

与 quote() 方法相同,但是字符串中的空白将以加号(+)取代。


5) unquote(string)

返回原始字符串。


标签:惠州北大青鸟惠州JAVA培训惠州IT培训惠州软件培训惠州软件开发惠州Python培训惠州计算机培训


Python技术排行
标签列表
网站分类
文章归档
最近发表