盘点URLError和HTTPError异常处理方式

共 3676字,需浏览 8分钟

 ·

2024-04-11 04:53

点击上方“ Python爬虫与数据挖掘 ”,进行关注

回复“ 书籍 ”即可获赠Python从入门到进阶共10本电子书

不堪玄鬓影,来对白头吟。

一、前言

本文主要说URLError 还有 HTTPError,以及一些处理方式。


二、URLError

1. 解释下 URLError 可能产生的3个原因:

      
        
          # 1. 网络无连接,即本机无法上网。
        
      
      
        
          
# 2. 连接不到特定的服务器。
# 3. 服务器不存在。

2. 案例

例:

在代码中,需要用 try-except 语句来包围并捕获相应的异常。

      
        
          # coding:UTF8
        
      
      
        
          
import urllib.request
request = urllib.request.urlopen("http://www.baidu.com")
try: urllib.request.urlopen(request) print("[Errno 11004] getaddrinfo failed") except urllib.URLError as e: print(e.reason)

利用了 urlopen 方法访问了一个不存在的网址。

运行结果:

673979f5994345accb75a448df88c0b5.webp

注:

它说明了错误代号是11004,错误原因是 getaddrinfo failed。


三、HTTPError

HTTPError 是 URLError 的子类,在利用 urlopen 方法发出一个请求时,服务器上都会对应一个应答对象 response,其中它包含一个数字”状态码”。

例:

捕获的异常是 HTTPError,它会带有一个 code 属性,就是错误代号,另外又打印了 reason 属性,这是它的父类 URLError 的属性。

      
        import urllib2
      
      
        req = urllib2.Request('http://blog.csdn.net/cqcre')
      
      
        try:
      
      
            urllib2.urlopen(req)
      
      
        except urllib2.HTTPError, e:
      
      
            print e.code
      
      
            print e.reason
      
    

运行结果:

fe8e2936f4649900a1609814f0688ce2.webp

1. 代码解析

错误代号是 403,错误原因是 Forbidden,说明服务器禁止访问。

知道,HTTPError 的父类是 URLError,根据编程经验,父类的异常应当写到子类异常的后面,如果子类捕获不到,那么可以捕获父类的异常,

2. 优化代码

      
        import urllib2
      
      
        req = urllib2.Request('http://blog.csdn.net/cqcre')
      
      
        try:
      
      
            urllib2.urlopen(req)
      
      
        except urllib2.HTTPError, e:
      
      
            print e.code
      
      
        except urllib2.URLError, e:
      
      
            print e.reason
      
      
        else:
      
      
            print "OK"  
      
    

031187774e89533882cb3dd7607e2a56.webp

如果捕获到了 HTTPError,则输出 code,不会再处理 URLError 异常。如果发生的不是HTTPError,则会去捕获 URLError 异常,输出错误原因。

另外还可以加入 hasattr 属性提前对属性进行判断,代码改写如下

      
        import urllib2
      
      
        req = urllib2.Request('http://blog.csdn.net/cqcre')
      
      
        try:
      
      
            urllib2.urlopen(req)
      
      
        except urllib2.URLError, e:
      
      
            if hasattr(e,"code"):
      
      
                print e.code
      
      
            if hasattr(e,"reason"):
      
      
                print e.reason
      
      
        else:
      
      
            print "OK"  
      
    

b9232ed8e4d7250d284b90ab8f8e6ee5.webp

3. 异常处理方法

  1. 首先对异常的属性进行判断,以免出现属性输出报错的现象

  2. 假如 response 是一个”重定向”,需定位到别的地址获取文档,urllib2 将对此进行处理。

注 :

HTTPError 实例产生后会有一个 code 属性,这就是是服务器发送的相关错误号。

因为 urllib2 可以为处理重定向,也就是 3 开头的代号可以被处理,并且 100-299 范围的号码指示成功,所以只能看到 400-599 的错误号码。


四、总结

本文基于基础,通过案例的分析,代码的展示。解决在实际应用中,对于URLError空异常的处理方式。介绍了两种主要的异常错误。以及提供了相应错误的解决方案处理方法。

欢迎大家积极尝试,有时候看到别人实现起来很简单,但是到自己动手实现的时候,总会有各种各样的问题,切勿眼高手低,勤动手,才可以理解的更加深刻。

使用语言,能够让读者更清晰,更直观的理解文章内容。代码很简单,希望对学习有帮助。

------------------- End -------------------

往期精彩文章推荐:

欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持

想加入Python学习群请在后台回复【 入群

万水千山总是情,点个【 在看 】行不行

/今日留言主题/

随便说一两句吧~

浏览 4
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报