您的位置：网站首页> requests爬虫> 当前文章

封装requests自定义请求函数限制最大请求次数

老董-我爱我家房产SEO2021-11-11189围观,139赞

　　打开1个网页如果出现卡死或者其他问题，正常的人类会再次尝试打开，也就是说请求1个网页如果出现故障会多试几次。同理，爬虫在抓取数据时候请求1个url也应该设置最大请求次数，万一第1次请求恰逢断网那么第2次请求可能就没事了，这样的程序才比较健壮不会遗漏数据。

　　在requests里没找到直接设置最大请求次数的方式，所以需要自行封装，封装需要用到递归！比如如下get请求函数最大会请求3次网页。

# -*- coding: utf-8 -*-
# 获取源码
def get_html(url,retry=2):
    try:
        r = requests.get(url=url,headers=my_header, timeout=10)
    except requests.exceptions.RequestException as e: # 或者 except Exception as e:
        print('请求源码失败', url, e)
        time.sleep(10)
        if retry > 0:
            get_html(url, retry - 1)
    else:
        html = r.text
        return html

　　上述函数执行顺序如下：

　　1、第1次请求，初始retry=2，请求异常会进入异常处理，retry-1变为1，如果第1次请求成功则不进入异常处理顺利返回html。

　　2、第2次请求，此时retry=1，请求异常会进入异常处理，retry-1变为0，如果第2次请求成功则不进入异常处理顺利返回html。

　　3、第3次请求，此时retry=0，请求异常会进入异常处理，此时retry==0停止递归；如果第3次请求成功则不进入异常处理顺利返回html。

很赞哦！

python编程网提示：转载请注明来源www.python66.com。
有宝贵意见可添加站长微信(底部)，获取技术资料请到公众号(底部)。同行交流请加群