如何设置Python爬虫定时任务
首先最容易的是while true死循环挂起,不废话,直接上代码:
import os
import time
import sys
from datetime import datetime, timedelta
def One_Plan():
# 设置启动周期
Second_update_time = 24 * 60 * 60
# 当前时间
now_Time = datetime.now()
# 设置 任务启动时间
plan_Time = now_Time.replace(hour=9, minute=0, second=0, microsecond=0)
# 设置差值,-1 day, 21:48:53.246576,类似于这样
# time.sleep()需要传入int,所以下面使用.total_seconds()
# 主要用来计算差值,返回int,具体功能可以自行查阅相关资料
delta = plan_Time - now_Time
first_plan_Time = delta.total_seconds() % Second_update_time
print("距离第一次执行需要睡眠%d秒" % first_plan_Time)
return first_plan_Time
# while Ture代码块,挂起程序,睡眠时间结束后调用函数名进行执行
while True:
s1 = One_Plan()
time.sleep(s1)
# 下面这里是自己定义的函数,想跑代码的可以换成hellow world函数或者注释掉这行测试下
exe_file(D_list)
print("正在执行首次更新程序")
from datetime import datetime
from threading import Timer
import time
# 定时任务
def task():
print(datetime.now().strftime("%Y-%m-%d %H:%M:%S"))
def timedTask():
'''
第一个参数: 延迟多长时间执行任务(秒)
第二个参数: 要执行的函数
第三个参数: 调用函数的参数(tuple)
'''
Timer(5, task, ()).start()
while True:
timedTask()
time.sleep(5)
7行代码,是不是很优雅?优不优雅的主要是代码少,不费劲对吧。
2020-06-05 14:06:39
2020-06-05 14:06:44
2020-06-05 14:06:49
2020-06-05 14:06:54
2020-06-05 14:06:59
2020-06-05 14:07:04
2020-06-05 14:07:09
2020-06-05 14:07:14
2020-06-05 14:07:19
2020-06-05 14:07:24
from datetime import datetime
import sched
import time
def timedTask():
# 初始化 sched 模块的 scheduler 类,传入(time.time, time.sleep)这两个参数
scheduler = sched.scheduler(time.time, time.sleep)
# 增加调度任务,enter(睡眠时间,执行级别,执行函数)
scheduler.enter(5, 1, task)
# 运行任务
scheduler.run()
# 定时任务
def task():
print(datetime.now().strftime("%Y-%m-%d %H:%M:%S"))
if __name__ == '__main__':
timedTask()
import schedule
import time
def hellow():
print('hellow')
def Timer():
schedule.every().day.at("09:00").do(hellow)
schedule.every().day.at("18:00").do(hellow)
while True:
schedule.run_pending()
time.sleep('需要睡眠的周期')
Timer()
在这里可以看到,有day-hour-minute,定时任务非常的方便,在while True里添加需要睡眠的时间,在函数模块内添加需要执行的次数即可。
推荐阅读
欢迎长按扫码关注「数据管道」
评论