代码拉取完成,页面将自动刷新
import pandas as pd
from datetime import datetime
def datelist(beginDate, endDate):
# beginDate, endDate是形如‘20160601’的字符串或datetime格式
date_l = [datetime.strftime(x, '%Y-%m-%d') for x in list(pd.date_range(start=beginDate, end=endDate))]
# print( date_l)
return date_l
if __name__ == '__main__':
dateList = datelist('20070101', '20220816')
filter_list = []
for i in range(0, len(dateList)):
#每隔一天 分一段
if (i % 1 == 0):
filter_list.append(dateList[i].replace('-', ''))
#倒序
filter_list.reverse()
target_url_list = []
# 跳过最后一个 --> len() -1
for i in range(0, len(filter_list) - 1):
origin_url_part_1 = 'https://www.nytimes.com/search?dropmab=true&endDate='
origin_url_part_2 = '&query=&sort=best&startDate='
target_url = origin_url_part_1 + filter_list[i] + origin_url_part_2 + filter_list[i + 1]
target_url_list.append(target_url)
print(target_url_list)
with open('resource/start_domain_url_list.txt', 'w') as f:
for url in target_url_list:
f.write(str(url))
f.write('\n')
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。