以下是一个示例代码,用于抓取宁德时代2018-2022年度的财务报表并将其保存在桌面上:
import requests
from bs4 import BeautifulSoup
import os
# 设置保存路径为桌面
desktop_path = os.path.expanduser("~/Desktop")
# 财务报表链接的固定部分
url_prefix = "http://www.catl.com.cn/index.php?m=content&c=index&a=lists&catid=30"
for year in range(2018, 2023):
# 构造当前年份对应的财务报表链接
url = f"{url_prefix}&year={year}"
# 获取页面内容
response = requests.get(url)
soup = BeautifulSoup(response.content, 'html.parser')
# 获取所有附件下载链接
download_links = []
for a_tag in soup.select('ul.attach-list a'):
download_links.append(a_tag.get('href'))
# 下载附件并保存到桌面
for link in download_links:
file_name = os.path.basename(link)
file_path = os.path.join(desktop_path, file_name)
with open(file_path, 'wb') as f:
f.write(requests.get(link).content)
请注意,这只是一个示例代码,实际使用时还需根据需要进行修改和调整。同时,请确保下载的文件遵守法律规定。