爬取2345天气数据|电子爱好者

admin管理员组
文章数量:1580441

爬取2345天气数据

方法：利用Selenium 库，用于模拟浏览器操作，获取每个页面的源码，毕竟，有源码不愁数据。

一、分析页面内容

可以看到页面只会展示每个月份的数据，无法同时爬取多个月份的值
想要爬取每个月份数据，需要点击“上个月” 按钮

二、代码实现

首先将模拟浏览器登陆页面
确保浏览器是谷歌浏览器

from selenium import webdriver  # 导入 Selenium 库，用于模拟浏览器操作
import requests  # 导入 requests 库，用于发送 HTTP 请求
from bs4 import BeautifulSoup  # 导入 BeautifulSoup 库，用于解析 HTML
import html.parser  # 导入 html.parser 模块
import time  # 导入 time 模块，用于暂停执行
import pandas as pd  # 导入 pandas 库，用于数据处理和分析
import undetected_chromedriver as uc
import random
# 创建 ChromeOptions 对象并设置浏览器选项
options = uc.ChromeOptions()
options.add_argument("--no-sandbox")
options.add_argument("--disable-dev-shm-usage")
options.add_argument("--window-size=444x133")
options.add_argument("--disable-gpu")
options.add_argument("--hide-scrollbars")
# options.add_argument("--blink-settings=imagesEnabled=false")  # 不加载图片
# options.add_argument("--headless")  # 无界面模式
driver = uc.Chrome(options)
url = 'https://tianqi.2345/wea_history/58334.html'  # 目标网页的 URL
driver.get(url)  # 打开目标网页，使用浏览器访问

如果是edge浏览器的话

from selenium import webdriver
# 在这里导入浏览器设置相关的类
from selenium.webdriver.edge.options import Options
# 无可视化界面设置 #
edge_options = Options()
# 使用无头模式
# edge_options.add_argument('--headless')
# 禁用GPU，防止无头模式出现莫名的BUG
edge_options.add_argument('--disable-gpu')
# 将参数传给浏览器
browser = webdriver.Edge(options=edge_options)
url = 'https://tianqi.2345/wea_history/58334.html'  # 目标网页的 URL
browser.get(url)

获取每个月的数据，然后点击上个月

data = []  # 创建一个空数组，用于存储标签文本
for i in range(1, 21):  # 循环从 1 到 20（共 20 个月的数据）
    page_content = driver.page_source  # 获取当前页面的源代码
    soup = BeautifulSoup(page_content, 'html.parser')  # 将页面源代码解析为 Beautiful Soup 对象
    weather = soup.find('table')  # 找到页面中的 table 标签
    for row in weather.find_all('tr'):  # 遍历 table 中的所有 tr 标签
        print(row)
        for td in row.find_all('td'):  # 遍历 tr 标签中的所有 td 标签
            data.append(td.text)  # 将 td 标签的文本添加到数据数组中
            print(td.text)
    element = driver.find_element('id', 'js_prevMonth')  # 找到 ID 为 js_prevMonth 的元素
    time.sleep(2)  # 暂停 2 秒，以便网页加载完成
    element.click()  # 点击上个月按钮
    time.sleep(2)  # 暂停 2 秒，以便网页加载完成
new_data = [data[i:i + 6] for i in range(0, len(data), 6)]  # 将数据按行分组，每行包含 6 个元素
df = pd.DataFrame(new_data,columns=['日期', '最高温', '最低温', '天气', '风力风向', '空气质量指数'])  # 创建一个 DataFrame，并指定列名
df[['日期', '星期']] = df['日期'].str.split(' ', expand=True)  # 将日期列拆分为日期和星期两列
df[['空气质量指数', '空气质量']] = df['空气质量指数'].str.split(' ', expand=True)  # 将空气质量指数列拆分为数值和质量两列
df = df.reindex(columns=['日期', '星期', '最高温', '最低温', '天气', '风力风向', '空气质量指数', '空气质量'])  # 重新排列 DataFrame 的列顺序
df.to_excel('天气数据.xlsx', index=False)  # 将 DataFrame 写入 Excel 文件，指定文件名

本文标签：天气数据

版权声明：本文标题：爬取2345天气数据内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1727866377a1134496.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

基于C#的恒星科普网站+49762（免费领源码）可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、全套文案

1天前

目录摘要1 绪论1.1 研究背景1.2研究内容1.3ASP.NET框架介绍1.4论文结构与章节安排2 恒星科普网站分析2.1 可行性分析2.2 系统流程分析2.2.1 数据流程3.3.2 业务流

基于PHP的软件测试教学实验管理系统+76393（免费领源码）可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、全套文案

1天前

目录摘要1 绪论1.1 研究背景1.2论文结构与章节安排2 软件测试教学实验管理系统分析2.1 可行性分析2.2 系统流程分析2.2.1 数据增加流程2.2.2 数据修改流程2.2.3 数据删除流程

django -- 错误跳转&表单验证&数据分页

1天前

## 重点： 1、错误跳转 2、表单验证 3、数据分页 ## 复习 from django.views.decorators.http from require_http_methods,require

Unity数据加密☀️ 三、加密DLL供Unity使用

1天前

文章目录 📢 本节效果展示1️⃣ 源代码展示2️⃣ 加密后代码 🟥 加密软件下载🟧 加密软件的使用方法🎁 加密必须要知道的事情&#x1f

如何保护电脑文件夹？多种方法保护数据安全

1天前

在数字化时代，电脑中的文件夹往往存储着我们最私密、最重要的数据，如个人文档、照片、工作资料等。因此，保护这些文件夹免受未经授权的访问、盗窃或损坏变得尤为重要。本文将介绍多种方

游戏数据安全----一个关于数据加密的简单代码实现

1天前

1. 一个思路一般游戏数据的安全性，在项目的后期才会考虑到，尤其是像休闲益智类、玩法吸睛而且迭代快速的游戏类型，一旦在市场上出现，为了避免相同类型竞品短时间内蜂拥而至，游戏数据的安全性就显得更为重要，进而影响到游戏团体的盈利

Android数据加密概述及多种加密方式聊天记录及账户加密提供高质量的数据保护

1天前

Android数据加密概述及多种加密方式聊天记录及账户加密提供高质量的数据保护数据加密又称密码学，它是一门历史悠久的技术，指通过加密算法和加密密钥将明文转变为密文，而解

iOS数据安全—加密解密「学习总结」

1天前

本文来自简书，原文地址:http:www.jianshup1a7d57b60778 写在前面在写项目中，数据的安全性至关重要，而仅仅用 POST 请求提交用户的隐私

【网络】网络层和数据链路层详解

19小时前

基本概念 TCP作为传输层控制协议，其保证的是数据传输的可靠性和传输效率，但TCP提供的仅仅是数据传输的策略，而真正负责数据在网络中传输的则传输层之下的网络层和链路层。 I

搜索引擎（大数据检索）论述[elasticsearch原理相关]

13小时前

首先需要大致知道搜索引擎有大致几类：1.全文搜索引擎 2.垂直搜索引擎 3.类目搜索引擎等。 1.全文搜索引擎：是全文本覆盖的，百度，google等都

【大数据搜索引擎】网络爬虫南华实验报告（2021年版）

13小时前

实验7：设计一个网络爬虫的算法，动态获取全国新型冠状肺炎疫情。实验8：提交一篇与实验作业7相对应的网络爬虫实验报告。实验作业7实验作业8下载链接 https:do

u盘分区格式化后怎么恢复数据？实用三法大公开

12小时前

在数字化时代，U盘作为便携的数据存储设备，广泛应用于我们的日常生活和工作中。然而，不慎的分区或格式化操作往往会导致重要数据的丢失，给用户带来不小的困扰。

SD卡格式化怎么恢复？一键扫描，轻松找回丢失的数据

12小时前

SD卡格式化怎么恢复数据？在日常生活中，我们常常会使用SD卡来存储各种数据，如照片、视频、文档等。然而，当SD卡意外格式化或者出现其他问题时&#

酒店评论数据分析（英文文本多分类）

8小时前

酒店评论数据分析英文文本多分类（实验过程仅供参考）实验任务：对酒店评论进行情感分析，具体评分存入 Testing data；此实验看似为评论情感打分，实则做文

json数据在谷歌浏览器的高亮显示

7小时前

json数据在谷歌浏览器的高亮显示 https:wwwblogsiyangyuanp5064810.html 下载crx 链接: https:pan.baidus1f9ZJkm8xta_GGXk9_x0Wqw 提取码:

侯毅张勇收购盒马传闻不实；英伟达大跌10%；用于Llama3训练的高质量数据集首次公开！

6小时前

一、商业圈 1.网传侯毅、张勇要20亿美元联手收购盒马，知情人士：消息不实 4月21日，有报道称，盒马创始人侯毅和阿里巴巴前CEO张勇有意联手竞购盒

大数据项目 --- 数据采集项目

4小时前

项目是串联知识点的最好的方式,这个项目之前看过,但是笔记并没有整理,并且环境已经破坏.由于项目二的需要,需要将这个项目进行重新搭建,对于之前的知识点使用这个项目进行重新复习.---最后一次搭建这个项目环境,供给后面使用,步步为营目录

爬取2345天气数据

3小时前

爬取2345天气数据方法： 利用Selenium 库，用于模拟浏览器操作，获取每个页面的源码，毕竟，有源码不愁数据。一、分

5118站长工具箱:SEO数据分析浏览器插件 - 叶涛的博客

3小时前

今天要大家介绍一款SEO常用必备软件——5118站长工具箱。软件介绍 5118站长工具箱是专门为站长SEO工作和新媒体人打造，结合大数据对浏览器进行可视化增强的智能插件。让每一个页面浏览都可以即时获取SEO工作所需的

vue渲染大量数据优化_vue大数据表格卡顿问题的完美解决方案

1小时前

前言 vue渲染小数据挺快,大数据vue开始出现卡顿现象，本文讲给大家详细介绍关于vue大数据表格卡顿问题的解决方法亲测苹果电脑，chrome浏览器无卡顿现象，其它浏览器并未测试，如遇到卡顿请备注系统和浏览器，方便我后续优化，谢谢先看一

电子爱好者 - 最新技术资讯及电子产品介绍！

爬取2345天气数据

爬取2345天气数据

一、分析页面内容

二、代码实现

更多相关文章

基于C#的恒星科普网站+49762（免费领源码）可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、全套文案

基于PHP的软件测试教学实验管理系统+76393（免费领源码）可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、全套文案

django -- 错误跳转&amp;表单验证&amp;数据分页

Unity数据加密☀️ 三、加密DLL供Unity使用

如何保护电脑文件夹？多种方法保护数据安全

游戏数据安全----一个关于数据加密的简单代码实现

Android数据加密概述及多种加密方式 聊天记录及账户加密 提供高质量的数据保护

iOS数据安全—加密解密「学习总结」

【网络】网络层和数据链路层详解

搜索引擎（大数据检索）论述[elasticsearch原理相关]

【大数据搜索引擎】网络爬虫南华实验报告（2021年版）

u盘分区格式化后怎么恢复数据？实用三法大公开

SD卡格式化怎么恢复？一键扫描，轻松找回丢失的数据

酒店评论数据分析（英文文本多分类）

json数据在谷歌浏览器的高亮显示

侯毅张勇收购盒马传闻不实；英伟达大跌10%；用于Llama3训练的高质量数据集首次公开！

大数据项目 --- 数据采集项目

爬取2345天气数据

5118站长工具箱:SEO数据分析浏览器插件 - 叶涛的博客

vue渲染大量数据优化_vue大数据表格卡顿问题的完美解决方案

发表评论

推荐文章

电脑安装了win10和ubuntu18.04双系统，进入引导系统后，无法进入linux系统，提示“You are in emergency mode. After logging in, type …

如何搭建一个可以远程开机、挂下载、读写文件、云备份或是搭个数据库玩查询的NAS

【学习笔记】程序员学操作系统

TCPIP协议簇

联通BSS-ESS-CBSS系统安装相关

热门文章

python爬虫中使用lxml解析本地HTML文件报错lxml.etree.XMLSyntaxError: Opening and ending tag mismatch.....

AnyMP4 MP3 Converter for Mac(mp3格式转换器)

1003 Emergency（两点间最短路径的条数）

15 个百度网盘搜索引擎

信息搜集之搜索引擎

Java正则表达式 贪婪 勉强 匹配说明 greedy vs ( lazy | reluctant )

vue项目中解决谷歌浏览器默认填充账号密码问题

软件测试的方法与应用实践

Alt+Tab切换应用程序窗口卡顿解决方案

Windows10系统下安装与配置tomcat的服务和卸载tomcat服务的方法步骤说明

最新文章

利用WiFi钓鱼法追邻居漂亮妹纸

原谅帽大作战网页版服务器连接失败,原谅帽大作战玩不了怎么回事_原谅帽大作站常见问题解决方法_玩游戏网...

三星服务器链接在哪个文件夹,三星手机无线连接，访问局域网电脑共享目录中的电影照片设置教程...

邻居蹭网怎么办？

macOS Sierra WiFi connecting problem

使用无线网络别掉以轻心 网银密码随时被盗

香橙派Kunpeng Pro测评：他给的实在太多了

在VMware workstation虚拟机上的Kali破解无线路由密码

kali系统破解WPA密码实战

无线渗透教程2：捕获数据包

python你TM太皮了——区区30行代码就能记录键盘的一举一动

计算机无线网络连接怎么弄,台式电脑怎么设置无线网络,小编教你台式电脑怎么设置无线网络...

macOS安装aircrack-ng破解附近Wi-Fi

我们的wifi，真的安全吗

如何读取照片的GPS信息？—最好的语言Java实现起来就这么简单【手把手教程+完整代码】

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

django -- 错误跳转&表单验证&数据分页

Android数据加密概述及多种加密方式聊天记录及账户加密提供高质量的数据保护

Java正则表达式贪婪勉强匹配说明 greedy vs ( lazy | reluctant )

使用无线网络别掉以轻心网银密码随时被盗

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载