python爬虫,爬取表格数据

python爬虫,爬取全国空气质量指数

编程环境:Jupyter Notebook
所要爬取的网页数据内容如下图

在这里插入图片描述

python爬虫代码及含义详细说明

#全国城市
import time
import requests
from bs4 import BeautifulSoup
headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
}#爬虫[Requests设置请求头Headers],伪造浏览器
# 核心爬取代码
url= 'http://www.tianqihoubao.com/aqi/aqi_rank.html'
params = {"show_ram":1}
response = requests.get(url,params=params, headers=headers)#访问url
listData=[]#定义数组
soup = BeautifulSoup(response.text, 'html.parser')#获取网页源代码
tr = soup.find('table',class_='b').find_all('tr')#.find定位到所需数据位置  .find_all查找所有的tr(表格)
# 去除标签栏
for j in tr[1:]:        #tr2[1:]遍历第1列到最后一列,表头为第0列
    td = j.find_all('td')#td表格
    Date = td[0].get_text().strip()           #遍历排名
    Quality_grade = td[1].get_text().strip()  #遍历城市
    AQI = td[2].get_text().strip()            #遍历空气质量指数AQI
    AQI_rank = td[3].get_text().strip()       #遍历PM2.5浓度
    PM = td[4].get_text()                     #遍历空气质量状况
    Cities = td[5].get_text()                  #遍历省份
    listData.append([Date,Quality_grade,AQI,AQI_rank,PM,Cities])
print (listData)#打印

运行结果如下

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_43488742/article/details/90742453
python爬虫,爬取表格数据
Python爬虫项目:爬取JSON数据存储Excel表格与存储图片
python爬虫爬取豆瓣书籍信息并生成表格
Python 爬虫小练习:基于 XPath 的表格信息爬取
另类爬虫:从PDF文件中爬取表格数据
爬虫入门之爬取静态网页表格数据
爬虫——爬取网页数据存入表格
python爬虫 爬取网站数据
python爬虫东方数据爬取
python爬虫 爬取斗鱼直播数据
python爬虫 爬取猫眼电影数据
python爬虫:爬取拉勾网数据
python :通过爬虫爬取数据(1)
python爬虫爬取异步加载的数据
Python爬虫爬取企查查数据
Python 爬虫爬取多页数据
Python爬虫爬取数据的步骤
python爬虫 - 爬取豆瓣上的数据
python爬虫:爬取新浪新闻数据
Python爬虫对json数据解析爬取
Python爬虫实战——爬取新闻数据(简单的深度爬虫)
Python 爬虫 爬取单个基因 表格数据的生物学功能 (urllib+正则表达式):
另类爬取表格数据
爬虫爬取网页上的表格
爬虫爬取机场网站的表格
Python3.模拟表单提交、爬取表格数据
python3将爬取的数据写入execl表格
Python:【2】使用Selenium爬取多页表格数据
Python爬虫实战--使用python爬取网站数据
Python 爬虫爬取网页
今日推荐
国产云输入法——仅华为无云端数据上传安全问题
开源日报 | 工业开源项目OGG 1.0;姐姐,你要和我一起配置火狐吗;苹果AI遥遥落后?Fedora 40
开放签电子签章:停止新增,优化体验,前进更进(五一假期前工作)
开源日报 | 中学生开源前端动画引擎;全球首个Llama3 8B中文版开源模型;联想电脑恐出局;Linus讽刺AI炒作
“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析
最强开源大模型 Llama 3 上架 Gitee AI
虽然老乡鸡开源的不是代码,但背后的原因却让人很暖心
周排行
决策树的部分理解
STM32软件IIC的实现
RocketMQ原理解析-HA
vue-动态路由(路由的传参和接参)
利用python对Excel中的特定数据提取并写入新表
【Ubuntu】 Ubuntu16.04搭建NFS服务
Elasticsearch基础操作与对应的curl命令行,python对接实现
JVM数据存储结构 & Java的值传递和址传递
yum命令使用指南
java基础(一):java语法基础
每日归档
更多
2024-04-24(36)
2024-04-23(26)
2024-04-22(39)
2024-04-21(0)
2024-04-20(6)
2024-04-19(5)
2024-04-18(0)
2024-04-17(5)
2024-04-16(70)
2024-04-15(42)

玻璃钢生产厂家商洛玻璃钢天花吊顶制造焦作玻璃钢卡通雕塑哪家好呼和浩特玻璃钢花盆定制三亚玻璃钢制品批发百色玻璃钢外壳制造柳州玻璃钢座椅公司辽宁玻璃钢外壳厂家直销长春玻璃钢花箱定做银川商场美陈生产厂家淮南玻璃钢餐桌椅定制云浮玻璃钢坐凳厂娄底不锈钢家具哪家好陇南玻璃钢花池哪家好鞍山玻璃钢花槽厂家直销呼和浩特玻璃钢浮雕批发鄂州玻璃钢摆件厂家咸阳玻璃钢前台定制绵阳玻璃钢设备外壳制作鹰潭玻璃钢卡通雕塑信阳玻璃钢花槽厂四川玻璃钢花盆制作合肥不锈钢花盆阜新玻璃钢休闲椅公司西安玻璃钢休闲椅厂家林芝玻璃钢花坛公司莱芜玻璃钢家具批发资阳玻璃钢家具厂家直销岳阳玻璃钢花槽定做延安玻璃钢医疗外壳加工太原玻璃钢座椅多少钱香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化