admin管理员组文章数量:1567517
2024年5月22日发(作者:)
课题
课时
第
20
课二手房数据分析与房价预测需求分析
2
课时(
90 min )
知识技能目标
:
(1)
能够对案例进行需求分析
(2 )
能根据需求对数据进行不同的预处理,选择合适的可视化图形进行分析和展示,并选择合适 的相关变
教学目标
量进行预测
(3)
练习使用
Pandas
处理异常值、重复值、缺失值,离散化连续数据和编码字符型数据等
素质目标
:
(1
)养成分析问题、事前规划的良好习惯
教学重难点
教学重点:对案例进行需求分析
教学难点:使用
Pandas
处理异常值、重复值、缺失值,离散化连续数据和编码字符型数据
教学方法
教学用具
案例分析法、问答法、讨论法、讲授法
电脑、投影仪、多媒体课件、教材、
APP
第
1
节课:考勤(
2 min )
一问题导入(
5 min )
一传授新知
(
28 min )
一课堂实践
(
10 min )
教学设计
第
2
节课:问题导入
(
8 min )
一传授新知
(
20 min )
一课堂实践
(
12 min )
一课堂小结
(
3 min )
一
作业布直
(
2 min )
教学过程 主要教学内容及步骤
第一节课
设计意图
考勤
【教师】使用
APP
进行签到
【学生】按照老师要求签到
培养学生的组 织
纪律性,掌握学 生的
出勤情况
(2 min )
【教师】提出问题
问题导入
我们已经学习了
python
数据处理的相关知识,那么关于一手房数据分析与 房价预测
如何进行需求分析呢?
【学生】思考、举手回答
通过提问的方 法,
了解学生对案 例的
了解程度,进 而引出
新知
(5 min)
【教师】总结学生的回答,并引入新知,讲解案例需求分析的相关知识
7.1
需求分析
目标分析
7.1.1
传授新知
A
【教师】提出问题
本案例的目标是什么?
>【学生】聆听、思考.主动回答问题
>【教师】总结学生的回答,并讲解新知
本章的目标是根据某房产网站中最新发布的北京_手房数据(共
100
页
3 000
条数据,
见图
7-1),
包拈区域、户型、面积、装修、房龄、总价、结构、朝向和
(28 min )
单价等,分析各区二手房数量和均价、二手房面积和总价区间占比、二手房房龄和 均价的相
关性、是否靠近地铁的不同装修二手房均价等,然后预测不同条件下二手 房的房价。
通过教师讲解、
课堂讨论、多媒体
演示等方式,使学
生了解案例的需(详
见教材),并详细讲
求分析,数据解
解各部分表示的内
析,重复值处理等
容
01 H
知识
>【教师】多媒体出示〃最新发布的北京二手房数据.xlsx
〃
文件的内容图片
数据源
数据源为通过网络爬虫爬取的某房产网站中最新发布的北京二手房数据,保存 在〃最
新发布的北京二手房数据文件中。
.Xlsx
〃
7.2
数据预处理
二
£«•1
开的
・A
其面布扇公式
CrtK
SVRfi
数据解析
台丽银河湾
通州
R
他
安华里社.
安贞 天
区 卢卡特
通苑鲁能
夫施所在所
南音知苑一期丰台箕他东亚印
7
号院水
道或蚀所在
区 象台能啕升
H
他
岸公肩马
坡
局塔蒙小区杜丹回通州 朝阳
平 修义 丰台 逋州
中信邦城两限区亦庄开发区耳他亦庄开支区港城
华芳因 马连丰台
通中所 北分丰台
西城
厂 红连哈包
福辣市园北区
与流北郃新区海淀马
£*8
草
括才园东里
西城
连逗 定东庄
at
水园
桥 五
龙期
H
小区
丰台
杜丹园 顺义城
道口
双兴北区 万
朝阳
方庄
榔园“、区
澹应
小西天
王安国 龙期
随义
Shwtl
唐宁
one
丰力
gog
。新世代
丰台
走强网园 王
心,龛
桥北里卢海桥
王台
成海寺 马连
正症
41
通州
朝阳
户型
3
室
1
厅
1
室
I
厅
小【教师】提出问题
数据解析的步骤有哪些?
计【学生】聆听.思考、主动回答问题
计【教师】总结学生的回答
,
并讲解新知
(
1
)定义
dealYear()
函数用于提取年份中的数值,转换为整型后计算房龄
(2022
减去该数值)。
期南西东南
两博两两四
西南南两南
西至陶南西
南北南尔
面区
79. 74
平米
59. 06
平米
90. 03
平米
142. X
平米
99. 43
平米
65.12
平米
45. 5
平米
72. 59
平米
123. 02
平*
96. 57
平米
48. 29
平米
53. 8
平米
77平米
87. 4
平米
118.89
平米
61. 4
平米
137.25
平米
54. 45
平米
51. 23
平米
51.6
平米
57.
79
平米
58
平米
43. 2
平米
96. 04
平米
结
H
卷
构
精
装
总
情
葩
财
H
情
装
单
H
城
价
苴
阳
柏
旭
筱
也
装
R
装
精
炮
筱
装
楂
装
趋
装
苴
装
稻
枪
H
装
他
K
信
H
他
精
装
精
架
他
K
也
具
横
隹
装
年
精
份
耳
中,,星(空
18
国)
2018
年诸板行
550
万
68.975
元/平顶层
房源标签
(共
18
层)
1990
年建塔柠
46275
78,226
元/平
18@2014
年建板塔结合
492
方
5% 649
元/平
低档M(共15
层)2014年建板楼520万36,456元/平
卬傍目(共
6
层)
2003
年建板柠
283
万
28,
的
3
元/平中楼名
(”
12
昼)
2015
年并板樽
225
万
34,552
元/不
低方国(共。层)
1989
年建嵌格
”0
万
123,077
元/平泯柠昼
(拄
21
昼
)2013
名建板塔结合
320
万
44,084
元/平
中穆义(共
23
区)
2008
年建板塔结合
489
万
39,750
元/平质
层⑴
24
层)
2000
年建塔柠
430
万
44.528
元/平
中横国(共
5
层)
1976
年建战柠
670
万
138, 746
元/平中件层
("4
层)
I960
年建板价
368
万
68. 402
元/平
低柠县(共
22
昼)
2000
年建
tg1;820
万
106, 494
元/平
11K2007
年建板柠
368
万
6% 989
元/平
顶层(共
18
层)
1
州
6
年建塔桂
8
的万
75,617
元/平低柠M
(尹
16
区)
1994
年建塔柠
634
万
103,258
元/平
原由共
6
居)
2005
迂建板柠
460
万
33,516
元/平卬横层(共
6
层)
1992
年建板接
325
万
59,688
元/平
中梏M(拄
17M) 1998
三碑塔移
33
。万
6% 416
元/年
10R2011
年建板塔结合
350
万
67,830
元/平
低方君(井
23W
〉
2005
年皆塔特
40$
万
70, 255
元/平
喜楞M
(共准)1984年速颗核5找万94,138元/千
质居出
6
层)
1990
年评板价
188
方
43,519
元/平
9
层
2007
年
建板株
860
万
89,547
元/平
(
2
)定义
dealType()
函数用于提取户型中室和厅的信息。在该函数中,首先 创建
列标签为〃室〃和〃厅〃、值为
0
的
DataFrame
对象;然后循环使用正则表 达式获取每行
厅
的数值,将其转换为整型后赋值给
DataFrame
对象对应的列。
271
Jr
1S1JT
2
至
1
厅
3
室
I
厅
3
室
I
厅
2
至
1
211
Jf 3
室
2
厅
2
室
2
(
3 )
将户型中的〃房间〃替换为〃室〃,然后将调用
dealType
。函数返回的
DataFrame
对象通过
join
。函数横向连接到原数据中。
(4 )
将年份中的字符替换为空字符,并使用
lambda
表达式调用
dealYear()
函
厅
数。
251
Jf 2
室
1
厅
(5 )
将面积、总价、单价等信息中的字符替换为空字符,仅保留数值部分,然 后转
厅
211
Jf 3
2I1JT
3
室
I
换为浮点型。
(
6
)修改部分列标签,如〃面积〃修改为〃面积(平方米)〃、〃年份〃修改 为〃房
龄〃、〃总价〃修改为〃总价(万元)〃、〃单价〃修改为〃单价(元/平方 米)"等。
(7 )
输出面积、房龄、总价、单价、室和厅。
十【教师】按照教材步骤进行程序演示:
室沂
2
室
1
厅
1
至
1
万
1
室
1
厅
2
室
1
厅
2
至
1
斤
1
室
1
厅
2
至
1
厅
import pandas as pd
版权声明:本文标题:《Python数据分析与应用案例教程》教案 第20课 二手房数据分析与房价预 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://www.elefans.com/dongtai/1716391381a501013.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论