admin管理员组

文章数量:1567517

2024年5月22日发(作者:)

课题

课时

20

课二手房数据分析与房价预测需求分析

2

课时(

90 min )

知识技能目标

(1)

能够对案例进行需求分析

(2 )

能根据需求对数据进行不同的预处理,选择合适的可视化图形进行分析和展示,并选择合适 的相关变

教学目标

量进行预测

(3)

练习使用

Pandas

处理异常值、重复值、缺失值,离散化连续数据和编码字符型数据等

素质目标

(1

)养成分析问题、事前规划的良好习惯

教学重难点

教学重点:对案例进行需求分析

教学难点:使用

Pandas

处理异常值、重复值、缺失值,离散化连续数据和编码字符型数据

教学方法

教学用具

案例分析法、问答法、讨论法、讲授法

电脑、投影仪、多媒体课件、教材、

APP

1

节课:考勤(

2 min )

一问题导入(

5 min )

一传授新知

28 min )

一课堂实践

10 min )

教学设计

2

节课:问题导入

8 min )

一传授新知

20 min )

一课堂实践

12 min )

一课堂小结

3 min )

作业布直

2 min )

教学过程 主要教学内容及步骤

第一节课

设计意图

考勤

【教师】使用

APP

进行签到

【学生】按照老师要求签到

培养学生的组 织

纪律性,掌握学 生的

出勤情况

(2 min )

【教师】提出问题

问题导入

我们已经学习了

python

数据处理的相关知识,那么关于一手房数据分析与 房价预测

如何进行需求分析呢?

【学生】思考、举手回答

通过提问的方 法,

了解学生对案 例的

了解程度,进 而引出

新知

(5 min)

【教师】总结学生的回答,并引入新知,讲解案例需求分析的相关知识

7.1

需求分析

目标分析

7.1.1

传授新知

A

【教师】提出问题

本案例的目标是什么?

>【学生】聆听、思考.主动回答问题

>【教师】总结学生的回答,并讲解新知

本章的目标是根据某房产网站中最新发布的北京_手房数据(共

100

3 000

条数据,

见图

7-1),

包拈区域、户型、面积、装修、房龄、总价、结构、朝向和

(28 min )

单价等,分析各区二手房数量和均价、二手房面积和总价区间占比、二手房房龄和 均价的相

关性、是否靠近地铁的不同装修二手房均价等,然后预测不同条件下二手 房的房价。

通过教师讲解、

课堂讨论、多媒体

演示等方式,使学

生了解案例的需(详

见教材),并详细讲

求分析,数据解

解各部分表示的内

析,重复值处理等

01 H

知识

>【教师】多媒体出示〃最新发布的北京二手房数据.xlsx

文件的内容图片

数据源

数据源为通过网络爬虫爬取的某房产网站中最新发布的北京二手房数据,保存 在〃最

新发布的北京二手房数据文件中。

.Xlsx

7.2

数据预处理

£«•1

开的

・A

其面布扇公式

CrtK

SVRfi

数据解析

台丽银河湾

通州

R

安华里社.

安贞 天

区 卢卡特

通苑鲁能

夫施所在所

南音知苑一期丰台箕他东亚印

7

号院水

道或蚀所在

区 象台能啕升

H

岸公肩马

局塔蒙小区杜丹回通州 朝阳

平 修义 丰台 逋州

中信邦城两限区亦庄开发区耳他亦庄开支区港城

华芳因 马连丰台

通中所 北分丰台

西城

厂 红连哈包

福辣市园北区

与流北郃新区海淀马

£*8

括才园东里

西城

连逗 定东庄

at

水园

桥 五

龙期

H

小区

丰台

杜丹园 顺义城

道口

双兴北区 万

朝阳

方庄

榔园“、区

澹应

小西天

王安国 龙期

随义

Shwtl

唐宁

one

丰力

gog

。新世代

丰台

走强网园 王

心,龛

桥北里卢海桥

王台

成海寺 马连

正症

41

通州

朝阳

户型

3

1

1

I

小【教师】提出问题

数据解析的步骤有哪些?

计【学生】聆听.思考、主动回答问题

计【教师】总结学生的回答

并讲解新知

1

)定义

dealYear()

函数用于提取年份中的数值,转换为整型后计算房龄

(2022

减去该数值)。

期南西东南

两博两两四

西南南两南

西至陶南西

南北南尔

面区

79. 74

平米

59. 06

平米

90. 03

平米

142. X

平米

99. 43

平米

65.12

平米

45. 5

平米

72. 59

平米

123. 02

平*

96. 57

平米

48. 29

平米

53. 8

平米

77平米

87. 4

平米

118.89

平米

61. 4

平米

137.25

平米

54. 45

平米

51. 23

平米

51.6

平米

57.

79

平米

58

平米

43. 2

平米

96. 04

平米

H

H

H

R

H

K

H

K

中,,星(空

18

国)

2018

年诸板行

550

68.975

元/平顶层

房源标签

(共

18

层)

1990

年建塔柠

46275

78,226

元/平

18@2014

年建板塔结合

492

5% 649

元/平

低档M(共15

层)2014年建板楼520万36,456元/平

卬傍目(共

6

层)

2003

年建板柠

283

28,

3

元/平中楼名

(”

12

昼)

2015

年并板樽

225

34,552

元/不

低方国(共。层)

1989

年建嵌格

”0

123,077

元/平泯柠昼

(拄

21

)2013

名建板塔结合

320

44,084

元/平

中穆义(共

23

区)

2008

年建板塔结合

489

39,750

元/平质

层⑴

24

层)

2000

年建塔柠

430

44.528

元/平

中横国(共

5

层)

1976

年建战柠

670

138, 746

元/平中件层

("4

层)

I960

年建板价

368

68. 402

元/平

低柠县(共

22

昼)

2000

年建

tg1;820

106, 494

元/平

11K2007

年建板柠

368

6% 989

元/平

顶层(共

18

层)

1

6

年建塔桂

8

的万

75,617

元/平低柠M

(尹

16

区)

1994

年建塔柠

634

103,258

元/平

原由共

6

居)

2005

迂建板柠

460

33,516

元/平卬横层(共

6

层)

1992

年建板接

325

59,688

元/平

中梏M(拄

17M) 1998

三碑塔移

33

。万

6% 416

元/年

10R2011

年建板塔结合

350

67,830

元/平

低方君(井

23W

2005

年皆塔特

40$

70, 255

元/平

喜楞M

(共准)1984年速颗核5找万94,138元/千

质居出

6

层)

1990

年评板价

188

43,519

元/平

9

2007

建板株

860

89,547

元/平

2

)定义

dealType()

函数用于提取户型中室和厅的信息。在该函数中,首先 创建

列标签为〃室〃和〃厅〃、值为

0

DataFrame

对象;然后循环使用正则表 达式获取每行

的数值,将其转换为整型后赋值给

DataFrame

对象对应的列。

271

Jr

1S1JT

2

1

3

I

3

I

2

1

211

Jf 3

2

2

2

3 )

将户型中的〃房间〃替换为〃室〃,然后将调用

dealType

。函数返回的

DataFrame

对象通过

join

。函数横向连接到原数据中。

(4 )

将年份中的字符替换为空字符,并使用

lambda

表达式调用

dealYear()

数。

251

Jf 2

1

(5 )

将面积、总价、单价等信息中的字符替换为空字符,仅保留数值部分,然 后转

211

Jf 3

2I1JT

3

I

换为浮点型。

6

)修改部分列标签,如〃面积〃修改为〃面积(平方米)〃、〃年份〃修改 为〃房

龄〃、〃总价〃修改为〃总价(万元)〃、〃单价〃修改为〃单价(元/平方 米)"等。

(7 )

输出面积、房龄、总价、单价、室和厅。

十【教师】按照教材步骤进行程序演示:

室沂

2

1

1

1

1

1

2

1

2

1

1

1

2

1

import pandas as pd

本文标签: 数据分析案例二手房进行