在人工智能时代下,机器学习、深度学习、大数据分析与处理、云计算等新技术的提出极大地促进了Python语言的发展,2017年IEEE Spectrum 发布的编程语言交互式排行榜上,Python独占榜首。Python以面向对象、容易学习、跨平台以及由此产生的低维护成本,深受Python爱好者喜欢并获得好评。
正是基于此,教育部高等学校计算机类教学指导委员会计划举办本次Python课程高级研修班,这次培训班的内容既有Python课程的的深度介绍,也有以Python为工具进行比较前沿的数据分析、爬虫的开发。
一、课程目标
- 掌握Python语言基础和编程方法,以及Python与其他语言的异同。
- 以Web新闻页面的采集、内容提取、处理及分析为应用案例和主线,掌握互联网大数据处理的关键技术和整个处理流程,使得参加培训的教师具备互联网大数据处理技术的知识体系。
- 学习掌握Web页面采集的爬虫技术架构及其Python实现方法,学习Web信息提取的技术原理,并掌握利用若干开源框架进行Web提取的方法。使参加培训的教师可以开设Web大数据采集的专业核心课程,并具备互联网大数据处理技术相关课程的实验设计能力。
二、课程内容及时间安排
2018年11月3日(星期六) | |
08:30-09:10 | 开幕式 |
单元 1:Python语言基础与梳理 | |
09:10-11:10 | 介绍Python语言变量、数据类型、列表、字典、元组、函数、类及文件操作 介绍开发环境、主要的编程方法 介绍C、Java等经典语言与Python语言的异同,梳理语言发展的一些特征规律 |
11:10-11:50 | 上机实践(基础编程) |
单元 2:Web数据采集技术 | |
14:00-16:30 | 介绍Web数据采集技术原理,包括基本架构、Web连接、URL处理、爬行策略、Robots协议、Cookie等技术 以新闻信息采集为例,介绍Web页面采集的Python实现方法 |
16:30-17:30 | 上机实践(采集新闻网站的科技类、财经类、体育类的HTML页面) |
2018年11月4日(星期日) | |
单元 3:Web信息提取技术 | |
9:00-11:00 | 介绍Web信息提取技术原理,包括信息提取的目标、DOM树、基于树结构的提取技术、基于统计方法的方法 Python实现方法,包括若干个开源框架及使用方法、比较和选择 |
11:00-11:50 | 上机实践(对新闻页面进行内容提取,生成文本集) |
单元 4:数据分析技术 | |
14:00-16:30 | 介绍数据处理技术的原理,包括词汇切分、词性识别、停用词过滤、人名识别等 数据分析与实现:词频统计、主题建模、基于Tensorflow进行CNN新闻分类等 可视化:工具、Python实现 |
16:30-17:30 | 上机实践(对Web信息提取的文本集进行处理和分析) |
会议结束 |
实操训练
本次培训设有四个现场实操辅导训练项目,以帮助参加培训的教师更好地掌握培训内容,提升实战技能,为后续课程开设做充分准备。
C站(CSDN)能力认证中心
更多推荐
上海市培训机构python
发布评论