运城学院课程教学进度表
_2020 ---_2021_学年 第_二_学期
_2020 ---_2021_学年 第_二_学期
院系(部):数学与信息技术学院 授课对象:数据科学与大数据技术专业1806班
课程编号 | 065104C | 课程名称 | 数据挖掘技术 | 主讲教师 | 王鹏岭 | 职称 | 讲师 | ||||||
课程类型 | 职业教育课 | 考核方式 | 考试 | 周学时 | 4 | 总学时 | 60(讲授:30实验课:30) | ||||||
使用教材 | 数据挖掘原理、方法及python应用实践教程,蒋国银等编,科学出版社. 2020.11 | ||||||||||||
周次 | 日期 | 讲授章节及主要教学内容 | 练习与作业 | 学时分配 | 备 注 | ||||||||
1 |
3月1日 至 3月6日 |
第1章 绪论 1.1 数据挖掘的含义 1.2 数据挖掘、机器学习与人工智能 1.3 数据挖掘基本任务 1.5 数据挖掘常用工具及其比较 1.5.1 Python 1.6.1 WinPython 1.6.2 Anaconda 1.6.3 集成开发环境 |
习题1、2、3、4 |
讲授(2) 实验(2 ) |
|
||||||||
2 |
3月8日 至 3月13日 |
第2章 数据预处理 18 2.1 概述 18 2.2 缺失值的处理 18 2.2.1 缺失值的查找 19 2.2.2 缺失值的删除 20 2.2.3 缺失值的填充 22 2.3 异常值的处理 23 2.4 数据的标准化 25 |
思考题1,2 习题1.2 |
讲授(2) 实验(2 ) |
|||||||||
3 |
3月15日 至 3月20日 |
2.5 数据的正则化 28 2.6 自定义转换器 30 2.7 生成多项式和交互特征 30 第3章 朴素贝叶斯分类器 33 3.1 朴素贝叶斯分类算法相关的统计学知识 |
思考题3 P41思考题1 |
讲授(2) 实验(2 ) |
|||||||||
4 |
3月22日 至 3月27日 |
3.2 极大似然估计 34 3.3 贝叶斯估计 36 3.4 朴素贝叶斯分类算法的Python实现 习题课 |
P41思考题2.,3 习题1 |
讲授(2) 习题(2) |
|||||||||
5 |
3月29日 至 4月3日 |
第4章 决策树 42 4.1 决策树分类算法概述 42 4.2 熵与信息增益 43 4.3 ID3算法 46 4.4 C4.5算法 |
P63思考题1 2 |
讲授(2) 实验(2 ) |
|||||||||
6 |
4月5日 至 4月10日 |
CART算法 49 4.6 过拟合与决策树剪枝 52 4.6.1 过拟合 52 4.6.2 决策树剪枝 52 4.7 分类模型的评估 实例:决策树的Python实现 |
习题1,2 |
讲授(2) 实验(2 ) |
|
||||||||
7 |
4月12日 至 4月17日 |
第5章 集成学习 65 第6章 5.1 集成学习的思想 65 第7章 5.2 集成学习模型:结合策略 5.3 Bagging方法与随机森林 集成学习模型的Python实现 |
P75思考题1 2 3 |
讲授(2) 实验(2 ) |
|
||||||||
8 |
4月19日 至 4月24日 |
第6章 k-近邻 76 6.1 数据在不同维度上分布的分类表现 76 6.2 算法原理 78 6.3 相似度与距离 |
思考题 |
讲授(2) 实验(2 ) |
|||||||||
9 |
4月26日 至 5月1日 |
6.4 k值的选择 83 6.5 分类决策规则 84 6.6 KNN算法 84 6.7 kd树 85 6.8 实例:鸢尾花分类 |
习题 |
讲授(2) 实验(2 ) |
|
||||||||
10 |
5月3日 至 5月8日 |
放假 |
|
||||||||||
11 |
5月10日 至 5月15日 |
第7章支持向量机 90 7.1 SVM算法介绍 90 7.2 线性可分支持向量机 7.3 线性不可分支持向量机 97 |
思考题 |
讲授(2) 实验(2 ) |
|
||||||||
12 |
5月17日 至 5月22日 |
实例:鸢尾花分类 第8章 人工神经网络 105 8.1 神经网络的基本概念 105 8.2 神经网络的发展过程 107 |
习题1、2 |
讲授(2) 实验(2 ) |
|||||||||
13 |
5月24日 至 5月29日 |
实例:mnist手写数字识别 第9章 聚类分析 121 9.1 聚类问题 121 9.2 基于原型的聚类方法:k-均值聚类 |
习题1,2 思考题1,2 |
讲授(2) 实验(2 ) |
|
||||||||
14 |
5月31日 至 6月5日 |
9.3基于密度的聚类方法:DBSCAN 9.4 基于层次的聚类方法 9.5 聚类结果的评价 130 9.6 使用Python进行聚类分析 |
习题1,2,3 |
讲授(2) 实验(2 ) |
|
||||||||
15 |
6月7日 至 6月12日 |
第10章关联分析 137 10.1 关联分析的基本概念 10.2 Apriori 关联分析算法 10.4使用Python进行关联分析 |
思考题1,2 习题1,2,3 |
讲授(2) 实验(2 ) |
|
||||||||
16 |
6月14日 至 6月19日 |
第12章 应用案例一 应用案例二 |
|
讲授(2) 实验(2 ) |
|
||||||||
17 |
6月21日 至 6月26日 |
主讲教师签名:王鹏岭 教研室主任审核签名: 系教学主任审核签名:
2021年3月2日 年 月 日 年 月 日
2021年3月2日 年 月 日 年 月 日