课程名称:
数据仓库与数据挖掘技术(Data warehouse and data mining)(8学时)
内容提要:
数据仓库与数据挖掘技术出现于20世纪80年代,90年代有了突飞猛进的发展,并可望在新的千年继续繁荣。数据仓库与数据挖掘是一个多学科领域,从多个学科汲取营养。这些学科包括数据库技术、人工智能、机器学习、神经网络、统计学、模式识别、知识库系统、知识获取、信息检索、高信能计算和数据可视化。
本课程包括二大方面的内容。第一,数据仓库方面的内容,包括数据仓库的基本概念,数据立方体,联机分析处理的实现。第二,数据挖掘方面的内容,包括数据的预处理技术数据挖掘原语,概念描述技术,关联规则方法,数据的分类与预测,数据聚类分析方法,最后是先进数据库中的数据挖掘方法。
本课程以数据仓库与数据挖掘的基本概念和基本方法为主要内容,以方法的应用为主线,系统叙述数据仓库和数据挖掘的有关概念和基础知识,使学生尽快掌握数据仓库和数据挖掘的基本概念,基本方法和应用背景。
通过本课程的学习,要求学生能对数据仓库和数据挖掘的基本方法和基本概念有整体的了解,特别对数据挖掘的关联规则,分类方法,聚类方法有深入的了解,并能够在软件开发过程中熟练掌握这些方法加以应用。
先修课程:
离散数学、操作系统、数据库原理、程序设计
适用专业:
软件工程
主要教材、参考书:
教材:
1.Jiawei Han and Micheline Kamber,Data Mining: Concepts and Techniques, 3rd ed. Morgan Kaufmann Publishers, 22 Jun 2011.
参考书:
1.Jiawei Han著,范明、孟小峰译,数据挖掘:概念与技术(原书第3版),机械工业出版社,2012年08月
2.陈文伟,数据仓库与数据挖掘教程, 清华大学出版社, 2006年8月
实验项目与学时分配:
序号 |
实验项目 |
学时 |
要求 |
1 |
关联规则 |
4 |
必做 |
2 |
决策树 |
4 |
必做 |