您现在位于:首页 >教学大纲>第五章

第五章 聚类技术

课时:2周,8学时。

内容:介绍无监督数据聚类技术的相关概念、经典算法和实际商务应用案例。
课程安排:

1. 基于划分的聚类(1学时)
掌握:基于均值的聚类算法k-means;
了解:基于中心点的聚类算法k-medoids和Clarans。

2. 层次聚类(1学时)
掌握:分裂、凝聚层次聚类算法的工作原理和过程;
了解:基于B+树的高效层次聚类算法Birch。

3. 基于密度的聚类(1学时)
掌握:基于高密度连接区域的密度聚类算法DBSACN;
了解:基于排序点图的密度聚类算法OPTICS。

4. 基于网格的聚类(1学时)
掌握:基于统计信息网格的聚类算法STING

5. 基于图论的聚类(1学时)
掌握:最小生成树(MST)聚类算法;
了解:基于图的互连度和接近度的聚类算法Chameleon。

6. 基于模型的聚类(1学时)
掌握:期望最大化算法EM的工作原理
了解:一种概念聚类算法CobWeb。

7. 聚类技术的商务应用案例(2学时)
掌握:介绍数据挖掘工具IBM SPSS Modeler进行数据聚类的常用策略,详细简介、展示聚类方法中k-均值、DBSCAN、EM等算法。
了解:用户偏好分析(Profile)、商业客户细分等聚类技术的经典商务智能应用范例。