本次学习我们仍然遵循“什么是数据挖掘”文章中的研究方法对航空公司消费客户进行聚类。本章学习重点是如何标准化处理数据,使用k-means聚类,明白聚类和分类的区别。
什么是数据挖掘
整个系列实战源码下载地址:https://github.com/wltongxue/python-DataMining-Practice
本次学习我们将从4个方面进行深入介绍:
1、数据挖掘的定义。(了解什么是数据挖掘?它是用来干什么的?)
2、数据挖掘的过程。(明白数据挖掘要做什么事情?)
3、挖掘建模中的算法和评价。(了解挖掘中最重要的建模部分都有哪些?)
4、所使用的python库。(使用代码进行实现时我们要具备的环境?)