1. 数据清理 (消除噪声和不一致数据)
2. 数据集成 (多种数据源可以组合在一起)
3. 数据选择 (从数据库中提取与分析任务相关的数据)
4. 数据变换 (数据变换或统一成适合挖掘的形式,如通过汇总或聚集操作)
5. 数据挖掘 (基本步骤,使用智能方法提取数据模式)
6. 模式评估 (根据某种兴趣度度量,识别表示知识的真正有趣的模式)
7. 知识表示 (使用可视化和知识表示技术,向用户提供挖掘的知识)
步骤1~4是数据预处理的不同形式,为挖掘准备数据.数据挖掘步骤可能与用户或知识库交互.有趣的模式提供给用户,或作为新的知识存放在知识库中.注意,根据这种观点,数据挖掘只是整个过程中的一个步骤,尽管是最重要的步骤,因为它发现用来评估的隐藏的模式.
时间: 2024-11-09 00:41:12