数据挖掘的特点是什么?
数据挖掘的各种功能如下-
数据类型-行业中可访问的大多数数据挖掘系统处理具有统计、分类和符号属性的格式化的、基于记录的、类似关系的数据。数据可以是ASCII文本、关系数据库数据或数据仓库数据的形式。必须测试format(s)它所治疗的每个系统可以处理的确切程度。
某些类型的数据或应用程序可能需要专门的算法来搜索模式,因此它们的需求无法由现成的通用数据挖掘系统来管理。相反,可以使用专门的数据挖掘系统,挖掘文本报告、地理空间数据、多媒体数据、流数据、时间序列数据、生物数据或Web数据,或者专用于特定应用程序(包括金融、零售业,或电信)。
系统问题-给定的数据挖掘系统只能在一个或多个操作框架上运行。托管数据挖掘软件的著名操作系统是UNIX/Linux和MicrosoftWindows。还有运行在Macintosh、OS/2等上的数据挖掘系统。面向市场的大数据
面向市场的大型数据挖掘系统通常采用客户端/服务器架构,客户端可以是个人计算机,服务器可以是一组强大的并行计算机。当前的趋势是数据挖掘系统支持基于Web的界面并启用XML数据作为输入和/或输出。
数据源-这定义了数据挖掘系统将运行的特定数据格式。有些系统仅在ASCII文本文件上运行,而有些系统则处理关系数据或数据仓库数据,访问多个关系数据源。
数据挖掘系统必须为ODBC连接提供ODBC连接或OLEDB。这些提供了开放的数据库连接,特别是能够访问任何关系数据(包括IBM/DB2、MicrosoftSQLServer、MicrosoftAccess、Oracle、Sybase等)和格式化的ASCII文本数据。
数据挖掘功能和方法-数据挖掘功能构成了数据挖掘系统的核心。一些数据挖掘系统仅支持一种数据挖掘功能,例如分类。其他可以帮助多种数据挖掘功能,包括概念描述、发现驱动的OLAP分析、关联挖掘、链接分析、统计分析、分类、预测、聚类、异常值分析、相似性搜索、序列模式分析和可视化数据挖掘。
对于给定的数据挖掘功能(包括分类),一些系统只能提供一种方法,而另一些系统可以提供多种方法(包括决策树分析、贝叶斯网络、神经网络、支持向量机、基于规则的分类、k-最近邻方法、遗传算法和基于案例的推理)。
提供多种数据挖掘功能和每个功能多种方法的数据挖掘系统为用户提供更高的灵活性和分析能力。有些问题可能需要用户尝试几种不同的挖掘功能或将几种结合在一起,对于不同类型的数据,不同的方法可能比其他方法更有效。