与数据挖掘方法相关的用户交互问题是什么?
与数据挖掘方法相关的各种用户交互问题如下-
在数据库中挖掘不同种类的知识-不同的用户可能对不同种类的知识感兴趣。因此,数据挖掘必须涵盖广泛的数据分析和知识发现任务,包括数据表征、鉴别、关联、分类、聚类、趋势和偏差分析以及相似性分析。
在多个抽象级别对知识进行交互式挖掘-因为准确地知道可以在数据库中找到什么是复杂的,所以数据挖掘过程必须是交互式的。交互式挖掘使用户能够有针对性地搜索模式,根据返回的结果支持和改进数据挖掘请求。这将支持用户在多个粒度和多个角度查看信息和发现模式。
合并背景知识-与数据库相关的领域知识,包括完整性约束和推导规则,可以帮助定位和加速数据挖掘过程,或判断已识别模式的兴趣。
数据挖掘查询语言和临时数据挖掘-需要开发的高级数据挖掘查询语言,可以与数据库或数据仓库查询语言集成,使用户能够通过支持用于分析的相关数据集、领域知识、要挖掘的知识类型以及对识别的模式强制执行的条件和兴趣约束的规范。
数据挖掘结果的呈现和可视化-发现的知识应以高级语言、视觉定义或其他表达形式进行定义,以便知识可以简单地学习并直接供人类使用。
处理异常值或不完整数据-存储在数据库中的数据可以反映异常值的噪声、异常情况或不完整的数据对象,这些数据对象可能会导致识别模式的准确性较差。需要可以管理异常值的数据清理方法和数据分析方法。
模式评估-数据挖掘系统可以发现数百种模式。发现的一些模式可能对给定用户来说是无趣的,定义了常识或缺乏新颖性。使用兴趣部分来指导发现过程并减少搜索空间是另一个活跃的研究领域。
并行、分布式和增量更新算法-多个数据库的大容量、数据的广泛分布以及某些数据挖掘方法的计算复杂性是推动并行和分布式数据挖掘算法进步的因素。