什么是空间数据挖掘?
空间数据库保存了大量与空间相关的数据,包括映射、预处理的遥感或医学影像记录以及超大规模集成电路芯片设计数据。空间数据库有几个区别于关系数据库的特性。它们携带拓扑和/或距离信息,通常由复杂的多维空间索引结构组织,这些结构通过空间数据访问方法访问,并且通常需要空间推理、几何计算和空间知识表示技术。
空间数据挖掘是指提取未明确存储在空间数据库中的知识、空间关系或其他有趣的模式。这种挖掘需要将数据挖掘与空间数据库技术相结合。可用于学习空间记录,发现空间与非空间记录之间的空间关系和关系,构建空间知识库,重组空间数据库,优化空间查询。
预计它将在地理数据系统、营销、遥感、图像数据库探索、医学成像、导航、交通控制、环境研究和许多其他使用空间数据的领域中得到广泛的应用。
由于空间数据量大,空间数据类型和空间访问方法困难,空间数据挖掘的一个核心挑战是探索有效的空间数据挖掘技术。统计空间数据分析一直是分析空间数据和探索地理信息的流行方法。
术语地统计学通常与连续的地理空间相关联,而术语空间统计通常与离散空间相关联。在管理非空间记录的统计模型中,人们通常会考虑不同数据区域之间的统计独立性。
空间分布的记录之间没有这种分离,因为实际上空间对象是相互关联的,或者更准确地说是空间共存,在这种意义上,两个对象放置得越近,它们发送相同属性的可能性就越大。例如,地理位置相近的地区的自然资源、气候、温度和经济状况很可能相似。
这种在附近空间中密切相关的特性导致了空间自相关的概念。基于这个概念,空间统计建模方法已经成功开发。空间数据挖掘将创建空间统计分析方法并将其扩展到大量空间数据,更加强调有效性、可扩展性、与数据库和数据仓库系统的合作、增强的用户交互以及新知识的发现。