什么是数据挖掘?什么是知识发现?简述KDD的主要过程

2022-09-30 03:00:53 来源：编辑：屈绍广

大家好,乐天来为大家解答以下的问题，关于什么是数据挖掘?什么是知识发现?简述KDD的主要过程这个很多人还不知道,现在让我们一起来看看吧！

1、数据挖掘（Data Mining）是指通过大量数据集进行分类的自动化过程，以通过数据分析来识别趋势和模式，建立关系来解决业务问题。

2、换句话说，数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

3、原则上讲，数据挖掘可以应用于任何类型的信息存储库及瞬态数据（如数据流），如数据库、数据仓库、数据集市、事务数据库、空间数据库（如地图等）、工程设计数据（如建筑设计等）、多媒体数据（文本、图像、视频、音频）、网络、数据流、时间序列数据库等。

4、也正因如此，数据挖掘存在以下特点：（1）数据集大且不完整数据挖掘所需要的数据集是很大的，只有数据集越大，得到的规律才能越贴近于正确的实际的规律，结果也才越准确。

5、除此以外，数据往往都是不完整的。

6、（2）不准确性数据挖掘存在不准确性，主要是由噪声数据造成的。

7、比如在商业中用户可能会提供假数据；在工厂环境中，正常的数据往往会收到电磁或者是辐射干扰，而出现超出正常值的情况。

8、这些不正常的绝对不可能出现的数据，就叫做噪声，它们会导致数据挖掘存在不准确性。

9、（3）模糊的和随机的数据挖掘是模糊的和随机的。

10、这里的模糊可以和不准确性相关联。

11、由于数据不准确导致只能在大体上对数据进行一个整体的观察，或者由于涉及到隐私信息无法获知到具体的一些内容，这个时候如果想要做相关的分析操作，就只能在大体上做一些分析，无法精确进行判断。

12、而数据的随机性有两个解释，一个是获取的数据随机；我们无法得知用户填写的到底是什么内容。

13、第二个是分析结果随机。

14、数据交给机器进行判断和学习，那么一切的操作都属于是灰箱操作。

本文分享完毕，希望对大家有所帮助。

标签：

免责声明：本文由用户上传，与本网站立场无关。财经信息仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。如有侵权请联系删除！

什么是数据挖掘?什么是知识 发现?简述KDD的主要过程