数据挖掘是什么?在CMA考试中需要考生掌握的知识有哪些呢?同时在学习中数据挖掘只有简简单单的定义吗?其实不是的,需要考生掌握的知识挺多的。小编给你讲一下!

)数据挖掘的定义

数据挖掘包括对大型数据集使用分析工具。从本质上讲,数据挖掘涉及大量数据的查询。其思 想是在组织常规收集,但在大多数操作设置中不使用的数据中查找模式、关系和见解。

(二)数据挖掘的挑战

数据挖掘通常使用来自组织外部的数据。公司寻找有用的信息,并确定能够提高销售、降低成 本和更有效的客户服务的趋势。

(三)数据挖掘可以分为五个步骤:

第1步是发现异常

第2步是找到变量之间的关系,然后以某种方式将这些关系聚类(分组)。

第3步,一旦数据被聚类,下一步就是概括这些关系,以使所展示的结构适用于新数据以及原始数据库。

第4步,回归分析(包括线性回归和多元回归)试图找到量化函数或方程,以*小的误差对 数据进行建模,即估计数据或数据集之间的关系。

第5步,数据挖掘的zui后一步提供了数据集的表示形式,包括可视化和报告。

(四)使用查询工具来检索信息

结构化查询语言( SQL)是一种用于挖掘大型数据集的成熟工具,是用于在关系数据库管理系统 ( RDBMSs)中访问和操纵数据的语言,通过使用一组用于创建、更新和检索信息的命令来构造和执 行查询。SQL支持包含结构化数据的大数据。

好了,考生需要掌握的数据挖掘就是这么多,小编给你准备了一些资料,有需要可点击下方链接获取!

戳:各科必背定义+历年真题中文解析+学习备考资料(PDF版)