数据挖掘工程师题库
- 在基于规则分类器的中,依据规则质量的某种度量对规则排序,保证每一个测试记录都是由覆盖它的“最好的”规格来分类,这种方案称为 ( )
- 检测一元正态分布中的离群点,属于异常检测中的基于( )的离群点检测
- 商业智能系统与一般交易系统之间在系统设计上的主要区别在于:后者把结构强加于商务之上,一旦系统设计完毕,其程序和规则不会轻易改变;而前者则是一个学习型系统,能自动适应商务不断变化的要求( )
- ( )是一个观测值,它与其他观测值的差别如此之大,以至于怀疑它是由不同的机制产生的。
- 下面哪些属于可视化高维数据技术 ( )
- 下列几种数据挖掘功能中,( )被广泛的应用于股票价格走势分析。
- 平均值函数avg()属于哪种类型的度量?
- 以下哪种聚类方法可以发现任意形状的聚类?
- 根据关联分析中所涉及的数据维,可以将关联规则分类为( )⏺
- 帮助市场分析人员从客户的基本信息库中发现不同的客户群,通常所使用的数据挖掘功能是( )
- 下面哪种不属于数据预处理的方法? ( )
- BIRCH是一种( )
- 下面选项中t不是s的子序列的是 ( )
- 考虑值集{1224 33 2 4 55 68 26},其四分位数极差是:( )
- 下面哪种分类方法是属于统计学的分类方法?
- 关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。( )
- 如果规则集R中不存在两条规则被同一条记录触发,则称规则集R中的规则为( )
- 置信度(confidence)是衡量兴趣度度量( )的指标。
- 以下哪个聚类算法不属于基于网格的聚类算法( )
- OLAP技术侧重于把数据库中的数据进行分析、转换成辅助决策信息,是继数据库技术发展之后迅猛发展起来的一种新技术( )
- 聚类(clustering)是这样的过程:它找出描述并区分数据类或概念的模型(或函数),以便能够使用模型预测类标记未知的对象类。 ( )
- 如果对属性值的任一组合,R中都存在一条规则加以覆盖,则称规则集R中的规则为( )
- 下面关于Jarvis-Patrick(JP)聚类算法的说法不正确的是( )
- 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?( )
- 噪声和伪像是数据错误这一相同表述的两种叫法。 ( )
- 考虑值集{1、2、3、4、5、90},其截断均值(p=20%)是( )
- 特征提取技术并不依赖于特定的领域。 ( )
- 数据的噪声是指( )。
- 下面的数据挖掘的任务中,( )将决定所使用的数据挖掘功能。
- 如果规则不满足置信度阈值,则形如的规则一定也不满足置信度阈值,其中是X的子集( )