问题:维度表一般又主键、分类层次和描述属性组成。对于主键可以选择两种方式:一种是采用自然键,另一种是采用()
查看答案
问题:什么是聚类?简单描述如下的聚类方法:划分方法,层次方法,基于密度的方法,基于模型的方法。为每类方法给出例子。
问题:常见的分箱方法有哪些?数据平滑处理的方法有哪些?
问题:数据变换的内容是什么?
问题:分类的过程包括获取数据、预处理、分类器设计和()
问题:一个好的聚类分析方法会产生高质量的聚类,具有两个特征:()和()
问题:考虑值集{12,24,33,2,4,55,68,26},其四分位数极差是:()。A、31B、24C、55D、3
问题:简述缺失值的处理方法。
问题:关于混合模型聚类算法的优缺点,下面说法正确的是()。A、当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理B、混合模型比K均值或模糊c均值更一般,因为它可以使用各种类型的分布C、混合模型很难发现不同大小和椭球形状的簇D、混合模型在有噪声和离群点时不会存在问题
问题:数据仓库常见的存储优化方法是什么?
问题:如果规则集R中不存在两条规则被同一条记录触发,则称规则集R中的规则为()。A、无序规则B、穷举规则C、互斥规则D、有序规则
问题:分类问题中常用的评价准则有精确度、查全率和查准率和()
问题:广义知识
问题:两个文档向量d1和d2的值为:d1=(1, 0, 3, 0, 2),d2=(3, 2, 0, 0, 1),则它们的余弦相似度为:()
问题:请列出3种数据仓库产品,并说明其优缺点。
问题:数据挖掘应用和一些常见的数据统计分析系统的最主要区别在于()。A、所涉及的算法的复杂性B、所涉及的数据量C、计算结果的表现形式D、是否使用了人工智能技术
问题:如果允许一条记录触发多条分类规则,把每条被触发规则的后件看作是对相应类的一次投票,然后计票确定测试记录的类标号,称为()。A、无序规则B、穷举规则C、互斥规则D、有序规则
问题:下面属于定量的属性类型是:()。A、标称B、序数C、区间D、相异
问题:请简述几种典型的多维数据的OLAP操作
问题:可信度