问题:许多基于内存的聚类算法所常用的两种数据结构是()和()
查看答案
问题:数据变换的内容是什么?
问题:数据压缩可分为:()和 ()两种类型。
问题:简述数据仓库4种体系结构的异同点以其适用性。
问题:序列数据没有时间戳。
问题:请简述几种典型的多维数据的OLAP操作
问题:噪声平滑方法:()。
问题:简述ID3算法的基本思想及其主算法和建树算法的基本步骤。
问题:广义知识
问题:分类问题中常用的评价准则有精确度、查全率和查准率和()
问题:简述数据仓库的组成。
问题:数据抽取的两个常见类型是静态抽取和增量抽取。静态抽取用于()填充数据仓库,增量抽取用于进行数据仓库的维护。
问题:在基本K均值算法里,当邻近度函数采用()的时候,合适的质心是簇中各点的中位数。A、曼哈顿距离B、平方欧几里德距离C、余弦距离D、Bregman散度
问题:常见的分箱方法有哪些?数据平滑处理的方法有哪些?
问题:请列出3种数据仓库产品,并说明其优缺点。
问题:下列()不是将主观信息加入到模式发现任务中的方法。A、与同一时期其他数据对比B、可视化C、基于模板的方法D、主观兴趣度量
问题:一个好的聚类分析方法会产生高质量的聚类,具有两个特征:()和()
问题:如果允许一条记录触发多条分类规则,把每条被触发规则的后件看作是对相应类的一次投票,然后计票确定测试记录的类标号,称为()。A、无序规则B、穷举规则C、互斥规则D、有序规则
问题:维度表一般又主键、分类层次和描述属性组成。对于主键可以选择两种方式:一种是采用自然键,另一种是采用()
问题:什么是聚类?简单描述如下的聚类方法:划分方法,层次方法,基于密度的方法,基于模型的方法。为每类方法给出例子。