单选题BIRCH是一种()。A 分类器B 聚类算法C 关联分析算法D 特征选择算法

题目
单选题
BIRCH是一种()。
A

分类器

B

聚类算法

C

关联分析算法

D

特征选择算法

如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

层次聚类算法分为哪两种方法?简述这两个层次聚类算法。


正确答案:层次聚类算法是假设类别之间存在层次结构,将样本聚到层次化的类中。层次聚类又有聚合或自底向上聚类、分裂或自顶向下聚类两种方法。聚合聚类开始将每个样本各自分到一个类,之后将相距最近的两类合并,建立一个新的类,重复此操作直到满足终止条件,得到层次化的类别。分裂聚类开始将所有样本分到一个类,之后将已有类中相距最远的样本分到两个新的类,重复此操作直到满足停止条件,得到层次化的类别。

第2题:

简述k-means算法,层次聚类算法的优缺点。


正确答案:(1)k-means算法:
优点:算法描述容易,实现简单快速
不足:
簇的个数要预先给定
对初始值的依赖极大
不适合大量数据的处理
对噪声点和离群点很敏感
很难检测到“自然的”簇
(2)层次聚类算法:
BIRCH算法:
优点:利用聚类特征树概括了聚类的有用信息,节省内存空间;具有对象数目呈线性关系,可伸缩性和较好的聚类质量。
不足:每个节点只能包含有限数目的条目,工作效率受簇的形状的影响大。
C.URE算法:
优点:对孤立点的处理能力强;适用于大规模数据处理,伸缩性好,没有牺牲聚类质量。
缺点:算法在处理大量数据时必须基于抽样,划分等技术。
R.OCK算法:
优点:分类恰当,可采用随机抽样处理数据。
缺点:最坏的情况下时间复杂度级数大。
基于密度的聚类算法:可识别具有任意形状不同大小的簇,自动确定簇的数目,分离簇和环境噪声,一次扫描即可完成聚类,使用空间索引时间复杂度为O(NlbN)。

第3题:

以下是机器学习的常用算法的是()。

A.降维算法

B.聚类算法

C.回归算法

D.分类算法


正确答案:ABCD

第4题:

BIRCH是一种()。

  • A、分类器
  • B、聚类算法
  • C、关联分析算法
  • D、特征选择算法

正确答案:B

第5题:

以下哪个聚类算法不属于基于网格的聚类算法()。

  • A、STING
  • B、WaveCluster
  • C、MAFIA
  • D、BIRCH

正确答案:D

第6题:

在对某商场的顾客进行流失预测分析时,先取得一个顾客样本集S,其模式为(id,a1,a2,…,an,c),其中id为顾客的唯一标识,ai(i=1,2,…,n)为顾客的属性,如年龄、性别、消费时间间隔等,c的取值为{流失,未流失}。现有算法A对样本S进行处理,输出结果为P,P能根据该样本集外的顾客u的n个属性,确定u的c属性值,以对顾客的流失作出预测。那么,A和P分别是( )。

A.聚类算法,聚类工具

B.分类算法,分类器

C.关联规则算法,规则集

D.多维分析算法,OLAP工具


正确答案:B
由于有样本集和测试集之分,又有已有的类别标签,所以属于监督学习。分类:通过学习得到一个目标函数f,把每个属性集x映射到一个预先定义的类标号y。分类属于监督学习。聚类:根据在数据中发现的描述对象及其关系的信息,将数据对象分组,组内的对象相互之间是相似的,而不同组中的对象则不同。组内的相似性越大,组间差别越大,聚类就越好,属于无监督学习。关联规则挖掘:发现隐藏在大型数据集中的有意义的联系。多维分析是指各级管理决策人员从不同的角度、快速灵活地对数据仓库中的数据进行复杂查询多维分析处理。根据题意显然是符合分类。所以选B。

第7题:

以下哪个聚类算法不是属于基于原型的聚类()。

  • A、模糊c均值
  • B、EM算法
  • C、SOM
  • D、CLIQUE

正确答案:D

第8题:

以下算法中属于聚类算法的是()。

A.随机森林

B.逻辑回归

C.Kmeans

D.KNN算法


正确答案:C

第9题:

逆向路径转发算法是一种()

  • A、静态路由选择算法
  • B、动态路由选择算法
  • C、多播路由选择算法
  • D、广播路由选择算法

正确答案:D

第10题:

K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。


正确答案:错误