智慧树知道数据挖掘-智慧树-知到-题库零氪单元测试答案

日期:2023-01-31 13:37:10

第一章测试

1、什么是KDD?
    A、A.数据挖掘与知识发现
    B、B.领域知识发现
    C、C.文档知识发现
    D、D.动态知识发现

2、数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。

3、数据挖掘的预测建模任务主要包括哪几大类问题?
    A、分类
    B、回归
    C、模式发现
    D、模式匹配

4、以下哪些学科和数据挖掘有密切联系?
    A、统计
    B、计算机组成原理
    C、矿产挖掘
    D、人工智能

5、离群点可以是合法的数据对象或者值。

第二章测试

1、下面哪个属于定量的属性类型:  
    A、标称
    B、序数
    C、区间
    D、相异

2、只有非零值才重要的二元属性被称作:  
    A、计数属性
    B、离散属性
    C、非对称的二元属性
    D、对称属性

3、定量属性可以是整数值或者是连续值。

4、中心趋势度量模(mode)是指
    A、算术平均值
    B、数据集中出现频率最高的值
    C、最大值
    D、最小值

5、以下哪些是属于中心趋势的度量
    A、平均值
    B、标准差
    C、五数概括
    D、中位数

第三章测试

1、数据清洗的方法不包括
    A、缺失值处理
    B、噪声数据清除
    C、一致性检查
    D、重复数据记录处理

2、对数据进行数据清理、集成、变换、规约是数据挖掘哪个步骤的任务?
    A、频繁模式挖掘
    B、分类和预测
    C、数据预处理
    D、噪声检测

3、以下哪项不属于数据规约的方法?
    A、数据迁移
    B、维规约
    C、数据压缩
    D、数值规约

4、大数据预处理的方法不包含以下哪个选项?
    A、数据清洗
    B、数据变换
    C、数据采集
    D、数据规约

5、在噪声数据中,波动数据比离群点数据偏离整体水平更大。

第四章测试

1、某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?   
    A、关联规则发现
    B、聚类
    C、分类
    D、自然语言处理

2、关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。

3、具有较高的支持度的项集具有较高的置信度。

4、给定关联规则A→B,意味着:若A发生,B也会发生。

5、啤酒与尿布的故事是聚类分析的典型实例。

第五章测试

1、分类和回归都可用于预测,分类的输出是离散的类别值,而回归的输出是连续数值。

2、决策树方法通常用于关联规则挖掘。

3、在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题。

4、对于SVM分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响。

5、下面哪种分类方法是属于统计学的分类方法?
    A、判定树归纳
    B、贝叶斯分类
    C、后向传播分类
    D、基于案例的推理

第六章测试

1、基于划分方法的聚类都是基于距离来判断数据对象相似度的

2、K-Means聚类过程中计算出的“质心”点是虚拟的。

3、DBSCAN聚类和K-Medians聚类都需要预先指定聚类的簇的数目

4、下列属于层次聚类方法的是
    A、K-Means
    B、AGNES
    C、DIANA
    D、DBSCAN

5、衡量离群点的离群因子,计算的是
    A、簇间距离
    B、轮廓系数
    C、平均绝对偏差
    D、簇间距离的加权平均值

第七章测试

1、神经元节点计算什么()
    A、神经元节点先计算激活函数,再计算线性函数(z = Wx + b)
    B、神经元节点先计算线性函数(z = Wx + b),再计算激活
    C、神经元节点计算函数g,函数g计算(Wx + b)
    D、在将输出应用于激活函数之前,神经元节点计算所有特征的平均值

2、在一个神经网络里,知道每一个神经元的权重和偏差是最重要的一步。如果以某种方法知道了神经元准确的权重和偏差,你就可以近似任何函数。实现这个最佳的办法是什么?
    A、随机赋值,祈祷它们是正确的
    B、搜索所有权重和偏差的组合,直到得到最佳值
    C、赋予一个初始值,通过检查跟最佳值的差值,然后迭代更新权重
    D、都不正确

3、梯度下降算法的正确步骤是什么? 1.计算预测值和真实值之间的误差 2.迭代跟新,直到找到最佳权重 3.把输入传入网络,得到输出值 4.初始化随机权重和偏差 5.对每一个产生误差的神经元,改变相应的(权重)值以减小误差
    A、4, 3, 1, 5, 2
    B、3, 2, 1, 5, 4
    C、5, 4, 3, 2, 1
    D、1, 2, 3, 4, 5

4、以下什么情况下神经网络模型被称为深度学习模型?
    A、加入更多层,使神经网络的深度增加
    B、有维度更高的数据
    C、当这是一个图形识别的问题时
    D、都不正确

5、卷积神经网络可以对一个输入完成不同种类的变换(旋转或缩放),这个表述正确吗?