|
|
4 years ago | |
|---|---|---|
| README.md | 4 years ago | |
README.md
numb
智能决策 1、 遗传算法是模拟自然界的 [C] 现象提出的算法。 A、自然选择 B、人工选择 C、适者生存 2、 遗传算法的基本操作包括: [A,B,C] 。 A、选择 B、交叉 C、变异 D、遗传 3、 模拟退火算法是模拟 [B] 的过程 A、灭火 B、金属退火 C、物体退火 4、 模拟退火算法与爬山法的不同是: [B] 。 A、优先选择最优解 B、以一定概率接收较差的解 C、始终选择最优解 5、 受自然界现象或原理启发而提出的智能优化算法包括[A、B、C、D]: A、遗传算法 B、蚁群算法 C、粒子群优化算法 D、模拟退火算法 6、 典型的智能决策系统包括[A,B,C,D]: A、知识库 B、模型库 C、方法库 D、数据库 7、构成状态空间的 4 个要素是:[B]。 A:开始状态、目标状态、规则和操作 B:初始状态、中间状态、目标状态和操作 C:空间、状态、规则和操作 D:开始状态、中间状态、结束状态和其他状态 8、专家系统是以 C 为基础,以推理为核心的系统。 A:专家 B:软件 C:知识 D:解决问题 9、下列说法错误的是:[C ]。 A、解的适应度是演化过程中进行选择的唯一依据。 B、优胜劣汰的选择机制使得适应值大的解有较高的存活率,这是遗传算法与一般搜索 算法的主要区别之一。 C、模拟退火算法允许向坏的方向移动以摆脱局部最大值,这种移动随着时间的推移概 率逐步上升。 D、搜索算法本质上是一个程序,旨在找到到达目标的最佳或最短路径。 10、粒子群优化算法在迭代过程中,粒子通过跟踪两个“极值”[B]和[ C]来搜索最优解。 A、群体极值 B、个体极值 C、全局极值 D、粒子极值 机器学习 表 1 贷款申请样本数据表 ID 年龄 有工作 有自己的房子 信贷情况 类别 1 青年 否 否 一般 否 2 青年 否 否 好 否 3 青年 是 否 好 是 4 青年 是 是 一般 是 5 青年 否 否 一般 否 6 中年 否 否 一般 否 7 中年 否 否 好 否 8 中年 是 是 好 是 9 中年 否 是 非常好 是 10 中年 否 是 非常好 是 11 老年 否 是 非常好 是 12 老年 否 是 好 是 13 老年 是 否 好 是 14 老年 是 否 非常好 是 15 老年 否 否 一般 否 1.【多选】表 1 是一个由 15 个样本组成的贷款申请训练数据,这些数据包括贷 款申请人的年龄、是否有工作、是否有房子以及信贷情况信息,表的最后一列表 示是否同意该客户贷款。利用这些样本训练一棵决策树,再利用得到的决策树决 定对于一个新的客户,是否同意其贷款。该问题属于( )。 A. 监督学习 B. 非监督学习 C. 二分类问题 D. 多分类问题 答案:AC,根据预测对象有没有标记信息可以将机器学习问题分为监督学习 和非监督学习,该数据集有标记信息(类别),因此属于监督学习;对于监督 学习中的分类问题,根据类别的数量可以将问题分为二分类和多分类问题, 该数据集中只有两个类别(是、否)因此该问题属于二分类问题。 2.【单选】对于表 1 所给的训练数据集 D,根据信息增益准则选择最优特征。分 别以𝐴1, 𝐴2, 𝐴3, 𝐴4表示年龄、有工作、有自己的房子和信贷情况 4 个特征。现已 经计算出经验熵𝐻(𝐷) = 0.971,不同特征划分下 D 的经验条件熵也已经通过计 算得到:𝐻(𝐷|𝐴1 ) = 0.888,𝐻(𝐷|𝐴2 ) = 0.647,𝐻(𝐷|𝐴3 ) = 0.551,𝐻(𝐷|𝐴4 ) = 0.608。则应选取特征( )作为最优特征。 A. 年龄 B. 有工作 C. 有自己的房子 D. 信贷情况 答案: C,根据信息增益准则,应选取信息增益最大的特征作为划分标准, 而信息增益的计算公式为𝑔(𝐷, 𝐴) = 𝐻(𝐷) − 𝐻(𝐷|𝐴),发现特征𝐴3的信息增益 最大,因此将其作为最优特征。 3【单选】 . 在构建决策树的过程中,下列情况中不会导致出现叶子结点的是( )。 A. 当前数据集以特征“年龄”划分,年龄取值为“老年”的样本全是正例 B. 当前数据集已经分别以“年龄”、“有工作”、“有自己的房子、”“信贷情况”为标 准进行划分,但数据集仍包含正例和反例 C. 当前数据集以特征“信贷情况”划分,但当前数据集已经没有信贷情况为“好”的 样本了 D. 当前数据集已经经过“年龄”、“有工作”两个特征的划分,现以“信贷情况”为标 准进行划分,信贷情况为“一般”的集合包含一个正例和两个反例 答案: D,考察决策树算法中生成子节点的三种情况:(1)当前结点包含的 样本全部属于同一类别;(2)当前属性集为空,或所有样本在所有属性上取 值相同;(3)当前结点包含的样本集合为空。这三种情况分别对应了 A、B、 C 选项。 4.【多选】以下关于 k 近邻算法的说法中,错误的是() A. k 近邻法中,当训练集、距离度量、分类决策规则确定后,其结果唯一确定 B. k 取值过小会导致过拟合,因此 k 值应尽可能大 C. k 近邻算法中的分类决策规则往往是多数表决,它等价于经验风险最小化 D. k 近邻算法虽然易于实现,但需要存储全部训练样本,计算量较大 答案: AB。k 近邻算法中,如果选取不同的 k 值,对结果的影响也会很大, 因此 A 错误;k 值过小会导致过拟合,k 值过大则体现不出相邻点的相似性, 需要取一个适中的 k 值,因此 B 错误。 5.【单选】数据点(1,3)和(5,6)之间的欧氏距离和曼哈顿距离分别是( )。 A. 5,5 B. 5,7 C. 7,5 D. 7,7 答案: B。根据欧氏距离计算公式𝑑𝑖𝑠𝑡(𝑥, 𝑦) = √∑ (𝑥𝑘 − 𝑦𝑘) 𝑑 2 𝑘=1 = ‖𝑥 − 𝑦‖2和曼哈 顿距离计算公式𝑑𝑖𝑠𝑡(𝑥, 𝑦) = ∑ |𝑥𝑘 − 𝑦𝑘 | 𝑑 𝑘=1 = ‖𝑥 − 𝑦‖1得欧氏距离和曼哈顿距离 分别为 5 和 7。下图中左图为欧氏距离,右图是曼哈顿距离。 6.【单选】以下两个图中,训练集、距离度量、分类决策规则都相同的情况下, k 值的大小关系为()。
𝒌𝟏 𝒌𝟐 A. 𝒌𝟏 > 𝒌𝟐 B. 𝒌𝟏 = 𝒌𝟐 C. 𝒌𝟏 < 𝒌𝟐 D. 无法确定 答案: C,当 k 取值为𝒌𝟏时,可以看到发生了过拟合,说明 k 的取值过小, 而 k 取值为𝒌𝟐时,过拟合现象几乎消失,因此𝒌𝟐是应该适当的值,由此可以 得到𝒌𝟏 < 𝒌𝟐。 7.【单选】以下关于 K-means 算法的说法中,正确的是( )。 A. K-means 算法是一种聚类方法,属于监督学习 B. 在训练初始阶段,K-means 算法需要先学习样本的类别数和初始类别中心 C. 不同的初始聚类中心对聚类结果影响不大 D. K-means 算法容易陷入局部最优 答案:D。K-means 算法是一种聚类方法,属于非监督学习,因为它没有标 签,故 A 错误;K-means 算法的 K 值和初始类别中心是需要人为设置的初始 参数,不是通过学习得到的,故 B 错误;初始聚类中心选取不同的值时,对 最终的聚类结果可能有较大的影响,故 C 错误。 8.【单选】以下哪个网络属于多层前馈神经网络( )神经网络图 A. B. C. D. 答案:A,多层前馈神经网络的定义是每层神经元与下一层神经元全互联, 神 经元之间不存在同层连接也不存在跨层连接,CD 都存在同层连接,B 存在跨 层连接,只有 A 满足定义。 9.【单选】以下关于神经元和感知机的说法中,错误的是( )。 A. 人工神经元主要由一组连接、一个加法器、一个激活函数组成 B. 理想激活函数是阶跃函数, 其中 0 表示抑制神经元而 1 表示激活神经元 C. 相较于阶跃函数,Sigmoid 函数具有连续、光滑的优点 D. 感知机由两层或两层以上神经元组成,可以解决复杂的问题 答案:D,感知机由两层神经元组成,可以实现逻辑与、或、非运算,但解决 更复杂的问题需要借助更复杂的模型。 10.【单选】以下关于误差逆传播算法的说法中,错误的是( )。 A. BP 算法基于梯度下降策略, 以目标的负梯度方向对参数进行调整 B. 学习率𝜂过大会导致震荡,因此越小越好 C. BP 算法容易陷入局部最小 D. BP 算法不仅可用于多层前馈神经网络,还可用于其他类型的神经网络 答案:B,学习率控制着算法每一轮迭代中的更新步长, 若太长则让容易震 荡, 太小则收敛速度又会过慢。 机器感知 1: 目标检测算法的主要目的是找到图像中用户感兴趣的语义对象的(c) A: 位置 B:类别 C:位置和类别 D:语义相关性 2. 以下哪项不是计算机中常用的颜色模型(d) A: RGB B:YCbCr C:HSV D:XYZ 3. 以下哪项图像变换操作会影响图像的清晰度(c) A: 图像旋转 B:图像缩小 C:图像放大 D:图像平移 4. 相比于二阶段目标检测算法,一阶段目标检测算法主要的优点是(b): A: 准确度高 B:速度快 C:运行内存小 D:模型简单 5. 相比于一阶段目标检测算法,二阶段目标检测算法主要的优点是(a): A: 准确度高 B:速度快 C:运行内存小 D:模型简单 6. 一阶段目标检测算法的主要原理是(b): A: 首先生成大量的枚举框,再采用深度学习算法提取特征并每个枚举框进行分类 B:采用回归的方式计算真实框与锚框之间的位置偏差和类别偏差 C:首先生成大量的枚举框,再采用传统的特征提取算法提取特征并每个枚举框进行分类 D:将目标检测问题转换为分类问题,通过枚举、特征提取和分类建立模型 7. YOLO 算法的损失函数不包括下列哪个部分(d): A: 对象分类误差 B:对象定位误差 C:对象置信度误差 D:非对象分类误差 8. YOLO 算法中锚框的大小和数量的设置是(a): A:人工设置 B:机器自动学习 C:即可人工设置也可机器自动学习 D:以上都不是 9. YOLO 算法中一个锚框所带的参数不包括(d): A:location B:objectiveness C:classification D:non-objectiveness 10. 非极大抑制算法保留的候选框是(c): A: 置信度最高的前 K 个候选框 B:置信度最高且位置具有多样性的前 K 个候选框 C:置信度最高的前 K 个不相互重叠的候选框 D:不相互重叠的 K 个候选框 大数据与机器人
- 以下哪个不是大数据的特征(c) A. 价值密度低 B. 数据类型繁多 C. 访问时间短 D. 处理速度快 答案 C
- 下面哪一个不是大数据的关键技术(d) A. 云计算 B. 分布式文件系统 C. 数据众包 D. 关系性数据库 答案 D
- 数据清洗的方法不包括(d) A:缺失值处理 B:噪声数据清除 C:一致性检查 D:重复数据记录处理 答案 D
- 下列关于大数据的说法中,错误的是( a) A:大数据具有体量大、结构单一、时效性强的特征 B:处理大数据需采用新型计算架构和智能算法等新技术 C:大数据的应用注重相关分析而不是因果分析 D:大数据的目的在于发现新的知识与洞察并进行科学决策 答案 A
- 下列哪项通常是集群的最主要瓶颈 (c) A. CPU B. 网络 C. 磁盘 IO D. 内存 答案 C 6.下列关于 MapReduce 说法不正确的是 (c ) A. MapReduce 是一种计算框架 B. MapReduce 来源于 google 的学术论文 C. MapReduce 程序只能用 java 语言编写 D. MapReduce 隐藏了并行计算的细节,方便使用 答案 C 7.关于大数据的价值密度描述正确的是以下哪个? (a ) A、大数据由于其数据量大,所以其价值密度低。 B、大数据由于其数据量大,所以其价值也大。 C、大数据的价值密度是指其数据类型多且复杂。 D、大数据由于其数据量大,所以其价值密度高。 答案 A
- 下列(c)应用领域不属于人工智能应用。 A. 人工神经网络 B. 自动控制 C. 信息管理系统 D. 专家系统 答案 C
- 步行机器人的行走机构多为(c) A. 滚轮 B. 履带 C. 连杆机构 D. 齿轮机构 答案 C
- 机器人系统的组成与结构主要有三大部分组成,不包括下面哪一个(c) A. 机械部分 B. 传感部分 C. 输出部分 D. 控制部分 答案 C
二分法 from math import * import numpy as np E = 1e-8 ########## begin ##########
请在此填写代码, 计算-sin(x)e*(x)+15*cos(x)*x**0.5=0的根
def f(x):
return -sin(x)e*(x)+15*cos(x)*x**0.5
def findroot(a,b,eps):
mid=(a+b)/2
while abs(f(mid))>=E:
mid = (a+b)/2
if f(mid) > 0:
b = mid
if f(mid)==0:
break
if f(mid) < 0:
a = mid
return mid
########### end ########### print('%.5f' %findroot(2,5,0.00001)) 几位小数 两个区间 几位小数 每一个相乘的数之间都要有* 记得点变更之后看,格式正确