1 / 4
文档名称:

BAT 机器学习笔试题库.docx

格式:docx   大小:16KB   页数:4页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

BAT 机器学习笔试题库.docx

上传人:jiyudian11 2022/6/25 文件大小:16 KB

下载得到文件列表

BAT 机器学习笔试题库.docx

文档介绍

文档介绍:1以下几种模型方法属于判别式模型(Discriminative Model)的有()
混合高斯模型
条件随机场模型
区分度训练
4)隐马尔科夫模型
A 2,3 B 3,4 C1,4 D1,2
2、 Nave Bayes是一种特殊特比算法: 用动态规划解决 HMM 的预测问题,不是参数估计 前向后向算法:用来算概率
极大似然估计:即观测序列和相应的状态序列都存在时的监督学****算法,用来估计参数 注意的是在给定观测序列和对应的状态序列估计模型参数,可以利用极大似然发估计。如果给定观测序列,没有对应的状态序列, 才用EM,将状态序列看不不可测的隐数据。
5正确答案是:D,您的选择是:空
解析: 之前的解析 有些问题,特完善如下。
L1范数是向量中各个元素的绝对值之和,又叫稀疏规则算子。L1正则化通过向代价函数中添加权重向量的L1 范数(即正则化项),使得优化后的模型中无用特征对应的权值变为0,相当于减少了特征维数,实现了特征的自 动选择,所以 LR 中加入 L1 范数可以进行特征选择、解决维度灾难问题、加快计算速度;
L2范数是向量中各个元素平方和的1/2次方。L2正则化通过向代价函数中添加权重向量的L2范数,使得优化 后的模型中所有的权值 w 尽可能趋于 0 但不为 0,通过 L2 范数,可以实现对模型空间的限制,从而在一定程度上 避免了过拟合;
过拟合的时候,拟合函数需要顾忌每一个点,最终形成的拟合函数波动很大, 在某些小区间里,函数值的变 化很大,也就是 w 非常大。所以 LR 中加入 L2 范数可以在一定程度上防止过拟合;
在 LR 中同时加入 L1 和 L2 范数不会产生结果更准确的效果。
6正确答案是:A,您的选择是:空
解析:
L1 正则化偏向于稀疏,它会自动进行特征选择,去掉一些没用的特征,也就是将这些特征对应的权重置为0.
L2 主要功能是为了防止过拟合,当要求参数越小时,说明模型越简单,而模型越简单则,越趋向于平滑,从 而防止过拟合。
L1正则化/Lasso
L1正则化将系数w的11范数作为惩罚项加到损失函数上,由于正则项非零,这就迫使那些弱的特征所对应的 系数变成0。因此L1正则化往往会使学到的模型很稀疏(系数w经常为0),这个特性使得L1正则化成为一种很 好的特征选择方法。
L2 正则化/Ridge regression
L2正则化将系数向量的L2范数添加到了损失函数中。由于L2惩罚项中系数是二次方的,这使得L2和L1有着 诸多差异,最明显的一点就是,L2正则化会让系数的取值变得平均。
对于关联特征,这意味着他们能够获得更相近的对应系数。还是以Y=X1+X2为例,假设X1和X2具有很强的 关联,如果用L1正则化,不论学到的模型是Y=X1+X2还是Y=2X1,惩罚都是一样的,都是2alpha。但是对于L2来 说,第一个模型的惩罚项是2alpha,但第二个模型的是4*alpha。可以看出,系数之和为常数时,各系数相等时惩 罚是最小的,所以才有了 L2会让各个系数趋于相同的特点。
可以看出,L2正则化对于特征选择来说一种稳定的模型,不像L1正则化那样,系数会因为细微的数据变化而 波动。所以L2正则化和L1正则化提供的价值是不同的,L2正则化对于特征理解来说更加有用:表示能力强的特征 对应的系数是