BP算法仅适用于多层前馈神经网络。
前馈神经网络的隐藏单元必须在所有的输入点都可微。
如果在一个高度非线性且复杂的一些变量中,一个树模型可能比一般回归模型效果更好。
过拟合只在监督学习中出现,非监督学习没有过拟合。
数据维数很高时,很多机器学习问题会变得相当困难,这种现象叫做维数灾难。
训练好的模型在测试集准确率100%,则在新的数据集上也会达到100%。
欠拟合是模型不能在训练集上获得足够低的误差,过拟合是指训练误差和测试误差差距小。
一般而言,L2正则化可产生比L1正则化更稀疏的解。
感知机学习一定收敛。
梯度为0的点不一定是局部极值。
深度学习是一种特殊的表示学习方法。
多层神经网络本质是是一个复合函数。
贝叶斯派统计方法比频率派统计方法估计模型参数更优。
RNN适用于序列数据的处理。
LSTM网络结构有利于解决RNN训练出现的梯度消失或者爆炸的问题。