目录
1 神经网络介绍
2 神经网络详解
2.1 非线性假设
如果是一个非线性的分类问题,我们需要多项式来拟合,比如选择2次项或者3次项,这个时候我们的Final Feature的个数复杂度是:
- 2次项的复杂度是$O(\frac {n^2} 2)$,
- 3次项的复杂度是$O({n^3})$。
也就是说不是Scalable的。
2.2 神经元与大脑
神经网络:在机器学习和认知科学领域,人工神经网络模仿人类大脑用只有一种学习算法通过人工神经元联结进行计算,一种非线性统计性数据建模工具。典型的神经网络具有:
-
结构(Architecture,神经元连接的权重(weights)和神经元的激励值(activities of the neurons))
-
激励函数(Activity Rule)
3.学习规则(Learning Rule)
科学家发现对于大脑中的某个区域,如果改变相应的输入信号,该区域可以学习处理任何信号,比如从听觉改成视觉。这改变了人们思考如何通过计算机来模仿人类的大脑,即通过单一算法而不是成百上千种算法。运行算法的单元就是神经元。
2.3 模型展示
2.4 例子和直觉
下面我们来看看Netural Network如何构建3个基本的逻辑电路,即AND,OR,Negation gate;以及在此基础上搭建出来的XNOR gate。
Handwritten Digit Classification - Yann Lecun是利用Netural Network识别手写数字的一个视频,是Yann Lecun(机器学习的著名科学家)发明的一个OCR程序。
2.5 多类的分类
3 作业
见Classification。附上一张跑分图。
4 总结
本文根据人类大脑神经元作为基本单元,“单一学习算法”为算法,用神经网络模拟人脑。
通常神经网络有$l$层(第1层是输入层,第n层是输出层,其他为隐藏层),每一层有$S_j$个激发单元,激励函数是$sigmoid(A\Theta^T)$ 函数,$\Theta^T$是权重。它的universal的学习函数算法为: