Machine Learning---Neural Network

Machine Learning：Neural Network

一：前言

1，Wikipedia上对Neural Network的定义：

In machine learning,artificial neural networks (ANNs) are a family of statistical learning algorithms inspired by biological neural networks (thecentral
nervous systems of animals, in particular thebrain) and are used to estimate or
approximate functions that can depend on a large number of input sand are generally unknown. Artificial neural networks are generally presented
as systems of interconnected "neurons" which can compute values from inputs, and are capable ofmachine learning as well aspattern recognition
thanks to their adaptive nature.

2，为什么要引入Neural Network？

我们前面学习了回归和分类模型，然而它们的实际应用受制于数据的规模（也就是维度灾难（curse of dimensionality））。Neural Network用于处理大量输入特征是非常有优势的，例如抽取计算机视觉中图片的像素作为输入特征，那么这将得到数量巨大的输入特征集；如果仍然回归和分类模型，学习参数所需要的时间将会是不能承受的；

二：Neural Network—Representation

1，Neural Network模型

在神经网络中，我们把第一层称为input layer，最后一层称为output layer，中间若干层都称为hidden layer。

下面我们来看一个非常简单的神经网络：

这个简单的神经网络相当于一个逻辑分类器。之所以会是这样的结果，是因为output layer上neutron的转换函数是sigmoid函数。当然这完全可以根据我们的实际问题去选择合适的activation function。

下面我们来详细的描述一下神经网络：

上图中，a(i,j)表示为第j层的第i个activation，它是由activation function转换得到的，也就是这里的g(.)；一般来说，各层的activation function是一样的(除了output layer，这个需要根据最后需要的形式来确定，比如离散、连续还是multi-classification等等)，当然你也可以选择使它们不一样，这样增大了实现起来的难度。Theta权重参数矩阵控制layer j到layer j+1的映射。

2，Forward Propagation Algorithm

这种Forward propagation的方式是从input layeràhidden layeràoutput layer来进行对h(x)的计算；我们并不是直接对原始数据进行建模、调参，而是利用中间层得到的结果，然而中间层的结果是由原始数据学习而来的；换言之，这有很大的灵活性，每层之间的转换可以是任何线性组合或者多项式组合等。

下面来看一下如何利用神经网络实现逻辑表达式：