首先深度学习是机器学习的一种,是一个复杂的机器学习模型,这种学习模型并不是单一的,而是多种多样的,深度学习通过增加神经网络的层次,将复杂的数据变得抽象化和简单化。
现如今人们利用深度学习模型实现的人工智能正在给人们生活带来居多的便利,例如:自动语音识别、自动图像识别、人脸支付、指纹识别、自动驾驶等等,生活中处处充满了人工智能的影子。
人工神经网络主要是模拟人大脑运算的一种算法模型。
例如:当人们通过不同的感知能力获得外界信息,从而刺激不同的神经元,让大脑发出不同的指令,没有受到刺激的神经元则不发出指令,基于此机理人们设计了人工多层神经网络计算模型。
目前人工神经网络常见的三种模型:全连接神经网络、卷积神经网络、循环神经网络。
下面我们来看看这三种神经网络模型的基本原理。
全连接神经网络是最普通,最常规的神经网络,由输入层、隐藏层和输出层组成。
每个全连接神经网络的输入和输出层的神经元是固定的,不能自由变换维度(为了便于理解,可以把维度理解成长度)。
假设我们平时买的手机价格只跟品牌、手机功能、手机使用材料这三个因素相关,那么我们输入层神经元的个数就是3个,如果需要增加一个影响因素,则需要我们人为的调整,所以全连接神经网络只能处理维度固定的数据。
如图(1)为一个全连接单隐藏层的网络模型,x1-xn为输入层,x、a、y对应的每个圆圈均为1神经元,b为神经元的偏置项(主要起到数据校正的作用,通常为0)。
箭头为连接每一个神经元之间的网络,且每个箭头都有各自的权重,所谓权重即这个因素对产生的下一个结果有多大的影响。
当我们将数据输入到输入层时,输入层的数据会与每一个箭头对应的权重相乘流入到隐藏层神经元,直到输出层输出结果,如果输出与预期结果偏差较大,就需要重新调整权重值,让输出结果尽可能接近我们心理阈值。
全连接神经网络主要的作用是将固定维度的数据进行分类处理,如图(2)影响力量的因素输入全连接神经网络后,会输出不同种类人的力量大小。
卷积神经网络计算模型是一种局部连接网络,他有两种常见的模型,一种是全部由卷积层组成,另一种由卷积层和全连接层组成。
卷积层的作用是为了解决全连接网络面对超大型数据运算难度大以及某些局部特征提取困难的问题。
卷积层接收到的数据可以是不同维度的,但如果后端是全连接神经网络,卷积层提取出来的就必须是固定维度的数据。
这种模型主要应用于图像的处理,例如人脸识别、医疗领域(如体外诊断:妇科形态学、血液形态学、尿液形态学等)。
如图3所示,我们需要让计算机具备识别图片的能力,卷积神经网络会先通过卷积层将图片进行特征采样,然后将采样到的特征输入给全连接神经网络。
全连接神经网络会对接收到的特征进行学习分类,直至输出层输出结果。
如图4,当计算机识别到的图片信息与预期偏差较大时,我们仍然需要调整参数,让最终识别结果尽可能与照片内容相符。
循环神经网络与前面两种神经网络不同之处,在于循环神经网络多了一个储存器(也可以理解为延长器)和隐藏输入层。
延迟器用来储存上一个时刻的状态信息,隐藏输入层用来接收前一个时刻的状态信息。
这种结构使得循环神经网络可以接收任意维度的时序性数据,也更加符合生物神经网络的结构。
如图5,X为第一个输入层,h为状态层,Y为输出层,输入层和输出层都可以是任意维度的。
例如:我可以按照先后顺序输入X1~Xn,输出的可以是Y1~Yn,也可以只是Yn,紫色箭头代表各个h层之间的连接网络。
这个连接网络也是具有权重值的,前一层的输出结果可以通过这个连接网络进入下一层的隐藏输入层,以此类推,最终的输出结果Yn将与X1~Xn的所有值相关。
如图6,我们输入的是一张图片,但输出的内容可以是不同形式的。
正因为这种模型的极高灵活性,所以它的应用也非常广,如语音识别、语言翻译、文章撰写、天气、股票预测等。
随着人们对深度学习认知的不断深入,技术水平的不断改进,我们坚信深度学习和神经网络将会给我们带来更多的惊喜。