人工神经网络基础概念、原理知识(补)

一提到人工神经网络应当想到三个基础的知识点:一是神经元模型;二是神经网络结构;三是学习算法。神经网络的种类多种多样,但其分类依据逃不出上面上个基础知识点。所以在学习中如果能够仅仅把握住以上三个线索,就能触类旁通,拥有一个非常好的视角看待神经网络。今天就对这三个基础知识点进行总结,达到指导神经网络学习以及深化对神经网络的理解的目的。

一、神经元模型

人工神经网络是在现代神经生物学研究基础上提出的模拟生物过程 ,反映人脑某些特性的一种计算结构。它不是人脑神经系统的真实描写,而只是它的某种抽象、简化和模拟。根据前面对生物神经网络的介绍可知,神经元及其突触是神经网络的基本器件 。 因此,模拟生物神经网络应首先模拟生物神经元。在人工神经网络中,神经元常被称为“处理单元” 。有时从网络的观点出发常把它称为“节点” 。人工神经元是对生物神经元的一种形式化描述,它对生物神经元的信息处理过程进行抽象,并用数学语言予以描述;对生物神经元的结构和功能进行模拟 , 并用模型图予以表达。

1. 神经元建模

目前人们提出的神经元模型已有很多 ,其中最早提出且影响最大的,是1943年心理学家 McCulloch 和数学家 W . Pitts 在分析总结神经元基本特性的基础上首先提出的M-P模型 。 该模型经过不断改进后,形成目前广泛应用的形式神经元模型。关于神经元的信息处理机制,该模型在简化的基础上提出以下6点假定进行描述 :

(1) 每个神经元都是一个多输入单输出的信息处理单元 ;(2) 神经元输入分兴奋性输入和抑制性输入两种类型 ;(3) 神经元具有空间整合特性和阈值特性 ;(4) 神经元输入与输出间有固定的时滞 ,主要取决于突触延搁 ;(5) 忽略时间整合作用和不应期 ;(6) 神经元本身是非时变的 , 即其突触时延和突触强度均为常数 。

基于上面的6条假设,神经元建模图示如下:

实际上表达就是一个整合∑、映射F的数学建模。

2. 神经元的数学模型

由神经元模型示意图,可以得到神经元的数学模型如下:

若将阈值参数作为输入端与w0权值整合到∑当中,就可以得到如下的简化形式:

3. 神经元的激活函数(映射F)

神经元的各种不同数学模型的主要区别在于采用了不同的变换函数 ,从而使神经元具有不同的信息处理特性 。 神经元的信息处理特性是决定人工神经网络整体性能的三大要素之一 , 因此变换函数的研究具有重要意义 。 神经元的变换函数反映了神经元输出与其激活状态之间的关系 , 最常用的变换函数有以下 4 种形式 。

(1)阈值型变换函数

采用单位阶跃响应函数,公式以及图示如下:

(2)非线性变换函数

非线性变换函数为实数域 R 到[0, 1]闭集的非减连续函数,代表了状态连续型神经元模型。 最常用的非线性变换函数是单极性的 Sigmoid 函数曲线,简称 S 型函数, 其特点是函数本身及其导数都是连续的, 因而在处理上十分方便。 单极性以及双极型S型函数公式及图示如下:

(3)分段线性变换函数

该函数的特点是神经元的输入与输出在一定区间内满足线性关系。由于具有分段线性的特点,因而在实现上比较简单。这类函数也称为伪线性函数,单极性分段线性变换函数的g公式和图示如下:

(4)概率型变换函数

采用概率型变换函数的神经元模型其输入与输出之间的关系是不确定的 ,需用一个随机函数来描述其输出状态为1或为0的概率。 设神经元输出为 1 的概率如下:

式中 ,T 称为温度参数 。 由于采用该变换函数的神经元输出状态分布与热力学中的玻尔兹曼(Boltzmann)分布相类似 , 因此这种神经元模型也称为热力学模型 。

二、神经网络结构

大量神经元组成庞大的神经网络,才能实现对复杂信息的处理与存储,并表现出各种优越的特性。神经网络的强大功能与其大规模并行互连、非线性处理以及互连结构的可塑性密切相关。因此必须按一定规则将神经元连接成神经网络,并使网络中各神经元的连接权按一定规则变化。生物神经网络由数以亿计的生物神经元连接而成,而人工神经网络限于物理实现的困难和为了计算简便,是由相对少量的神经元按一定规律构成的网络。人工神经网络中的神经元常称为节点或处理单元,每个节点均具有相同的结构,其动作在时间和空间上均同步。

但是至少可以为自己的荷包省钱可以支些招,这点还是很现实的。

人工神经网络基础概念、原理知识(补)

相关文章:

你感兴趣的文章:

标签云: