神经互联网

  人工神经互连网(ANN)
简称神经网络(NN),能效仿生物神经系统对物体所作出的竞相反应,是由具有适应性粗略单元(称为神经元)组成的普遍并行互连网络

1  神经元

1.1  M-P 神经元

  如下图所示,来自别的神经元的信号,$x_1, x_2, … , x_n
$,传递过来作为输入信号,并因此带权重 ($w_1, w_2, … , w_n$) 的连接
(connection) 继续传递,

  然后神经元的总输入值 $\sum w_i x_i$ 与阈值 $\theta$
作相比较,最终通过激活函数$\,f\,$发生神经元的出口: $y = f\left(\,\sum
\limits_{i=1}^n {w_i x_i} – \theta \right)$

   4858mgm 1

1.2  激活函数 (activation function)

  理想中,阶跃函数可作为激活函数,将输入值映射为出口值 “0” 和
“1;实际中,常用 Sigmoid 函数作激活函数,
$f(x)=\,\dfrac{1}{1+e^{-x}}$,如下图所示:

  4858mgm 2

  OpenCV 中应用的激活函数是另一种样式,$f(x)=\beta
\,\dfrac{1-e^{-\alpha x}}{1+e^{-\alpha x}}$

  当 α = β = 1
时,$f(x)=\dfrac{1-e^{-x}}{1+e^{x}}$,该函数把只怕在较大范围内浮动的输入值,“挤压”
到 (-1, 1) 的输出范围内

    4858mgm 3  

  具体的装置函数如下,param1 –> α,param2 –> β

// 设置激活函数,目前只支持 ANN_MLP::SIGMOID_SYM
virtual void cv::ml::ANN_MLP::setActivationFunction(int type, double param1 = 0, double param2 = 0); 

 

2  神经网络

2.1  感知机 (perceptron)

 
感知机由两层神经元组成,输入层接收外界输入信号,而输出层则是3个M-P 神经元。

 
实际上,感知机可视为3个最简便的“神经互连网”,用它可很简单的贯彻逻辑与、或、非等简易运算。

    4858mgm 4

2.2 层级结构

 
常见的神经网络,可分为三层:4858mgm,输入层、隐含层、输出层。输入层接收外界输入,隐层和输出层负责对信号举行加工,输出层输出最后的结果。

 
以下图为例:每层神经元与下一层神经元全互连,而同层神经元之间不延续,也不存在跨层连接,那样的构造称为“多层前馈神经互连网”(multi-layer
feedforward neural networks)

    4858mgm 5

2.3  层数设置

   OpenCV 中,设置神经互连网层数和神经元个数的函数为
setLayerSizes(InputArray _layer_sizes),则上海教室对应的 InputArray
可由如下代码来组成

// (a) 3层,输入层神经元个数为 4,隐层的为 6,输出层的为 4
Mat layers_size = (Mat_<int>(1,3) << 4,6,4);

// (b) 4层,输入层神经元个数为 4,第一个隐层的为 6,第二个隐层的为 5,输出层的为 4
Mat layers_size = (Mat_<int>(1,4) << 4,6,5,4);

  
如何安装隐层神经元的个数仍是个未决的难题,实际中多选取“试错法”来调整

 

3  OpenCV 函数

1)  创建

static Ptr<ANN_MLP> cv::ml::ANN_MLP::create();  // 创建空模型

2) 设置参数

// 设置神经网络的层数和神经元数量
virtual void cv::ml::ANN_MLP::setLayerSizes(InputArray _layer_sizes);

// 设置激活函数,目前只支持 ANN_MLP::SIGMOID_SYM
virtual void cv::ml::ANN_MLP::setActivationFunction(int type, double param1 = 0, double param2 = 0); 

// 设置训练方法,默认为 ANN_MLP::RPROP,较常用的是 ANN_MLP::BACKPROP
// 若设为 ANN_MLP::BACKPROP,则 param1 对应 setBackpropWeightScale()中的参数,param2 对应 setBackpropMomentumScale() 中的参数
virtual void cv::ml::ANN_MLP::setTrainMethod(int method, double param1 = 0, double param2 = 0);
virtual void cv::ml::ANN_MLP::setBackpropWeightScale(double val); // 默认值为 0.1
virtual void cv::ml::ANN_MLP::setBackpropMomentumScale(double val); // 默认值为 0.1

// 设置迭代终止准则,默认为 TermCriteria(TermCriteria::MAX_ITER + TermCriteria::EPS, 1000, 0.01)
virtual void cv::ml::ANN_MLP::setTermCriteria(TermCriteria val);

3)  训练

// samples - 训练样本; layout - 训练样本为 “行样本” ROW_SAMPLE 或 “列样本” COL_SAMPLE; response - 对应样本数据的分类结果
virtual bool cv::ml::StatModel::train(InputArray samples,int layout,InputArray responses);  

4)  预测

// samples,输入的样本书数据;results,输出矩阵,默认不输出;flags,标识,默认为 0
virtual float cv::ml::StatModel::predict(InputArray samples, OutputArray results=noArray(),int flags=0) const;       

 

4 代码示例

  上面是 OpenCV 3.3 中,在“支持向量机”的例程上做的修改,使用 BP
神经网络,实现了和 SVM 相同的归类效果。

   OpenCV 中的 扶助向量机 (Support Vector Machine),可参见另一篇博文
OpenCV 之 支持向量机
(一)

 1 #include "opencv2/core/core.hpp"
 2 #include "opencv2/imgproc/imgproc.hpp"
 3 #include "opencv2/imgcodecs/imgcodecs.hpp"
 4 #include "opencv2/highgui/highgui.hpp"
 5 #include "opencv2/ml/ml.hpp"
 6 
 7 using namespace cv;
 8 
 9 int main()
10 {
11     // 512 x 512 零矩阵
12     int width = 512, height = 512;
13     Mat img = Mat::zeros(height, width, CV_8UC3);
14 
15     // 训练样本
16     float train_data[6][2] = { { 500, 60 },{ 245, 40 },{ 480, 250 },{ 160, 380 },{400, 25},{55, 400} };
17     float labels[6] = {0,0,0,1,0,1};  // 每个样本数据对应的输出
18     Mat train_data_mat(6, 2, CV_32FC1, train_data);
19     Mat labels_mat(6, 1, CV_32FC1, labels);
20 
21     // BP 模型创建和参数设置
22     Ptr<ml::ANN_MLP> bp = ml::ANN_MLP::create();
23 
24     Mat layers_size = (Mat_<int>(1,3) << 2,6,1); // 2维点,1维输出
25     bp->setLayerSizes(layers_size);
26 
27     bp->setTrainMethod(ml::ANN_MLP::BACKPROP,0.1,0.1);
28     bp->setActivationFunction(ml::ANN_MLP::SIGMOID_SYM);
29     bp->setTermCriteria(TermCriteria(TermCriteria::MAX_ITER, 10000, /*FLT_EPSILON*/1e-6));
30 
31     // 保存训练好的神经网络参数
32     bool trained = bp->train(train_data_mat,ml::ROW_SAMPLE,labels_mat);
33     if (trained) {
34         bp->save("bp_param");
35     }
36 
37     // 创建训练好的神经网络
38 //    Ptr<ml::ANN_MLP> bp = ml::ANN_MLP::load("bp_param");
39 
40     // 显示分类的结果
41     Vec3b green(0, 255, 0), blue(255, 0, 0);
42     for (auto i=0; i<img.rows; ++i) {
43         for (auto j=0; j<img.cols; ++j) {
44             Mat sample_mat = (Mat_<float>(1, 2) << j, i);
45             Mat response_mat;
46             bp->predict(sample_mat,response_mat);
47             float response = response_mat.ptr<float>(0)[0];
48             if (response > 0.5) {
49                 img.at<Vec3b>(i, j) = green;
50             } else if (response < 0.5) {
51                 img.at<Vec3b>(i, j) = blue;
52             }
53         }
54     }
55 
56     // 画出训练样本数据
57     int thickness = -1;
58     int lineType = 8;
59     circle(img, Point(500, 60), 5, Scalar(255, 255, 255), thickness, lineType);
60     circle(img, Point(245, 40), 5, Scalar(255, 255, 255), thickness, lineType);
61     circle(img, Point(480, 250), 5, Scalar(255, 255, 255), thickness, lineType);
62     circle(img, Point(160, 380), 5, Scalar(0, 0, 255), thickness, lineType);
63     circle(img, Point(400, 25), 5, Scalar(255, 255, 255), thickness, lineType);
64     circle(img, Point(55, 400), 5, Scalar(0, 0, 255), thickness, lineType);
65 
66     imwrite("result.png", img);        // 保存训练的结果
67     imshow("BP Simple Example", img);
68 
69     waitKey(0);
70 }

   运转结果如下所示:

  4858mgm 6 

专注:OpenCV 3.0
以上版本,相较以前的本子,其中关于机器学习的部分做了较大改变,自身也是踩了部分坑才获得预期的效能。

 1)  代码 #25,必须在 setActivationFunction()
以前,否则陶冶后的结果多为 nan

 2)  代码 #46,response_mat
为预测的结果。若输出向量为 1 列,则如 #47
所示,可一直取出预测结果;若输出向量为 n 列,则可取平均值只怕最大值。

      同时,依据平均值或最大值,代码 #48 处的阈值也要相应的更动。

    float response = 0;
    for (auto i=0;i<n;++i) {
          response += response_mat.ptr<float>(0)[i];
    }

 3)  代码 #39,若已经演练好神经网络的参数,并将其保存到文件
bp_param 中。

      则可将 #22 ~ #35 全部表明掉,再反注释掉
#38,那样,间接加载磨练好的神经互连网,便能够采取了。

 

参考资料

  <机器学习> 周志华  第伍章

  <总结学习方式> 李航  第①章

  OpenCV 3.0  Tutorials  — Neural Networks

 
OpenCV进阶之路:神经互连网识别车牌字符 
    ☆Ronny丶

 【形式识别】OpenCV中央银行使神经互连网CvANN_MLP 
     xiaowei_cqu

 

相关文章