马赫带效应模拟的点光源金属钢印文字检测方法转让专利
申请号 : CN201910951390.3
文献号 : CN110688999B
文献日 : 2020-08-28
发明人 : 刘玲 , 杨静
申请人 : 合肥海诺恒信息科技有限公司
摘要 :
权利要求 :
1.一种马赫带效应模拟的点光源金属钢印文字检测方法,其特征是:含有以下步骤:步骤一、使面阵相机面向待检测金属钢印,待检测金属钢印区域位于面阵相机视野内,在点光源下用面阵相机进行拍照,捕捉到一帧待检测金属钢印的输入图像数据;
步骤二、对面阵相机的输入图像数据进行预处理操作,经过预处理操作后得到图像S;
步骤三、基于马赫带效应建模,使用图像S建立基于马赫带的自求商模拟图像R,基于马赫带的自求商模拟图像R的表达式如下:其中,Si,j是图像S在位置(i,j)处的像素亮度值,Bi,j是图像B在位置(i,j)处的像素亮度值,mean(S)和mean(B)分别是对图像S和图像B整体求得的均值;
B是一种通过处理后的图像,使用带有抖动的扩张均值卷积窗K对图像S做卷积,得到图像B;
步骤四、根据整型或浮点型量化形式使用映射函数将自求商模拟图像R的值域进行归一化,得到待输入深度神经网络的图像U;
步骤五、将图像U输入基于深度神经网络的文字检测器,得到文字包络区域;
步骤六、将文字包络区域进行透视变换,通过文字包络区域的四个角点求解透视变换矩阵,得到透视变换后的图像;
步骤七、将透视变换后的图像输入光字符识别网络,得到金属钢印文字的识别结果。
2.根据权利要求1所述的马赫带效应模拟的点光源金属钢印文字检测方法,其特征是:所述步骤二中的预处理操作分两种情况:当面阵相机为RGB彩色相机时,使用最暗通道原则提取输入图像的亮度值,得到图像S;
当面阵相机为灰度相机时,直接将输入图像作为图像S;
最暗通道原则的表达式如下:
Pi,j=min(Ri,j,Gi,j,Bi,j)其中(i,j)是指输入图像的像素位于输入图像某通道的第i行第j列,Ri,j,Gi,j,Bi,j分别代表输入图像在位置(i,j)处的像素中R,G,B通道分量值,Pi,j是指位置(i,j)处的输入图像的R,G,B通道中最小亮度值。
3.根据权利要求1所述的马赫带效应模拟的点光源金属钢印文字检测方法,其特征是:所述卷积窗K如下:
其中,p为均值权重,W为普通的均值窗。
4.根据权利要求3所述的马赫带效应模拟的点光源金属钢印文字检测方法,其特征是:使用积分图I对所述均值窗W进行加速,对于图像S,积分图I通过加和公式表示如下:I(i,j)=∑x
I(i,j)=I(i-1,j)+I(i,j-1)-I(i-1,j-1)+S(i,j)。
5.根据权利要求1所述的马赫带效应模拟的点光源金属钢印文字检测方法,其特征是:所述步骤四中,当深度神经网络的输入量化格式为INT8时,有映射函数 根据函数映射特性计算位深为8bit的图像查找表T:Tx(x∈[0,255])=M(x)*255对自求商模拟图像R进行查表转换,得到待输入深度神经网络的图像U:Ui,j=T(Si,j*255);
当深度神经网络的输入量化格式为浮点型时,使用映射函数 计算,得到待输入深度神经网络的图像U。
6.根据权利要求1所述的马赫带效应模拟的点光源金属钢印文字检测方法,其特征是:所述步骤六中,文字包络区域由四边形代替,透视变换关系如下:该关系式中,等号的左侧为目标位置,等号的右侧为转移矩阵A和像素原始位置齐次项,求解矩阵A,每个点有:
4点组成适定方程,求得矩阵A;4点的目标位置确定下一级网络输入(h*w)的图像大小构成,4点的目标位置为:P(0,0),P(0,h-1),P(w-1,0),P(w-1,h-1);
至此,得到(h*w)区域内透视变换后的图像。
说明书 :
马赫带效应模拟的点光源金属钢印文字检测方法
技术领域: