文字识别装置转让专利
申请号 : CN201110208692.5
文献号 : CN102346859B
文献日 : 2013-10-09
发明人 : 山内劳雄
申请人 : 卡西欧计算机株式会社
摘要 :
权利要求 :
1.一种文字识别装置,其特征在于,
具备:
至少2轴的加速度传感器;
获取单元,其获取所述加速度传感器的测量结果作为与各轴对应的分量的加速度数据,所述测量结果与在平面内移动该文字识别装置的框体的同时所进行的书写文字的动作对应;
判别单元,其基于由所述获取单元获取的每个分量的加速度数据,来判别1文字的开始书写和结束书写;
确定单元,其将在从所述判别单元判别为1文字的开始书写起到判别为结束书写为止的期间由所述获取单元依次获取的每个分量的加速度数据,作为包含笔画和笔画之间的加速度的、从文字的第1笔画起到最后1笔画为止时间上连续的一系列的加速度数据,并按每个分量来分别确定存在于该一系列的加速度数据之中的多个特征点;
生成单元,其将包含由所述确定单元确定的多个特征点的每个分量的特征点数据作为输入文字数据生成;和文字识别单元,其通过将基本文字数据和由所述生成单元生成的输入文字数据进行对照来进行文字识别,所述基本文字数据作为文字识别用而预先准备,且按所述每个分量包含多个特征点,所述确定单元在各分量的加速度数据的每一个中,将局部的最大点即极大点和局部的最小点即极小点确定为特征点,所述生成单元按由所述确定单元确定的每个特征点,决定表示是极大点还是极小点的极点的种类,并求取其极点的加速度的值作为极点等级,且将包含该极点的种类和极点等级的每个分量的特征点数据作为输入文字数据生成,所述基本文字数据作为与特征点相关的数据,是包含所述极点的种类和极点等级的数据。
2.根据权利要求1所述的文字识别装置,其特征在于,
所述文字识别装置还具备排除单元,该排除单元从所述一系列的加速度数据中排除在从所述判别单元判别为1文字的结束书写起到判别为下一文字的开始书写为止的期间由所述获取单元获取的加速度数据。
3.根据权利要求1所述的文字识别装置,其特征在于,
所述判别单元基于将所述加速度传感器的测量结果在所述平面内分离的正交的各分量的加速度的合成矢量的大小是否在规定阈值以上且是否连续规定时间以上,来判别1文字的开始书写和结束书写。
4.根据权利要求1所述的文字识别装置,其特征在于,
所述生成单元按与所述2轴中的其中一轴对应的加速度数据内的每个特征点,求取表示和与另一轴对应的加速度数据内的特征点之间的相对关系的数据作为与另一轴之间的相关特征,并和与另一轴之间的相关特征一并,将包含所述极点的种类以及所述极点等级的每个分量的特征点数据作为输入文字数据生成,所述基本文字数据作为与特征点相关的数据,是包含所述与另一轴之间的相关特征、所述极点的种类、所述极点等级的数据。
5.根据权利要求1所述的文字识别装置,其特征在于,
所述文字识别装置还具备旋转变换单元,该旋转变换单元通过将所述各轴分别朝着相同方向旋转规定的角度,来将由所述获取单元获取的与各轴对应的每个分量的加速度数据变换成在其旋转坐标系上与各轴对应的每个分量的加速度,所述确定单元按每个分量分别确定在由所述获取单元获取的每个分量的加速度数据之中存在的多个特征点作为本来的特征点,并按每个分量分别确定在由所述旋转变换单元变换后的每个分量的加速度数据之中存在的多个特征点作为旋转后的特征点,所述生成单元将包含由所述确定单元确定的本来的特征点以及旋转后的特征点的、每个分量的特征点数据作为输入文字数据生成,所述文字识别单元通过将基本文字数据和由所述生成单元生成的输入文字数据对照来进行文字识别,所述基本文字数据作为文字识别用的基本文字而预先包含所述本来的特征点以及旋转后的特征点。
6.根据权利要求1所述的文字识别装置,其特征在于,
所述文字识别单元按所述输入文字数据内的每个特征点,根据该每个特征点与两端的特征点之间的关系来求取该每个特征点的重要度,并参照该每个特征点的重要度来进行文字识别。
7.根据权利要求1所述的文字识别装置,其特征在于,
所述文字识别单元计算所述基本文字数据和所述输入文字数据之间的类似度,在将类似度最高的基本文字作为识别文字的情况下,当所述输入文字数据内的某分量的特征点的数目少于某基本文字数据的相同分量的特征点的数目时,不计算与该基本文字之间的类似度而判断为该基本文字不是识别文字。
8.根据权利要求1所述的文字识别装置,其特征在于,
所述基本文字数据按每个特征点具有系数,该系数在由所述文字识别单元根据所述基本文字数据的特征点和所述输入文字数据的特征点之间的差来计算类似度时使用。
9.一种文字识别装置,其特征在于,
具备:
3轴的加速度传感器;
获取单元,其获取来自所述加速度传感器的测量结果作为1文字份的时间序列的加速度矢量,该测量结果与在移动该文字识别装置的框体的同时所进行的书写文字的动作对应;
选择单元,其在由所述获取单元获取的1文字份的加速度矢量序列之中,选择矢量的大小为大的值、且彼此大致正交的多个加速度矢量;
平面确定单元,其确定由所述选择单元选择的多个加速度矢量决定的平面;
第1变换单元,其将由所述获取单元获取的所述1文字份的加速度矢量序列变换成由所述平面确定单元确定的平面内的正交的2分量的加速度矢量序列;
文字识别单元,其将由所述第1变换单元变换后的平面内的2分量的加速度矢量序列作为输入文字数据,并将该输入文字数据和预先准备的文字识别用的基本文字数据进行对照,由此来进行文字识别;
确定单元,其从由所述第1变换单元变换后的2分量的加速度矢量序列之中确定1文字的开始书写的方向;和第2变换单元,其对由所述平面确定单元确定的平面内的2分量的加速度矢量序列进行旋转变换,使得由所述确定单元确定的1文字的开始书写的方向与存储于所述文字识别用的基本文字数据内的该基本文字的开始书写的方向一致,所述文字识别单元将由所述第2变换单元变换后的平面内的2分量的加速度矢量序列作为输入文字数据,并将该输入文字数据和所述基本文字数据进行对照。
10.根据权利要求9所述的文字识别装置,其特征在于,
所述选择单元将加速度矢量的大小为大的值、且彼此大致正交的多个矢量选择多组,所述平面确定单元按由所述选择单元选择的每组来分别确定平面,并从按该每组确定的平面之中确定一个平面来作为书写文字的文字平面。
11.根据权利要求9所述的文字识别装置,其特征在于,
所述第1变换单元将所述1文字份的加速度矢量序列变换成这样的2分量的加速度矢量序列:使由所述平面确定单元确定的平面旋转,使得该平面和与所述3轴的加速度传感器的各轴对应的3个分量之中任意一个分量的重力加速度为零的平面一致。
12.根据权利要求9所述的文字识别装置,其特征在于,
所述文字识别装置还具备判别单元,该判别单元基于由所述获取单元获取的加速度矢量序列来判别1文字的开始书写和结束书写,所述选择单元在从由所述判别单元判别为1文字的开始书写起到判别为结束书写为止的期间由所述获取单元依次获取的加速度矢量序列之中,选择矢量的大小为大的值、且彼此大致正交的多个矢量。
13.一种文字识别方法,其特征在于,
包括:
获取步骤,获取与在平面内移动内置有至少2轴的加速度传感器的框体的同时所进行的书写文字的动作对应的、所述加速度传感器的测量结果作为与各轴对应的分量的加速度数据;
判别步骤,基于由所述获取步骤获取的每个分量的加速度数据,来判别1文字的开始书写和结束书写;
确定步骤,将在从由所述判别步骤判别为1文字的开始书写起到判别为结束书写为止的期间由所述获取步骤依次获取的每个分量的加速度数据,作为包含笔画和笔画之间的加速度的、从文字的第1笔画起到最后1笔画为止时间上连续的一系列的加速度数据,并按每个分量来分别确定存在于该一系列的加速度数据之中的多个特征点;
生成步骤,将包含由所述确定步骤确定的多个特征点的每个分量的特征点数据作为输入文字数据生成;和文字识别步骤,通过将基本文字数据和由所述生成步骤生成的输入文字数据进行对照来进行文字识别,所述基本文字数据作为文字识别用而预先准备,且按所述每个分量包含多个特征点,所述确定步骤中,在各分量的加速度数据的每一个中,将局部的最大点即极大点和局部的最小点即极小点确定为特征点,所述生成步骤中,按由所述确定步骤确定的每个特征点,决定表示是极大点还是极小点的极点的种类,并求取其极点的加速度的值作为极点等级,且将包含该极点的种类和极点等级的每个分量的特征点数据作为输入文字数据生成,所述基本文字数据作为与特征点相关的数据,是包含所述极点的种类和极点等级的数据。
14.一种文字识别方法,其特征在于,
包括:
获取步骤,获取与在移动内置有3轴的加速度传感器的框体的同时所进行的书写文字的动作对应的、来自所述加速度传感器的测量结果作为1文字份的时间序列的加速度矢量;
选择步骤,在由所述获取步骤获取的1文字份的加速度矢量序列之中,选择矢量的大小为大的值、且彼此大致正交的多个加速度矢量;
平面确定步骤,确定由所述选择步骤选择的多个加速度矢量决定的平面;
第1变换步骤,将由所述获取步骤获取的所述1文字份的加速度矢量序列变换成由所述平面确定步骤确定的平面内的正交的2分量的加速度矢量序列;
文字识别步骤,将由所述第1变换步骤变换后的平面内的2分量的加速度矢量序列作为输入文字数据,并将该输入文字数据和预先准备的文字识别用的基本文字数据进行对照,由此来进行文字识别;
确定步骤,从由所述第1变换步骤变换后的2分量的加速度矢量序列之中确定1文字的开始书写的方向;和第2变换步骤,对由所述平面确定步骤确定的平面内的2分量的加速度矢量序列进行旋转变换,使得由所述确定步骤确定的1文字的开始书写的方向与存储于所述文字识别用的基本文字数据内的该基本文字的开始书写的方向一致,所述文字识别步骤中,将由所述第2变换步骤变换后的平面内的2分量的加速度矢量序列作为输入文字数据,并将该输入文字数据和所述基本文字数据进行对照。
说明书 :
文字识别装置
技术领域
背景技术
问题或积分误差的问题。进而,为了从测量数据中去除重力这种强干扰,需要在重力方向的变化的追踪中对角速度传感器的输出进行积分,而在该积分中也存在上述的积分初始状态
不明的问题或积分误差的问题,因此实现可靠的文字识别极其困难。
发明内容
度数据,所述加速度传感器的测量结果与在平面内移动该文字识别装置的框体的同时所进
行的书写文字的动作对应;判别单元,其基于由所述获取单元获取的每个分量的加速度数
据,来判别1文字的开始书写和结束书写;确定单元,其将在从所述判别单元判别为1文字
的开始书写起到判别为结束书写为止的期间由所述获取单元依次获取的每个分量的加速
度数据作为包含笔画和笔画之间的加速度的、从文字的第1笔画起到最后1笔画为止时间
上连续的一系列的加速度数据,并按每个分量来分别确定存在于该一系列的加速度数据之
中的多个特征点;生成单元,其将包含由所述确定单元确定的多个特征点的每个分量的特
征点数据作为输入文字数据生成;和文字识别单元,其通过将基本文字数据和由所述生成
单元生成的输入文字数据进行对照来进行文字识别,所述基本文字数据作为文字识别用而
预先准备,且按所述每个分量包含多个特征点。
果与在移动该文字识别装置的框体的同时所进行的书写文字的动作对应;选择单元,其在
由所述获取单元获取的1文字份的加速度矢量序列之中,选择矢量的大小为大的值、且彼
此大致正交的多个加速度矢量;平面确定单元,其确定由所述选择单元选择的多个加速度
矢量决定的平面;第1变换单元,其将由所述获取单元获取的所述1文字份的加速度矢量序
列变换成由所述平面确定单元确定的平面内的正交的2分量的加速度矢量序列;和文字识
别单元,其将由所述第1变换单元变换后的平面内的2分量的加速度矢量序列作为输入文
字数据,并将该输入文字数据和预先准备的文字识别用的基本文字数据进行对照,由此来
进行文字识别。
同时所进行的书写文字的动作的情况下,获取所述加速度传感器的测量结果作为与各轴对
应的分量的加速度数据的功能,其中,所述测量结果与在平面内移动所述框体的同时所进
行的书写文字的动作对应;基于获取的所述每个分量的加速度数据,来判别1文字的开始
书写和结束书写的功能;将在从判别为1文字的开始书写起到判别为结束书写为止的期间
依次获取的所述每个分量的加速度数据作为包含笔画和笔画之间的加速度的、从文字的第
1笔画起到最后1笔画为止时间上连续的一系列的加速度数据,并按每个分量来分别确定
存在于该一系列的加速度数据之中的多个特征点的功能;将包含所确定的所述多个特征点
的每个分量的特征点数据作为输入文字数据生成的功能;和通过将基本文字数据和所生成
的所述输入文字数据进行对照来进行文字识别的功能,其中,所述基本文字数据作为文字
识别用而预先准备,且按所述每个分量包含多个特征点。
所进行的书写文字的动作的情况下,获取来自所述加速度传感器的测量结果作为1文字份
的时间序列的加速度矢量的功能,其中,所述测量结果与在移动所述框体的同时所进行的
书写文字的动作对应;在所获取的所述1文字份的加速度矢量序列之中,选择矢量的大小
为大的值、且彼此大致正交的多个矢量的功能;确定由所选择的所述多个矢量决定的平面
的功能;将由所获取的所述1文字份的加速度矢量序列变换成所确定的所述平面内的正交
的2分量的加速度矢量序列的功能;和将所变换后的所述平面内的2分量的加速度矢量序
列作为输入文字数据,并将该输入文字数据和预先准备的文字识别用的基本文字数据进行
对照,由此来进行文字识别的功能。
同方向旋转45°后的波形例的图。
图。
具体实施方式
图。
行动作。控制部1通过来自具备二次电池的电源部2的电力供给进行动作,并按照存储部
3内的各种程序来控制该数码相机的整体动作,在该控制部1中设置有未图示的CPU(中央
运算处理装置)或存储器等。
实施方式的程序。另外,在存储部3内的数据区域中,除了对文字识别用的基本文字数据进行存储的识别字典存储器DM、对所摄影的图像进行存储保存的图像存储器FM以外,还存储
有各种标志信息、数码相机的动作所需的各种信息。此外,存储部3可以是包括诸如SD卡、IC卡等装卸自由的可移动式存储器(记录介质)的结构,或者可以是在未图示的规定的外
部服务器上具有存储部3的结构。
处理等各种处理作为与来自操作部4的操作信号对应的处理。显示部5使用例如高清液晶
或者有机EL,除了显示诸如日期时间信息、保存图像等以外,在相机功能的使用时,成为显示实时取景图像(监测图像)的取景器(finder)画面。
变焦镜头,使让焦点距离可变的视角变更机构工作,来进行望远/广角或变焦摄影。
中,基于加速度传感器7的测量结果来进行文字识别。即,控制部1基于加速度传感器7的
测量结果,也就是彼此正交的3轴方向(X·Y·Z方向)的加速度分量,来确定相对于重力
方向平行的二维平面(垂直面),并基于分离成在该平面内正交的2轴的分量的加速度数
据,即基于第1轴(第1分量)的加速度数据和第2轴(第2分量)的加速度数据来进行
文字识别。
写起到结束书写为止的期间,将依次取得的各分量的加速度数据作为包含笔画和笔画之间
的加速度的从文字的第1笔画起到最后1笔画为止时间上连续的一系列的加速度数据,并
按每个分量来分别确定存在于该一系列的加速度数据之中的多个特征点。将包含如此确定
的多个特征点的每个分量的特征点数据作为输入文字数据生成,并将该输入文字数据与识
别字典存储器DM内的各基本文字数据对照,由此来进行文字识别。
局部的最小点即极小点。而且,各特征点由其“每个极点的种类”、“极点时刻(时间上的位置)”、“极点等级(extremum level)(加速度的大小)”、“与其他轴之间的相关特征(比率)”的数据构成。同样,在识别字典存储器DM内的各基本文字数据中,每个特征点也是由“每个极点的种类”、“极点时刻(时间上的位置)”、“极点等级(加速度的大小)”、“与其他轴之间的相关特征(比率)”的数据构成。然后,按每个特征点将该输入文字数据与全部的
基本文字数据进行对照,由此来进行文字识别。
度数据。在此,控制部1在各分量的加速度数据的每一个中,将局部的最大点即极大点和局部的最小点即极小点确定为特征点,并按每个该特征点将表示是极大点还是极小点的值作
为“极点的种类”求取,且将该极点的加速度的值作为“极点等级”求取。另外,在按每个特征点将文字的开始书写位置作为原点(时间“0”,加速度“0”)的情况下,将到达各极点(极大点和极小点)的时刻作为“极点时刻”求取。
其他轴是指,若求取相关特征的极点是第1分量的极点,则第2分量的轴是其他轴,反之,若是第2分量的极点,则第1分量的轴是其他轴。另外,“与其他轴之间的相关特征”是指,在将从其他轴的极大点到极小点、或者从极小点到极大点的极点间范围作为基准时,表示相
对处于怎样的位置的时间上的比率(时间的比率)、等级上的比率(等级的比率),并按全
部极点的每一个来进行求取。按这种方式求取“与其他轴之间的相关特征(比率)”是由
于,在对文字快速书写时、慢速书写时、部分变快进行书写时,后述的文字识别将变难,具体而言,比较与对照对象的基本文字的极点之间的类似度的处理将变难,因此,通过以与其他轴之间的相对关系为指标,就不易被书写1文字的速度或速度的变化影响。
其他轴之间的相关特征(时间的比率)示出了,在以从第2分量的极大点到极小点、或者从
极小点到极大点的极点间范围为基准(时间尺度比)时,第1分量的第0个极点的时间的
比率为“-0.7246”,第1分量的第1个极点的时间比率为“-0.3832”。另外,第2分量的第
0个极点的、与其他轴之间的相关特征(时间的比率)示出了,在以从第1分量的极大点到
极小点、或者从极小点到极大点的极点间范围为基准(时间尺度比)时,第2分量的第0个
极点的时间的比率为“0.4706”。
轴之间的相关特征(等级的比率)示出了,在以从第2分量的极大点到极小点、或者从极小
点到极大点的极点间范围为基准(等级尺度比)时,第1分量的第0个极点的等级的比率
为“-0.4579”,第1分量的第1个极点的等级比率为“-0.1495”。另外,第2分量的第0个
极点的、与其他轴之间的相关特征(等级的比率)示出了,在以从第1分量的极大点到极小
点、或者从极小点到极大点的极点间范围为基准(等级尺度比)时,第2分量的第0个极点
的等级的比率为“0.5856”。
量对应具有多个特征点(极点)的特征点数据。该特征点数据是按各分量的每个特征点包
含“K(j、k)”、“R(j、k)”、“L(j、k)”、“T(j、k)”的项目的数据,项目数据“K(j、k)”表示第j分量的加速度的第k个极点的种类(极大点或者极小点)。项目数据“R(j、k)”表示上述
极点的与其他轴之间的相关特征(时间的比率或者等级的比率)。项目数据“L(j、k)”表
示上述极点的极点等级。项目数据“T(j、k)”表示上述极点的极点时刻。
1)”、“T(2、1)”的项目,…,与第N个极点对应,具有“K(2、N-1)”、“R(2、N-1)”、“L(2、N-1)”、“T(2、N-1)”的项目。此外,M、N的值不限于相同,还有不同的情况。
上述程序代码的动作依次执行。这在后述的其他实施方式中也相同,除了记录介质以外,还能利用经由传输介质从外部供给的程序/数据来执行本实施方式特有的动作。
始书写位置(步骤A2)。
止(步骤A4)。其后,在使框体缓慢平滑地移动到下一文字的开始书写位置后(步骤A5),
开始书写下一文字。以下,直到使文字输入结束为止(在步骤A6中的否),都回到上述的步
骤A3重复手写输入操作,由此依次手写输入多个文字。
6的流程脱离时,回到整体动作的主流程(省略图示)。
度的向上的1G,因此在每次测量加速度时,作为从其测量结果中减去向上的1G的准备,在
开始书写文字之前,测量与框体的姿势(大致相同的姿势)对应的重力加速度,并临时存储
在存储部3内的RAM中。
平滑地移动到文字的开始书写位置使得2个加速度合成矢量的大小在规定的阈值以上而
不连续规定时间以上,也就是说,规定的阈值以上的加速度合成矢量不连续规定时间(规
定次数)以上,其后,开始书写文字。由此,检测出规定阈值以上的加速度合成矢量连续了规定时间(规定次数)以上(在步骤B2中为是)。
速度数据进行存储的处理(步骤B4),通过从加速度传感器7的测量结果中减去重力加速
度,来将消去了重力份的2分量的加速度作为开始书写的测量结果存储于存储部3内的RAM
中,其后,基于是否检测出小于规定阈值的加速度合成矢量连续了规定时间(规定次数)以
上,来调查是否已结束书写1文字(步骤B5),在这种情况下,用户保持框体的姿势,到结束书写1文字为止都在使框体连续移动的同时不停止书写文字的手而一笔书写地进行书写,
从1笔画的终点起到下1笔画的起点描画平滑的轨迹,按照这种方式使框体移动,若结束书
写1文字,则停止框体的移动,因此,在结束书写1文字时,检测出小于规定阈值的加速度合成矢量连续了规定时间(规定次数)以上(在步骤B5中为是)。
中的加速度数据存储在存储部3内的RAM中的处理。将像这样存储加速度传感器7的测量
结果的动作例如1秒间进行100次左右。这样,在存储部3内的RAM中,从1文字的开始书
写起到结束书写为止的期间依次取得的各分量的加速度数据作为包含笔画和笔画之间的
加速度的从文字的第1笔画起到最后1笔画为止时间上连续的一系列的加速度数据被依次
存储。
上的长度(例如,像汉语数字的“一”那样简单的文字输入所需的时间以上)(步骤B7)。然
后,若是小于阈值的长度(在步骤B7中为否),则在为了使本次的加速度传感器7中的测量
结果无效而消去存储于存储部3内的RAM中的本次的一系列的加速度数据后(步骤B8),
回到检测文字的开始书写的步骤B2。现在,若1文字的输入时间为规定的阈值以上的长度
(在步骤B7中为是),则基于存储于存储部3内的RAM中的1文字份的一系列的加速度数
据,执行用于进行文字识别的文字判别处理(步骤B9)。
速度数据之中去除因加速度传感器7自身的噪声或轻微的手的抖动而引起的加速度的高
频分量,对2分量的加速度施加低频滤波。其次,对1文字份的加速度数据进行等级的归一
化(normalization)(步骤C2)。即,一般而言,在根据加速度的变化来进行文字识别的装
置中,即使是同样大小的文字,在缓慢书写时和快速书写时,加速度的大小也会变化。为了避免对后面的文字识别处理造成影响,在将框体静止时的加速度的2分量均设为“0”时,搜索1文字份中的2分量的加速度数据之中绝对值最大的加速度,并按照对2分量的加速度
一律乘以相同的系数的方式进行等级的归一化,使得其值在任何文字中都相同。
大点)和局部的最小点(极小点),将该极大点、极小点确定为特征点,并确定其种类(极大
点或极小点)。然后,按每个特征点求取在该点的归一化后的加速度等级(极点等级)(步
骤C4),并且在将1文字的开始书写设为时刻“0”时,求取到达此极点的时刻(极点时刻)
(步骤C5)。进而,按每个特征点来求取与其他轴之间的相关特征(步骤C6)。在这种情况
下,如图2所示,按其中一轴的每个特征点,以与其他轴的极点间范围为基准,求取表示相对处于怎样的位置的时间的比率。另外,如图3所示,按其中一轴的每个特征点,以其他轴的极点间范围为基准,求取表示相对处于怎样的大小的等级的比率。
基本文字中的、排头的基本文字指定为对照对象(步骤C8),并一边将指定的基本文字数据
和输入文字数据进行对照一边计算它们的类似度(步骤C9)。
3个,另外,输入文字的某分量的极点是从第0个极点起到第k个(第4个)极点为止的5
个的情况。另外,图中,“基本F(j、k)”示出了作为如图4所示的基本文字数据的“每个极点的种类”、“与其他轴之间的相关特征(比率)”、“极点等级”、“极点时刻”的“K(j、k)”、“R(j、k)”、“L(j、k)”、“T(j、k)”。另外,“输入F(j、k)”示出了输入文字数据的“每个极点的种类”、“与其他轴之间的相关特征(比率)”、“极点等级”、“极点时刻”。
极点的种类相同为条件,在基本文字和输入文字的“与其他轴之间的相关特征(比率)”之
间进行比较,并在“极点等级”之间进行比较,同时计算其差的平均值,且从图8(1)~(10)之中选择差最小的对照类型。在按每个分量进行这样的对照后,再次根据各分量的每个特
征点的差来计算其平均值,并将其平均值作为对于其基本文字的类似度(类似度距离)进
行求取。
否),都在指定下一基本文字的同时(步骤C11),重复一边对照指定的基本文字数据和输入
文字数据一边计算它们的类似度的处理(步骤C9)。像这样在与全部的基本文字对应求取
其类似度距离后(在步骤C10中为是),将平均值最小的文字(类似度距离最短的文字)决
定为识别文字(输入候选)(步骤C12)。
候选的操作(步骤B11),并调查是否已关闭文字识别功能,即是否已通过用户操作指示了
文字输入的结束(步骤B12)。然后,在已进行下一候选操作时(在步骤B11中为是),读取
下一候选(步骤B13),并作为输入候选显示在显示部5中(步骤B10)。另外,若未指示文
字输入的结束(在步骤B12中为否),则回到上述的步骤B2,以下,尽管通过重复上述的动
作来进行针对下一手写文字的文字识别,但在已指示文字输入的结束时(步骤B12),在该
时间点图6的流程将结束。
基于与加速度传感器7的各轴对应的分量的加速度数据,判别1文字的开始书写和结束书
写,并在将其间的每个分量的加速度数据作为包含笔画和笔画之间的加速度的、从文字的
第1笔画起到最后1笔画为止时间上连续的一系列的加速度数据取得后,按每个分量分别
确定存在于该一系列的加速度数据之中的多个特征点,且将包含此多个特征点的每个分量
的特征点数据作为输入文字数据生成,然后与基本文字数据对照,因此能基于加速度传感
器7的测量结果顺利且可靠地对在平面内所书写的文字进行文字识别,从而富于实用性。
中因框体的姿势变化而引起的重力方向的些许的变化或抖动,除了具有文字识别的鲁棒性
以外,还不需要陀螺仪等除加速度传感器以外的传感器。另外,由于并非需要构成文字的要素(笔画)分离的文字识别的方法,因此在空中书写文字这样的状况下,不需要相当于抬笔
(pen-up)或落笔(pen-down)这样麻烦且困难的操作或移动,从而能实现自然、流畅且快速
的文字输入,进而由于基本文字与输入文字相同,是由多个特征点构成,因此,字典的容量可以做得较小,从而富于实用性。
和结束书写,因此,对用户而言,在开始书写1文字前使框体大致静止,然后使框体缓慢平滑地移动到文字的开始书写位置即可,另外,在结束书写1文字的时间点,再次使框体大致静止即可,通过极其自然的动作便能判别1文字的开始书写和结束书写。
输入文字数据,因此即使利用少的数据量也能得到合理表现框体的移动轨迹的输入文字数
据。
数据和基本文字数据进行对照时,能基于极点时刻来确定各特征点,从而能进行可靠的对
照。
成将极点的种类以及极点等级和该与其他轴之间的相关特征一起包含的输入文字数据,因
此能较强适应在1文字输入中的速度变化,从而能实现更可靠的文字识别。
的比率、和表示处于怎样的值的等级的比率的两者中的一者的比率,因此作为与其他轴之
间的相关特征是恰当的。
角度(45°),来将从加速度传感器7获取的各分量的加速度数据变换成旋转后的平面坐标
系上的加速度数据,并从该旋转后的加速度数据中得到上述特征点数据。此外,尽管在旋转后的特征点数据中包含“每个极点的种类”、“极点等级”、“极点时刻”、“与其他轴之间的相关特征(比率)”的项目,但可以省略“每个极点的种类”。
点数据作为输入文字数据生成,进而,将基本文字数据也设为与输入文字数据相同,是包含本来的特征点和旋转后的特征点的数据结构。此外,在两实施方式中,对基本上或名称上相同的部分赋予相同的符号表示,并省略其说明,而且,下面以第2实施方式的特征部分为中心进行说明。
向旋转45°后的波形例。
变化少的简单的波形(无特征的波形)。在这种情况下,与其他轴之间的相关特征(比率)
变得不明确,无法进行比率的对照,而如图9(2)所示,若将各轴分别朝相同方向旋转45°,则第1以及第2分量的加速度数据变得富于变化,从而与其他轴之间的相关特征(比率)
变得明确。
的分量对应,具有多个特征点、以及使其2轴旋转45°后的多个特征点的特征点数据。该特
征点数据是按各分量的每个特征点具有“K(i、j、k)”、“R(i、j、k)”、“L(i、j、k)”、“T(i、j、k)”的项目数据的结构,项目数据“K(i、j、k)”表示将轴旋转i次后的旋转坐标系上的第j分量的加速度的第k个极点的种类(极大点或者极小点)。
持有4分量的数据。
0)”、“T(45、1、0)”的项目,…,与第P个极点对应,具有“K(45、1、P-1)”、“R(45、1、P-1)”、“L(45、1、P-1)”、“T(45、1、P-1)”的项目。另外,图示的例子示出了在旋转45°后的第2分量的加速度中的极点的个数为Q个的情况,与第0个极点对应,具有“K(45、2、0)”、“R(45、
2、0)”、“L(45、2、0)”、“T(45、2、0)”的项目,…,与第Q个极点对应,具有“K(45、2、Q-1)”、“R(45、2、Q-1)”、“L(45、2、Q-1)”、“T(45、2、Q-1)”的项目。此外,极点数M、N、P、Q彼此没有关联性,根据文字而各不相同。
字份的加速度数据进行等级的归一化(步骤D2)。然后,在2分量的加速度数据的每一个
中,搜索局部的最大点(极大点)和局部的最小点(极小点),将该极大点、极小点确定为特
征点,并求取其种类(极大点或极小点)(步骤D3),并按每个特征点求取极点等级(步骤
D4),并且,求取极点时刻(步骤D5),还求取与其他轴之间的相关特征(步骤D6)。
别朝相同的方向旋转规定的角度(45°),来将在上述的步骤D2中进行归一化后的1文字
份的加速度数据变换成其旋转坐标系上的加速度数据(步骤D7)。
转45°时的旋转坐标系上的第1分量的加速度,并且,求取使原始平面坐标系上的第2轴
(第2分量)的加速度朝着相同方向旋转45°时的旋转坐标系上的第2分量的加速度。
级)(步骤D9),并在将1文字的开始书写作为时刻“0”时,求取到达该极点的时刻(极点
时刻)(步骤D10)。进而,按每个特征点求取与其他轴之间的相关特征(步骤D11)。这样,
将包含从旋转前的加速度数据中确定的多个特征点(本来的特征点)和从旋转后的加速度
数据中确定的多个特征点(旋转后的特征点)的特征点数据作为输入文字数据生成(步骤
D12)。然后,将存储于识别字典存储器DM中的各基本文字之中的排头的基本文字指定为对
照对象(步骤D13),并在将指定的基本文字数据和输入文字数据进行对照的同时计算他们
的类似度,来进行文字识别(步骤D14~D17)。
轴对应的每个分量的加速度,并将包含存在于从加速度传感器7取得的加速度数据之中的
多个特征点(本来的特征点)、和存在于旋转变换后的加速度数据之中的多个特征点(旋转
后的特征点)的每个分量的特征点数据作为输入文字数据生成,并与基本文字数据对照,
因此,无论怎样的文字,都能恰当地进行文字识别。即,即使是例如1文字输入中的加速度数据变化少的简单波形(无特征的波形),也能通过规定角度(45°)的旋转而成为富于变
化的波形,得到与其他轴之间的相关特征(比率)明确的加速度数据,从而能恰当地进行文
字识别。
上述第2实施方式的基本文字数据若将旋转前的2轴的分量作为第1分量、第2分量,且将
旋转后的2轴的分量作为第3分量、第4分量,则将成为总共4分量的数据,但也可以通过
30度旋转以及60度旋转而成为总共持有6分量的数据。
择差最少的对照类型来求取与基本文字之间的类似度,但也可以省略与不需要的对照类型
之间的对照。在这种情况下,可以按输入文字数据内的每个特征点,根据其与两端的特征点之间的关系来求取其重要度,并参照该每个特征点的重要度来进行文字识别。
将极点的深度定义为与其两端的极点之间的等级差的和,则图中,第n+1个极点的深度为
a+b,第n+2个极点的深度为b+c,另外,第n+3个极点的深度为c+d。
个)的情况下,无需计算与其基本文字之间的类似度距离,就能判断该输入文字不是该基
本文字。
字识别。
数多于基本文字数据的相同分量的特征点的个数的情况下,不计算与其基本文字之间的类
似度而能判断该基本文字不是识别文字,因此能进一步高效且可靠地进行文字识别。
下,若使得不计算与基本文字之间的类似度而判断为该基本文字不是识别文字,则能在不
求取重要度的前提下高效且可靠地进行文字识别。
点具有对照标志,该对照标志表示是否进行基本文字数据内的规定的项目和输入文字数据
内的规定的项目之间的对照。
能更恰当地求取类似度。
的特性上,“与其他轴之间的相关特征(比率)”、“极点等级”显著变化的特征点,由于承认在类似度距离的计算中可以不使用其文字的基本文字的相应特征点的情况,因此若按基本
文字的每个特征点设置标志,则能更正确地计算类似度距离。
级的比率)R”比基准特征点的比率R即基本文字的相同分量的第n个极点的“与其他轴之
间的相关特征(时间的比率或者等级的比率)R”更偏后的情况下,或者在如图16(2)所示,
更偏前的情况下,分别使用不同的类似度距离系数Rd。另外,类似度距离比率Ld也同样有
2种,可以在输入文字的极点等级L低于和高于基准特征点的比率L的情况下使用不同的类
似度距离比率Ld。
轴之间的相关特征(时间的比率或者等级的比率)R”位于该范围内的情况下,将类似度距
离设为“0”,在偏离该范围的情况下,可以设为超过“0”的类似度距离。这样,通过使基本特征点的比率R具有范围,能更恰当地得到类似度距离。
行动作。控制部11通过来自具备二次电池的电源部12的电力供给进行动作,并按照存储部
13内的各种程序来控制该数码相机的整体动作,在该控制部11中设置有未图示的CPU(中
央运算处理装置)或存储器等。
本实施方式的程序。另外,在存储部13内的数据区域中,除了对文字识别用的基本文字数
据进行存储的识别字典存储器DM2、对所摄影的图像进行存储保存的图像存储器FM2以外,
还存储有各种标志信息、数码相机的动作所需的各种信息。此外,存储部13可以是包括诸
如SD卡、IC卡等装卸自由的可移动式存储器(记录介质)的构成,或者可以是在未图示的
规定的外部服务器上具有存储部13的构成。
摄影处理等各种处理作为与来自操作部14的操作信号对应的处理。显示部15使用例如高
清液晶或者有机EL,除了显示诸如日期时间信息、保存图像等以外,在相机功能的使用时,成为显示实时取景图像(监测图像)的取景器画面。
头或变焦镜头,使让焦点距离可变的视角变更机构工作,来进行望远/广角或变焦摄影。
识别功能。控制部11在文字识别功能的工作中,基于加速度传感器17的测量结果来进行
文字识别。即,控制部11基于加速度传感器17的测量结果,也就是彼此正交的3轴方向
(X·Y·Z方向)的加速度分量,来确定相对于重力方向平行的二维平面(垂直面),并基于
分离成在该平面内正交的2轴的分量的加速度数据,即基于第1轴(第1分量)的加速度
数据和第2轴(第2分量)的加速度数据来进行文字识别。
始书写起到结束书写为止的期间,获取加速度传感器17的测量结果作为1文字份的时间序
列的加速度矢量,并在此1文字份的加速度矢量序列之中,选择矢量的大小为大的值且彼
此大致正交(正交或者接近正交的状态)的多个(例如,2个)加速度矢量。即,对于作为
加速度传感器17的测量结果的1文字份的时间序列的加速度矢量,为了减小加速度传感器
17自身的微小的噪声或细微的手抖动、在1文字输入中的框体的姿势的“偏差”等影响,在选择多个加速度矢量时,选择矢量的大小为大的值且彼此大致正交的加速度矢量。
文字平面。
即确定的文字平面与“Z轴=0”的面一致后,将变换后的2分量的加速度矢量序列作为输
入文字数据,并将该输入文字数据和识别字典存储器DM2内的全部的基本文字数据进行对
照,由此按每个基本文字计算与输入文字之间的类似度,从而进行文字识别。
文字数据,由与正交的2轴的分量对应的二维加速度数据构成。而且,在该基本文字之中,存储有表示该文字的开始书写的笔画方向(在开始书写的时间点的矢量方向)的数据。
述程序代码的动作依次执行。即,除了记录介质以外,还能利用经由传输介质从外部供给的程序/数据来执行本实施方式特有的动作。
始书写位置(步骤E2)。
画的起点的移动(步骤E3)。然后,在结束书写1文字的时间点再次使框体大致静止(步
骤E4)。其后,在使框体缓慢平滑地移动到下一文字的开始书写位置后(步骤E5),开始书
写下一文字。以下,直到使文字输入结束为止(在步骤E6中的否),都回到上述的步骤E3
重复手写输入操作,由此依次手写输入多个文字。
量)中含有作为重力加速度的向上的1G,因此在每次测量加速度时,作为从其测量结果中
减去向上的1G的准备,在开始书写文字之前,测量与框体的姿势对应的重力加速度,并临
时存储在存储部13内的RAM中。
维平面内分离正交的2个加速度合成矢量的大小在规定的阈值以上且不连续规定时间以
上,即规定的阈值以上的加速度合成矢量不连续规定时间(规定次数)以上的方式使框体
缓慢平滑地移动到文字的开始书写位置后,开始书写文字。由此,检测出规定阈值以上的加速度合成矢量连续了规定时间(规定次数)以上(在步骤F2中为是)。
度数据进行存储的处理(步骤F4),通过从加速度传感器17的测量结果中减去重力加速度
来将消去了重力份的2分量的加速度作为开始书写的测量结果存储于存储部13内的RAM
中,其后,基于是否检测出小于规定阈值的加速度合成矢量连续了规定时间(规定次数)以
上,来调查是否已结束书写1文字(步骤F5)。在这种情况下,用户保持框体的姿势,到结束书写1文字为止都在使框体连续移动的同时不停止书写文字的手而一笔书写地进行书写,
从1笔画的终点起到下1笔画的起点描画平滑的轨迹,按照这种方式使框体移动,若结束书
写1文字,则停止框体的移动,因此,在结束书写1文字时,检测出小于规定阈值的加速度合成矢量连续了规定时间(规定次数)以上(在步骤F5中为是)。
输入中的加速度数据存储在存储部13内的RAM中的处理。将像这样存储加速度传感器17
的测量结果的动作例如1秒间进行100次左右。这样,在存储部13内的RAM中,从1文字
的开始书写起到结束书写为止的期间依次取得的各分量的加速度数据作为包含笔画和笔
画之间的加速度的从文字的第1笔画起到最后1笔画为止时间上连续的一系列的加速度数
据被依次存储。即,在从1文字的开始书写起到结束书写为止的期间,获取加速度传感器的测量结果作为1文字份的时间序列的加速度矢量,并依次存储在存储部13内的RAM中。
的长度(例如,像数字的“1”那样简单的文字输入所需的时间以上)(步骤F7)。然后,若是小于阈值的长度(在步骤F7中为否),则在为了使本次的加速度传感器17中的测量结果无
效而消去存储于存储部13内的RAM中的本次的一系列的加速度数据后(步骤F8),回到检
测文字的开始书写的步骤F2。现在,若1文字的输入时间为规定的阈值以上的长度(在步
骤F7中为是),则基于存储于存储部13内的RAM中的1文字份的时间系列的加速度数据,
执行后述的文字平面检测·文字方向检测·文字判别处理(步骤F9)。
中,选择矢量的大小为大的值、且彼此大致正交的多个(例如,2个)加速度矢量,从而确定由多个加速度矢量决定的平面(步骤G1)。通过多次重复这样的平面确定处理来确定多个
平面(步骤G2)。即,为了确定多个在各个方向的平面,将加速度矢量的大小为大的值、且彼此大致正交的多个(例如,2个)的矢量选择多组,并按每组来分别确定平面。通过最小二
乘法或加权平均(加权平均法),从像这样确定的多个平面之中选择(确定)一个平面作为
文字平面(步骤G3)。
份的时间序列的加速度矢量将全部被变换成旋转后的平面内的数据。
(确定)1文字的开始书写的方向,也就是文字的开始书写的笔画方向(在开始书写时间点
的矢量方向)(步骤G7)。然后,在指定存储于识别字典存储器DM2中的各基本文字之中的
排头的基本文字作为对照对象后(步骤G8),计算用于使在文字平面内旋转的“旋转矩阵”,使得在上述步骤G7中确定的文字方向(在文字的开始书写时间点的矢量方向)与在已指
定的基本文字的开始书写时间点的矢量方向一致(步骤G9)。然后,使用该“旋转矩阵”使
1文字份的时间序列的加速度矢量全部旋转(步骤G10)。这样,1文字份的时间序列的加速
度矢量将被变换成与基本文字的上下(the top and bottom)的方向一致的数据。
骤G11)。其后,计算“旋转矩阵”,该“旋转矩阵”用于使在上述步骤G10旋转变换后的1文字份的加速度矢量序列以其文字的开始书写时间点的矢量方向为轴,按照文字平面翻过来
的方式旋转(步骤G12)。然后,利用该“旋转矩阵”使1文字份的时间序列的加速度矢量全
部旋转(步骤G13)。这样,1文字份的时间序列的加速度矢量将被变换成其文字的表里关
系的数据。其后,将按翻转的方式旋转变换后的1文字份的加速度矢量序列作为输入文字
数据,一边将该输入文字数据和指定的基本文字数据进行对照一边计算它们的类似度(步
骤G14)。
下一基本文字后(步骤G16),回到上述步骤G9,重复一边对照下一基本文字数据一边计算
其类似度的处理(步骤G9~G16)。其结果是,在与全部的基本文字对应,求取其类似度后
(在步骤G16中为是),将类似度最高的基本文字决定为识别文字(输入候选)(步骤G17)。
指示下一候选的操作(步骤F11),并调查是否已关闭文字识别功能,即是否已通过用户操
作指示了文字输入的结束(步骤F12)。现在,在已进行下一候选操作的情况下(在步骤F11
中为是),读取下一候选(步骤F13),并作为输入候选显示在显示部15中(步骤F10)。另
外,若未指示文字输入的结束(在步骤F12中为否),则回到上述的步骤F2,以下,尽管通过重复上述的动作来进行针对下一手写文字的文字识别,但在已指示文字输入的结束时(在
步骤F12中为是),在该时间点图21的流程将结束。
字的动作作为1文字份的时间序列的加速度矢量获取,并选择该1文字份的加速度矢量序
列中的、矢量的大小为大的值且彼此大致正交的多个加速度矢量,并在确定由多个加速度
矢量决定的平面后,通过将1文字份的加速度矢量序列变换成所确定的平面内的正交的2
分量的加速度矢量序列而得到的输入文字数据、和预先准备的文字识别用的基本文字数据
进行对照,来进行文字识别,因此,可以使框体不总是呈相同的姿势,或使书写文字的平面不总是相同,能在大幅减轻手写输入文字时的用户的负担的同时,基于加速度传感器17的
测量结果顺利且可靠地识别文字,从而富于实用性。
中因框体的姿势变化而引起的重力方向的些许的变化或抖动,除了具有文字识别的鲁棒性
以外,还不需要陀螺仪等除加速度传感器以外的传感器,且不论对框体以何种姿势握持,平面是垂直是水平还是倾斜,都能进行文字识别,从而能大幅减轻用户的负担。
字平面,因此能恰当地确定文字平面。
始书写的方向一致,并将变换后的加速度矢量序列作为输入文字数据,且对照基本文字数
据,因此,在文字平面内,无论使文字的上下为哪个方向,都能进行文字识别。
况下,不需要相当于抬笔或落笔这样麻烦且困难的操作或移动而能判别1文字输入。
和结束书写,因此,对用户而言,在开始书写1文字前使框体大致静止,然后使框体缓慢平滑地移动到文字的开始书写位置即可,另外,在结束书写1文字的时间点,再次使框体大致静止即可,通过极其自然的动作便能判别1文字的开始书写和结束书写。
的实施例都包含在本发明的范围之内。