商品代码分析系统以及商品代码分析方法转让专利

申请号 : CN201480028798.9

文献号 : CN105229640B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 山川朝贤正木京一本多志津子金城久实子见田洋伊藤史金井美奈子山口纯子

申请人 : 株式会社IDS

摘要 :

在各店铺中将以不同的分类或商品名登记的商品信息简单地分类到统一的种类中,并且变更为适当的商品名来将商品信息一元化。读出将构成分层构造的各分层中分类名的关键字和成为各商品名的存储目的地的单位列关联起来存储的分类辞典数据库(22),针对所输入的各记录,按照分类名的关键字的出现率,对各记录的商品名进行临时分类登记,读出用于存储属于各单位列的商品名的关键字的商品名辞典数据库的关键字的出现率,将各记录的商品名登记到单位列中。然后,在计算临时分类以及商品名登记中的关键字的出现率时,规定各辞典以及各关键字的应用顺序、各关键字的应用顺序和关键字的组合。(23),针对临时分类登记的各记录,按照商品名

权利要求 :

1.一种商品代码分析系统,其分析将分层分类后的商品名存储为记录的分析对象数据库,并根据分层构造进行总计,其特征在于,该商品代码分析系统具备:输入接口,其在维持所述分层构造的状态下,输入所述分析对象数据库;

分类辞典,其将构成所述分层构造的各分层中分类名的关键字和成为各商品名的存储目的地的单位列关联起来进行存储;

商品名辞典,其在通过所述分层构造分类后的每个单位列中存储属于各单位列的商品名的关键字;

临时分类执行部,其针对从所述输入接口所输入的所述分析对象数据库的各记录,按照所述分类辞典中分类名的关键字的出现率,对各记录的商品名进行临时分类登记;

商品名登记部,其根据所述临时分类执行部中的临时分类登记,针对所述分析对象数据库的各记录,按照所述商品名辞典中商品名的关键字的出现率,将各记录的商品名登记到所述单位列中;以及辞典检索执行部,其在计算所述临时分类执行部以及所述商品名登记部中所述关键字的出现率时,规定各辞典以及各关键字的应用顺序、关键字的组合;

其中,所述商品名登记部具有如下的核对功能:执行临时分类模式和核对模式,在两模式的结果不同时通知该结果,其中,临时分类模式是根据所述临时分类执行部进行的临时分类登记来进行所述商品名的辞典检索,核对模式是与所述临时分类登记的结果无关地对全部分类进行辞典检索。

2.根据权利要求1所述的商品代码分析系统,其特征在于,

所述商品代码分析系统还具备:

注释辞典,其将与登记在所述商品名辞典中的商品名相关联的信息存储在通过所述分层构造分类后的每个单位列中;以及注释登记部,其针对所述分析对象数据库的各记录,按照所述注释辞典中关键字的出现率,将与各记录的商品名相关联的信息登记到该商品所属的单位列中,所述辞典检索执行部在计算所述注释登记部中所述关键字的出现率时,规定各辞典以及各关键字的应用顺序、关键字的组合。

3.根据权利要求1所述的商品代码分析系统,其特征在于,

所述商品代码分析系统还具备:学习功能部,其根据所述核对功能的结果,使所述两模式的辞典检索结果反映到对应的辞典中。

4.根据权利要求1或2所述的商品代码分析系统,其特征在于,

所述辞典检索执行部将所述各记录内的商品名以及相关联的信息字符串分解成单词单位,以分解后的单词单位执行所述各辞典的应用。

5.根据权利要求1或2所述的商品代码分析系统,其特征在于,

所述辞典检索执行部还具备:关键字控制部,其根据各关键字的字符串长度以及组合各关键字而得的关键字的字符串长度,来设定所述关键字的应用顺序。

6.一种商品代码分析方法,用于分析将分层分类后的商品名存储为记录的分析对象数据库,并根据分层构造进行总计,其特征在于,该商品代码分析方法具备如下的步骤:输入步骤,在维持所述分层构造的状态下,通过输入接口输入所述分析对象数据库;

临时分类执行步骤,读出将构成所述分层构造的各分层中分类名的关键字和成为各商品名的存储目的地的单位列关联起来存储的分类辞典,并且针对从所述输入接口所输入的所述分析对象数据库的各记录,按照所述分类辞典中分类名的关键字的出现率,对各记录的商品名进行临时分类登记;

商品名登记步骤,读出在通过所述分层构造分类后的每个单位列中存储属于各单位列的商品名的关键字的商品名辞典,并且根据所述临时分类执行步骤中的临时分类登记,针对所述分析对象数据库的各记录,按照所述商品名辞典中商品名的关键字的出现率,将各记录的商品名登记到所述单位列中;以及辞典检索执行步骤,在计算所述临时分类执行步骤以及所述商品名登记步骤中所述关键字的出现率时,规定各辞典以及各关键字的应用顺序、关键字的组合;

其中,所述商品名登记步骤中包括核对步骤,在所述核对步骤中:执行临时分类模式和核对模式,在两模式的结果不同时通知该结果,其中,临时分类模式是根据所述临时分类登记步骤进行的临时分类登记来进行所述商品名的辞典检索,核对模式是与所述临时分类登记的结果无关地对全部分类进行辞典检索。

7.根据权利要求6所述的商品代码分析方法,其特征在于,

商品代码分析方法还具备:注释登记步骤,读出将与登记在所述商品名辞典中的商品名相关联的信息存储在通过所述分层构造分类后的每个单位列中的注释辞典,并且针对所述分析对象数据库的各记录,按照所述注释辞典中关键字的出现率,将与各记录的商品名相关联的信息登记到该商品所属的单位列中,在所述辞典检索执行步骤中,在计算与所述注释辞典相关的所述关键字的出现率时,规定各辞典以及各关键字的应用顺序、关键字的组合。

8.根据权利要求6所述的商品代码分析方法,其特征在于,

所述商品代码分析方法还具备:学习步骤,根据所述核对步骤的结果,使所述两模式的辞典检索结果反映到对应的辞典中。

9.根据权利要求6或7所述的商品代码分析方法,其特征在于,

在所述辞典检索执行步骤中,将所述各记录内的商品名以及相关联的信息字符串分解成单词单位,以分解后的单词单位执行所述各辞典的应用。

10.根据权利要求6或7所述的商品代码分析方法,其特征在于,

所述辞典检索执行步骤还具备:关键字控制步骤,根据各关键字的字符串长度以及组合各关键字而得的关键字的字符串长度,来设定所述关键字的应用顺序。

说明书 :

商品代码分析系统以及商品代码分析方法

技术领域

[0001] 本发明涉及一种分析将分层分类后的商品名存储为记录的分析对象数据库,并根据该分层构造进行总计的商品代码分析系统以及商品代码分析程序。

背景技术

[0002] 对于超市等零售业者,掌握多样化的顾客需要并展开经营是十分重要的,因此,例如掌握调查在全部市场中销售的商品是哪些商品而得的市场数据,来进行对市场的全部商品的销售动向进行分析的所谓的营销。
[0003] 作为分析这样的销售动向的技术,例如有专利文献1。在专利文献1公开了如下系统:根据从零售业者的POS(Point of sales:销售时间点信息管理)终端取得的商品销售数量数据和商品库存数量数据,从商品的市场整体的库存状况迅速且简单地分析市场动向。
[0004] 现有技术文献
[0005] 专利文献
[0006] 专利文献1:日本特开2005-8341号公报

发明内容

[0007] 发明要解决的课题
[0008] 然而,各店铺(企业)独自进行各商品的管理,因此各店铺的商品信息被分类成独自的商品种类(category),或对商品赋予独自的商品代码,作为商品主信息进行管理。因此,如果简单地收集各店铺的商品主信息并累计在数据库中,即使是相同商品也被分类为不同的种类,无法解析准确的销售动向。
[0009] 此外,在各店铺中,有时在商品主信息中包含商品的产地或数量等与商品相关的信息,因此对于包含与商品相关的信息的商品名和不包含与商品相关的信息的商品名,即使是相同的商品有时也被登记为不同的商品。另一方面,还存在对各店铺的商品主信息重新分类种类或变更商品名的作业十分复杂这样的问题。
[0010] 因此,本发明是解决上述问题而提出的发明,其目的在于提供一种商品代码分析系统以及商品代码分析程序,能够将在各店铺中以不同的分类或商品名登记的商品信息简单地分类为统一的种类,并且变更为适当的商品名来将商品信息一元化。
[0011] 用于解决课题的方法
[0012] 为了解决上述课题,本发明的商品代码分析系统,其分析将分层分类后的商品名存储为记录的分析对象数据库,并根据该分层构造进行总计,其特征在于,该商品代码分析系统具备:输入接口,其在维持所述分层构造的状态下,输入所述分析对象数据库;分类辞典,其将构成所述分层构造的各分层中分类名的关键字和成为各商品名的存储目的地的单位列关联起来进行存储;商品名辞典,其在通过所述分层构造分类后的每个单位列中存储属于各单位列的商品名的关键字;临时分类执行部,其针对从所述输入接口所输入的所述分析对象数据库的各记录,按照所述分类辞典中分类名的关键字的出现率,对各记录的商品名进行临时分类登记;商品名登记部,其根据所述临时分类执行部中的临时分类登记,针对所述分析对象数据库的各记录,按照所述商品名辞典中商品名的关键字的出现率,将各记录的商品名登记到所述单位列中;以及辞典检索执行部,其在计算所述临时分类执行部以及所述商品名登记部中所述关键字的出现率时,规定各辞典以及各关键字的应用顺序、所述各关键字的应用顺序和关键字的组合。
[0013] 在这样的本发明中,针对所输入的各记录,首先,按照分类辞典中分类名的关键字的出现率,将各记录临时分类登记到成为存储目的地的单位列中,并且,按照商品名辞典中商品名关键字的出现率,将临时登记的商品名变更为统一的关键字后进行登记,因此能够将在各店铺中以不同的分类或商品名登记的记录简单地分类到统一的单位列中,并且变更为适当的商品名来将商品信息一元化。
[0014] 尤其是,在本发明中,辞典检索执行部在临时分类执行部以及商品名登记部计算关键字的出现率时,规定各辞典和各关键字的应用顺序、各关键字的应用顺序以及关键字的组合。在此,关键字的应用顺序例如表示针对分类内的商品关键字设定优先级,从优先级高的关键字开始进行检索,或从字符串长度长的顺序开始进行检索等应用关键字的顺序。此外,关键字的组合是指商品名或其商品的形态、制造商、期限限定信息等为确定商品名所需要的2个以上的关键字的组合,作为基于该组合的检索方法,除了包含所指定的全部关键字的与检索和包含所指定的某个关键字的或检索等外,还包括连接多个关键字而作为一个关键字进行检索的方法。
[0015] 这样,根据本发明,规定各辞典和各关键字的应用顺序、各关键字的应用顺序以及关键字的组合,因此通过构成分类或商品名的字符数量或字符的组合,即使是属于不同单位列的商品,也能够根据适当的关键字的应用顺序或关键字的组合来进行处理,将各店铺的记录存储在适当的单位列中。
[0016] 在上述发明中,所述商品代码分析系统还具备:注释辞典,其将与登记在所述商品名辞典中的商品名相关联的信息存储在通过所述分层构造分类后的每个单位列中;以及注释登记部,其针对所述分析对象数据库的各记录,按照所述注释辞典中关键字的出现率,将与各记录的商品名相关联的信息登记到该商品所属的单位列中,所述辞典检索执行部在计算所述注释登记部中所述关键字的出现率时,规定各辞典以及各关键字的应用顺序、所述各关键字的应用顺序和关键字的组合。
[0017] 在此,与商品名相关的信息例如包括商品的产地、数量、制造商、装入数量等信息。在该情况下,针对商品名以外的信息,也参照注释辞典,按照与商品名相关联的信息的关键字的出现率登记到单位列中,因此对于商品的分类或商品名以外的附加信息也能够相关联地进行登记。
[0018] 此时,在注释登记部计算关键字的出现率时,辞典检索执行部规定各辞典以及各关键字的应用顺序、各关键字的应用顺序和关键字的组合,因此通过与商品相关的信息的字符串数或字符的列,即使存在与商品相关的各信息属于不同的项目的信息的情况下,也能够通过规定关键字的应用顺序或关键字的组合,存储在恰当的项目中。
[0019] 在本发明中,所述商品名登记部具有如下的核对功能:执行临时分类模式和核对模式,在两模式的结果不同时通知该结果,其中,临时分类模式是根据所述临时分类执行部进行的临时分类登记来进行所述商品名的辞典检索,核对模式是与所述临时分类登记的结果无关地对全部分类进行辞典检索。
[0020] 在上述发明中,所述商品代码分析系统还具备:学习功能部,其根据所述核对功能的结果,使所述两模式的辞典检索结果反映到对应的辞典中。
[0021] 在上述发明中,辞典检索执行部将各记录内的商品名以及相关联的信息字符串分解成单词单位,以分解后的单词单位执行各辞典的应用。在该情况下,例如即使在店铺输入的记录中混合输入了商品名和与商品相关联的信息的情况下,辞典检索执行部以单词单位进行分解来执行各辞典的应用,因此能够将记录登记到适当的单位列中。
[0022] 在上述发明中,所述辞典检索执行部还具备:关键字控制部,其根据各关键字的字符串长度以及组合各关键字而得的关键字的字符串长度,来设定所述关键字的应用顺序。在该情况下,在登记商品名“AAABB”的情况下,且在商品名辞典中存在字符串长度长的“AAA”和字符串长度短的“BB”的情况下,辞典检索执行部根据字符串长度,能够先从字符串长度长的“AAA”开始进行检索,因此能够防止将商品名“AAABB”登记在“BB”的分类下。
[0023] 此外,辞典检索执行部例如将AA1、AA2、AA3等有关联的关键字按照AA1×AA2、AA1×AA3、AA2×AA1、AA2×AA3、AA3×AA1、AA3×AA2方式循环相互组合,能够进行与检索和或检索等。此时,按照关键字的合计字符串长度的从长到短的顺序进行检索,由此能够进行更适当的分类。并且,辞典检索执行部能够设置例如像AA1AA2、AA1AA3那样适当连接有关联的关键字来新生成检索用关键字的功能。组合该检索用关键字和本来的关键字来任意调整字符串长度,进行与检索、或检索等,由此能够调节分解而得的被限定的关键字的应用顺序,能够提高分析精度。
[0024] 这样,根据本发明,根据关键字或组合后的关键字的字符串长度设定关键字的应用顺序,因此能够将记录登记到适当的单位列中。
[0025] 通过在计算机上执行以预定语言记述的程序的发明,能够实现上述的本发明的系统。具体而言,本发明是分析将分层分类后的商品名存储为记录的分析对象数据库,并根据该分层构造进行总计的商品代码分析程序,使使计算机进行如下的处理:
[0026] (1)输入步骤,在维持所述分层构造的状态下,通过输入接口输入所述分析对象数据库;
[0027] 临时分类执行步骤,读出将构成所述分层构造的各分层中分类名的关键字和成为各商品名的存储目的地的单位列关联起来存储的分类辞典,并且针对从所述输入接口所输入的所述分析对象数据库的各记录,按照所述分类辞典中分类名的关键字的出现率,对各记录的商品名进行临时分类登记;
[0028] (2)商品名登记步骤,读出在通过所述分层构造分类后的每个单位列中存储属于各单位列的商品名的关键字的商品名辞典,并且根据所述临时分类执行步骤中的临时分类登记,针对所述分析对象数据库的各记录,按照所述商品名辞典中商品名的关键字的出现率,将各记录的商品名登记到所述单位列中;以及
[0029] (3)辞典检索执行步骤,在计算所述临时分类执行步骤以及所述商品名登记步骤中所述关键字的出现率时,规定各辞典以及各关键字的应用顺序、所述各关键字的应用顺序和关键字的组合。
[0030] 并且,将该程序安装在用户终端或Web服务器等计算机或IC芯片上,并在CPU上执行,由此能够容易地构筑具有上述的各功能以及作用/效果的系统。该程序例如可以通过通信线路进行发布,还可以作为在独立式计算机上运行的应用包(package application)进行转让。
[0031] 并且,可以将这样的程序记录在通用计算机可读取的记录介质中,通过记录了该程序的记录介质,使用通用的计算机或专用计算机能够实现上述的系统或方法,并且能够容易地进行程序的保存、搬运以及安装。
[0032] 发明效果
[0033] 如以上所述,根据本发明能够将在各店铺中以不同的分类或商品名登记的商品主信息简单地分类到统一的种类中,并且变更为适当的商品名来将商品信息一元化。

附图说明

[0034] 图1是表示实施方式涉及的商品代码分析系统的概念图。
[0035] 图2是表示实施方式涉及的用于展示店铺侧的商品信息的各记录的表数据。
[0036] 图3是表示实施方式涉及的累积在商品主信息数据库中的单位列内的各信息的表数据。
[0037] 图4是表示实施方式涉及的累积在注释辞典数据库中的各信息的表数据。
[0038] 图5是表示实施方式涉及的商品代码分析方法的概要的说明图。
[0039] 图6是表示实施方式涉及的各种辞典数据的生成方法的流程图。
[0040] 图7是表示实施方式涉及的商品信息的分类方法的流程图。
[0041] 图8是表示实施方式涉及的商品信息的分类方法的流程图。

具体实施方式

[0042] 以下,参照附图详细说明本发明的商品代码分析系统的实施方式。图1是表示本实施方式涉及的管理服务器的内部构造的框图,图2是表示本实施方式涉及的累积在商品主信息数据库中的商品主信息的表数据。图3是本实施方式涉及的累积在注释辞典数据库中的信息的表数据,图4是表示本实施方式涉及的用于展示店铺侧的商品主信息的表数据。另外,在说明中使用的“模块”表示装置或设备等硬件,或具有其功能的软件,或由它们的组合等构成来达成预定的动作的功能单位。
[0043] 本实施方式的系统是将在多个店铺S的信息处理终端3等中产生的分层分类后的商品名取得为记录,并根据分层构造对该记录进行总计的系统,其由管理服务器1和数据库组2构成。
[0044] 信息处理终端3例如是由销售食品或日用品等超市等零售业者所持有的、具备CPU的运算处理功能以及通信接口的通信处理功能的信息处理终端,可以通过个人电脑等通用计算机或使功能专有化的专用装置(例如,POS装置等)来实现,还包括与移动终端相同的移动计算机或PDA(Personal Digital Assistance,个人数字处理)、便携电话等。
[0045] 数据库组2是积累与本系统相关的信息的数据库服务器,还积累辞典数据,该辞典数据在登记对各店铺的记录进行统一存储的商品信息或不同店铺的各记录的信息时使用。
[0046] 具体而言,该数据库组2具备商品主信息数据库21、分类辞典数据库22、商品名辞典数据库23、注释辞典数据库24、JAN代码数据库25以及分析对象数据库26。
[0047] 分析对象数据库26是积累包含成为分析对象的各店铺的商品名的商品信息的表数据,以记录单位存储分层分类后的商品名。具体而言,如图2所示,在分析对象数据库26中分为“分类1~4”、“JAN代码”、“商品代码”以及“商品名”项目进行存储。在此,“分类1~4”是与各部门的商品相关的属性信息,在图2所示的例子中,分类1表示农业部门,分类2表示蔬菜等商品组,分类3表示蘑菇等更详细的商品组,分类4表示玉蕈等的品种。
[0048] 在“JAN代码”记录日本的公用商品代码,在“商品代码”中记录在店铺独自分配的代码。此外,在“商品名”中记录用于表示商品的名称、商品的产地或数量等内容的、与商品相关信息的信息。
[0049] 商品主信息数据库21是将所输入的各记录的商品名累积在成为各商品名的存储目的地的单位列(column)中的存储装置。在此,如图3所示,单位列是用“分类1”~“分类4”的项目区分而得的信息,在图3所示的例子中展示了与商品“玉蕈”相关的单位列。在该单位列内进一步将各商品的“商品名”和与商品相关的信息即“注释信息”存储在数据库内。
[0050] “分类1~4”是与各部门的商品相关的属性信息,在图3所示的例子中,分类1表示农业部门,分类2表示蔬菜等商品组,分类3表示蘑菇等更详细的商品组,分类4表示玉蕈等的品种。
[0051] 此外,在“商品名”中记录有附加了用于表示与商品的产地和数量等内容相关的预定注释信息的商品的名称的信息。此外,在“注释信息”中积累用于说明该商品的描述性信息,在图所示的例子中积累了制造源信息即“制造商”、能够与其他进行区别的信息即“品牌”、表示生产地方的产地、表示商品的大小或重量的信息即“尺寸”、表示盒子内的放入数量等销售形态信息的“装入数量”等信息。另外,在本实施方式中,在“商品名”中存储有附加了注释信息的商品名,但也可以仅存储商品名。
[0052] 另外,虽未进行图示,但在商品主信息数据库21中附加有用于识别各商品的管理侧商品识别信息。并且,在其他数据库中,在该管理侧商品识别信息中相关联地记录有用于识别店铺的识别信息或包含该商品的销售状况等利用信息等。在此,利用信息包括在店铺设定的“平均价格”、“销售金额”、“销售件数”、“销售店铺率”以及“全国销售最终实际成绩”等销售状况信息和“更新日”等“更新状况信息”。并且,根据管理侧商品识别信息检索该商品的利用信息或每个店铺的商品信息,由此能够对各商品进行分析。此时,在“商品名”项目中附加有注释信息的情况下,能够通过商品名和所附加的注释信息的组合进行检索。
[0053] 分类辞典数据库22是将构成分层构造的各分层中分类名的关键字和成为各商品名的存储目的地的单位列相关联起来进行存储的存储装置。在本实施方式中,将在每个分类出现的关键字中的、出现率高的关键字作为分类用关键字进行记录,并且将出现率低的关键字与出现率高的关键字相关联起来进行积累。
[0054] 商品名辞典数据库23是在根据分层构造分类的每个单位列中存储属于各单位列的商品名的关键字的存储装置。在本实施方式中,将在每个分类出现的商品名的关键字中的、出现率高的关键字作为商品名分配的关键字进行记录,并且将出现率低的关键字与出现率高的关键字相关联起来进行积累。
[0055] 注释辞典数据库24是将与登记在商品名辞典数据库23中的商品名相关联的信息(商品名以外的信息)存储在根据分层构造分类的每个单位列中的存储装置。如图4所示,作为积累在该注释辞典数据库24内的单词大致被分为“商品关系信息”、“属性关联信息”、“调理关联信息”,并且根据各内容被分类。具体而言,在“商品关系信息”中积累商品相关的信息被分为“制造商”、“品牌”、“产地/国名”、“容量/重量(kg/ml)”、“尺寸/长度”、“装入数量/拼盘数量”、表示味道种类的“风味”、表示角色名的“角色”、表示罐或袋包装等容器种类的“容器、包装”、“材料、品种、调味作料”、表示成为过敏抗原的材料的“过敏原”、表示购买限制年龄的“年龄限制”、商品的销售时期(平日、上午、奥运会期间等),或表示季节(春天或母亲节等)信息的“销售时期/季节”、表示销售地区等信息的“销售区域/特产品”、表示打折信息等的“销售特性”等项目。
[0056] 并且,在“属性关联信息”中累积与购买商品的目标相关的信息,被分为按照购买金额顺序分类的“次序/十分位数”、“性别”、“年龄层”、表示顾客的志向信息的“志向”、表示销售时期的“时间”等项目。并且,在“调理关联信息”中累积与商品的调理相关的信息,被分类“保存期间”、“保存方法”、“加工程度”、表示利用的状况的“就餐环境”等项目。另外,即使在1个店铺有上述任一个项目的情况下,也将这些各数据累积在注释辞典数据库24中。
[0057] JAN代码数据库25将作为共同商品代码的JAN代码与商品主信息数据库21的各项目即分类1~4、商品名以及注释信息的各单词关联起来进行存储。另外,在JAN代码数据库25中具备将在所有店铺共同的分类以及商品名等与JAN代码关联起来的正式JAN表数据和管理侧向JAN代码暂时性分配了临时分类及以及临时商品名等的临时JAN表数据。这是因为每天新的商品被登记,对于进行更新的具有JAN代码的商品,将全部数据累积在正式JAN表数据中的困难的,因此作为管理侧,首先,作为临时,累积将JAN代码与管理侧决定的分类以及商品名关联起来的表数据。之后,每隔一定期间累积在临时JAN表数据中的信息进行与正式JAN表数据进行整合的处理,因此能够将临时登记的分类以及商品名变更为正式的分类以及商品名。向该临时JAN表数据的登记既可以根据管理者的用户操作进行登记,也可以采用自动登记没有登记在正式JAN表数据中的商品信息的结构。
[0058] 另一方面,管理服务器1是按照单位列对来自店铺的商品信息进行分类并登记在数据库中的服务器装置,通过执行各种信息处理的服务器计算机或具有其功能的软件来实现。如图1所示,该管理服务器1具备通信接口11、输入接口12、输出接口13以及控制部14。
[0059] 输入接口12是鼠标或键盘等用于输入用户操作的装置,在本实施方式中,在维持分层构造的状态下向分析对象数据库26输入记录。输出接口13是显示器或扬声器等用于输出影像或声音的装置。尤其,该输出接口13包括液晶显示器等显示部13a。通信接口11是能够进行通话或数据通信的通信接口,经由通信网络进行分组数据的收发,取得各店铺S的记录。存储器18是累积OS(Operating System,操作系统)或本实施方式涉及的商品代码分析程序等的存储装置。
[0060] 控制部14是通过CPU或DSP(Digital Signal Processor,数字信号处理器)等处理器、存储器以及其他电子电路等硬件,或具有其功能的程序等软件,或它们的组合构成的运算模块,通过适当读入并执行程序虚拟地构筑各种功能模块,通过构筑的各功能模块进行各部的动作控制、针对用户操作的各种处理。在本实施方式中,控制部14具备商品信息登记部15、商品信息检索部16以及辞典数据生成部17。
[0061] 辞典数据生成部17是构筑各种辞典数据库的模块。首先,该辞典数据生成部17在接受成为样品的商品名等信息的输入时,通过形态要素解析处理等语言解析程序从商品信息的各项目中提取各单词。
[0062] 然后,辞典数据生成部17计算出每个项目的关键字的出现率,将出现率高的关键字设定为统一的单词,累积在各辞典数据库中。以下,对该辞典数据的设定进行详述。另外,在本实施方式中,如图2所示,作为辞典登记用数据,假定输入了A公司、B公司以及C公司的各记录。
[0063] 首先,说明根据从店铺输入的商品信息,在辞典数据库内构筑分类1~4的关键字的情况。在本实施方式中,对于分类1,在A公司是“农产品”、在B公司是“蔬果”,在C公司是“农产品”。此时,辞典数据生成部17将出现率高的“农产品”设定为分类1中的出现率高的关键字。
[0064] 此外,在分类2中,A公司、B公司以及C公司都使用“蔬菜”单词,因此将出现率高的“蔬菜”设定为出现率高的关键字。此外,在分类3中,A公司使用“菌类”单词,B公司使用“蘑菇”单词,C公司使用“菌菇类”单词。在该情况下,将出现率高的B公司的“蘑菇”设定为分类3中的出现率高的关键字。
[0065] 并且,在分类4中,A公司使用“斑·玉·蕈”单词,B公司使用“玉蕈”字符,C公司使用“斑玉蕈”和“玉蕈”单词。在该情况下,将出现率高的B公司以及C公司的“玉蕈”设定为分类4中的出现率高的关键字。另外,将没有设定为出现率高的关键字的、出现率低的各关键字与出现率高的各关键字关联起来存储在各辞典数据库内。
[0066] 接着,说明在辞典数据库内构筑商品名的关键字的情况。首先,辞典数据生成部17接受根据商品主信息内的商品名仅置换商品名的处理。例如,如图4所示,在商品名为“斑玉蕈(北斗)”的情况下,接受提取“北斗”字符,置换为仅“斑玉蕈”的单词的处理。然后,辞典数据生成部17统计商品名中的同音的单词,并将出现率高的商品名登记为出现率高的关键字。在此,存在称为“斑·玉·蕈”和斑玉蕈同音的单词,但“斑玉蕈”的单词的出现率高,将商品名设定为“斑玉蕈”。此时,在部门内登记的关键字可以附加表示在运用时使用的顺序的优先级。
[0067] 此时,辞典数据生成部17接受组合商品名和其商品的形态等为确定商品名而所需要的2个以上的关键字后登记为关键字的处理。并且,对于是同一商品但名称根据地域而不同的商品(例如,在关东为“春菊”而在关西为“菊菜”等),接受将哪个商品名设定为关键字的选择操作来统一商品名。
[0068] 接着,说明针对注释信息的向注释辞典数据库内的设定。辞典数据生成部17将与商品有关的信息记录在注释辞典数据库24内的各项目中。例如,图3所示,从A公司的商品名“斑玉蕈(北斗)”提取的“北斗”单词,接受用户操作后登记在“制造商”项目中。然后,对于注释信息,也对每个项目计算出关键字的出现率,设定出现率高的关键字,累积在各辞典数据库中。
[0069] 通过以上这样的辞典数据生成部17的处理,在各种数据库内构筑分类、商品名、注释信息的各关键字。然后,商品信息登记部15参照构筑的各种辞典数据库22~25,之后,对从各店铺输入的商品信息(商品名以及每个店铺的分类名、注释信息等)进行分析,作为统一的信息总计在商品主信息数据库21内。
[0070] 该商品信息登记部15具备临时分类执行部15a、商品名登记部15b、辞典检索执行部15c、核对功能部15d、学习功能部15e以及注释登记部15f。
[0071] 临时分类执行部15a是针对从输入接口12输入的分析对象数据库26的各记录,按照分类辞典数据库22中的分类名的关键字的出现率来对各记录的商品名进行临时分类登记的模块。具体而言,临时分类执行部15a在输入了记录的情况下,按照分类1~4的顺序比较记录的分类名和分类辞典数据库22中的分类名的关键字,将记录的分类名置换为记录出现率高的关键字来进行临时分类登记。
[0072] 例如,如图2所示,假定输入了A公司的记录。这样,输入的记录中的、分类1的单词“农产品”和分类2的单词“蔬菜”与存储在分类辞典数据库22中的出现率高的关键字相同,因此将“农产品”临时分类登记在分类1中,并且,将“蔬菜”临时分类登记在分类2中。另一方面,分类3的单词“菌类”参照分类辞典数据库22时,存在比“菌类”出现率高的“蘑菇”,与“蘑菇”关键字相关联,因此将该记录临时分类登记在“蘑菇”的分类3中。此外,对于分类4的“斑玉蕈”同样地,将出现率高的关键字即“玉蕈”临时分类登记在分类4中。
[0073] 同样地,在假定输入了B公司的记录的情况下,参照分类辞典数据库22时,存在比分类1的“蔬菜”出现率更高的关键字即“农产品”,因此将“农产品”临时分类登记在分类1中。之后,作为被输入的分类2的“蔬菜”、分类3的“蘑菇”以及分类4的“玉蕈”的关键字是出现率高的关键字,因此临时分类登记在该关键字的分类中。
[0074] 此外,在输入了C公司的记录的情况下,参照分类辞典数据库22时,分类1的单词“农产品”和分类2的单词“蔬菜”与分类辞典数据库22的出现率高的关键字相同,因此将“农产品”临时分类登记在分类1中,并且将“蔬菜”临时分类登记在分类2中。另一方面,分类3的单词“菌菇类”参照分类辞典数据库22时,存在比“菌菇类”出现率高的关键字即“蘑菇”,因此将“蘑菇”临时分类登记在分类3中。此外,对于分类4的“斑玉蕈”同样地,将出现率高的关键字即“玉蕈”临时分类登记在分类4中。另外,没有在辞典数据库内累积的单词被输入到辞典数据生成部17中后被辞典登记。
[0075] 商品名登记部15b是根据临时分类执行部15a中的临时分类登记,针对分析对象数据库26的个记录,按照商品名辞典数据库23中的商品名的关键字的出现率,在单位列中登记各记录的商品名的模块。
[0076] 对该商品名登记部15b的处理进行详述,首先,商品名登记部15b依次比较所输入的记录的商品名和存储在商品名辞典数据库23内的每个部门的关键字,检测出与该输入的商品名相关联的出现率高的关键字,将该现率高的关键字的商品名登记在单位列内的项目“商品名”栏。
[0077] 具体而言,如图2所示,在输入了A公司的记录的情况下,第一行的“斑玉蕈”与出现率高的关键字即“斑玉蕈”相同,因此将“斑玉蕈”字符登记在单位列中。
[0078] 另一方面,B公司的商品名“丹波玉蕈”在参照商品名辞典数据库23内时,出现率高的关键字被设定为“丹波玉蕈”。因此,将B公司的商品“丹波玉蕈”的商品名变换为“丹波玉蕈”后登记在单位列中。此外,B公司的“玉蕈茸”变换为“玉蕈”后进行登记。同样地,将其他记录变换为出现率高的关键字后进行登记。
[0079] 注释登记部15f是参照注释辞典数据库24登记该商品的注释信息的模块。具体而言,注释登记部15f针对分析对象数据库26的各记录,按照注释辞典数据库24中的关键字的出现率,将与各记录的商品名相关联的信息登记在商品所属的单位列中。
[0080] 例如,图2所示,在选择的关键字为“北斗”的情况下,判断该单词是否被包含在注释辞典数据库24内。在此,“北斗”单词是登记在“制造商”项目中的单词,因此如图3所示,注释登记部15f向注释信息的“制造商”项目分配“北斗”单词。同样地,对于各项目出现率高的关键字被分别分配给各注释信息的项目。例如,将“中国”关键字分配给“产地”项目,将“数值+g(克)”关键字分配给“尺寸”项目。
[0081] 辞典检索执行部15c是在计算临时分类执行部15a以及商品名登记部15b中的关键字的出现率时,规定各辞典和各关键字的应用顺序、各关键字的应用顺序以及关键字的组合的模块。
[0082] 在此,作为各辞典和各关键字的应用顺序,例如包括针对商品关键字设定优先级后从优先级高的关键字开始进行检索,或从字符串长度长的顺序开始进行检索的方法。另外,可以根据关键字控制部15g来执行基于该字符串长度的检索。该关键字控制部15g是根据各关键字的字符串长度以及组合各关键字而得的关键字的字符串长度来设定关键字的应用顺序的模块。
[0083] 在本实施方式中,对全部门的商品关键字设定10个阶段的优先级,从优先级高的关键字开始进行检索,并且对于相同优先级的关键字,从字符串长度长的顺序开始进行检索。
[0084] 例如,在登记商品名“AAABB”的情况下,且在商品名辞典中字符串长度长的关键字“AAA”和字符串长度短的关键字“BB”为相同优先级的情况下,辞典检索执行部根据字符串长度,能够先从字符串长度长的“AAA”开始进行检索,因此能够防止将商品名“AAABB”登记在“BB”的分类下。另一方面,如果将字符串长度短的关键字“BB”的优先级设定为比字符串长度长的关键字“AAA”高,则即使是相同的商品名“AAABB”,也将该商品登记在“BB”的商品列中。另外,该关键字的应用顺序能够根据商品部门或商品名适当进行选择,能够仅通过优先级或字符串长度的任一方进行检索。此外,也可以更换应用顺序以便根据字符串长度进行检索,在存在相同字符串长度的情况下参照优先级。并且,也可以任意地变更优先级的阶段。
[0085] 此外,辞典检索执行部15c具有规定关键字的组合的功能。具体而言,辞典检索执行部15c为了确定商品名能够组合必要的2个以上的关键字来进行检索。与该商品组合的信息是“商品的形态”、“制造商”、“销售时期/季节”、“风味”等包含在注释辞典数据库24中的信息,能够从数据库中任意地提取这些信息。作为该提取方法,例如既可以对管理者在画面上显示应该按照哪个条件检索并接受检索条件,也可以按照预先决定的设定了关键字的组合的应用顺序进行检索。
[0086] 然后,辞典检索执行部15c例如将AA1、AA2、AA3等有关联的关键字按照AA1×AA2、AA1×AA3、AA2×AA1、AA2×AA3、AA3×AA1、AA3×AA2方式循环相互组合,能够进行包含指定的全部关键字的与(AND)检索或包含任意关键字的或(OR)检索等。此时,根据关键字的合计字符串长度的从长到短顺序或优先级进行检索,由此能够进行更适当的分类。并且,辞典检索执行部15c能够设置例如像AA1AA2、AA1AA3那样适当连接有关联的关键字来新生成检索用关键字的功能。组合该检索用关键字和本来的关键字来任意调整字符串长度,进行与检索、或检索等,由此能够调节分解而得的被限定的关键字的应用顺序,能够提高分析精度。此外,即使在组合之间插入其他单词,该单词在判定中不被识别,即使在组合之间有其他单词也能够进行判定。
[0087] 另外,辞典检索执行部15c以向临时分类执行部15a和商品名登记部15b输入与记录的商品名以及相关联的信息为前提,通过形态要素解析处理等语言解析程序以单词单位对各记录内的商品名以及相关联的信息字符串进行分解,以被分解的单词单位执行各辞典的应用。例如,图2所示,对于从A公司输入的记录的商品名“斑玉蕈(北斗)”,分解为“斑玉蕈”和“北斗”字符。
[0088] 此外,辞典检索执行部15c具备:在计算注释登记部15f中的关键字的出现率时,还规定各辞典、各关键字的应用顺序、以及各关键字的应用顺序和关键字的组合的功能。
[0089] 另外,辞典检索执行部15c具备如下功能:如图2所示,在从店铺侧取得的记录中含有JAN代码的情况下,参照JAN代码数据库25,提取与JAN代码关联起来的分类1~4、商品名以及注释信息的各单词,如图3所示,登记在商品主信息数据库21中(图中,P1~P5)。另外,此时,例如在商品名中记录组合了制造商名或品牌名等注释信息而得的名称。
[0090] 核对功能部15d是执行临时分类模式和核对模式,并在两模式中的结果不同时,通知该结果的模块,其中,临时分类模式是根据基于临时分类执行部15a的临时分类登记进行商品名的辞典检索,核对模式是与临时分类登记的结果无关地对全部分类进行辞典检索。该核对结果的通知例如包括通过电子邮件等通知的情况和使显示部13a弹出两模式的结果的情况。此外,还具备通知后接受是否使任意分类(部分)登记的选择的功能。
[0091] 此外,核对功能部15d在JAN代码数据库25中没有登记有输入的商品信息所包含的JAN代码的情况下,参照临时JAN表数据,判断在临时JAN表数据中是否包含该JAN代码。在临时JAN表数据中也没有包含JAN代码的情况下,使显示部13a显示该信息,并接受登记在哪个分类(部门)中的用户操作。
[0092] 另一方面,在临时JAN表数据中包含JAN代码的情况下,分类为登记在该临时JAN表数据中的临时分类。即使在该情况下,也在显示部13a上显示分类的结果,接受分类目的地的变更操作即可。此外,核对功能部15d包括根据用户的任意操作,将特定的商品名移动到其他分类目的地的功能。另外,作为该用户操作的接受方法,例如在画面上显示单位列一览,在该显示画面上管理者进行拖拽等,由此能够进行移动任意的单位列的直观的操作。
[0093] 学习功能部15e是根据核对功能的结果,将两模式中的辞典检索结果反映到对应的辞典中的模块。具体而言,学习功能部15e根据在核对功能部15d接受的用户操作,通过关键字控制部15g向辞典数据增加变更,变更关键字的应用顺序等,在本次以后输入了同一商品的情况下不进行通知处理,而是自动地累积在与该商品对应的单位列内。此外,该学习功能部15e在一旦进行了将分类到单位列中的特定的商品名移动到其他任意的分类目的地的变更操作的情况下,自动地变更输入了同一商品时的关键字的应用顺序等以便向本次以后的辞典检索结果反映变更操作。
[0094] 对该学习功能部15e的处理进行详细叙述。例如,核对功能结果,或根据用户的任意的操作,将特定的商品名移动到其他分类目的地的情况下,例如在画面上显示单位列一览(分类一览),在该显示画面上,通过拖拽等进行确定,确定成为变更对象的商品名以及移动目的地的单位列。根据该变更操作,学习功能部15e为了在变更操作后,成为变更对象的商品名不会对其他关键字的检索结果产生影响,自动地变更向关键字赋予的优先级,或字符串数、与其他关键字的组合,变更关键字的应用顺序。
[0095] 在进行该变更操作时,具体执行以下的操作。
[0096] (1)首先,比较分类源和变更后的分类源,判断任某个分类是否优先成为检索执行的对象,判断成为变更对象的商品名(关键字)的应用顺序是上升还是下降(移动种类判定处理)。
[0097] (2)接着,根据移动种类判定处理的判定结果,决定由变更处理可能导致产生干扰的范围(范围决定处理)。具体而言,在成为变更对象的商品名的应用顺序上升的情况和下降的情况下,决定是否在比成为变更对象的商品名优先级高或字符串数多的关键字的范围内或字符串数少的关键字的范围内进行检查。
[0098] (3)然后,根据上述范围决定处理,针对包含在所决定的范围内的关键字进行有无干扰产生的检查。具体而言,执行参照具有成为变更对象的商品名所属的分类源以及以变更后的分类目的地为检索结果的辞典的反引处理,提取将分类源和变更后的分类目的地关联起来的关键字(反引提取处理)。
[0099] (4)接着,比较通过反引提取处理提取的关键字和成为变更对象的商品名(关键字),根据其优先级或字符串数进行优先级的调整或检索用关键字的生成。在本实施方式中,对优先级的等级设有限制,因此尽可能通过检索用关键字的生成消除上述干扰,在仅通过检索用关键字的生成不能消除干扰的情况下,进行优先级的调整。作为该检索用关键字的生成,例如像AA1AA2、AA1AA3那样适当连接有关联的关键字来新生成检索用关键字,组合该检索用关键字和本来的关键字来任意地调整字符串长度。在辞典检索执行部15c中,进行多个关键字的与检索,按照这些多个关键字的总字符串数的从长到短的顺序进行应用,因此生成想要的字符串长度的检索用关键字,由此能够调整其应用顺序。
[0100] 商品信息检索部16是参照商品主信息数据库21,检索与检索条件对应的每个主单位的商品信息的模块。另外,关于检索条件,除了分类1~4、商品名以及注释信息外,也可以根据店铺识别信息按店铺进行检索。此外,对于检索到的商品,也可以根据商品识别信息检索销售状况等。
[0101] (商品代码分析方法)
[0102] 通过运行具有以上结构的商品代码分析系统,能够实施将记录总计到统一的数据库中的商品代码分析方法。图5是表示本实施方式的商品代码分析方法的概要的说明图,图6是表示本实施方式的各种辞典数据的生成方法的流程图,图7和图8是表示本实施方式的商品主信息的分类方法的流程图。
[0103] 如图5所述,首先,在步骤S100中,执行构筑(生成)解析用各种辞典数据的处理,之后,在步骤S200和步骤S300中,如果从各店铺输入记录,则对该记录进行分类,登记到统一的商品主信息数据库中。
[0104] (1)各种辞典数据的生成方法
[0105] 对辞典数据的生成方法进行说明。如图6所示,首先,决定商品种类(category)的分类数量(S101)。在本实施方式中,分为分类1(经营部门)、分类2(商品组)、分类3(更详细的商品组)、分类4(品种)。
[0106] 接着,辞典数据生成部17接受作为样品的记录的输入(S102)。作为该记录的接受,既可以是从显示在浏览器上的商品选择栏等输入的信息,也可以是从记录在记录介质中的数据读取的信息。
[0107] 在记录输入的接受结束时,辞典数据生成部17提取记录的分类1~4、商品名以及注释信息的各项目的单词(S103)。然后,计算出各项目中的关键字的出现率,设定出现率高的关键字,累积在各辞典数据库中(S105)。将出现率低的关键字与出现率高的关键字对应起来存储在各辞典数据库中(S106)。
[0108] (2)商品分类方法
[0109] 接着,针对记录的商品名的分类方法进行说明。另外,在本实施方式中,假定预先规定了各辞典以及各关键字的应用顺序、各关键字的应用顺序以及关键字的组合。该应用规定还包括根据各关键字的字符串长度以及组合了各关键字的字符串长度来设定关键字的应用顺序。在本实施方式中,从辞典内的优先级高的关键字开始进行检索,并且在关键字为相同优先级的情况下,设定为从字符串长度长的关键字开始进行检索。并且,也可以针对注释信息、针对各关键字的应用顺序、各关键字的应用顺序以及关键字的组合的应用顺序进行设定。
[0110] 首先,如图7所示,在维持分层构造的状态下,通过输入接口12输入分析对象数据库26的各记录时(S201),辞典检索执行部15c判断在记录内是否包含JAN代码(S202)。在记录内包含JAN代码的情况下(S202的是),判断在JAN代码数据库25内的正式JAN表数据中是否登记有该JAN代码(S203)。在JAN表数据内包含JAN代码的情况下(S203的是),根据该JAN代码,决定商品的分类(分类1~4)、商品名以及注释信息并登记(S210)。
[0111] 另一方面,在正式JAN表数据内没有包含JAN代码的情况下(S203中的否),参照该临时JAN表数据,判断在临时JAN表数据中是否包含该JAN代码(S204)。
[0112] 在临时JAN表数据中存在该JAN代码的情况下(S204的是),选择所分配的临时分类以及临时商品名并进行临时分类登记(S210)。此时,在显示部13a上显示临时分类的结果,接受分类目的地的变更操作。
[0113] 另一方面,在临时JAN表数据中没有登记有该JAN代码的情况下(S204的否),辞典检索执行部15c对每个项目提取登记在记录内的各信息的单词,并且对各记录内的商品名以及相关联的信息字符串通过形态要素解析分解为单词单位。然后,通过核对功能部15d,使显示部13a显示通知信息,接受用户操作(S211)。之后,核对功能部15d根据用户操作,将所选择的该分类的关键字登记到各辞典中,并且将该商品信息临时分类登记在该分类中(S210)。
[0114] 在记录内没有JAN代码的情况下(S202的否),临时分类执行部15a针对从输入接口12输入的分析对象数据库26的各记录,按照分类辞典数据库22中的分类名的关键字的出现率,对各记录的商品名进行临时分类登记。具体而言,读出各部门的分类名的关键字(S205),并且读出分类辞典数据库22(S206),判断在分类辞典数据库22内是否登记有该记录的分类名(S207)。
[0115] 在分类辞典数据库22内登记有记录内的单词的情况下(S207的是),按照关键字的出现率(S209),临时分类登记到出现率高的单位列中(S210)。另一方面,在分类辞典数据库22内没有登记有记录内的单词的情况下(S207的否),将该分类的关键字新登记到辞典中(S208)。具体而言,辞典检索执行部15c对每个项目提取登记在记录内的各信息的单词,并且对各记录内的商品名以及相关联的信息字符串通过形态要素解析分解为单词单位。然后,通过核对功能部15d,使显示部13a显示通知信息,接受用户操作。之后,根据用户操作,将该分类的关键字登记到各辞典中,并且将该商品信息临时分类登记在分类中(S210)。
[0116] 接着,如图8所示,商品名登记部15b进行这样的商品名登记步骤,即:针对分析对象数据库26的各记录,按照商品名辞典数据库23中的商品名的关键字的出现率,将各记录的商品名登记在单位列中。
[0117] 具体而言,选择在临时分类执行步骤执行的被临时分类登记的记录(S301),对每个通过分层构造分类的单位列读出商品名辞典数据库23(S302),判断在商品名辞典数据库23内是否登记有该商品名(S303)。
[0118] 在商品名辞典数据库23内没有登记所选择的商品名的情况下(S303的否),将该商品名的单词登记到辞典中(S304),之后,将该商品名登记到单位列中(S306)。另外,与步骤S103~步骤S106同样地进行向辞典内的单词登记处理。另一方面,在商品名辞典数据库23内登记有商品名的情况下(S303的是),按照商品名的关键字的出现率(S305),将该记录的商品名登记到相应的的单位列中(S306)。
[0119] 另外,在该商品名登记步骤中,执行临时分类模式和核对模式,并在两模式中的结果不同时,通知该结果其中,临时分类模式根据基于临时分类登记步骤的临时分类登记进行商品名的辞典检索,核对模式与临时分类登记的结果无关地对全部分类进行辞典检索。在该情况下,根据核对步骤的结果,将两模式中的辞典检索结果分应给对应的辞典。
[0120] 接着,注释登记部15f进行这样的注释登记步骤:针对分析对象数据库26的各记录,按照注释辞典数据库24中的关键字的出现率,将与各记录的商品名相关联的信息登记在商品所属的单位列中。
[0121] 具体而言,首先,读出与登记在商品名辞典数据库23中的商品名相关联的信息和存储在每个单位列中的注释辞典数据库24(S307和S308),判断在辞典内是否登记有该单词(S309)。
[0122] 在注释辞典数据库24内登记有所选择的单词的情况下(S309的是),向该登记的注释信息的项目(例如,“制造商”、“品牌”、“产地”、“尺寸”以及“装入数量”)部分分配该单词,并登记注释信息(S311)。
[0123] 另一方面,在注释辞典数据库24内没有登记所选择的单词的情况下(S309的否),将该注释信息登记在辞典内(S310),并将该注释信息登记在各项目中(S311)。另外,与步骤S103~步骤S106同样地进行向辞典内的单词登记处理。另外,注释登记部15f重复步骤S307~S311的处理直到记录内的单词完全没有为止。之后,参照下个记录,重复步骤S201~S311的处理,直到完全没有为止进行同样的处理。
[0124] (商品代码分析程序)
[0125] 通过在计算机上执行以预定的语言记述的商品代码分析程序,能够实现上述的本实施方式的商品代码分析系统以及商品代码分析方法。即,通过将该程序安装在对便携信息终端(PDA)集成了便携电话/通信功能的便携终端机、配置在网络上而向客户端侧提供数据或功能的服务器装置,或游戏装置等专用装置,或IC芯片上,并在CPU上执行,能够容易地构筑具有上述的各功能的系统。该程序例如可以通过通信线路进行发布,此外也可以作为在独立式计算机上运行的应用包进行转让。
[0126] 并且,可以将这样的程序记录在个人计算机可读取的记录介质中。具体而言,可以记录在软(硬)盘或盒式磁带等磁记录介质、CD-ROM或DVD-ROM等光盘外,还可以记录在USB存储器或存储卡等各种记录介质中。
[0127] (作用/效果)
[0128] 根据上述这样的本实施方式,针对所输入的各记录,首先,临时分类执行部15a按照分类辞典数据库22中的分类名的关键字的出现率,将各记录临时分类登记在成为存储目的地的单位列中,然后,商品名登记部15b按照商品名辞典数据库23中的商品名的关键字的出现率,变更为统一了临时登记的商品名的关键字并登记,因此能够将在各店铺中以不同的分类或商品名登记的记录简单地分类到统一的单位列中,并且变更为适当的商品名来将商品信息一元化。
[0129] 尤其,根据本实施方式,辞典检索执行部15c在临时分类执行部15a以及商品名登记部15b计算关键字的出现率时,规定各辞典和各关键字的应用顺序、各关键字的应用顺序和关键字的组合。具体而言,例如在辞典内的关键字中包含“AAABB”和“BB”关键字的情况下,即使在登记商品名“AAABB”的情况下,且在商品名辞典中存在字符串长度长的“AAA”和字符串长度短的“BB”的情况下,辞典检索执行部能够根据字符串长度首先从字符串长度长的“AAA”开始进行检索,因此能够防止将商品名“AAABB”登记在“BB”的分类下。此外,例如可以在每个商品列对关键字设定优先级,设定为从优先级高的关键字开始进行检索。
[0130] 此外,在本实施方式中,辞典检索执行部15c使用商品名和该商品的形态等为确定商品名所需要的2个以上的关键字的组合来进行判定。具体而言,例如将AA1、AA2、AA3等有关联的关键字按照AA1×AA2、AA1×AA3、AA2×AA1、AA2×AA3、AA3×AA1、AA3×AA2方式循环相互组合,能够进行与检索或者或检索等。此时,根据关键字的合计字符串长度的从长到短的顺序进行检索,由此能够进行更恰当的分类。并且,辞典检索执行部15c能够设置例如像AA1AA2、AA1AA3那样适当连接有关联的关键字来新生成检索用关键字的功能。组合该检索用关键字和本来的关键字来任意调整字符串长度,进行与检索、或检索等,由此能够调节分解而得的被限定的关键字的应用顺序,能够提高分析精度。
[0131] 此外,根据本实施方式,针对商品名以外的信息,也参照注释辞典登记到该商品所属的单位列中,因此对于商品的分类或商品名以外的附加信息也能够相关联地进行登记。
[0132] 并且,根据本实施方式,具有进行临时分类模式和核对模式,在两模式的结果不同时,通知该结果的核对功能,因此例如有在不同的分类相互利用的商品名的情况下,通知该结果,因此能够确切地判断该商品名是属于哪个分类的商品。并且,具备向各辞典反映针对该结果通知的处理的学习功能,因此在进行下次的登记时,能够自动地对该商品进行分配。
[0133] 在本实施方式中,辞典检索执行部15c以单词单位对各记录内的商品名以及相关联的信息字符串进行分解,以被分解的单词单位执行各辞典的应用,因此例如即使在店铺输入的记录中混合输入了商品名和商品相关联的信息的情况下,以最小单位的单词进行临时分类登记以及商品名登记的处理,因此能够将记录登记到恰当的单位列中。
[0134] [变更例]
[0135] 另外,上述的各实施方式的说明是本发明的一例。因此,本发明不限于上述的实施方式,在不脱离本发明的技术思想的范围内能够根据设计等进行各种变更。
[0136] 例如,在上述的实施方式中,参照分类辞典数据库22对所输入的商品信息进行临时分类登记后,根据商品名辞典数据库23登记到单位列中,但例如可以不进行临时分类登记的处理,而是参照商品名辞典数据库23将所输入的商品名直接登记到单位列中。
[0137] 在该情况下,进行与对上述的全部分类进行辞典检索的核对模式相同的处理,比较所输入的商品名和全部分类的关键字。另外,在该情况下,关键字的应用顺序等也能够任意地选择优先级、字符串长度以及关键字的组合等。
[0138] 在这样的变形例中,也能预先将商品名与分类1~4关联起来,因此可以向总计的商品主信息自动地分配分类1~4。并且,在该情况下,省略了临时登记处理,因此能够提高总计处理速度。
[0139] 符号说明
[0140] 1  管理服务器
[0141] 2  数据库组
[0142] 3  信息处理终端
[0143] 11  通信接口
[0144] 12  输入接口
[0145] 13  输出接口
[0146] 13a  显示部
[0147] 14  控制部
[0148] 15  商品信息登记部
[0149] 15a  临时分类执行部
[0150] 15b  商品名登记部
[0151] 15c  辞典检索执行部
[0152] 15d  核对功能部
[0153] 15e  学习功能部
[0154] 15f  注释登记部
[0155] 15g  关键字控制部
[0156] 16  商品信息检索部
[0157] 17  辞典数据生成部
[0158] 18  存储器
[0159] 21  商品主信息数据库
[0160] 22  分类辞典数据库
[0161] 23  商品名辞典数据库
[0162] 24  注释辞典数据库
[0163] 25JAN 代码数据库
[0164] 26  分析对象数据库