一种原料药的智能管理方法和系统转让专利

申请号 : CN202211186216.2

文献号 : CN115276665B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 金海峰

申请人 : 江苏森信达生物科技有限公司

摘要 :

本发明涉及数字数据处理技术领域,具体涉及一种原料药的智能管理方法和系统,该方法获取原料药包上的标签,得到标签数据;构建动态字典,动态字典的横坐标表示数据类型,纵坐标表示同类型数据;根据历史数据的数据类型获取截取数据长度,对截取数据长度进行直方图构建,根据直方图中的数据类型数、每个类型下数据的出现次数得到筛选阈值;根据筛选阈值得到目标数据类型,根据目标数据类型下截取数据的多种排列方式计算相似性,基于相似性得到基础字典,根据基础字典建立字典表;根据字典表对标签数据进行压缩存储。本方案通过改进的传统LZW算法对原料药包的数据进行压缩存储,以便于更好的进行原料药的智能管理。

权利要求 :

1.一种原料药的智能管理方法,其特征在于,该方法包括以下步骤:获取原料药包上的标签,得到标签数据;

构建动态字典,所述动态字典的横坐标表示数据类型,纵坐标表示同类型数据,动态字典进行更新时,横坐标轴与纵坐标轴同时更新,当更新后的动态字典中不包含更新后的组合数据时,录入纵坐标轴信息对组合数据进行更新;根据历史数据的数据类型获取截取数据长度,对截取数据长度进行直方图构建,根据直方图中的数据类型数、每个类型下数据的出现次数得到筛选阈值;根据筛选阈值得到目标数据类型,根据目标数据类型下截取数据的多种排列方式计算相似性,基于相似性得到基础字典,根据基础字典建立字典表;

根据所述字典表对标签数据进行压缩存储;

所述筛选阈值的计算公式为:

其中,表示筛选阈值,S表示截取的数据段中数据类型数, 表示第i个类型的数据出现次数, 表示出现次数最多的类型的出现次数;

所述截取数据长度的获取方法为:

获取当前历史数据段中的数据类型和数据总类型之间的比值,当所述比值大于经验值时,将所述当前历史数据段作为截取数据长度。

2.如权利要求1所述的一种原料药的智能管理方法,其特征在于,所述相似性的计算公式:其中,表示相似性,m表示大于筛选阈值的数据类型数量, 表示数据类型j对应位置的相同概率。

3.如权利要求1所述的一种原料药的智能管理方法,其特征在于,所述根据筛选阈值得到目标数据类型的方法,包括:每个类型下数据的出现次数大于筛选阈值时,对应类型为目标数据类型。

4.如权利要求1所述的一种原料药的智能管理方法,其特征在于,所述基于相似性得到基础字典的方法,包括:当相似性小于相似性阈值时,将截取数据对应的排列方式作为基础字典。

5.一种原料药的智能管理系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1‑4任意一项所述一种原料药的智能管理方法的步骤。

说明书 :

一种原料药的智能管理方法和系统

技术领域

[0001] 本发明涉及数字数据处理技术领域,具体涉及一种原料药的智能管理方法和系统。

背景技术

[0002] 原料药是药品的原材料,通过对原料药进行加工合成后成为可供临床应用的医药。原料药的仓储管理通常包括原料药的入库验收、出库拣货、在库存储、分单打印等等一系列的操作,在此过程中采用信息化的系统进行存储会存在大量的数据,导致对原料药的仓储情况管理较为困难。
[0003] 传统对大量数据进行存储时通常需要对数据进行压缩处理,而原料药的仓储管理往往是对原料药的编码与时间戳进行记录,对应的数据流中存在大量的连续重复的字节和字串,对数据流中存在大量的连续重复的字节和字串进行压缩时通常采用LZW压缩算法的压缩效果较好。传统LZW压缩算法是构建字典,在字典中能找到当前字符串 时,编码器就一直输入字符,将输入的字符接在 后面,直至输入某个字符 在字典中搜索失败,此时停止,通过字典索引替换原始数据中的相应字符或字符串,然后把 存入字典。传统LZW压缩算法中虽然只加入了一个有效的字符 ,但存入了过多的字符,这样即浪费了内存空间又增加了处理时间。

发明内容

[0004] 为了解决上述技术问题,本发明的目的在于提供一种原料药的智能管理方法和系统,所采用的技术方案具体如下:
[0005] 第一方面,本发明实施例中提供了一种原料药的智能管理方法,该方法包括以下步骤:
[0006] 获取原料药包上的标签,得到标签数据;
[0007] 构建动态字典,所述动态字典的横坐标表示数据类型,纵坐标表示同类型数据;根据历史数据的数据类型获取截取数据长度,对截取数据长度进行直方图构建,根据直方图中的数据类型数、每个类型下数据的出现次数得到筛选阈值;根据筛选阈值得到目标数据类型,根据目标数据类型下截取数据的多种排列方式计算相似性,基于相似性得到基础字典,根据基础字典建立字典表;
[0008] 根据所述字典表对标签数据进行压缩存储。
[0009] 进一步的,所述筛选阈值的计算公式为:
[0010]
[0011] 其中,表示筛选阈值,S表示截取的数据段中数据类型数, 表示第i个类型的数据出现次数, 表示出现次数最多的类型的出现次数。
[0012] 进一步的,所述相似性的计算公式:
[0013]
[0014] 其中,表示相似性,m表示大于筛选阈值的数据类型数量, 表示数据类型j对应位置的相同概率。
[0015] 进一步的,所述截取数据长度的获取方法为:
[0016] 将当前历史数据段中的数据类型和数据总类型之间的比值作为截取数据长度。
[0017] 进一步的,所述根据筛选阈值得到目标数据类型的方法,包括:
[0018] 每个类型下数据的出现次数大于筛选阈值时,对应类型为目标数据类型。
[0019] 进一步的,所述基于相似性得到基础字典的方法,包括:
[0020] 当相似性小于相似性阈值时,将截取数据对应的排列方式作为基础字典。
[0021] 第二方面,本发明实施例还提供了一种原料药的智能管理系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一项所述方法的步骤。
[0022] 本发明实施例至少具有如下有益效果:构建定位字典,根据历史数据的分布类型自适应初始字典,并根据统计特征自适应获取最优字典长度,以得到字典表,利用字典表对原料药包的数据进行压缩存储,以便于更好的进行原料药的智能管理。

附图说明

[0023] 为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0024] 图1为本发明一个实施例提供的一种原料药的智能管理方法的步骤流程图;
[0025] 图2为本发明提供的动态字典的示意图
[0026] 图3为本发明提供的字典更新的示意图;
[0027] 图4为本发明提供的统计直方图的示意图;
[0028] 图5为本发明提供的一种基础字典的示意图。

具体实施方式

[0029] 为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种原料药的智能管理方法和系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
[0030] 除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
[0031] 下面结合附图具体的说明本发明所提供的一种原料药的智能管理方法和系统的具体方案。
[0032] 请参阅图1,其示出了本发明一个实施例提供的一种原料药的智能管理方法的步骤流程图,该方法包括以下步骤:
[0033] 步骤S001,获取原料药包上的标签,得到标签数据。
[0034] 当原料药进行入库、出库时,通过扫描仪器扫描原料药包装上的标签,获取对应的标签数据,标签数据主要包含药品批号与相应的日期消息,同时包含所采集的原料药的种类、入出库时间以及数量等信息。将采集到的数据传输到数据处理系统,数据处理系统对获取到的数据进行压缩处理,将处理后的数据传输到存储系统进行数据存储,便于数据的管理。
[0035] 步骤S002,构建动态字典,所述动态字典的横坐标表示数据类型,纵坐标表示同类型数据;根据历史数据的数据类型获取截取数据长度,对截取数据长度进行直方图构建,根据直方图中的数据类型数、每个类型下数据的出现次数得到筛选阈值;根据筛选阈值得到目标数据类型,对目标数据类型下截取数据之间的相似性,基于相似性得到基础字典,根据基础字典建立字典表。
[0036] 具体的,传统LZW算法通过构建字典以达到对数据进行压缩的目的,在字典中能找到当前字符串 时,编码器就一直输入字符,将输入的字符接在 后面,直至输入某个字符在字典中搜索失败,此时停止,通过字典索引替换原始数据中的相应字符或字符串,然后把存入字典,传统LZW压缩算法中虽然只加入了一个有效的字符 ,但存入了过多的字符,这样即浪费了内存空间又增加了处理时间。因此,期望在构建字典时可以动态更新字典,以达到字典的复用,减小字典的存储空间的同时减少数据处理时间。
[0037] 传统LZW算法所构建的字典中存在大量冗余信息,在对字典保存时会造成占用空间大,故针对这种情况,对传统LZW算法进行改进,其改进方法如下:
[0038] 本发明提出了一种新的动态字典:以左上角为原点构建坐标系,x轴表示字典中的数据类型,y轴表示同类型数据。如图2所示:x轴代表数据出现的先后顺序,如x=1为文本信息如:“TO BE OR NOT TO BE OR TO BE OR NOT”中的第一个数据,y轴表示同类型数据的定位数据。初始时刻字典为0,开始进行存储数据时,字典读入文本信息的第一个数据,如图2中的 ,此时T的存储信息为(1,1),继续读入文本信息中的第二个数据,如示例中的 ,此时字典进行更新,x轴y轴同时更新,x轴录入第二个数据,如图2中的 ,此时 的存储信息为(2,1),由于字典中不包含更新后的组合数据,故对组合数据进行更新,即录入y轴信息,即组合数据 的存储信息为(1,2),当之后再次出现组合数据 时,直接记录组合数据的存储信息为(1,2)即可;同理继续录入并更新字典,则字典更新的示意图如图3所示。
[0039] 根据动态字典,我们每次记录的为数据的坐标信息,如图2,当出现组合数据时,我们存储的信息为(1,4)。
[0040] 通过该方法进行数据压缩时需要从0开始构建字典,但在构建字典时会发现从0开始构建字典会导致数据压缩率较小,且字典更新较为繁琐,故根据数据类型进行初始字典生成。截取数据,对于原料药的时序信息而言,不同时间段的高频率信息会存在不同,故根据数据类型截取多段数据,根据多段数据中高频率信息的分布情况自适应生成初始字典。根据历史数据可知数据类型,例如历史数据中数据类型通常为数字和英文字母,则数据类型为数字的类型数加字母类型数,故截取数据长度为:
[0041]
[0042] 式中,A表示数据类型比例,当A的值大于等于经验值时,经验值取A=0.7,截取对应长度的数据段,S表示当前数据段中数据类型,N表示数据总类型。从第一数据开始,当出现不同类型的数据时S值加1,S初始值为0,随着数据的读取,数据段中的数据类型不断增加,当S的值增加到某一时刻时,A的值等于0.7,此时停止录入数据,截取当前数据长度作为参考数据。建立统计直方图对截取数据段中的数据进行统计,统计直方图如图4所示,该统计直方图中S表示数据类型数,M表示每种类型数据出现的次数。
[0043] 对于不同类型的数据而言,数据越多越有可能为连续的字符串,故根据直方图的统计情况获取初始字典长度,即:
[0044]
[0045] 式中 表示筛选阈值,S表示截取的数据段中数据类型数, 表示第i个类型的数据出现次数, 表示出现次数最多的类型的出现次数。根据筛选阈值 对S种类型的数据进行筛选,当 的值大于等于 时,对该类型的数据进行标记,大于阈值的数据类型记为。
[0046] 例如数据类型S为 共26种,其中 满足筛选阈值要求,即对于该段截取数据中 的出现频率高,即这三个数据很有可能为关联出现的,故对于该段截取数据而言,初始字典中最好可以包含3位,但统计特征只能够获取数据的统计特征,不知道数据的分布情况,即 的排列方式不确定,故获取长度为 的滑窗,在截取的数据中进行滑动,获取 的排列方式,若 的排列方式是按照某一种排列方式如 的方式进行排列,则将 作为初始字典;若 的排列方式是按照多种排列方式进行排列,则统计每种排列出现的次数,若大于等于二,则计算其与其他排列方式的相似性,若不相似,则将对应的排列方式作为基础字典,否则舍弃,所述相似性为:对应位置相同的记为1,否则为0,例如: 与 的相似性序列为111100,则:
[0047]
[0048] 式中 表示相似性,m表示大于阈值的数据类型数量, 表示数据类型j对应位置的相同概率,若相同则为1,否则为0.当 时,说明序列中大部分是相同的,故此序列作为基础字典是没有必要的。
[0049] 通过将数据分成多端,重复上述操作,得到多个基础字典,如图5所示,根据基础字典建立对应的字典表,以得到改进的传统LZW算法。
[0050] 步骤S003,利用改进的传统LZW算法对标签数据进行压缩存储。
[0051] 具体的,利用基础字典建立对应的字典表对标签数据进行压缩存储,通过分析存储数据进行原料药管理,通过存储时间、出入库数量与出入口频率进行原料药的管理,防止原料药因存储不当导致风化、受潮等异常,同时更好的追踪原料药的使用情况,便于更好的进行原料药的采购。
[0052] 综上所述,本发明提供了一种原料药的智能管理方法,该方法获取原料药包上的标签,得到标签数据;构建动态字典,动态字典的横坐标表示数据类型,纵坐标表示同类型数据;根据历史数据的数据类型获取截取数据长度,对截取数据长度进行直方图构建,根据直方图中的数据类型数、每个类型下数据的出现次数得到筛选阈值;根据筛选阈值得到目标数据类型,根据目标数据类型下截取数据的多种排列方式计算相似性,基于相似性得到基础字典,根据基础字典建立字典表;根据字典表对标签数据进行压缩存储。本方案通过改进的传统LZW算法对原料药包的数据进行压缩存储,以便于更好的进行原料药的智能管理。
[0053] 基于与上述方法相同的发明构思,本发明实施例还提供了一种原料药的智能管理系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述一种原料药的智能管理方法中任意一项所述方法的步骤。
[0054] 需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0055] 本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
[0056] 以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。