会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利分类库 / 将固体从固体中分离;分选 / 一种高坪效的农产品分拣系统及方法

一种高坪效的农产品分拣系统及方法

申请号 CN202410109492.1 申请日 2024-01-25 公开(公告)号 CN117900137A 公开(公告)日 2024-04-19
申请人 成都九洲电子信息系统股份有限公司; 发明人 李松柏; 陈俊; 罗成思; 李鑫; 李学荣; 邓文熙; 兰松涛; 杨宇浩; 杨波;
摘要 本 发明 公开了一种高坪效的农产品分拣系统及方法,系统包括分拣控 制模 块 、信息推送模块显示终端以及分拣模块;分拣 控制模块 用于确定农产品分拣信息,并发送给信息推送模块;其中,农产品分拣信息包括分拣波次、单次最大分拣量、储位信息及分拣路径;显示终端用于显示信息推送模块接收的农产品分拣信息;分拣模块用于根据农产品分拣信息进行农产品分拣,逐波次分拣农产品。本发明提供的高坪效的农产品分拣系统及方法,通过 软件 系统和 硬件 设备协同作业,提升分拣场地坪效,提高作业效率,减少误差。
权利要求

1.一种高坪效的农产品分拣系统,其特征在于,包括分拣控制模、信息推送模块显示终端以及分拣模块;
所述分拣控制模块用于确定农产品分拣信息,并发送给信息推送模块;其中,所述农产品分拣信息包括分拣波次、单次最大分拣量、储位信息及分拣路径;
所述显示终端用于显示信息推送模块接收的农产品分拣信息;
所述分拣模块用于根据农产品分拣信息进行农产品分拣,逐波次分拣农产品。
2.根据权利要求1所述的高坪效的农产品分拣系统,其特征在于,所述分拣控制模块包括波次确定单元和分拣确定单元;
所述波次确定单元用于根据待分拣农产品订单及场地大小,确定单次最大分拣量,并根据分拣时间及总分拣量与场地最大容量的关系,确定农产品的分拣波次;
所述分拣确定单元用于根据储物动态分配算法,确定各分拣波次下各农产品的储物信息及分拣路径。
3.根据权利要求1所述的高坪效的农产品分拣系统,其特征在于,所述分拣模块包括智能分拣称、分拣运输车以及分拣检验模块;
所述智能分拣称用于农产品分拣信息,分拣对应的农产品;
所述分拣运输车用于将分拣的农产品按照确定的分拣路径投放至对应订单托盘处;其中,每个订单托盘与储位信息对应;
所述分拣检验模块用于确认当前波次的农产品是否完成分拣,并在显示终端上,使下一分拣波次的农产品信息覆盖当前完成分拣的农产品信息。
4.根据权利要求3所述的高坪效的农产品分拣系统,其特征在于,当当前分拣波次下存在未完成分拣的农产品订单时,在显示终端以对应标识符标记且不被新的农产品信息覆盖,直到该农产品信息完成分拣。
5.根据权利要求1~4任一项权利要求所述的高坪效的农产品分拣系统的农产品分拣方法,其特征在于,包括以下步骤:
S1、确定农产品分拣信息,包括分拣波次、单次最大分拣量、储位信息及分拣路径;
S2、按照农产品分拣信息分拣当前波次的农产品;
S3、检验农产品订单是否完成分拣;
若是,则进入步骤S5;
若否,则进入步骤S4;
S4、更新下一波次的农产品分拣信息,并返回步骤S2;
S5、将分拣的农产品装车并按照配送路线配送。
6.根据权利要求5所述的农产品分拣方法,其特征在于,所述步骤S1中,根据所有待分拣农产品订单及场地大小,确定单次最大分拣量;
在所有待分拣农产品订单中,将时间相近的总分拣量不超过场地最大容量的农产品订单划分为一个分拣波次。
7.根据权利要求5所述的农产品分拣方法,其特征在于,所述步骤S1中,确定储位信息及分拣路径的方法具体为:
在各分拣波次下,构建以分拣农产品和储位对应关系为分配策略,以分拣路径最短为优化目标的农产品分拣模型,并对其求解,获得农产品的储位信息及分拣路径;
所述农产品分拣模型为:
式中,dij表示储位i和j之间的距离,oim表示订单托盘m是否放在储位i,pjg表示农产品g是否放置在储位i,ymg表示农产品g是否属于订单托盘,N为储位的总数,M为订单托盘的总数,G为货物的总数,i为储位的索引,m为订单托盘的索引,g为货物的索引;其中,oim∈{0,
1},pjg∈{0,1},ymg∈{0,1},i∈{0,1,…,N},m∈{0,1,…,M},g∈{0,1,…,G}。
8.根据权利要求7所述的农产品分拣方法,其特征在于,求解所述农产品分拣模型,获得农产品的储位信息及分拣路径的方法具体为:
A1、基于构建的农产品分拣模型进行深度强化学习模型的环境建模,并采用深度神经网络CNN来拟合深度强化学习模型的Q值函数;
A2、收集历史农产品分拣信息数据来训练深度强化学习模型;
A3、利用训练好的深度强化学习模型根据当前分拣波次的农产品订单为其分配分拣路径及储位信息。
9.根据权利要求8所述的农产品分拣方法,其特征在于,所述步骤A1中,所述深度强化学习模型的环境建模包括状态s、动作a、奖励Reward以及策略Policy;
其中,状态s表示为分拣中心的整体状态,包括储位的状态、订单托盘的位置、货物托盘的位置;动作a表示分拣人员的决策,即选择分拣的储位;奖励Reward以分拣路径长度的负数作为奖励函数;策略Policy为通过深度神经网络表示的Q值函数,Q值函数在状态s下采取动作a的预期累积奖励;
所述步骤A2中,在训练所述深度强化学习模型时,输入数据为当前状态st,采取的动作at,奖励rt,下一个状态st+1;输出数据为Q值函数使Q值逼近目标Q值的更新参数,并基于此获得对应的状态及动作作为所需储位信息及分拣路径;
其中,Q值函数的更新参数表达式为:
式中,α为学习率,γ是折扣因子,θ为网络参数。
10.根据权利要求5所述的农产品分拣方法,其特征在于,所述步骤S4中,在更新下一波次的农产品分拣信息时,当当前分拣波次下存在未完成分拣的农产品订单时,将其分拣信息保留并进行标识且一并更新至下一波次的农产品分拣信息中,直到该农产品信息完成分拣。

说明书全文

一种高坪效的农产品分拣系统及方法

技术领域

[0001] 本发明属于农产品分拣配送中心信息技术领域,具体涉及一种高坪效的农产品分拣系统及方法。

背景技术

[0002] 对于农产品分拣配送企业,仓储的租金是主要成本,同样的面积能够完成多少订单就是分拣中心的坪效,该指标是评价一个仓库单位面积处理订单的能指标。尤其是针对农产品这种非标品,因非标准化、时效性高、堆叠存放难等问题,现代物流的一些先进手段比如立体库、输送带等并不适合农产品分拣中心。因此还是需要通过场地的重复利用,实现效率和成本的统一和平衡。分拣作为连接订单、采购和配送中的重要一环,分拣中心的运转效率直接影响到后面配送环节的时效。
[0003] 订单陡增的情况,必须要通过场地的重复利用、信息化系统的指引来完成分拣过程。要实现场地的重复利用,首先要结合客户预期的到货时间、场地最大容量等条件来安排确定分拣波次;其次,在农产品分拣过程中,每个客户的货物需要1到多个托盘进行存放,传统做法是在货位上固定挂一个纸质吊牌显示客户编号和名称以方便分拣人员投放货物,无法实现场地重复利用。要实现分波次分拣,吊牌必须要支持内容可动态调整。为进一步提升效率,还需要能够动态分配待分拣货物的暂存区和客户托盘的位置,以分拣人员总分拣路径最短为目标,实现分拣效率提升。

发明内容

[0004] 针对现有技术中的上述不足,本发明提供的高坪效的农产品分拣系统及方法解决了现有的分拣系统,场地难以实现重复利用,坪效低的问题。
[0005] 为了达到上述发明目的,本发明采用的技术方案为:一种高坪效的农产品分拣系统,包括分拣控制模、信息推送模块显示终端以及分拣模块;
[0006] 所述分拣控制模块用于确定农产品分拣信息,并发送给信息推送模块;其中,所述农产品分拣信息包括分拣波次、单次最大分拣量、储位信息及分拣路径;
[0007] 所述显示终端用于显示信息推送模块接收的农产品分拣信息;
[0008] 所述分拣模块用于根据农产品分拣信息进行农产品分拣,逐波次分拣农产品。
[0009] 进一步地,所述分拣控制模块包括波次确定单元和分拣确定单元;
[0010] 所述波次确定单元用于根据待分拣农产品订单及场地大小,确定单次最大分拣量,并根据分拣时间及总分拣量与场地最大容量的关系,确定农产品的分拣波次;
[0011] 所述分拣确定单元用于根据储物动态分配算法,确定各分拣波次下各农产品的储物信息及分拣路径。
[0012] 进一步地,所述分拣模块包括智能分拣称、分拣运输车以及分拣检验模块;
[0013] 所述智能分拣称用于农产品分拣信息,分拣对应的农产品;
[0014] 所述分拣运输车用于将分拣的农产品按照确定的分拣路径投放至对应订单托盘处;其中,每个订单托盘与储位信息对应;
[0015] 所述分拣检验模块用于确认当前波次的农产品是否完成分拣,并在显示终端上,使下一分拣波次的农产品信息覆盖当前完成分拣的农产品信息。
[0016] 进一步地,当当前分拣波次下存在未完成分拣的农产品订单时,在显示终端以对应标识符标记且不被新的农产品信息覆盖,直到该农产品信息完成分拣。
[0017] 一种农产品分拣方法,包括以下步骤:
[0018] S1、确定农产品分拣信息,包括分拣波次、单次最大分拣量、储位信息及分拣路径;
[0019] S2、按照农产品分拣信息分拣当前波次的农产品;
[0020] S3、检验农产品订单是否完成分拣;
[0021] 若是,则进入步骤S5;
[0022] 若否,则进入步骤S4;
[0023] S4、更新下一波次的农产品分拣信息,并返回步骤S2;
[0024] S5、将分拣的农产品装车并按照配送路线配送。
[0025] 进一步地,所述步骤S1中,根据所有待分拣农产品订单及场地大小,确定单次最大分拣量;
[0026] 在所有待分拣农产品订单中,将时间相近的总分拣量不超过场地最大容量的农产品订单划分为一个分拣波次。
[0027] 进一步地,所述步骤S1中,确定储位信息及分拣路径的方法具体为:
[0028] 在各分拣波次下,构建以分拣农产品和储位对应关系为分配策略,以分拣路径最短为优化目标的农产品分拣模型,并对其求解,获得农产品的储位信息及分拣路径;
[0029] 所述农产品分拣模型为:
[0030]
[0031]
[0032]
[0033]
[0034]
[0035]
[0036] 式中,dij表示储位i和j之间的距离,oim表示订单托盘m是否放在储位i,pjg表示农产品g是否放置在储位i,ymg表示农产品g是否属于订单托盘,N为储位的总数,M为订单托盘的总数,G为货物的总数,i为储位的索引,m为订单托盘的索引,g为货物的索引;其中,oim∈{0,1},pjg∈{0,1},ymg∈{0,1},i∈{0,1,…,N},m∈{0,1,…,M},g∈{0,1,…,G}。
[0037] 进一步地,求解所述农产品分拣模型,获得农产品的储位信息及分拣路径的方法具体为:
[0038] A1、基于构建的农产品分拣模型进行深度强化学习模型的环境建模,并采用深度神经网络CNN来拟合深度强化学习模型的Q值函数;
[0039] A2、收集历史农产品分拣信息数据来训练深度强化学习模型;
[0040] A3、利用训练好的深度强化学习模型根据当前分拣波次的农产品订单为其分配分拣路径及储位信息。
[0041] 进一步地,所述步骤A1中,所述深度强化学习模型的环境建模包括状态s、动作a、奖励Reward以及策略Policy;
[0042] 其中,状态s表示为分拣中心的整体状态,包括储位的状态、订单托盘的位置、货物托盘的位置;动作a表示分拣人员的决策,即选择分拣的储位;奖励Reward以分拣路径长度的负数作为奖励函数;策略Policy为通过深度神经网络表示的Q值函数,Q值函数在状态s下采取动作a的预期累积奖励;
[0043] 所述步骤A2中,在训练所述深度强化学习模型时,输入数据为当前状态st,采取的动作at,奖励rt,下一个状态st+1;输出数据为Q值函数使Q值逼近目标Q值的更新参数,并基于此获得对应的状态及动作作为所需储位信息及分拣路径;
[0044] 其中,Q值函数的更新参数表达式为:
[0045]
[0046] 式中,α为学习率,γ是折扣因子,θ为网络参数。
[0047] 进一步地,所述步骤S4中,在更新下一波次的农产品分拣信息时,当当前分拣波次下存在未完成分拣的农产品订单时,将其分拣信息保留并进行标识且一并更新至下一波次的农产品分拣信息中,直到该农产品信息完成分拣。
[0048] 本发明的有益效果为:
[0049] (1)本发明方法通过订单分波次分拣,实现了场地的重复利用,提升分拣中心的效益。
[0050] (2)本发明方法中,通过储位优化,实现分拣路径最短,降低分拣人员数量,使得成本更低。
[0051] (3)本发明方法通过软硬件协同作业,减少失误,降低客诉,提高了用户满意度。附图说明
[0052] 图1为本发明实施例提供的高坪效的农产品分拣方法流程图

具体实施方式

[0053] 下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
[0054] 实施例1:
[0055] 本发明实施例提供了一种高坪效的农产品分拣系统,包括分拣控制模块、信息推送模块显示终端以及分拣模块;
[0056] 所述分拣控制模块用于确定农产品分拣信息,并发送给信息推送模块;其中,所述农产品分拣信息包括分拣波次、单次最大分拣量、储位信息及分拣路径;
[0057] 所述显示终端用于显示信息推送模块接收的农产品分拣信息;
[0058] 所述分拣模块用于根据农产品分拣信息进行农产品分拣,逐波次分拣农产品。
[0059] 在本发明实施例中,分拣控制模块包括波次确定单元和分拣确定单元;
[0060] 所述波次确定单元用于根据待分拣农产品订单及场地大小,确定单次最大分拣量,并根据分拣时间及总分拣量与场地最大容量的关系,确定农产品的分拣波次;其中,客户下发订单时会指定期望送达时间,本实施例中的分拣时间是指从接单到配送出发的时间窗口;总分拣量是指一个波次的分拣总量。
[0061] 所述分拣确定单元用于根据储物动态分配算法,确定各分拣波次下各农产品的储物信息及分拣路径。其中,通过构建一个储位(含货物储位和客户托盘储位)的动态分配算法,以分拣人员总分拣路径最短为优化目标,设计分拣货物和客户托盘储位分配策略,实现分拣环节的效率提升。
[0062] 在本发明实施例中,分拣模块包括智能分拣称、分拣运输车以及分拣检验模块;
[0063] 所述智能分拣称用于农产品分拣信息,分拣对应的农产品;
[0064] 所述分拣运输车用于将分拣的农产品按照确定的分拣路径投放至对应订单托盘处;其中,每个订单托盘与储位信息对应;
[0065] 所述分拣检验模块用于确认当前波次的农产品是否完成分拣,并在显示终端上,使下一分拣波次的农产品信息覆盖当前完成分拣的农产品信息。
[0066] 在本实施例中,当当前分拣波次下存在未完成分拣的农产品订单时,在显示终端以对应标识符标记且不被新的农产品信息覆盖,直到该农产品信息完成分拣。
[0067] 在本发明实施例中,显示终端包括控制单元、显示单元、通信单元、供电单元,显示终端的控制单元、显示单元、通信单元与信息推送模块呈星形状直接相连,分拣模块与信息推送模块直接相连。
[0068] 实施例2:
[0069] 本发明实施例提供了实施例1中农产品分拣系统的农产品分拣方法,如图1所示,包括以下步骤:
[0070] S1、确定农产品分拣信息,包括分拣波次、单次最大分拣量、储位信息及分拣路径;
[0071] S2、按照农产品分拣信息分拣当前波次的农产品;
[0072] S3、检验农产品订单是否完成分拣;
[0073] 若是,则进入步骤S5;
[0074] 若否,则进入步骤S4;
[0075] S4、更新下一波次的农产品分拣信息,并返回步骤S2;
[0076] S5、将分拣的农产品装车并按照配送路线配送。
[0077] 在本发明实施例的步骤S1中,根据所有待分拣农产品订单及场地大小,确定单次最大分拣量;
[0078] 在所有待分拣农产品订单中,将时间相近的总分拣量不超过场地最大容量的农产品订单划分为一个分拣波次。
[0079] 在本发明实施例的步骤S1中,确定储位信息及分拣路径的方法具体为:
[0080] 在各分拣波次下,构建以分拣农产品和储位对应关系为分配策略,以分拣路径最短为优化目标的农产品分拣模型,并对其求解,获得农产品的储位信息及分拣路径;
[0081] 所述农产品分拣模型为:
[0082]
[0083]
[0084]
[0085]
[0086]
[0087]
[0088] 式中,dij表示储位i和j之间的距离,oim表示订单托盘m是否放在储位i,pjg表示农产品g是否放置在储位i,ymg表示农产品g是否属于订单托盘,N为储位的总数,M为订单托盘的总数,G为货物的总数,i为储位的索引,m为订单托盘的索引,g为货物的索引;其中,oim∈{0,1},pjg∈{0,1},ymg∈{0,1},i∈{0,1,…,N},m∈{0,1,…,M},g∈{0,1,…,G}。
[0089] 在本实施例中,求解所述农产品分拣模型,获得农产品的储位信息及分拣路径的方法具体为:
[0090] A1、基于构建的农产品分拣模型进行深度强化学习模型的环境建模,并采用深度神经网络CNN来拟合深度强化学习模型的Q值函数;
[0091] A2、收集历史农产品分拣信息数据来训练深度强化学习模型;
[0092] A3、利用训练好的深度强化学习模型根据当前分拣波次的农产品订单为其分配分拣路径及储位信息。
[0093] 本实施例的步骤A1中,所述深度强化学习模型的环境建模包括状态s、动作a、奖励Reward以及策略Policy;
[0094] 其中,状态s表示为分拣中心的整体状态,包括储位的状态、订单托盘的位置、货物托盘的位置;动作a表示分拣人员的决策,即选择分拣的储位;奖励Reward以分拣路径长度的负数作为奖励函数;策略Policy为通过深度神经网络表示的Q值函数,Q值函数在状态s下采取动作a的预期累积奖励。
[0095] 在本实施例步骤A2中,使用贪心策略或epsilon‑greedy策略,通过与环境交互来收集训练数据;每一步的经验包括当前状态、采取的动作、奖励、下一个状态以及是否终止等信息。
[0096] 在本实施例步骤A2中,在训练所述深度强化学习模型时,输入数据为当前状态st,采取的动作at,奖励rt,下一个状态st+1;输出数据为Q值函数使Q值逼近目标Q值的更新参数,并基于此获得对应的状态及动作作为所需储位信息及分拣路径;
[0097] 其中,Q值函数的更新参数表达式为:
[0098]
[0099] 式中,α为学习率,γ是折扣因子,θ为网络参数。
[0100] 在本发明实施例中步骤S4中,在更新下一波次的农产品分拣信息时,当当前分拣波次下存在未完成分拣的农产品订单时,将其分拣信息保留并进行标识且一并更新至下一波次的农产品分拣信息中,直到该农产品信息完成分拣。
[0101] 在本实施例中,在农产品分拣过程中,分拣作业人员使用智能分拣称进行分拣,根据分拣称的显示,选择农产品,放置重量台,系统自动抓取农产品重量,并将重量回传至系统,以更新农产品订单价格;同时分拣秤打印出分拣小票,根据确定分拣路径,小票会显示投递的先后顺序以指导运输人员作业;运输人员负责运输分拣好的商品,按照分拣小票的指引,将商品投放到对应的客户托盘;配送司机负责装车前的查验,当显示终端显示为“所有商品已分拣时”进行货物比对,确认无误后可开始装车,装车完成后按照规划好的配送路线进行配送。
[0102] 本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
[0103] 本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。