聚类筛选自适应机器学习辅助设计高可靠性无铅锡基焊料合金的方法转让专利

申请号 : CN202210826948.7

文献号 : CN115700574A

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 董自强元皓游康东贾延东王刚张统一彭巨擘蔡珊珊罗晓斌刘晨王加俊

申请人 : 上海大学云南锡业集团(控股)有限责任公司研发中心

摘要 :

本发明公开了一种聚类筛选后自适应机器学习辅助设计无铅锡基焊料合金的方法,先收集获取无铅锡基焊料合金的材料数据建立数据集;再使用k‑means聚类方法对力学性能聚类,剔除性能较差的簇,把样本分类;将不同类别的合金成分和其特征筛选后的原子特征作为输入,其力学性能作为输出;建立单目标机器学习模型;对于每种机器学习模型采用留一交叉验证法和皮尔逊指数R作为机器学习模型精度指标,对于每种不同的力学性能,选取皮尔逊指数R最大的机器学习模型;对于收集到的无铅锡基合金成分数据做内差和正交排列组合,作为虚拟样本;最后将虚拟样本输入到机器学习模型中,得出力学性能预测值,根据预测值优选出性能优异的合金成分,实现辅助设计合金。

权利要求 :

1.一种聚类筛选后自适应机器学习辅助设计无铅锡基焊料合金的方法,其特征在于,所述方法包括如下步骤:步骤S1:收集获取无铅锡基焊料合金的材料数据,建立基础数据集;

步骤S2:使用k‑means聚类方法对力学性能聚类,以不同力学性能数据的乘积作为综合目标性能数据,以每簇均值的综合性能参数作为评价该簇的力学性能指标,取其中综合性能优良的簇,剔除综合性能差的簇;再使用k‑means聚类方法对合金成分聚类,把样本分为至少两个类别;

步骤S3:使用合金成分构造原子特征,对原子特征进行高相关滤波和特征筛选,将不同类别样本的合金成分和筛选后的原子特征作为输入数据,其力学性能数据作为输出数据;

步骤S4:使用12种不同的算法分别建立单目标机器学习模型,对于每种机器学习模型采用留一交叉验证法和皮尔逊指数R作为机器学习模型精度指标,对于每种不同的力学性能,选取皮尔逊指数R最大的机器学习模型;

步骤S5:对于收集到的无铅锡基合金成分数据做内差和正交排列组合,作为虚拟样本,将虚拟样本输入到机器学习模型中,得出力学性能预测值,根据预测值进行合金成分筛选,从而实现合金参数的设计。

2.根据权利要求1所述的聚类筛选后自适应机器学习辅助设计无铅锡基焊料合金的方法,其特征在于,所述步骤S1具体包括:收集无铅锡基焊料的合金成分质量比;

收集无铅锡基焊料的力学性能数据,至少包括拉伸强度和断裂延伸率。

3.根据权利要求1所述的聚类筛选后自适应机器学习辅助设计无铅锡基焊料合金的方法,其特征在于,所述步骤S2具体包括:使用k‑means聚类方法对力学性能拉伸强度和断裂延伸率进行聚类,剔除力学性能相对较低的数据类,对剩余数据进行保留;

使用k‑means聚类方法对合金成分进行聚类,按照聚类分簇结果将样本分类。

4.根据权利要求3所述的聚类筛选后自适应机器学习辅助设计无铅锡基焊料合金的方法,其特征在于,在所述步骤S2中,使用k‑means聚类方法对力学性能拉伸强度和断裂延伸率进行聚类,剔除力学性能相对较低的数据类,对剩余数据进行保留;筛选后的数据集带入机器学习模型相比于不剔除数据输入到机器学习模型时的精度有很大幅度提升。

5.根据权利要求1所述的聚类筛选后自适应机器学习辅助设计无铅锡基焊料合金的方法,其特征在于,所述步骤S3具体包括:将合金成分比例转换为原子比例作为补充特征,并加入原子半径、价电子数、鲍林电负性作为补充特征,对补充的特征进行高相关滤波和shapvalue特征重要性排序筛选。

6.根据权利要求1所述的聚类筛选后自适应机器学习辅助设计无铅锡基焊料合金的方法,其特征在于,所述步骤S4具体包括:将合金成分和筛选后的原子特征作为输入,一种力学性能作为输出,建立单目标机器学习模型;

使用12种不同的算法分别建立单目标机器学习模型,12种模型包括:Linear、Ridge、LASSO、MLP、Decision Tree、Random Forest、Xgboost、Adaboost、GBDT、Bagging、SVM、KNN;

每种机器学习模型采用留一交叉验证法;

皮尔逊指数R作为机器学习模型精度指标,R的数学表达式为:

对于每种不同的力学性能,选取皮尔逊指数R最大的机器学习模型;其中,其中,n表示样本个数,Xi表示预测值,Yi表示测量值, 表示预测值的均值, 表示测量值的均值。

7.根据权利要求1所述的聚类筛选后自适应机器学习辅助设计无铅锡基焊料合金的方法,其特征在于,所述步骤S5具体包括:基于收集到的无铅锡基合金成分数据,从每个合金成分的最大值到零,设定步长做内差,并进行排列组合,作为虚拟样本;

将虚拟样本输入到机器学习模型中,得出力学性能预测值,以不同力学性能的乘积作为衡量强度和韧性的综合指标,从力学性能的帕累托边界上选取综合性能较好的样本进行实验制备,从而实现辅助合金设计过程。

8.根据权利要求1所述的聚类筛选后自适应机器学习辅助设计无铅锡基焊料合金的方法,其特征在于,适合设计的合金的成分范围为重量百分比组成:3.0‑5.5%的Ag,0.5‑

1.0%的Cu,1.0‑5.0%的Bi,0.01‑1.0%的Ti,0.01‑1.0%的Ni,余量为Sn。

说明书 :

聚类筛选自适应机器学习辅助设计高可靠性无铅锡基焊料合

金的方法

技术领域

[0001] 本发明涉及材料设计技术领域,特别涉及一种自适应机器学习辅助设计无铅锡基焊料合金的方法。

背景技术

[0002] Pb‑Sn合金由于熔点低、强度高、导电性好,而且对多数工程常用的基底材料润湿性好,广泛用于电子行业两种金属表面之间的连接。迄今为止,还没有任何焊料合金能完全取代 Pb‑Sn。但是铅污染环境,危害人体健康。随着欧盟“WEEE指令”和“RoHS指令”,以及美国、日本、中国等国家有关规定和管理办法的颁布和实施,Pb‑Sn合金已被大多数国家禁止使用。研发具有优异性能的无铅焊料也是现今电子封装和微连接领域研究的热点问题。
[0003] 基于材料基因组的材料研发理念,结合机器学习,研发新型无铅焊料,建立适用于锡基焊料开发的机器学习模型,实现对不同成分的锡基焊料性能的准确预测,开发出具有优异综合性能的无铅锡基焊料对当今电子工业的发展具有重要的意义。传统的材料研发手段通常为“试错法”,其周期长,而且成本较高。通过结合机器学习及大数据等技术,结合专家领域知识,可以加快新材料从研发、制造到应用的速度,降低研发成本。通过此种聚类筛选后自适应机器学习辅助设计无铅锡基焊料合金的方法,可以为开发性能优良的无铅锡基焊料合金及其它新材料提供一种高效的路径。

发明内容

[0004] 本发明的目的在于利用机器学习的方法加速开发设计无铅锡基焊料合金,以降低研发成本。为了实现上述目的,本发明提供了一种聚类筛选后自适应机器学习辅助设计无铅锡基焊料合金的方法,能开发性能优良的无铅锡基焊料合金。
[0005] 一种聚类筛选后自适应机器学习辅助设计无铅锡基焊料合金的方法,包括如下步骤:
[0006] 步骤S1:收集获取无铅锡基焊料合金的材料数据,建立基础数据集;
[0007] 步骤S2:使用k‑means聚类方法对力学性能聚类,以不同力学性能数据的乘积作为综合目标性能数据,以每簇均值的综合性能参数作为评价该簇的力学性能指标,取其中综合性能优良的簇,剔除综合性能差的簇;再使用k‑means聚类方法对合金成分聚类,把样本分为至少两个类别;
[0008] 步骤S3:使用合金成分构造原子特征,对原子特征进行高相关滤波和特征筛选,将不同类别样本的合金成分和筛选后的原子特征作为输入数据,其力学性能数据作为输出数据;
[0009] 步骤S4:使用12种不同的算法分别建立单目标机器学习模型,对于每种机器学习模型采用留一交叉验证法和皮尔逊指数R作为机器学习模型精度指标,对于每种不同的力学性能,选取皮尔逊指数R最大的机器学习模型;
[0010] 步骤S5:对于收集到的无铅锡基合金成分数据做内差和正交排列组合,作为虚拟样本,将虚拟样本输入到机器学习模型中,得出力学性能预测值,根据预测值进行合金成分筛选,从而实现合金参数的设计。
[0011] 优选地,一种聚类筛选后自适应机器学习辅助设计无铅锡基焊料合金的方法,包括如下步骤:
[0012] 步骤S1:收集获取无铅锡基焊料合金材料数据;
[0013] 收集无铅锡基焊料的合金成分质量比;
[0014] 收集无铅锡基焊料的力学性能,力学性能至少包括拉伸强度和断裂延伸率;
[0015] 步骤S2:使用k‑means聚类方法对力学性能聚类,以几种力学性能的乘积作为综合目标性能,以每簇均值的综合性能作为评价该簇的力学性能指标,取其中综合性能优良的簇,剔除综合性能较差的簇,再使用k‑means聚类方法对合金成分聚类,把样本分为几个类别;
[0016] 使用k‑means聚类方法对力学性能拉伸强度和断裂延伸率进行聚类,剔除拉伸强度低同时断裂延伸率也低的一簇数据,对剩余数据进行保留;
[0017] 使用k‑means聚类方法对合金成分进行聚类,按照聚类分簇结果将样本分为几个类别;
[0018] 优选地,本发明剔除拉伸强度低同时断裂延伸率也低的一簇数据后,将剩余的几个类别数据训练机器学习模型,相比于不剔除数据训练机器学习模型的模型精度有很大幅度提升;
[0019] 步骤S3:将合金成分比例转换为原子比例作为补充特征,并加入原子半径、价电子数、鲍林电负性作为补充特征。对补充的特征进行高相关滤波和shapvalue特征重要性排序筛选;
[0020] 步骤S4:将不同类别的合金成分和筛选后的原子特征作为输入,其力学性能作为输出,使用12种不同的算法分别建立单目标机器学习模型,对于每种机器学习模型采用留一交叉验证法和皮尔逊指数R作为机器学习模型精度指标,对于每种不同的力学性能,选取皮尔逊指数 R最大的机器学习模型;
[0021] 使用12种不同的算法分别建立单目标机器学习模型,12种模型包括:Linear、Ridge、 LASSO、MLP、Decision Tree、Random Forest、Xgboost、Adaboost、GBDT、Bagging、SVM、 KNN;
[0022] 每种机器学习模型采用留一交叉验证法;
[0023] 皮尔逊指数R作为机器学习模型精度指标,R的数学表达式为:
[0024]
[0025] 对于每种不同的力学性能,选取皮尔逊指数R最大的机器学习模型。其中,n表示样本个数,Xi表示预测值,Yi表示测量值, 表示预测值的均值, 表示测量值的均值。
[0026] 步骤S5:对于收集到的无铅锡基合金成分数据结合专家领域知识做内差和正交排列组合,产生虚拟样本,将虚拟样本输入到机器学习模型中,得出不同成分组合的力学性能预测值;
[0027] 基于收集到的无铅锡基合金成分数据,结合专家领域知识,从每个合金成分的最大值到零,设定步长做内差,并进行排列组合,作为虚拟样本;
[0028] 将虚拟样本输入到机器学习模型中,得出力学性能预测值,以几种力学性能的乘积作为衡量强度和韧性的综合指标,从拉伸强度和断裂延伸率的帕累托边界上选取综合性能较大的样本进行实验验证,从而实现辅助设计合金。
[0029] 优选地,本发明方法适合设计的合金的成分范围为重量百分比组成:3.0‑5.5%的Ag, 0.5‑1.0%的Cu,1.0‑5.0%的Bi,0.01‑1.0%的Ti,0.01‑1.0%的Ni,余量为Sn。本发明通过以上方法提出一种高可靠性无铅焊料合金的成分范围。
[0030] 一种辅助设计无铅锡基焊料合金的系统,包括运算分析模块、存储模块和输入输出模块,其特征在于:利用运算分析装置执行本发明所述的聚类筛选后自适应机器学习辅助设计无铅锡基焊料合金的方法的程序。
[0031] 本发明与现有技术相比较,具有如下显而易见的突出实质性特点和显著优点:
[0032] 本发明利用现有实验数据,进行机器学习预测,根据预测结果指导材料成分设计,从而缩短实验周期,降低研发成本,具有加快无铅焊料合金从研发、制造到应用的速度。

附图说明

[0033] 图1是本发明的总流程图。
[0034] 图2是本发明对力学性能拉伸强度和断裂延伸率聚类图。
[0035] 图3是本发明的高相关滤波示意图。
[0036] 图4是本发明的特征重要性排序图。
[0037] 图5是本发明的留一交叉验证法示意图。
[0038] 图6是本发明的自适应机器学习流程图。
[0039] 图7是本发明的实验验证图。

具体实施方式

[0040] 下面结合附图对本发明的技术方案做进一步的详细说明:
[0041] 一种聚类筛选后自适应机器学习辅助设计无铅锡基焊料合金的方法,包括如下步骤:
[0042] 步骤S1:收集获取无铅锡基焊料合金的材料数据,建立基础数据集;
[0043] 步骤S2:使用k‑means聚类方法对力学性能聚类,以不同力学性能数据的乘积作为综合目标性能数据,以每簇均值的综合性能参数作为评价该簇的力学性能指标,取其中综合性能优良的簇,剔除综合性能差的簇;再使用k‑means聚类方法对合金成分聚类,把样本分为至少两个类别;
[0044] 步骤S3:使用合金成分构造原子特征,对原子特征进行高相关滤波和特征筛选,将不同类别样本的合金成分和筛选后的原子特征作为输入数据,其力学性能数据作为输出数据;
[0045] 步骤S4:使用12种不同的算法分别建立单目标机器学习模型,对于每种机器学习模型采用留一交叉验证法和皮尔逊指数R作为机器学习模型精度指标,对于每种不同的力学性能,选取皮尔逊指数R最大的机器学习模型;
[0046] 步骤S5:对于收集到的无铅锡基合金成分数据做内差和正交排列组合,作为虚拟样本,将虚拟样本输入到机器学习模型中,得出力学性能预测值,根据预测值进行合金成分筛选,从而实现合金参数的设计。
[0047] 在本实施例中,收集获取无铅锡基焊料合金的材料数据90条。其中包括无铅锡基焊料的合金成分质量比,合金成分有锡、银、铜、铋、铟、锑、镍、锌、钛、铝。无铅锡基焊料的力学性能包括拉伸强度和断裂延伸率。
[0048] 使用k‑means聚类方法对力学性能拉伸强度和断裂延伸率进行聚类,如图2所示,按照聚类结果分为3簇,剔除拉伸强度低同时断裂延伸率也低即综合性能最低的第一簇数据,对剩余数据进行保留。将剩余数据输入到机器学习模型中,相比于不剔除数据输入到机器学习模型时的精度有很大幅度提升,拉伸强度的R从0.822提升到0.881,断裂延伸率的R从0.581 提升到了0.749。
[0049] 使用k‑means聚类方法对合金成分进行聚类,聚类结果为银含量大于3%和小于等于3%两簇,按照聚类分簇结果将样本分高银和低银两类。
[0050] 将合金成分比例转换为原子比例作为补充特征,并加入原子半径、价电子数、鲍林电负性作为补充特征。对补充的特征进行高相关滤波(图3)和shapvalue特征重要性排序筛选(图 4)。
[0051] 将合金成分筛选后的原子特征作为输入,一种力学性能作为输出,使用12种不同的算法分别建立单目标机器学习模型。这12种机器学习算法包括:Linear、Ridge、LASSO、MLP、Decision Tree、Random Forest、Xgboost、Adaboost、GBDT、Bagging、SVM、KNN。每种机器学习模型采用留一交叉验证法,如图5所示,皮尔逊指数R作为机器学习模型精度指标。对于每种不同的力学性能,选取皮尔逊指数R最大的机器学习模型,高银拉伸强度的机器学习模型为Xgboost,高银断裂延伸率的机器学习模型为SVM,低银拉伸强度的机器学习模型为KNN,低银断裂延伸率的机器学习模型为LASSO。
[0052] 基于收集到的无铅锡基合金成分数据结合专家领域知识确定合金元素范围,从每个合金成分的最大值到零,设定步长为0.1%做内差,并进行排列组合得到945536328条,作为虚拟样本。
[0053] 将虚拟样本输入到机器学习模型中,得出力学性能预测值,我们将拉伸强度和断裂延伸率的乘积作为衡量强度和韧性的综合指标,利用综合指标筛选出性能优异的焊锡合金成分组合,辅助合金成分设计。通过以上方法我们确定了类具有优异力学性能的无铅焊料合金的成分范围,其重量百分比组成:3.0‑5.5%的Ag,0.5‑1.0%的Cu,1.0‑5.0%的Bi,0.01‑1.0%的Ti, 0.01‑1.0%的Ni,余量为Sn。通过综合指标筛选出综合性能最优的两个样本样品进行实验,设计出的两个合金和性能如表1所示。在机器学习辅助下设计出的两种无铅锡基焊料合金的综合性能均比训练集中的合金综合性能要高,与训练集的平均综合性能相比提升了33%,如图7所示。
[0054] 表1聚类筛选后自适应机器学习辅助设计出的两种示例无铅锡基焊料合金[0055]
[0056] 本发明上述实施例聚类筛选后自适应机器学习辅助设计无铅锡基焊料合金的方法,首先收集获取无铅锡基焊料合金的材料数据,建立数据集;然后,使用k‑means聚类方法对力学性能聚类,剔除性能较差的簇;再使用k‑means聚类方法对合金成分聚类,把样本分为几个类别;将不同类别的合金成分和其特征筛选后的原子特征作为输入,其力学性能作为输出;使用12种不同的算法分别建立单目标机器学习模型;对于每种机器学习模型采用留一交叉验证法和皮尔逊指数R作为机器学习模型精度指标,对于每种不同的力学性能,选取皮尔逊指数R最大的机器学习模型;对于收集到的无铅锡基合金成分数据做内差和正交排列组合,作为虚拟样本;最后,将虚拟样本输入到机器学习模型中,得出力学性能预测值,根据预测值优选出性能优异的合金成分,从而实现辅助设计合金。
[0057] 以上所述仅对本发明实施例结合附图进行了说明,但本发明不限于上述实施例,还可以根据本发明的发明创造的目的做出多种变化,凡依据本发明技术方案的精神实质和原理下做的改变、修饰、替代、组合或简化,均应为等效的置换方式,只要符合本发明的发明目的,只要不背离本发明的技术原理和发明构思,都属于本发明的保护范围。