主动学习模块
本模块通过调用开源算法库 Bgolearn 实现(📒手册)。用于材料成分定向设计以及性能定向优化过程。通过已有实验数据(样本)及其测试性能,在给定的成分空间中搜索最优的材料成分设计,以将目标性能最大/最小化。推荐的成分通过实验合成后,变成新的数据加入数据集合,Bgolearn将利用更多的数据信息对下一次设计做出更加可靠的推荐。迭代这个过程可以高效地在给定的成分空间中,寻找到具有优秀性能的新材料。其中所有的实验过程也可以通过模拟过程代替。如下图:
关于主动学习中虚拟空间采样点的说明:
-
如果只上传一个数据文件,则文件默认为标准数据集,虚拟采样点通过主动学习模块的
sample space ratio
和sample number
生成,注意自动生成的虚拟采样点可能违背物理规律(例如,特征数据为合金的成分时,推荐的样本成分总和大于100 w.t%) -
如果上传两个文件,则第一个文件默认为标准数据集,第二个文件默认为虚拟采样点文件。 虚拟采样点
.csv
文件数据布局如下:
操作
在Home
主页,进入active learning
模块
页面弹出如下图所示的.csv
文件上传框。
上传数据之后,Data Table
功能显示加载所上传的.csv
文件的数据,通过调节rows
调整显示的数据表的行数。
Features vs Targets
功能显示数据集的特征变量和目标变量,默认.csv
文件中的最后一列为目标变量,可通过input target
调节目标变量的个数。
-
Choose Target
-选择目标特征 -
在
Sampling
功能下选择model
,在Hyper Parameters
中可调节算法的超参数
Note : 超参数说明, 见 Bgolearn 📒手册
-
simple number
选择推荐的样本个数 -
min search
选择优化的方向(最小/最大) -
sample criterion
选择bayes推荐算法, 共包括九种效用函数
1:
Expected Improvement algorith
-期望提升函数2:
Expected improvement with "plugin"
-有“plugin”的期望提升函数3:
Augmented Expected Improvement
-增广期望提升函数4:
Expected Quantile Improvement
-期望分位提升函数5:
Reinterpolation Expected Improvement
-重插值期望提升函数6:
Upper confidence bound
-高斯上确界函数7:
Probability of Improvement
-概率提升函数8:
Predictive Entropy Search
-预测熵搜索函数9:
Knowledge Gradient
-知识梯度函数
- 在
sample space ratio
中选择虚拟空间采样点范围:
sample numeber
选择每个特征的采样个数
根据所选择的算法和超参数推荐的样本可点击download
可下载。