数据表格智能分析和可视化
该功能模块为特征工程提供初步的数据智能分析和可视化展示,主要实现特征变量和目标变量在数据集中的分布和关系可视化。
数据表格智能分析
用户登录时,在Data Preliminar功能模块下,单击Data Profiling按钮。
进入Data Profiling模块,页面弹出如下图所示的.csv文件上传框。
上传数据之后,页面显示数据的智能分析报告。
数据变量关系可视化分析
用户登录时,在Data Preliminar功能模块下,单击Data Visualization按钮。
数据表格信息
进入Data Profiling模块,上传数据之后,Data Table功能显示加载所上传的.csv文件的数据,可通过调节rows调整显示的数据表的行数。
数据统计信息
Data Statistics功能显示所上传数据的统计信息,点击download可进行下载
选择目标变量
Features vs Targets功能显示数据集的特征变量和目标变量,默认.csv文件中的最后一列为目标变量,可通过input target调节目标变量的个数。
特征变量分布
Feature Statistics Distribution功能显示每个特征变量分布统计直方图并给出核密度估计曲线,可通过Plot parameters功能调节图像的颜色、字体、标题和刻度大小。
目标变量分布
Target Statistics Distribution功能显示每个特征变量分布统计直方图并给出核密度估计曲线,可通过Plot parameters功能调节图像的颜色、字体、标题和刻度大小。
特征变量配方分布
Feature Recipe Distribution功能按照数据集中特征的顺序统计每个特征在样本中的数量,从而得知目标的常规配方,可通过Plot parameters功能调节图像的颜色、字体、标题和刻度大小。
特征变量数据集分布
Distribution of Feature in Dataset功能统计特征变量在数据集中的分布情况,可通过Plot parameters功能调节图像的颜色、字体、标题和刻度大小。
特征变量与目标变量
Features and Targets功能显示特征变量和目标变量的关系,可通过Plot parameters功能调节图像的颜色、字体、标题和刻度大小。
目标变量与目标变量
Tagrets and Targets功能显示特征变量和目标变量的关系,可通过Plot parameters功能调节图像的颜色、字体、标题和刻度大小 。
如果是多目标数据,Tagrets and Targets功能显示目标变量和目标变量的关系,可通过Plot parameters功能调节图像的颜色、字体、标题和刻度大小 。