数据表格智能分析和可视化


该功能模块为特征工程提供初步的数据智能分析和可视化展示,主要实现特征变量和目标变量在数据集中的分布和关系可视化。

数据表格智能分析


用户登录时,在Data Preliminar功能模块下,单击Data Profiling按钮。

进入Data Profiling模块,页面弹出如下图所示的.csv文件上传框。

上传数据之后,页面显示数据的智能分析报告。

数据变量关系可视化分析


用户登录时,在Data Preliminar功能模块下,单击Data Visualization按钮。

数据表格信息


进入Data Profiling模块,上传数据之后,Data Table功能显示加载所上传的.csv文件的数据,可通过调节rows调整显示的数据表的行数。

数据统计信息


Data Statistics功能显示所上传数据的统计信息,点击download可进行下载

选择目标变量


Features vs Targets功能显示数据集的特征变量和目标变量,默认.csv文件中的最后一列为目标变量,可通过input target调节目标变量的个数。

特征变量分布


Feature Statistics Distribution功能显示每个特征变量分布统计直方图并给出核密度估计曲线,可通过Plot parameters功能调节图像的颜色、字体、标题和刻度大小。

目标变量分布


Target Statistics Distribution功能显示每个特征变量分布统计直方图并给出核密度估计曲线,可通过Plot parameters功能调节图像的颜色、字体、标题和刻度大小。

特征变量配方分布


Feature Recipe Distribution功能按照数据集中特征的顺序统计每个特征在样本中的数量,从而得知目标的常规配方,可通过Plot parameters功能调节图像的颜色、字体、标题和刻度大小。

特征变量数据集分布


Distribution of Feature in Dataset功能统计特征变量在数据集中的分布情况,可通过Plot parameters功能调节图像的颜色、字体、标题和刻度大小。

特征变量与目标变量


Features and Targets功能显示特征变量和目标变量的关系,可通过Plot parameters功能调节图像的颜色、字体、标题和刻度大小。

目标变量与目标变量


Tagrets and Targets功能显示特征变量和目标变量的关系,可通过Plot parameters功能调节图像的颜色、字体、标题和刻度大小 。

如果是多目标数据,Tagrets and Targets功能显示目标变量和目标变量的关系,可通过Plot parameters功能调节图像的颜色、字体、标题和刻度大小 。