数据表格智能分析和可视化
该功能模块为特征工程提供初步的数据智能分析和可视化展示,主要实现特征变量和目标变量在数据集中的分布和关系可视化。
数据表格智能分析
用户登录时,在Data Preliminar
功能模块下,单击Data Profiling
按钮。
进入Data Profiling
模块,页面弹出如下图所示的.csv
文件上传框。
上传数据之后,页面显示数据的智能分析报告。
数据变量关系可视化分析
用户登录时,在Data Preliminar
功能模块下,单击Data Visualization
按钮。
数据表格信息
进入Data Profiling
模块,上传数据之后,Data Table
功能显示加载所上传的.csv
文件的数据,可通过调节rows
调整显示的数据表的行数。
数据统计信息
Data Statistics
功能显示所上传数据的统计信息,点击download
可进行下载
选择目标变量
Features vs Targets
功能显示数据集的特征变量和目标变量,默认.csv
文件中的最后一列为目标变量,可通过input target
调节目标变量的个数。
特征变量分布
Feature Statistics Distribution
功能显示每个特征变量分布统计直方图并给出核密度估计曲线,可通过Plot parameters
功能调节图像的颜色、字体、标题和刻度大小。
目标变量分布
Target Statistics Distribution
功能显示每个特征变量分布统计直方图并给出核密度估计曲线,可通过Plot parameters
功能调节图像的颜色、字体、标题和刻度大小。
特征变量配方分布
Feature Recipe Distribution
功能按照数据集中特征的顺序统计每个特征在样本中的数量,从而得知目标的常规配方,可通过Plot parameters
功能调节图像的颜色、字体、标题和刻度大小。
特征变量数据集分布
Distribution of Feature in Dataset
功能统计特征变量在数据集中的分布情况,可通过Plot parameters
功能调节图像的颜色、字体、标题和刻度大小。
特征变量与目标变量
Features and Targets
功能显示特征变量和目标变量的关系,可通过Plot parameters
功能调节图像的颜色、字体、标题和刻度大小。
目标变量与目标变量
Tagrets and Targets
功能显示特征变量和目标变量的关系,可通过Plot parameters
功能调节图像的颜色、字体、标题和刻度大小 。
如果是多目标数据,Tagrets and Targets
功能显示目标变量和目标变量的关系,可通过Plot parameters
功能调节图像的颜色、字体、标题和刻度大小 。