你所在的位置: 首页 > 正文

每天五分钟python编程:单变量的单特征和单变量的多特征绘图分析

2019-10-03 点击:1708

2019-09-07 01: 16: 24小艾科技

分析

如果数据是单变量,则有两种情况,一种是单个功能,即一个变量只有一个值,另一种是多特征,即一个变量具有多个值。

单变量单特征适用于使用直方图进行绘制,而单变量多种特征适用于使用散点图进行绘制

首先绘制单个变量单个特征的直方图

导入matplotlib.pyplot作为plt导入numpy作为np导入大熊猫作为pd导入seaborn作为sns sns.set(color_codes=True)np.random.seed(sum(map(ord('',``distributions))))x=np。 Random.normal(size=100)sns.distplot(x,kde=False)plt.show()

参数kde=False表示无核密度

绘制单变量单特征数据分布的等高线图

导入matplotlib.pyplot as plt导入numpy as np导入pandas as pd从scipy导入seaborn as sns导入统计信息sns.set(color_codes=True)np.random.seed(sum(map(ord('',``distributions''))) x=np.random.normal(size=100)sns.distplot(x,kde=False,fit=stats.gamma)plt.show()

通过指定参数fit=stats.gamma

绘制直方图的轮廓

绘制单变量的多功能地图

从plc导入matplotlib.pyplot作为plt从scipy导入numpy作为np导入熊猫作为pd导入seaborn作为sns进口统计数据均值,cov=[0,1],[(1,5),(。5,1)] data=np .random.multivariate_normal(mean,cov,200)df=pd.DataFrame(data,columns=[''x'',``y''])sns.jointplot(x=''x'',y=' 'y'',data=df)plt.show()

注:columns=[''x',''y']表示数据框中指定数据的列名

然后在绘制sns时。连接图(x=''x',y=''y',data=df),x=''x',y=”y”应与之对应。

SNS。连接图可以很容易地绘制散点图和直方图,只有序列格式和NDARX格式可以用来绘制,而数据帧格式是不能绘制的,必须。数值可以进入NDAREX,但是这里可以使用DF格式的数据DF格式完成绘图操作。意义

如何输出测向数据,然后像这样输出测向数据

当数据量较大时,可以使用十六进制样式的图像显示。如下图所示,颜色越深,数据就越多样化。

{!--pgc_列--}

import matplotlib.pyplot as plt import numpy as np import pandas as pd import seaborn as sns from scipy import stats mean,cov=[0,1],[1,5,(.5,1)]data=np.random.multivariate_normal(mean,cov,200)df=pd.dataframe(data,columns=[''x',''y'])sns.jointplot(x=''x',y=''y',data=df将pandas作为sns导入。种类=''hex'')plt.show()

绘制两个以上特征值的散点图

当一个特征变量的特征值超过两个时,则可以将这两个和两个组合以绘制散点图

import matplotlib.pyplot as plt import numpy as np import pandas as pd import seaborn as sns from scipy import stats sns.set(color_code=true)iris=sns.load懔dataset(''iris'')sns.pairplot(iris)plt.显示()

鸢尾花是sns随附的鸢尾花的数据集。该数据集是单变量和多特征的。它具有四个功能,因此可以将两者结合起来。上面的特殊对角线只是一个特征值,因此它们是直方图而不是散点图

分析

如果数据是单变量,则有两种情况,一种是单个功能,即一个变量只有一个值,另一种是多特征,即一个变量具有多个值。

单变量单特征适用于使用直方图进行绘制,而单变量多种特征适用于使用散点图进行绘制

首先绘制单个变量单个特征的直方图

导入matplotlib.pyplot作为plt导入numpy作为np导入大熊猫作为pd导入seaborn作为sns sns.set(color_codes=True)np.random.seed(sum(map(ord('',``distributions))))x=np。 Random.normal(size=100)sns.distplot(x,kde=False)plt.show()

参数kde=False表示无核密度

绘制单变量单特征数据分布的等高线图

导入matplotlib.pyplot as plt导入numpy as np导入pandas as pd从scipy导入seaborn as sns导入统计信息sns.set(color_codes=True)np.random.seed(sum(map(ord('',``distributions''))) x=np.random.normal(size=100)sns.distplot(x,kde=False,fit=stats.gamma)plt.show()

通过指定参数fit=stats.gamma

绘制直方图的轮廓

绘制单变量的多功能地图

从plc导入matplotlib.pyplot作为plt从scipy导入numpy作为np导入熊猫作为pd导入seaborn作为sns进口统计数据均值,cov=[0,1],[(1,5),(。5,1)] data=np .random.multivariate_normal(mean,cov,200)df=pd.DataFrame(data,columns=[''x'',``y''])sns.jointplot(x=''x'',y=' 'y'',data=df)plt.show()

注意:columns=[''x'',''y'']表示指定数据帧的数据的列名

然后在sns.jointplot(x=''x'',y=“''y'',data=df)中绘制x=''x'',y=” y''应该与之对应

>

Sns.jointplot可以轻松绘制散点图和直方图。只能使用序列格式和ndarray格式进行绘图。但是,无法绘制日期框架格式。您必须将.values转换为ndarray,但是在这里。您可以使用数据框格式的数据df完成绘图操作。应当注意

如果要输出df的数据,则以这种方式输出df的数据

当数据量较大时,可以使用十六进制图像显示,如下所示,颜色越深,收集的数据越多

{!-PGC_COLUMN-}

从plc导入matplotlib.pyplot作为plt从scipy导入numpy作为np导入熊猫作为pd导入seaborn作为sns进口统计数据均值,cov=[0,1],[(1,5),(。5,1)] data=np .random.multivariate_normal(mean,cov,200)df=pd.DataFrame(data,columns=[''x'',``y''])sns.jointplot(x=''x'',y=' 'y'',data=df,kind=''hex'')plt.show()

绘制两个以上特征值的散点图

当特征变量的特征值超过2时,可以将两者结合起来绘制散点图

导入matplotlib.pyplot作为plt导入numpy作为np导入大熊猫作为pd从scipy导入seaborn作为sns导入统计信息sns.set(color_codes=True)iris=sns.load_dataset(``iris'')sns.pairplot(iris)plt。展()

鸢尾花是sns随附的鸢尾花的数据集。该数据集是单变量和多特征的。它具有四个功能,因此可以将两者结合起来。上面的特殊对角线只是一个特征值,因此它们是直方图而不是散点图

法律逻辑

河北新闻网 版权所有© www.aafmtw.com 技术支持:河北新闻网 | 网站地图