中位数也称第二分位数对不对,中位数和分位数的区别

首页 > 上门服务 > 作者:YD1662023-07-03 08:36:02

2)极差、方差、标准差的作用

极差的计算非常简单,但是极差没有充分的利用数据信息。

方差(标准差)可以体现数据的“分散性”,方差(标准差)越大,数据越分散,方差(标准差)越小,数据越集中。

方差(标准差)也可以体现数据的“波动性”(稳定性)。方差(标准差)越大,数据波动性越大。

方差(标准差)越小,数据波动性越小。

当数据较大时,也可以使用n代替n-1。

3)代码:计算鸢尾花数据集中花萼长度的极差、方差、标准差

iris = load_iris()

dt = np.concatenate([iris.data,iris.target.reshape(-1,1)],axis=1)

df = pd.DataFrame(dt,columns=iris.feature_names ["types"])

display(df.sample(5))

sub = df["sepal length (cm)"].max() - df["sepal length (cm)"].min()

sub

var = df["sepal length (cm)"].var()

var

std = df["sepal length (cm)"].std()

std

var == std ** 2

结果如下:

中位数也称第二分位数对不对,中位数和分位数的区别(13)

绘制图形:

plt.figure(figsize=(15,4))

plt.ylim(-0.5,1.5)

plt.plot(df["sepal length (cm)"],np.zeros(len(df)),ls="",marker="o",ms=10,color="g",label="花瓣长度")

plt.plot(df["sepal width (cm)"],np.ones(len(df)),ls="",marker="o",ms=10,color="b",label="花瓣宽度")

plt.axvline(df["sepal length (cm)"].mean(),ls="--",color="g",label="花瓣长度均值")

plt.axvline(df["sepal width (cm)"].mean(),ls="-",color="b",label="花瓣宽度均值")

plt.legend()

结果如下:

中位数也称第二分位数对不对,中位数和分位数的区别(14)

7、分布形状:偏度和峰度

1)偏度① 概念

中位数也称第二分位数对不对,中位数和分位数的区别(15)

t1 = np.random.randint(1,11,100)

t2 = np.random.randint(11,21,500)

t3 = np.concatenate([t1,t2])

left_skew = pd.Series(t3)

t1 = np.random.randint(1,11,500)

t2 = np.random.randint(11,21,100)

t3 = np.concatenate([t1,t2])

right_skew = pd.Series(t3)

display(left_skew.skew(),right_skew.skew())

sns.kdeplot(left_skew,shade=True,label="左偏")

sns.kdeplot(right_skew,shade=True,label="右偏")

plt.legend()

结果如下:

中位数也称第二分位数对不对,中位数和分位数的区别(16)

上一页12345下一页

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.