您的位置 首页 投资

Winsorized均值定义

Winsorized是什么意思? Winsorized mean是一种平均方法,首先用最接近的观测值替换最小和最大值。这样做是为了限制异常极值或异常值对计算的影响。在替换这些值之后…

Winsorized是什么意思?

Winsorized mean是一种平均方法,首先用最接近的观测值替换最小和最大值。这样做是为了限制异常极值或异常值对计算的影响。在替换这些值之后,算术平均值公式被用来计算winsorized平均值。

加权平均数的公式是

Winsorized Mean = xn…xn+1+xn+2…xnNwhere:N =要由观测值替换的最大和最小数据点的数量\ begin { aligned } & \ text { Winsorized Mean } \ = \ \ frac { x _ { N } \ dots x _ { N+1 } \+\ x _ { N+2 } \ dots x _ { N } } { N } \ \ & \ text BF { where:} \ \ & \ begin { aligned } N \ = \ & \ text {最大和最小数据的数量}

Winsorized的意思有两种表达方式。“kn”winsorized均值是指替换“k”个最小和最大的观测值,其中“k”是一个整数。一个“X%”的winsorized均值包括从数据的两端替换给定百分比的值。

如何计算加权平均值

通过替换最小和最大的数据点,然后对所有数据点求和,并将总和除以数据点的总数,来计算winsorized均值。

Winsorized的意思告诉你什么?

winsorized均值对异常值不太敏感,因为它可以用不太极端的值来代替它们。也就是说,与平均值相比,它更不容易受到轮廓的影响。然而,如果一个分布有肥尾,去除分布中最高值和最低值的影响将很小,因为分布图中有大量的可变性。

关键要点

  • 一种平均方法,包括用最接近的观测值替换最小和最大值。
  • 对异常值不太敏感,因为它可以用不太极端的值来代替它们。
  • 这不同于修剪平均值,修剪平均值涉及移除数据点——尽管两者的结果往往很接近。
  • 如何使用Winsorized均值的示例

    人们可以计算下列数据集的winsorized均值:1,5,7,8,9,10,14。在这个例子中,我们假设winsorized均值是一阶的,我们用它们最近的观测值替换最小和最大的值。

    数据集现在显示如下:5,5,7,8,9,10,10。取新集合的算术平均值,得出7.7的加权平均值,即(5 + 5 + 7 + 8 + 9 + 10 + 10)除以7。

    或者考虑一个20%的winsorized均值,取前10%和后10%,并用它们的下一个最接近的值替换它们。我们将在g数据集中获得以下内容:2,4,7,8,11,14,18,23,23,27,35,40,49,50,55,60,61,61,62,75。两个最小和最大的数据点,即10%,将被替换为下一个最接近的值。因此,新的数据集是:7,7,7,8,11,14,18,23,23,27,35,40,49,50,55,60,61,61,61,61。winsor化平均值为33.9,即数据总数(678)除以数据点总数(20)。

    Winsorized均值与裁剪均值的区别

    winsorized均值包括修改数据点,而修剪均值包括移除数据点。winsor化均值和修剪均值接近是很常见的。

    使用加权平均的局限性

    winsorized方法的一个主要缺点是它们会给数据集带来偏差。当然,数据组在修改后的偏差比留在异常值中的偏差要小。

    了解更多关于Winsorized均值的信息

    要获得相关的见解,请阅读更多关于关键均值计算之间的差异。

    本文来自网络,不代表爱财富网立场,转载请注明出处:http://www.htuba.com/news/556.html

    作者: 爱财富网

    发表评论

    您的电子邮箱地址不会被公开。 必填项已用*标注

    返回顶部