2024年3月28日发(作者:长安欧尚x7图片)

少年易学老难成,一寸光阴不可轻 - 百度文库

第一节 全距、四分位距、百分位距

一、全距(Range)

1、概念

全距是一组数据中最大值与最小值之差,故又称两极差,简称极差。用符号R表示。它是表示一组数据离散程度

的最简单、最易理解的一种差异量数。

2、计算

全距计算比较简单。

对于原始数据求全距的方法是:找出最大值、最小值,然后用公式:R=最大值-最小值

对于频数分布表求全距的方法:

最大一组与最小一组组中值之差;

或者是最大一组上限与最小一组下限之差。

注意:如果数据是连续型,必须用精确上下限。

极差(概念要点及计算公式)

1. 一组数据的最大值与最小值之差

2. 离散程度的最简单测度值

3. 易受极端值影响

4. 未考虑数据的分布

计算公式为

未分组数据 R = max(Xi) - min(Xi)

1

少年易学老难成,一寸光阴不可轻 - 百度文库

组距分组数据 R = 最高组上限 - 最低组下限

全距

3 应用条件及优缺点

全距概念清楚,意义明确,计算简单,是其明显的优点.

但因它仅由最大值与最小值求得,易受两极端数值的影响.如果两极端有偶然性或属异常值时,全距不稳定、不可靠。

它不考虑中间数值的差异,即其它数据未起作用,反应不灵敏。它明显地受取样变动的影响。

由于上述原因,全距只是一种低效的差异量数,只能作为差异量的粗略指标。

它的用处一般只用于研究的预备阶段,用它检查数据的大概散布范围,以便确定统计分组。即在编制频数分布表时

决定全距范围之用。

二、四分位距(四分差)

1、四分位距的概念

为了避免全距受两极端数值影响的缺点,则用按一定顺序排列的一组数据中间部位50%个频数距离的一半作为差

异量指标,即四分位距,又称四分差,用Q表示。

若将从小到大排列的一组数据分成频数相等的四段,第一与第二段的分界点称第一个四分位数(Q1)。第三与第

四段的分界点称第三个四分位数(Q3)。则四分位距就是第三个四分位数(第75%百分位数)与第一个四分位数

(第25%百分位数)差的一半。

用公式表示为:Q=(Q3-Q1)/2

四分位差(概念要点)

1. 离散程度的测度值之一

2. 也称为内距或四分间距

3. 第3四分位数与第1四分位数之差 QD = Q3 – Q1

4. 反映了中间50%数据的离散程度

5.不受极端值的影响

2

更多推荐

数据,全距,极端,频数