2024年3月28日发(作者:长安欧尚x7图片)
少年易学老难成,一寸光阴不可轻 - 百度文库
第一节 全距、四分位距、百分位距
一、全距(Range)
1、概念
全距是一组数据中最大值与最小值之差,故又称两极差,简称极差。用符号R表示。它是表示一组数据离散程度
的最简单、最易理解的一种差异量数。
2、计算
全距计算比较简单。
对于原始数据求全距的方法是:找出最大值、最小值,然后用公式:R=最大值-最小值
对于频数分布表求全距的方法:
最大一组与最小一组组中值之差;
或者是最大一组上限与最小一组下限之差。
注意:如果数据是连续型,必须用精确上下限。
极差(概念要点及计算公式)
1. 一组数据的最大值与最小值之差
2. 离散程度的最简单测度值
3. 易受极端值影响
4. 未考虑数据的分布
计算公式为
未分组数据 R = max(Xi) - min(Xi)
1
少年易学老难成,一寸光阴不可轻 - 百度文库
组距分组数据 R = 最高组上限 - 最低组下限
全距
3 应用条件及优缺点
全距概念清楚,意义明确,计算简单,是其明显的优点.
但因它仅由最大值与最小值求得,易受两极端数值的影响.如果两极端有偶然性或属异常值时,全距不稳定、不可靠。
它不考虑中间数值的差异,即其它数据未起作用,反应不灵敏。它明显地受取样变动的影响。
由于上述原因,全距只是一种低效的差异量数,只能作为差异量的粗略指标。
它的用处一般只用于研究的预备阶段,用它检查数据的大概散布范围,以便确定统计分组。即在编制频数分布表时
决定全距范围之用。
二、四分位距(四分差)
1、四分位距的概念
为了避免全距受两极端数值影响的缺点,则用按一定顺序排列的一组数据中间部位50%个频数距离的一半作为差
异量指标,即四分位距,又称四分差,用Q表示。
若将从小到大排列的一组数据分成频数相等的四段,第一与第二段的分界点称第一个四分位数(Q1)。第三与第
四段的分界点称第三个四分位数(Q3)。则四分位距就是第三个四分位数(第75%百分位数)与第一个四分位数
(第25%百分位数)差的一半。
用公式表示为:Q=(Q3-Q1)/2
四分位差(概念要点)
1. 离散程度的测度值之一
2. 也称为内距或四分间距
3. 第3四分位数与第1四分位数之差 QD = Q3 – Q1
4. 反映了中间50%数据的离散程度
5.不受极端值的影响
2
更多推荐
数据,全距,极端,频数
发布评论