使用的环境
计算机环境:Windows11Excel版本:Excel2016家庭与学生版
众数
众数(Mode)是数据中出现次数最多的数值,即一组数中最常出现的数。不受极端值影响,代表分布的最高峰点;一组数据可能有多个众数(多峰)或无众数。
众数的计算
非分组数据众数计算
众数的确定方法因所掌握的数据条件不同而有所不同。根据非分组数据计算众数比较容易,只要找出出现频数最多或出现频率最高的变量值即可。
在Excel 中使用MODE函数计算非分组数据的众数,在Excel2016中MODE函数有些变化
可以看到是有三个类似的函数,分别是MODE.MULT、MODE.SNGL、MODE,MODE.MULT主要用于返回数据中的多个众数的情况,MODE.SNGL、MODE返回一个众数(当数据中有多个众数是返回出现的第一个),区别只是MODE函数为了兼容旧版的公式而前面两个带后缀的是新的函数,旧版本的Excel中不存在。今天主要讲众数,讲第三个,第二个和第三个用法一致。
语法:MODE(number1,[number2],...)MODE 函数语法具有下列参数:Number1 必需。 要计算其众数的第一个数字参数。Number2,... 可选。 要计算其众数的 2 到 255 个数字参数。 也可以用单一数组或对某个数组的引用来代替用逗号分隔的参数。备注参数可以是数字或者是包含数字的名称、数组或引用。如果数组或引用参数包含文本、逻辑值或空白单元格,则这些值将被忽略;但包含零值的单元格将计算在内。作为错误值或无法转换为数字的文本的参数会导致错误。如果数据集合中不包含重复的数据点,则 MODE 返回错误值 #N/A。
用示例说明用法,在B2中输入函数得到众数:
不难发现这个示例数据不止一个众数,这个函数没法返回。这个时候就需要用到MODE.MULT,这里只简单介绍使用方式,展开说太多了,具体的单独写一篇数组公式。
选择单元格 B2:B7 输入函数:
然后按 Ctrl+Shift+Enter,可以获得所有的众数结果:
这时可以注意到两点:
1)、所有众数结果为1,2,3.
2)、公式有{}花括号。这个就是数组公式的用法。
分组数据众数的计算
对于没有初始数据的分组数据计算众数。先要找出频数最多的一组作为众数组,然后运用公式来确定众数。对于组距分组数据,众数的数值与其相邻两组的频数分布有一定的关系,这种关系可做如下的理解。
设众数组的频数为f m,众数前一组的频数为f-1,众数后一组的频数为f+1。当众数相邻两组的频数相等时,即f-1=f+1,众数组的组中值即为众数;当众数组的前一组的频数多于众数组后一组的频数时,即f-1>f+1,则众数会向其前一组靠,众数小于其组中值;当众数组后一组的频数多于众数组前一组的频数时,即f-1<f+1,则众数会向其后一组靠,众数大于其组中值。基于这种思路,分组数据众数的计算公式如下:
式中,L表示众数所在组的下限;d表示众数所在组的组距。
利用上述公式计算众数时是假定数据分布具有明显的集中趋势,且众数组的频数在该组内是均匀分布的,若这些假定不成立,则众数的代表性就会很差。从众数的计算公式可以看出,众数是根据众数组及相邻组的频率分布信息来确定数据中心点位置的,因此,众数是一个位置代表值,它不受数据中极端值的影响。
根据示例展示用法:
(1)确定众数组,由数据易知众数组为频数最高的组“120~130”,频数为27。(2)在单元格中输入公式“=120+(C5-C4)/((C5-C4)+(C5-C6))*10” 按Enter键即可。其中,120为众数组的下限,10 为众数组的组距,C5 为众数组的频数为f m ,C4为众数前一组的频数为f -1,C6为众数后一组的频数为f+1,计算结果如图所示。
中位数
中位数(Median)是数据排序后居中的数值,将数据分为两等份,不受极端值影响;在等差数列或正态分布中等于均值,主要用于有顺序的数值型数据,不适用于分类数据。
中位数的计算
未分组数据中位数的计算
在Excel中使用MEDIAN函数计算非分组数据的中位数。
语法MEDIAN(number1, [number2], ...)MEDIAN 函数语法具有下列参数:number1, number2, ... Number1 是必需的,后续数字是可选的。 要计算中值的 1 到 255 个数字。备注如果参数集合中包含偶数个数字,MEDIAN 将返回位于中间的两个数的平均值。参数可以是数字或者是包含数字的名称、数组或引用。 逻辑值和直接键入到参数列表中代表数字的文本被计算在内。如果数组或引用参数包含文本、逻辑值或空白单元格,则这些值将被忽略;但包含零值的单元格将计算在内。如果参数为错误值或为不能转换为数字的文本,将会导致错误。
示例说明:
区域 A2:A6 中 5 个数字的中值。 因为有 5 个值,所以第三个是中值。
区域 A2:A7 中 6 个数字的中值。 因为有 6 个值,所以中值是第三个和第四个数字之间的中点。
分组数据中位数计算
假设一个长度为n的数列,根据分组数据计算中位数也需要分两步进行:
(1)从变量数列的累计频数栏中找出第n/2个单位所在的组,即“中位数组”,该组的上、下限就规定了中位数的可能取值范围。
(2)假定在中位数组内的各单位是均匀分布的,则中位数的计算公式如下:
其中,Li表示中位数所在组的下限,d表示中位数所在组的组距,Fi表示中位数所在组的累计频数,Fi-1表示中位数所在组的前一组的累计频数,n表示数据个数。
还是使用众数中的分组数据示例进行演示:
(4)根据公式来计算中位数,输入公式“=130+(C13/2-D5)/(D6-D5)*10”。其中,130为中位数所在组的下限,C13为样本个数n,D5为中位数所在组的前一组的累计频数,D6为中位数所在组的累计频数,10为组距。
小结
使用同一份数据计算的中位数和众数并不相等,说明这份数据是偏态分布的。因为对于对称分布的数据两者应该是相等的。