1. 首页 > 教育

请教统计学达人,我的样本数据差距大,一组9人,另一组有160人,请问该如何比较二者是否存在差异性?

请教统计学达人,我的样本数据差距大,一组9人,另一组有160人,请问该如何比较二者是否存在差异性?

如何分析方差不齐的数据

方差齐性检验一般是用方差最大组的方差比最小组的方差,如果比值显著不等于1,那就是方差不齐性。

按说不齐性是不可以进行后续的方差分析的,因为在均值检验中(包括方差分析,T检验等)各个实验处理的效应被认为是一种固定效应,对所有人的作用一样,也就是说,处理的作用就是给每个人原来的的水平加上一个相同的常数,这样的话,每个被试组原来什么方差,实验处理后还是什么方差,那么,如果不同被试组的方差不齐性,也就是方差之比显著不等于1,就说明被试之间原本就差异很大,那我们的方差分析就得不到准确的结论,不知道究竟是实验处理造成了不同被试组间的差异,还是说这里面也混淆了个体差异。就算只有两个组之间方差不齐,其他都齐,但这也会对不同部分均方的计算造成影响,哪怕只有两个组不齐,那也是不齐。

方差不齐性,原则上不能进行方差分析,但spss里的方差分析是在最小二乘法的框架下做的,和教育及心理统计教材中介绍的方差分析的分析方式不太一样,好处是这样的方差分析比较稳健,对于方差齐性的问题不敏感,即使违反了,也还是能用,结果也还是比较可信的。在spss里面齐性并不是方差分析的必要条件。只不过教材是为了给你介绍大概原理,而且对最新的软件的性能也不是非常了解,所以非要齐性。况且做方差分析的论文里面一般也不会报告齐性检验。所以你就直接用方差分析就行了。

如果还是不放心,可以做一些数据转换,使其接近齐性,比如box—cox转换,对数转换等等。

在统计学中,若数据相差较大,用什么平均数最好

数据相差大和极端值不能完全等同,前者更可能标准方差大,即数据分布相对平均值更离散。如果是极端值,平均值首先被排除,考虑使用众数或中位数,在这种情况下:

(来自百度文库wenku.baidu/link?url=ivacE35Pp4jvnTgswTlmwpsafrgxz7bhbYtNgvEa_ZDrVLkXh_fyCPgniKvZ7LmjRBZk7cpla9wzIRnCswcqhR9YwLr4UUQGn63ZqeMXdj7)

  (1)众数是一组数据分布的峰值,是一种位置代表值。其优点是易于理解,不受极端值的影响。当数据的分布具有明显的集中趋势时,尤其是对于偏态分布,众数的代表性比均值要好。其缺点是具有不唯一性,对于一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。

  (2)中位数是一组数据中间位置上的代表值。其特点是不受数据极端值的影响。对于具有偏态分布的数据,中位数的代表性要比均值好。

  (3)均值是就全部数据计算的,它具有优良的数学性质,是实际中应用最广泛的集中趋势测度值。其主要缺点是易受数据极端值的影响,对于偏态分布的数据,均值的代表性较差。作为均值变形的调和平均数和几何平均数,是适用于特殊数据的代表值,调和平均数主要用于不能直接计算均值的数据,几何平均数则主要用于计算比率数据的平均数,这两个测度值与均值一样易受极端值的影响。

  2. 各种代表值应用的场合

  (1)当数据呈对称分布或接近对称分布时,三个代表值相等或接近相等,这时应选择均值作为集中趋势的代表值,因为均值包含了全部数据的信息,而且易被大多数人所理解和接受;

  (2)当数据为偏态分布,特别是当偏斜的程度较大时,我们应选择众数或中位数等位置代表值,这时它们的代表性要比均值好。

  此外,应注意当一组数据中出现0或负数时,无法计算调和平均数或几何平均数

样本量差异较大可以做方差分析吗?

方差分析的条件里并没有说样本量的问题,只有:在各个总体中因变量都服从正态分布、在各个总体中因变量的方差都相等、各个观测值之间是相互独立的。

关键是你的35个人是否能代表它的总体,386个人是否能代表它的总体。感觉样本量差异如此大,方差居然可以齐性,很奇怪。

做完方差分析后做一下统计效力看看如何。

感觉统计里的差异检验还是要讲一下均衡的原则。我觉得相差太大了,不好比。但是没有找到说方差分析样本量差异大能不能做,只有试验设计的均衡原则。