两独立样本t检验和非参数检验的实证分析
摘要:教学质量是靠具体课程完成,课程的建设是教学质量提升的重要环节和基本保证。本文简述了概率论与数理统计重点课程建设的必要性,重点在于对课程建设前后分层随机抽样得来的样本进行实证分析。实证分析主要从基本统计分析、参数检验、非参数检验三个大的方面进行,尤其是非参数检验方面,又具体利用了三种不同的检验法进行分析推断。
关键词:t检验;非参数检验;显著性水平;频数分析
概率论与数理统计是我国高等院校理工类、经济类、管理类各专业的一门重要公共基础课程,同时也是一门应用广泛,适用性强的工具课。此门课程的教学为学生的其他专业课及其将来毕业后的工作、继续深造等方面奠定必要的数学基础,而且对培养学生的逻辑思维能力、分析判断问题能力、统计观点、应用能力和创新能力均有着特殊而又重要的作用,是培养高素质综合型人才的重要保证。
笔者本身是东华理工大学理学院的一线教师,这两年来,同时在江西财经大学统计学院读研究生。在此期间,笔者主持的“概率论与数理统计”重点课程建设项目小组一直在努力的探索和研究,收获了一些成果。本文的主要目的是针对进行重点课程建设这几年来,对搜集到的学生该门课程的考试成绩从统计学的角度进行实证分析。尤其是从参数检验和非参数统计两个重要角度进行探究,论证这几年来进行课程建设是否让学生成绩取得了明显的提高。
本文数据来源于东华理工大学所有开设了概率论与数理统计课程的学院,分别收集了2010学年第二学期(即下半年)概率成绩和2012学年第二学期概率成绩。总共十个学院,进行分层随机抽样,对每个学院随机抽取10名学生,最终获到两组样本,每组各100个样本点。下面开始进行实证分析:
一、基本统计分析
对数据的分析首先从基本统计分析入手。通过基本统计分析,掌握数据的基本统计特征,同时迅速把握数据的总体分布形态。而基本统计分析往往先从频数分析开始,由于成绩数据均为定距型数据,直接采用频数分析不利于对其分布形态的把握,因此先对数据分组后再进行频数分析。SPSS频数分析的操作如下:选择菜单【Analyze】→【Descriptive】→【Frequencies】,结果如下:
从上面的统计表中可以看出,进行重点课程建设后,平均分有了明显的提高,而且从频数分布表可以看出,第3组第4组即中高分数段百分数有了明显提升。从数据的角度初步说明课程建设有效果,学生成绩明显改善。
二、进行两独立样本t检验
此次实证分析获取的数据是来自于2010年和2012年,分别看成是两个总体,且近似可认为服从正态分布,此外样本数据的获取是独立抽样的,因此,可以用两独立样本t检验的方法进行。原假设:2012年的平均成绩比2012年的平均成绩有显著提高,即H0:μ1-μ2=0 分析结果表略。分析结论应通过两步完成:
第一步,两个总体方差是否相等的F检验,即检验两个总体方差从统计的角度看相等,这一步是为第二步t检验时所采用的t分布的自由度为多少做准备。从表中观察到F统计量的值是3.673,对应的概率P值为0.057,因此可以认为两总体的方差是没有显著差异的,即说明第二步所使用的t统计量是服从自由度为n1+n2-2的t分布。
第二步:两个总体均值的检验。在第一步中,由于两个总体的方差无显著差异,因此应该看第一行(Equal variances assumed)T检验的结果。其中T统计量的观测值为-2.557,对应的双尾概率P-值为0.011。如果显著性水平α=0.05,由于概率P-值小于0.05,因此认为两总体的均值有显著差异,即2010年和2012年的概率成绩平均值存在显著差异。结合之前进行的基本统计分析结果,明确能够判定出进行了重点课程建设之后,学生平均成绩有了明显的提升,建设效果显著,进步明显。最后再从上表的第九列和第十列分析,这两列的具体数据为-8.472,-1.094,是两总体差的95%置信区间的下限跟上限,由于该置信区间均为负数,不跨零,因此也从另外一个角度证实了上述推断。
三、进行两独立样本非参数检验
在上面参数检验时,先通过基本统计分析判断其总体近似服从正态分布,然后再进行的检验。但其实在两个总体的分布不甚了解的情况下,我们可以通过对两组独立样本进行非参数检验,从而也能够分析推断两个总体的分布,均值等方面是否存在显著差异。这也是另外一种分析检验的途径。
下面利用SPSS软件进行曼-惠特尼U检验,K-S检验,W-W游程检验共三种非参数检验方法。
SPSS基本操作如下:【Analyze】→【Nonparametric Tests】→【2 Independent Samples】
分析结果表略:由曼惠特尼U检验,可知第1组(即课程建设前)秩总和为8910,第2组(即课程建设后)秩总和为11190,U,Z统计量分别为3.860E3(科学记数法),-2.786,由于是大样本,因此采用Z统计量。若显著性水平为0.05,则概率P-值为0.005,小于显著性水平α=0.05,因此应拒绝原假设,即认为重点课程建设之后学生平均成绩跟建设前存在显著差异,结合基本统计分析得出结论,重点课程建设效果良好,提升明显。
由K-S检验,可知课程建设前后学生成绩的累计概率的最大绝对差为0.230,nD的观测值为1.626,概率P-值为0.010。如果显著性水平为0.05,概率P-值则小于显著性水平α=0.05,因此应该拒绝原假设,即用K-S检验法,也能推断出课程建设前后均值显著性差异,课程建设对学生成绩有了较大的提高。
由W-W游程检验,可知课程建设前后两组数据秩的游程数为57,根据游程计算的Z统计量观测值为-6.238,对应的单尾概率P-值为0.000。如果显著性水平为0.05,由于概率P-值小于显著性水平α/2=0.025,因此仍然拒绝原假设,认为课程建设前后成绩的分布有显著差异,从而也能得出类似前两种非参数检验法的结论。
四、结论
本人主持的“概率论与数理统计”重点课程建设项目至今已建设3年。从教学大纲、教学课件等日常教学文件的修改,再到数理统计实验的推广,试题库的编辑,网络互动答疑平台的建立,在这三年中项目组成员在多方面都进行了大量的工作,付出了辛苦的劳动。我们进行课程建设的目的就是提高教学质量,教学质量的提高才是办学的根本。本文通过从随机抽样获取的学生成绩数据入手,进行全方位多层次多角度的统计检验,最后得出的结论证明了我们重点课程建设取得了良好的效果,让学生成绩有了长足的进步。当然这仅仅是纯粹站在数据的角度纯粹从统计的观点出发进行的分析,实际对课程建设的综合汇报还需要结合更多的东西进行整体评价,限于篇幅,本文单纯进行的实证分析就写到此。
参考文献:
[1] 靳庭良,张宝青.回归分析中t检验与F检验关系的进一步探讨[J].统计与决策,2009(21).
[2] 马明,刘华,马少虎.SPSS统计软件包的非参数检验问题[J].甘肃高师学报, 2006(02).
[3] 胡尧.两样本问题中的非参数检验[J].贵州大学学报(自然科学版),2005(03).
[4] 王伏虎,赵喜仓.双样本尺度参数的四种非参数检验方法[J].统计与决策,2011(17).
[5] 杨文强,吴翊.《概率论与数理统计》精品课程建设的思考[J].高等教育研究学报,2009(04).
推荐访问: 检验 实证 样本 独立 参数