统计学题库 统计学题库及答案解析
1、 绪论 1.1 医学统计学简介 “统计”包括统计活动或统计工作、统计数据或统计资料、统计数据处理、统计结果与结论四个方面的内容。统计学的定义是:数据收集、整理、分析、解释和表达的原理和方法。医学统计学的定义:用统计学的原理和方法研究生物医学现象的应用科学。学习医学统计学的意义:(1)学会驾驭变异性,(2)帮助设计你的研究,(3)撰写科研论文,(4)提供经得起重复的科学证据。
【单选题】 1、下列哪项内容不是医学统计学研究的主要内容:E A、 统计学基本原理与方法; B、健康与疾病统计; C、卫生服务统计; D、生物统计; E、国民经济统计 2、变异是指:B A、样本个体观察值的差异; B、相同总体个体观察值之间的差异; C、不同总体个体观察值的差异; D、不同总体抽样人数的差别; E、重复抽样样本统计量的差别 3、统计推论的主要内容有:B A、估计样本量 B、区间估计与假设检验 C、统计量组间差别对比; D、不同总体参数差别对比; E、编制频数分布表 【多选题】 统计的基本内容包括 ABCD A、统计活动或统计工作;
B、统计数据或统计资料;
C、统计数据处理;
D、统计结果解释;
E、统计表达 【多选题】作为一名研究生,主要通过( )方式收集自己的“一手”研究数据。
ABCD A、实验室研究;
B、 动物实验;
C、临床观测;
D、抽样调查;
E、病历资料 作为硕士研究生,为什么要学习医学统计学? 答:通过学习医学统计学主要目的有:1.学会驾驭变异性;
2.设计研究;
3.论文的统计学审查;
4.提供科学证据 1.2医学统计学的重要概念 总体(population)指特定范围内所有同质个体的测量值的。当总体中每个个体可以用1,2,……,N标识时,该总体称为有限总体,反之,称为无限总体。样本(sample)指实际获得的测量值,每个测量值来源于总体中的部分个体,并可以用1,2,……,n标识。由于测量值是随机变量,测量值的名称简称“变量”。通过样本测量值可计算统计量,如样本均数、样本率,用来估计对应的总体参数,如总体均数、总体率。n个个体的p个变量的测量值构成资料,资料又分计量资料、计数资料、等级资料三种类型。“误差”分随机误差和系统误差两种。频率是一个随机试验“阳性”结果发生率,概率是描述随机事件发生可能性大小的一个度量。
【单选题】 抽样的目的是:B A、计算样本统计量; B、由样本统计量推断总体参数; C、通过典型案例推断总体参数; D、研究所有样本的个体特征; E、研究总体中所有个体的特征 统计学中最具有代表性的样本是指: D A、随意抽取的总体中任意个体; B、有意识的选择总体中的典型个体; C、依照研究者要求选取总体中有意义的个体; D、依照随机原则抽取总体中的个体; E、选择总体中容易得到的个体 统计中所说的总体是指: A A、根据研究目的而确定的同质个体的全部; B、特定研究对象的全体; C、特定研究对象的全部测量值; D、特定研究对象的全体的个体数; E、特定研究对象的总体参数 为了由样本推断总体,样本应该是: E A、总体中任意的一部分; B、总体中的典型部分; C、总体中有意义的一部分; D、总体中有价值的一部分; E、总体中有代表性的一部分 参数是指: B A、随机变量; B、总体的统计指标; C、样本的统计指标; D、样本统计量的个数; E、总体统计指标的个数 下列有关抽样误差描述错误的是: E A、抽样误差是不可避免的; B、抽样误差是由个体差异造成的; C、抽样误差可通过增加样本量的方法加以控制; D、抽样误差大小可应用统计学方法加以估计; E、抽样误差大小用标准差表示 抽样误差指的是 C A、个体值和总体参数值之差; B、个体值和样本统计量值之差; C、样本统计量值和总体参数值之差; D、不同的总体参数值之差; E、相同总体个体测量值之差 习惯上,下列属于小概率事件的为 D A、P=0.09; B、 P=0.10; C、P=0.15; D、P=0.03; E、以上都不是 下列分类资料属等级资料的是: D A、季节(春、夏、秋、冬) B、职业(工人、农民、专业技术人员、干部、个体工商户) C、血型(A型、B型、AB型、O型); D、学历(文盲、小学、初中、高中、大专及以上); E、居住地(陕北、关中、陕南 概率是描述某随机事件发生可能性大小的数值,以下对概率的描述哪项是错误的 E A、其值的大小在0和1之间; B、当试验次数n充分大时,频率近似为概率; C、随机事件发生的概率小于0.05或0.01时,可认为在一次试验中它不可能发生; D、必然事件发生的概率为1; E、其概率值是概率分布曲线下界值的尾部面积 1.简述常见的资料类型,并举例说明。
答:计数资料(身高、体重、血压)、计量资料(血型的分布)、等级资料(病人治疗效果:如痊愈、好转、恶化或死亡) 2. 简述什么是误差,什么是抽样误差? 答:误差是指测量测得的量值减去参考量值或一个量的观测值或计算值与其真值之差,可分为随机误差、系统误差及非系统误差(过失误差)。其中随机误差影响因素众多,大小变化无规律、无方向性;
系统误差受确定因素影响,大小变化有方向性;
非系统误差(过失误差)指研究者偶然失误而造成的误差。抽样误差是样本统计量与总体参数的差异。抽样误差是指:抽样误差是指:在同质总体中,随机样本统计量与总体参数的差异。
2、计量质料统计描述 2、1 集中趋势指标 集中趋势的描述是指使用平均数这一指标体系来描述一组变量值的集中趋势或平均水平。在本知识点中,我们将学习算术均数、几何均数和中位数这三个常用的集中趋势指标。要求同学们掌握这三个指标的计算以及各指标的适用条件,能够根据资料分布特征(正态或偏态分布)选择适当的集中趋势指标。
【单选题】 描述一组正态分布资料的集中程度,以( )指标较好。:A A、算术均数 B、几何均数 C、中位数 D、四分位数 E、百分位数 对成倍增长的计量资料描绘其集中趋势,宜用:
B A、算术均数 B、几何均数 C、中位数 D、方差 E、百分位数 血清学滴度资料最常用来表示其平均水平的指标是 C A、算术均数 B、中位数 C、几何均数 D、变异系数 E、标准差 哪种平均数指标受极端值的影响最小 B A、算术均数 B、中位数 C、几何均数 D、变异系数 E、标准差 偏态分布宜用以下哪个指标描述其分布的集中趋势 C A、算术均数 B、标准差 C、中位数 D、四分位数间距 E、方差 某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、l0、2、24+(小时),该食物中毒的平均潜伏期为( )小时。: C A、5 B、5.5 C、6 D、10 E、12 下面那一项分布的资料,均数等于中位数 E A、对数正态 B、左偏态 C、右偏态 D、偏态 E、正态 一组某病患者的潜伏期(天)分别是:2、5、4、6、9、7、10和18,其平均水平的指标该选 A A、中位数 B、算术均数 C、几何均数 D、平均数 E、百分位数 表示总体均数的符号是 B A、σ B、 μ C、X D、S E、M 中位数是第( )百分位数。
D A、5 B、10 C、25 D、50 E、75 论述算术均数、几何均数、中位数与百分位数的适用范围 答:常用的描述集中趋势的指标有: 算术均数、几何均数及中位数。①算术均数,简称均数,反映一组观察值在数量上的平均水平,适用于对称分布,尤其是正态分布资料;
②几何均数: 用G表示,也称倍数均数,反映变量值平均增减的倍数, 适用于等比资料,对数正态分布资料;
③中位数: 用M 表示,中位数是一组观察值按大小顺序排列后,位置居中的那个观察值。它可用于任何分布类型的资料,但主要应用于偏态分布资料,分布不明资料或开口资料 2、 2离散趋势指标 要全面刻画一组数据(变量值)的数据特征,除了计算反映数据平均水平的指标外,还需计算反映变异程度的指标。离散趋势指标可用来描述数据的变异大小。在本知识点中,我们将学习极差、四分位数间距、方差与标准差、变异系数这四个离散趋势指标。要求同学们掌握这四个指标的计算以及各指标的适用条件,能够根据资料分布特征(正态或偏态分布)选择适当的离散趋势指标。
【单选题】 描述一组正态分布资料的离散程度,以( )指标较好。
C A、极差 B、离均差 C、标准差 D、离均差平方和 E、变异系数 若比较身高、身体质量资料的变异度,宜用 D A、标准差 B、离均差 C、四分位数间距; D、变异系数 E、极差 以均数和标准差可以全面描述哪种类型资料的特征 C A、正偏态分布 B、负偏态分布 C、正态分布 D、对称分布 E、对数正态分布 各观察值均加(或减)同一数后 B A、均数不变,标准差改变 B、均数改变,标准差不变 C、两者均不变 D、两者均改变 E、以上都不对 各观察值同乘以一个不等于0的常数后,不变的是 E A、算术均数 B、标准差 C、几何均数 D、中位数 E、变异系数 均数与标准差之间的关系是 E A、标准差越大,均数代表性越好 B、标准差越小,均数代表性越差 C、均数越大,标准差越小 D、均数越大,标准差越大 E、标准差越小,均数代表性越好 描述一组偏态分布资料的变异度,以( )指标较好。
D A、全距 B、标准差 C、变异系数 D、四分位数间距 E、方差 比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是 D A、全距 B、标准差 C、方差 D、变异系数 E、极差 变异系数CV的数值 C A、一定大于1 B、一定小于1 C、可以大于1,也可小于1 D、一定小于标准差 E、一定小于均数 某总体含有n个个体,今测得n个个体某定量指标的数值,计算总体标准差时,其自由度应为 B A、n-1 B、 n C、 n-2 D、n+1 E、n+2 论述极差、四分位数间距、标准差及变异系数的适用范围 答:均为计量资料的离散趋势指标。极差可用于任何分布的数据;
四分位数间距可用于任何分布的数据,特别适用于偏态分布的数据;
标准差适用于正态分布或近似正态分布的数据;
变异系数用于观察值单位不同时变异大小的比较,或均数相差悬殊时变异大小的比较。
2、3正态分布 正态分布是一种最常见、最重要的连续型随机变量分布,德国数学家Gauss将正态分布应用于天文学研究使其广为人知,所以正态分布又称为Gauss分布。在本知识点中,我们将学习正态分布的定义、正态分布的特征、正态分布的变换(标准正态分布)以及正态分布的应用。要求同学们掌握正态分布的特征和标准正态分布的相关知识。
【单选题】 正态分布 E A、其均数与几何均数相等 B、其均数与中位数不相等 C、其中位数与几何均数相等 D、其均数、中位数、几何均数均不相等 E、其均数、中位数、几何均数均相等 若X服从均数为μ,标准差为σ的正态分布,则X的第99百分位数等于 D A、 μ+1.64σ B、μ+1.96σ C、μ-2.32σ D、μ+2.58σ E、μ+2.33σ 正态分布有两个参数μ与σ,( ) 相应的正态曲线的形状越扁平。
C A、μ越大 B、μ越小 C、σ越大 D、σ越小 E、以上都不对 正态曲线下、横轴上,从均数-1.96倍标准差到均数的面积为 ( )。
D A、95% B、45% C、97.5% D、47.5% E、 50% 描述一组正态分布资料的统计学特征,以( )指标较好 C A、均数、中位数 B、 均数、四分位数间距 C、均数、标准差 D、极差、变异系数 E、离均差、几何均数 ,若则两曲线( ) D A、位置与形态均相同 B、位置与形态均不同 C、形态不同,位置相同 D、曲线向右平移 就是曲线 E、 曲线比曲线陡峭 若x~N(10,4),X为来自该总体的随机样本(n=16),则X服从( ) A A、N (10, 1) B、 N (10, 2) C、N (10, 0.25) D、N (10, 0.5) E、自由度为15的 t 分布 设随机变量X的概率密度为,若要将X转化为服从标准正态分布的变量u,则所采用的标准化变换为 C A、 B、 C、 D、 E、 标准正态分布的均数与标准差分别为 A A、0与1 B、 1与0 C、0与0 D、1与1 E、以上都不正确 标准正态分布曲线下中间95%的面积所对应的横轴u值的范围是 B A、-1.64到+1.64 B、-1.96到+1.96 C、-2.58到+2.58 D、-∞到1.96 E、 -1.96到+∞ 1、试论述正态分布、标准正态分布及对数正态分布的联系和区别 答:正态分布:原始值不需转换;
属于对称分布类型;
用µ表示集中趋势的指标;
均数与中位数的关系是µ=M(中位数)。标准正态分布:作u转换;
属于对称分布类型;
集中趋势µ=0;
均数与中位数的关系是µ=M。对数正态分布:作对数转换;
属于正偏态分布;
集中趋势用G(几何均数表示);
均数与中位数的关系是µ>M。
论述正态分布的面积分布规律 答:正态分布曲线与X轴所成的面积恒等于1或100%。区间μ±1.96的面积为95%,区间μ±2.58的面积为99%。
2、4医学参考值范围 医学参考值是指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标常数。由于存在个体差异,生物医学数据并非常数而是在一定范围内波动,所以采用医学参考值范围作为判定正常和异常的参考标准。在本知识点中,我们将学习医学参考值范围的基本概念和制定医学参考值范围的两种方法:正态分布法和百分位数法。要求同学们掌握医学参考值范围的基本概念和两种制定方法,能够根据资料分布特征(正态或偏态分布)选择制定方法。
【单选题】 某指标的均数为,标准差为S。(-1.96S,+1.96S)计算出来的区间,常称为( B )。
A、99%参考值范围 B、95%参考值范围;
C、 90%参考值范围 D、 99%可信区间 E、 95%可信区间 【单选题】下列关于医学参考值范围描述中,不正确的是(B)。
A、排除了有关疾病等因素对所研究指标有影响的正常人的解剖、生理、生化等数据的波动范围;
B、没有任何疾病的人的解剖、生理、生化等数据的波动范围;
C、习惯确定90%、95%或99%的医学参考值范围;
D、根据专业知识确定取单侧界限或双侧界限;
E、资料为正态分布时,可用正态分布法进行计算。
【单选题】已知正常成人的95%参考值范围是90-140毫米汞柱。现测的某人的收缩压为144毫米汞柱,则(E )。
A、人一定不是高血压 B、人是高血压的概率低于0.05 C、人是高血压的概率高于0.05 D、人是高血压的概率为0.05 E、上答案都不对 【单选题】某年在某地随机抽取100名健康女性,算得其血清总蛋白含量的均数为74g/L,标准差为4g/L,则其95%参考值范围估计为( B )。
A、74±4×4 B、74±1.96×4 C、74±2.58×4 D、74±2.58×4÷10 E、74±1.96×4÷10 5【单选题】确定某指标的医学参考值范围时,其正常人是指(D )。
A、从未患过病的人 B、只患过小病但不影响被研究指标的人 C、健康状况良好的人 D、排除了影响被研究指标的疾病或因素的人 E、排除了患过某病或某因素的人 6【单选题】若正常成人的血铅含量X近似服从对数正态分布,现拟用300名正常人血铅值确定正常人的99%参考值范围,最好采用公式( D )计算。(其中Y=lgX) D A、X+2.58S B、X+2.33S C、 D、 E、 7【判断题】用百分位数法确定铅作业工人血铅值的95%参考值范围,其上限应为P95。
:
√ 8【判断题】正常成年男子红细胞计数近似正态分布,95%参考值范围为3.60~5.84(×1012/L)。若一名成年男子测得红细胞计数为3.10(×1012/L),则该男子一定有病。
:× 9【判断题】医学参考值范围的单侧和双侧问题需要根据医学专业知识而定。√ 10【判断题】 对于1-α的医学参考值范围,1-α的正常人该指标分布在此范围内。
√ 医学中参考值范围的确定原则和方法是什么? 答:原则:1、确定同质的参照总体:一般选择“正常人”——指排除了影响所研究指标的疾病和有关因素的同质人群;
2、选择足够例数的参照样本,一般要求n>100;
3、控制检测误差,统一测定标准;
4、选择单、双侧界值,依据专业知识确定;
5、权衡假阳性率和假阴性率,选择适当的百分数范围;
6、计算参考值范围。方法:1、正态分布法:适用于服从或近似服从正态分布的资料,或偏态分布资料经变量变换(取对数、倒数等)服从或近似正态分布;
2、百分位数法:服从偏态分布的资料。
3、 总体均数的估计与建设检验 3、1抽样误差与标准误 由于存在个体差异,抽得样本的均数往往并不太可能等于总体均数,因此通过样本推断总会有误差。这种由个体变异产生、随机抽样造成的样本统计量与总体参数之间的差异称为抽样误差。抽样误差不可避免或消除,其产生的根本原因是生物个体的变异性,而这种变异性是广泛存在的,但是抽样误差的分布是有一定规律。本节主要讲授抽样误差的概念并通过抽样实验来描述抽样误差的分布规律。抽样误差是统计学中一个很重要的概念,是很多假设检验方法的基础,需要重点掌握。
1【单选题】抽样的目的是( )。
A、研究样本统计量 B、由样本统计量推断总体参数 C、研究典型案例 D、研究总体统计量 E、研究特殊个体特征 我的答案:B 2【单选题】标准差越大的意义,下列认识中错误的是( )。
A、观察个体之间变异越小 B、观察个体之间变异越大 C、样本的抽样误差可能越大 D、样本对总体的代表性可能越差 E、样本均数的代表性越差 我的答案:A 3【单选题】 控制抽样误差可采用( )。
A、减少样本含量 B、增大样本标准差 C、增大样本含量 D、减少样本标准差 E、控制总体变异 我的答案:C 4【单选题】 描述了 A、所有观察值对总体均数的离散程度 B、所有含量相同的样本均数对总体均数的离散程度 C、某个样本均数的离散程度 D、某些样本均数对总体均数的离散程度 E、样本观察值的离散程度 我的答案:B 5【单选题】关于随机抽样,下列哪一项说法是正确的 ( ) A、研究者在抽样时应精心挑选个体,以使样本更能代表总体 B、抽样时应使得总体中的每一个个体都有同等的机会被抽取 C、按照研究者的意愿随意抽取个体 D、为确保样本具有更好的代表性,样本量应越大越好 E、通过随机抽样获得的样本都具有很好的代表性 我的答案:B 6【单选题】 在常用的几种抽样调查中,其抽样误差的大小关系一般是( )。
A、整群抽样小于分层抽样 B、系统抽样大于简单随机抽样 C、整群抽样大于简单随机抽样 D、简单随机抽样小于最优分配分层随机抽样 我的答案:C 7【单选题】 用于描述均数的抽样误差大小的指标是 A、S B、S/ C、CV D、R极差 E、 我的答案:B 8【单选题】下面有关标准误的叙述中正确的是() A、标准误就是总体参数的标准差 B、标准误描述了样本内数据间的差异 C、总体均值越大,标准误越大 D、样本均值越小,标准误越大 E、标准误反应了自同一总体中抽取的相同样本量的样本指标间的波动程度 我的答案:E 9【单选题】一般而言在下列抽样方法中抽样误差最小的是( )。
A、 整群抽样 B、 系统抽样 C、 配额抽样 D、 分层抽样 E、 单纯随机抽样 我的答案:D 10【多选题】 关于抽样误差下列说法正确的是( ) A、表现为同一总体的多个样本均数不同 B、可以通过严密的实验设计消除 C、产生的原因是个体差异 D、与样本含量成反比 E、可用标准误估计其大小 我的答案:ACE 11【多选题】在有关标准误与抽样误差的表述中,正确的是() A、标准误就是样本统计量的标准差 B、标准误能反应抽样误差大小 C、标准误反应了总体才参数的波动情况 D、标准误样本统计量的波动情况 E、标准误越小,抽样误差越大 我的答案:ABD 标准差和标准误有何区别和联系?什么情况下用标准差?什么情况下用标准误? 答:区别:①概念不同;
标准差是描述观察值(个体值)之间的变异程度;
标准误是描述样本均数的抽样误差;
②用途不同;
标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误用于估计参数的可信区间,进行假设检验等。③它们与样本含量的关系不同:当样本含量n足够大时,标准差趋向稳定;
而标准误随n的增大而减小,甚至趋于0 。
联系:标准差,标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。
3、2 t分布 t分布(t-distribution)是一种重要的统计分布,由威廉·戈塞特于1908年首先发表,当时他还在都柏林的健力士酿酒厂工作。因为公司规定不能以他本人的名义发表,所以论文使用了学生(Student)这一笔名,因此也称为Student-t分布。在医学统计学中,t-分布经常应用在对呈正态分布的总体的均值进行估计或者对两样本均数进行显著性检验。在样本量比较大时(如超过60)时,可以应用u检验,但样本量较小时会产生很大的误差,需要应用t检验。
1【单选题】在有关t分布的下列表述中错误的是() A、以0为中心,左右对称 B、曲线下面积为1 C、自由度不同,t分布的形状也不同 D、分布与标准正态分布差别不大 E、自由度越小,t分布两侧尾部的面积较标准正态分布越大 我的答案:D 2【单选题】 当n=50,a=0.05时,(50)=( ) A、1.676 B、2.009 C、2.403 D、1.299 我的答案:A 3【单选题】关于以0为中心的t分布,错误的是( ) A、t分布图是一族曲线 B、t分布图是单峰分布 C、t分布图以0为中心,左右对称 D、相同自由度时,越大,P值越大 我的答案:D 4【单选题】t分布有( )个参数? A、 3 B、2 C、 1 D、4 我的答案:C 5【多选题】在有关t分布与标准正态分布的描述中,正确的是() A、t分布与标准正态分布都是对称分布 B、当样本量充分大时,t分布近似于标准正态分布 C、自由度越小,t分布与标准正态分布在两侧尾部的差异越小 D、自由度越小,t分布与标准正态分布在两侧尾部的差异越大 E、t分布与标准正态分布类似,中位数、均数、众数三者重合 我的答案:ABDE 6【判断题】自由度一定时,p与t成反比。
我的答案:√ 7【判断题】概率(p)一定时,自由度与t成反比。
我的答案:√ 8【判断题】标准正态分布是t分布的特例。(对) 我的答案:√ 1、 标准正态分布与t分布的区别和联系? 答:联系:随着自由度增大t分布趋近于标准正态分布;当n>30时二者相差很小;当n→∞时二者重合 区别:①正态分布是与自由度无关的一条曲线 t分布是依自由度而变的一组曲线.② t分布较正态分布顶部略低而尾部稍高. 2、 u分布与t分布有何不同? 答:不同点:t分布是一簇分布曲线,t分布的曲线的形状是随自由度的变化而变化,t分布的极限分布是标准正态分布。U分布曲线以0为中心,左右两侧完全对称,不受自由度影响。
3、3总体均数的估计 总体均数是一个总体指标(参数),而参数的估计方法有两种,一种是点估计,另外一种是区间估计。点估计就是用样本统计量直接估计总体参数。而区间估计是按预先给定的概率(1-α)所确定的包含未知总体参数的一个范围。该范围称为参数的可信区间或置信区间。本节讲授总体均数的区间估计方法,即借助t分布或u分布给未知的总体均数确定一个可能的范围。重点内容是总体均数可信区间的计算和可信区间的确切涵义。
1【单选题】统计中所说的总体是指( )。
A、根据研究目的而确定的同质的个体子全部 B、根据地区划分的研究对象的全体 C、根据时间划分的研究对象的全体 D、随意想象的研究对象的全体 E、根据人群划分的研究对象的全体 我的答案:A 2【单选题】正态分布有两个参数与,()相应的正态曲线的形状越扁平。
A、越大 B、越大 C、越小 D、越小 E、以上都不对 我的答案:B 3【单选题】( )小,表示用该样本均数估计总体均数的可靠性大。
A、 变异系数 B、标准差 C、 标准误 D、极差 我的答案:C 4【单选题】以下关于参数点估计的说法正确的是( ) A、CV越小,表示用该样本估计总体均数越可靠 B、标准误越小,表示用该样本估计总体均数越准确 C、标准误越大,表示用该样本估计总体均数的可靠性越差 D、σ越小,表示用该样本估计总体均数越可靠; E、样本含量越大,参数估计越精确 我的答案:C 5【单选题】提高区间估计精度的本质方法是() A、增大置信度 B、减少置信度 C、增大样本含量 D、减少样本含量 E、精心选择样本,控制样本数据间的变异 我的答案:C 6【单选题】 上述公式中,可用来估计均数可信区间的是() A、Mx±1.96SMx B、Mx±2.58S C、x±1.96SMx D、x±1.96S E、Mx±2.58SMx 我的答案:A 7【单选题】参数估计的置信度为1-α的置信区间表示() A、以1-α的可能性包含了未知总体参数真值的区间 B、以α的可能性包含了未知总体参数真值的区间 C、总体参数取值的变动范围;抽样误差的最大可能范围 D、总体参数以1-α的可能性被该区间包含 我的答案:A 8【多选题】在有关区间估计的表述中,正确的是() A、标准误越小,区间估计的精度越好 B、标准误越小,区间估计的精度越差 C、可信度越大,估计的区间精度越好 D、可信度越大,估计的区间精度越差 E、区间估计的精度由标准误与可信度决定 我的答案:ADE 均数的可信区间与参考值范围有何不同? 答:含义不同:总体均数的可信区间是总体均数的所在范围,是按预先给定的概率,确定的包含未知总体均数的可能范围。参考值范围是个体值的波动范围,是绝大多数“正常人”生理生化、解剖学某项指标的波动范围。
用途不同:总体均数的可信区间用于总体均数的区间估计。参考值范围表示绝大多数观察对象某项指标的分布范围,医学诊断时判断个体某项指标是否正常。
3、4假设检验的基本原理 从总体中随机抽样,由样本信息推断总体特征,除参数估计方法之外,在实际应用中还会遇到这样的问题:某一样本均数是否来自于某已知均数的总体?两个不同样本均数是否来自均数不等的两个总体?要解决这类问题,可以采用假设检验。假设检验过去称为显著性检验。它是利用小概率反证法的思想,从问题的对立面出发间接判断要解决的问题。即在假设H0成立的条件下计算检验统计量,然后根据某种分布获得P值来判断。本节以单样本t检验为例讲授假设检验的基本原理和步骤。弄清这个基本原理,再学习其它的假设检验方法时就会很容易理解。
1【单选题】 由两样本均数的差别推断两总体均数的差别,H0:μ1=μ2,H1:μ1≠μ2;
现差别的假设检验结果为P<0.05,从而拒绝H0,接受H1,则( )。
A、第一类误差小于5% B、H0成立的可能性小于5% C、第二类误差小于5% D、H1成立的可能性大于95% 我的答案:B 2【单选题】( )时,应作单侧检验。
A、已知A药优于B药 B、已知A药不会优于B药 C、不知A药好还是B药好 D、已知A药与B药疗效差不多 E、A药与B药疗效相同 我的答案:B 3【单选题】 两样本均数比较时,在其他条件相同情况下,下列四种选择中,()时检验效能最大。
A、α=0.05,n1=n2=20; B、α=0.01,n1=n2=30; C、α=0.05,n1=n2=30; D、α=0.01,n1=n2=20; E、α=0.01,n1=20,n2=30; 我的答案:C 4【单选题】在对总体参数的假设检验中,若给定显著性水平a(0 A、 a B、 1-a C、 a/2 D、 不能确定 我的答案:A 5【单选题】进行假设检验的目的是( ) A、 判断样本统计量间的差异仅仅是抽样引起的还是总体原本就不相同 B、 由样本统计量估计总体参数 C、 确定发生该观察结果的概率 D、 计算统计量 E、 以上都不对 我的答案:A 6【单选题】在两均数u检验中,其无效假设为( )。
A、 两个总体均数不同 B、两个样本均数不同 C、两个总体均数相同 D、两个样本均数相同 E、两个总体位置不同 我的答案:C 7【单选题】假设检验中,显著性水平a表示( ) A、 接受H0但是H0为伪 B、无具体含义;
C、置信度为a D、拒绝H0但H0为真 我的答案:D 8【多选题】关于假设检验,下列那些说法是错误的( )。
A、 单侧检验优于双侧检验 B、 采用配对t检验还是成组t检验是由实验设计方法决定的 C、 检验结果若P值大于0.05,则接受H0犯错误的可能性很小 D、 用t检验进行两样本总体均数比较时,要求方差齐性 E、 用u检验进行两样本总体均数比较时,要求方差齐性 我的答案:ACE 9【判断题】进行两均数差别的假设检验时,当P≤0.05时,则拒绝H0;
当P>0.05时,则接受H0,认为两总体均数无差别。
我的答案:× 1、 假设检验中,和P的区别何在? 答:和P均为概率,其中是指拒绝了实际上成立的H0所犯错误的最大概率,是进行统计推断时预先设定的一个小概率事件标准。P值是由实际样本获得的,在H0成立的前提条件下,出现等于及大于(或/和等于及小于)现有样本获得的检验统计量值的概率。在假设检验中通常是将P与对比来得到结论,若P≤,则拒绝H0,接受H1,有统计学意义,可以认为……不同或不等;
否则,若P>,则不拒绝H0,无统计学意义,还不能认为 ……不同或不等。
2、 假设检验和区间估计有何联系? 答:主要联系:a.都是根据样本信息推断总体参数;
b.都以抽样分布为理论依据,建立在概率论基础之上的推断;
c.二者可相互转换,形成对偶性。
3、 假设检验时,一般当p<0.05时,则拒绝H0,理论依据是什么? 答:P值为H0成立的条件下,比检验统计量更极端的概率,即大于等于检验统计量的概率。当P≤0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于0.05,因为小概率事件几乎不可能在一次试验中发生,所以拒绝H0。下差别“有统计学”意义的结论的同时,我们能够知道可能犯错误的概率不会大于0.05,也就是说,有了概率保证。
3.5 t检验 计量资料的假设检验中,最为简单、常用的方法就是t检验(t-test)。常见的t检验的类型有三类:单样本t检验、配对样本t检验和两样本t检验。单样本t检验用于已知样本均数(代表未知总体均数)与已知总体均数进行比较,配对样本t检验用于配对设计,两样本t检验是最常用的一种t检验形式,通过比较两个样本均数来推断两个总体均数是否不相等。在应用t检验的时候要注意它们的适用条件:单样本t检验要求样本来自正态总体,配对t检验要求差值服从正态分布,两样本t检验要求两个样本均来自正态总体,且两总体方差相等。
1【单选题】在样本含量为n的单样本t检验中,自由度应该是( )。
A、n B、n-1 C、n-2 D、2n-1 E、2n-2 我的答案:B 2【单选题】在进行成组设计的 t检验之前,要注意两个前提条件,一是各样本是否来自正态总体,二是( )。
A、核对数据 B、做方差齐性检验 C、求和 D、作变量变换 E、处理缺失值 我的答案:B 3【单选题】下列关于t检验的说法中,正确的是( ) A、用于两样本均数比较时,要求两样本方差相等 B、用于两样本均数比较时,若P小于0.05,说明两样本均数不同 C、用于两样本均数比较时,t值越大说明两总体均数差异越大 D、 P值越小两总体均数差别越大 E、 P值越小拒绝的理由越充分 我的答案:E 4【单选题】在两样本比较的t检验中,无效假设是( )。
A、 两样本均数不等 B、 两样本均数相等 C、 两总体均数不等 D、 两总体均数相等 E、 两样本中位数相等 我的答案:D 5【单选题】两独立样本比较的t检验可用哪种设计类型的方差分析来替代( )。
A、完全随机设计 B、随机区组设计 C、两种设计都可以 D、AB都不行 我的答案:A 6【单选题】在配对样本t检验中,自由度应该是( ) 。
A、2n-2 B、对子数-1 C、2n-1 D、n-1 E、n 我的答案:B 7【单选题】对于配对t 检验和成组设计t 检验,下列哪一种说法是错误的( ) A、配对设计的资料如果做成组t 检验,不但不合理,而且平均起来统计效率降低 B、成组设计的资料用配对t 检验,不但合理,而且平均起来可以提高统计效率 C、成组设计的资料,无法用配对t 检验 D、作配对 t检验或成组 t检验,应根据原始资料的统计设计类型而定 E、成组设计的资料不能用配对t 检验 我的答案:B 8【判断题】在t检验,如果|t|>1.96,则拒绝H0。
我的答案:√ 9【判断题】t检验是对两样本均数的差别作统计检验的方法之一。
我的答案:× 10【判断题】t检验可用于同一批对象的身高与体重均数差别的统计检验。
我的答案:× 1、 怎样正确选用单侧检验还是双侧检验t检验? 答:结合相关专业知识和具体分析目的而确定,实际工作中一般认为双侧检验较保守和稳妥,如无特殊说明,常采用双侧检验。
2、 什么是配对设计?在医学研究中存在哪些形式?如何使配对研究设计得更好? 答:配对设计是将受试对象按某些特征或条件配成对子(非随机),然后把每对中的两个受试对象随机分配到实验组和对照组(或不同处理组)。配对设计情形:①两同质受试对象分别接受两种不同的处理;
②同一受试对象分别接受两种不同处理;
③同一受试对象处理前后。设立平行对照显示处理的作用,可使配对研究设计得更好。
3.6 I型错误与II型错误 假设检验采用小概率反证法的思想,根据P值作出的推断结论具有概率性,无论拒绝还是不拒绝H0,都可能犯错误。I型错误:“实际无差别,但下了有差别的结论”。也叫假阳性错误或称“弃真”错误,用a表示。II型错误是“实际有差别,但下了无差别的结论”。也叫假阴性错误或称“取伪”错误,用b表示。实际工作中H0是否成立我们并不知道,但是在下结论的时候我们只有两个选择,拒绝H0,只可能犯I型错误;
“接受”H0,只可能犯II型错误。在假设检验过程中,我们只控制了I型错误a的大小,II型错误β的大小是未知的,因此,在假设检验的过程中不能下接受H0的结论,因为没有概率保证。而只能说不拒绝H0 1【单选题】下述( )为第一类错误的定义。
A、拒绝实际上并不成立的H0 B、受实际上并不成立的H0 C、拒绝实际上成立的H0 D、接受实际上成立的H0 E、拒绝实际上并不成立的H1 我的答案:C 2【单选题】假设检验的第Ⅱ类错误是指( ) A、正确,检验结果接受 B、正确,检验结果拒绝 C、正确,检验结果接受 D、正确,检验结果拒绝 E、Ⅱ类错误的大小为??9.png 我的答案:D 3【单选题】两样本均数比较时,以下检验水准中第二类错误最小的是( ) A、=0.05 B、=0.01 C、=0.15 D、=0.025 E、=0.20 我的答案:E 4【单选题】符合t检验条件的数值变量资料如果采用秩和检验,不拒绝H0时( )。
A、 第一类错误增大 B、 第二类错误增大 C、 第一类错误减少 D、 第二类错误减少 E、 第一类错误和第二类错误均减少 我的答案:C 5【单选题】在样本容量n固定的条件下( ) A、 缩小显著性水平,就扩大了拒绝域,从而增加犯Ⅰ型错误的可能性 B、 缩小显著性水平,可缩小拒绝域,从而减少犯Ⅰ型错误的可能性 C、 缩小显著性水平,可缩小拒绝域,从而增加犯Ⅰ型错误的可能性 D、 要同时减少两类错误是不可能的 我的答案:B 6【单选题】假设检验时,若增大样本容量,则犯两类错误的概率( ) A、 都增大 B、 都减小 C、 都不变 D、 一个增大一个减小 我的答案:B 7【单选题】在假设检验中,由于抽样的偶然性,拒绝了实际上成立的H0假设,则( ) A、 犯Ⅰ类错误 B、 犯Ⅱ错误 C、 推断正确 D、 A,B都有可能 我的答案:A 8【判断题】只要增加样本含量到足够大,就可以避免I和II型错误。
我的答案:× 9【判断题】两样本均数差别作同样的假设检验,无效假设成立与否所犯II型错误的概率相等。
我的答案:× 1、 I型错误与II型错误有何区别和联系?了解这两类错误有何实际意义? 答:I型错误是拒绝实际上成立的HO所犯的错误,其概率最大值是α;
II型错误是不拒绝实际上不成立的HO 所犯的错误,其概率为β。样本含量一定时,减少α会引起β增大;
减小β会引起α增大;
若要同时减小α和β,只有增加样本含量。关于α和β的具体数值,需根据实际问题预先做出选择。
4、方差分析 4.1 方差分析的基本思想已完成 方差分析(又称F检验)是计量资料的假设检验方法之一,尤其是对于处理因素具有两个以上水平数的研究,如果数据满足正态性和方差齐性条件,一般采用方差分析比较均数的组间差异。方差分析将全部观测值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差外,每个部分的变异可由某个因素的作用(或几个因素的交互作用)加以解释。通过比较不同变异来源的均方,借助F分布,推论研究因素对实验结果的影响。不同设计类型的变异分解项目不同。
1【单选题】各组数据的( )时,不可直接作方差分析。
A、均数相差较大 B、中位数相差较大 C、n相差较大 D、变异系数相差较大 E、方差相差较大 我的答案:E 2【单选题】方差分析时组内变异表现为( )。
A、 不同处理组个体测量值与组均数不同 B、 不同处理组的组均数不同 C、 各组均数与总均数不同 D、 个体测量值与总均数不同 E、 各组个体测量值均不相同 我的答案:A 3【单选题】两样本均数的比较,可用( )。
A、方差分析 B、t检验 C、q检验 D、方差分析与t检验均可 E、u检验 我的答案:D 4【单选题】单因素方差分析中,当P<0.05时,可认为( )。
A、各样本均数都不相等 B、各总体均数不等或不全相等 C、各总体均数都不相等 D、各总体均数相等 我的答案:B 5【单选题】对于不满足方差分析条件的资料,可以通过( )进行组间差别的假设检验。
A、均数多重比较 B、选用非参数检验方法 C、q检验 D、t检验 E、变量变换,使资料满足方差分析的要求 我的答案:D 6【单选题】 在方差分析中,()反映的是样本数据与其组平均值的差异。
A、总离差 B、组间误差 C、抽样误差 D、组内误差 我的答案:D 7【多选题】方差分析的前提条件是( )。
A、各个总体服从正态分布 B、各个总体均值相等 C、各个总体具有相同的方差 D、各个总体相互独立 我的答案:ACD 8【多选题】 若检验统计量F近似等于1,说明( )。
A、组间方差中不包含系统因素的影响 B、 组内方差中不包含系统因素的影响 C、. 组间方差中包含系统因素的影响 D、 方差分析中应拒绝原假设 E、. 方差分析中应接受原假设 我的答案:ABD 9【多选题】以下说法中正确的是( )。
A、方差分析时要求各样本来自相互独立的正态总体 B、方差分析时要求各样本所在总体的方差相等 C、方差除以其自由度就是均方 D、完全随机设计的方差分析时,组内均方就是误差均方 E、以上都正确 我的答案:ABD 不同设计类型资料方差分析的主要区别是什么?在交叉设计、重复测量设计、析因设计等其它多因素设计类型中,总变异是如何分解的? 答:首先,计算总变异;
然后,计算处理产生的变异。最后,用总变异减去处理产生的变异即误差变异。在单因素完全随机设计中,处理产生的变异即水平组间变异。
4.2 完全随机设计资料的方差分析 如果实验分组采用完全随机化方法,实验结束后用方差分析比较各组均数之间差别的统计学意义,则将所有观察值总的离均差平方和SS总分解为包含处理因素效应的组间离均差平方和SS组间 和只反映随机误差的组内离均差平方和SS组内,总的自由度也进行同样的分解,并得到各部分的均方MS。比较MS组间与MS组内,得到检验统计量F值。查F分布界值表,根据界值与F值的相对大小,决定是否拒绝零假设。
1【单选题】方差分析结果,F处理>F组内 ,则统计推论是( )。
A、 各总体均数不全相等 B、 各总体均数都不相等 C、 各样本均数不全相等 D、 各样本均数间差别都有显著性 E、 根据现在资料,还不能拒绝H0 我的答案:A 2【单选题】完全随机设计方差分析中的组间均方是( )的统计量。
A、表示随机误差(含个体差异和测量误差)作用的指标 B、表示某处理因素的效应作用大小 C、表示某处理因素的效应和随机误差两者综合影响的结果 D、表示数据的离散程度 E、表示抽样误差的大小 我的答案:C 3【单选题】 完全随机设计方差分析中,计算F统计量,其分子与分母的自由度各为( )。
A、r, n B、 r-n, n-r C、 r-1,n-r D、 n-r , r-1 我的答案:C 4【单选题】完全随机设计资料的方差分析中,备择假设是( C )。
A、几组样本均数不相 B、几组样本均数不全相等或不相等 C、几组总体均数不等或不全相等 D、几组总体均数相等 E、以上均不正确 我的答案:C 5【单选题】完全随机设计资料的方差分析中,必然有( )。
A、 SS组内 B、 MS组间 C、 MS总=MS组间+MS组内 D、 MS组间>MS组内 E、 SS总=SS组间+SS组内 我的答案:E 6【单选题】三个样本均数比较方差分析的应用条件是( )。
A、样本为正态分布, B、总体为正态分布, C、样本为正态分布, D、总体为正态分布, E、满足上述条件之一即可 我的答案:D 7【单选题】完全随机设计方差分析F值的计算公式( )。
A、SS组间/SS组内 B、MS组内/ MS组间 C、 MS组间/MS组内 D、 MS组间/ SS组间 我的答案:C 8【判断题】完全随机设计方差分析是采用完全随机化的分组方法。
我的答案:√ 9【判断题】对于非正态分布或/和方差不齐的资料,可以采用完全随机设计方差分析。
我的答案:× 完全随机设计方差分析与成组设计资料t检验有什么异同和关系?如何正确选择使用? 答:完全随机设计方差分析可以用于两样本及以上样本之间的比较。成组设计资料T检验用于完全随机设计两样本均数的比较,推论两样本均数所代表的两总体均数是否不等。
联系:二者均要求各组样本来自正态分布总体的随机样本,各组的总体方差相等(方差齐性)。当分组g=2时,选用成组设计资料T检验、完全随机设计方差分析,二者作用相等。当g大于2时,选用完全随机设计方差分析 4.3 随机区组设计资料的方差分析 如果实验分组时实施了配伍或配对,实验结束后用方差分析比较各组均数之间差别的统计学意义,则将SS总分解为包含处理因素效应的SS处理间、包含配伍因素作用的SS区组间和只反映随机误差的MS误差,总的自由度也进行同样的分解,并得到各部分的MS。比较MS处理间与MS误差,得到检验统计量F值。查F界值表,根据界值与F值的相对大小,决定是否拒绝零假设,判断处理因素所导致的组间差异是否具有统计学意义。
1【单选题】随机区组设计的方差分析中,必然有( )。
A、SS处理>SS区组 B、 MS处理>MS区组 C、MS总=MS处理+MS区组+MS误差 D、SS总=SS处理+SS区组+SS误差 E、MS处理>MS误差 我的答案:D 2【单选题】完全随机设计、随机区组设计的SS及自由度各分解为几部分( )。
A、 2,2 B、 2,3 C、 2,4 D、 3,3 我的答案:B 3【单选题】完全随机设计与随机区组设计相比较( )。
A、随机区组设计的变异来源比完全随机设计分得更细 B、随机区组设计的误差一定小于完全随机设计 C、完全随机设计的效率高于随机区组设计 D、两组设计试验效率一样 E、以上说法都不对 我的答案:A 4【判断题】随机区组设计是配对设计。
我的答案:× 5【判断题】当g=2时,随机区组设计方差分析与配对设计资料的t检验等价。
我的答案:√ 6【判断题】随机区组设计是配对设计。(错) 我的答案:× 7【判断题】当g=2时,随机区组设计方差分析与配对设计资料的t检验等价。
我的答案:√ 1. 随机区组设计方差分析与配对设计t检验是什么关系?如何正确选择使用? 答:随机区组设计是将处理因素分为g个水平(处理组),根据非处理因素将实验单位配成b个区组,每一区组中的g个观察单位随机分配到各处理组。当g=2时,随机区组设计资料方差分析的结果与配对设计资料的t检验等价。当g=2时为配对设计,当g≥3为随机区组设计。根据处理因素分的组数来选择。
2. 从检验效能看,随机区组设计是否优于完全随机设计?为什么?在选择使用这两种设计方法时,应该考虑哪些因素? 答:随机区组设计优于完全随机设计,理由:完全随机设计为单因素设计,仅考虑处理因素。随机区组设计为双因素设计,考虑的因素有处理因素、区组因素,通过区组来控制可能的非处理因素或者混杂因素,且在进行方差分析时将区组变异从总的变异中分解出来,则当确实存在区组效应时,由于从误差项分离了区组变异,使方差分析过程中减少了非处理因素或混杂因素引起的偏倚变异,减少了误差而提高了检验效率。选择使用这两种设计方法时,考虑是否存在区组因素(客观存在、会影响实验结果)。
4.4 多个样本均数间的多重比较 如果方差分析拒绝了零假设,只能说明各组的总体均数不全相等。为了进一步了解哪两个均数不等,需进行多个样本均数间的两两比较或多重比较,不能重复使用两样本均数比较的t检验,以免加大犯Ⅰ类错误的概率。多重比较的方法很多,其中LSD-t检验适用于在专业上有特殊意义的一对或几对样本均数间的比较;
Dunnett-t检验适用于各实验组与对照组均数的比较;
SNK-q检验适用于多个样本均数两两之间的全面比较。
1【单选题】四个样本均数经方差分析后,P<0.05,为进一步弄清四个均数彼此之间有无差别,须进行( )。
A、检验 B、q检验 C、u检验 D、t检验 E、Dunnett-t检验 我的答案:B 2【单选题】多个样本均数之间两两比较宜作( )。
A、LSD-t检验 B、SNK-q检验 C、Dunnett-t检验 D、检验 我的答案:B 3【单选题】某一对或几对在专业上有特殊价值的均数间差别的比较宜作( )。
A、LSD-t检验 B、SNK-q检验 C、Dunnett-t检验 D、检验 我的答案:A 4【单选题】多组均数的两两比较中,若不用q检验而用t检验,则( ) 。
A、结果更合理 B、会把一些无差别的总体判断为有差别的概率加大 C、会把一些有差别的总体判断为无差别的概率加大 D、以上都不对 我的答案:B 5【单选题】多个实验组与一个对照组均数差别的多重比较宜作( )。
A、LSD-t检验 B、SNK-q检验 C、Dunnett-t检验 D、检验 我的答案:C 6【判断题】4个均数作差别的统计检验,可以分别作两两比较的6次t检验以作详细分析。
我的答案:× 7【判断题】多个样本均数间的多重比较如采用t检验则会加大犯二类错误的概率。
我的答案:× 1. 为什么在方差分析的结果为拒绝H0,接受H1之后,对多个样本均数的两两比较要用多重比较的方法? 答:因为多组均数的比较若采用两样本均数比较的t检验,会加大I型错误 5、计数资料的统计描述 5.1 常用相对数 常用的相对数指标有比、比例和率三种。两个有关指标之比称为比(ratio),或称相对比;
当比的分子是分母的一部分时,称为比例(proportion),或称结构相对数;
当比例与时间有关系时称为率(rate),或称强度相对数。在应用中有时习惯将某些比例指标称为率,如患病率、治愈率等。
1【单选题】计算麻疹疫苗接种后血清检查的阳转率,分母是( ) A、 麻疹患者数 B、麻疹疫苗接种数 C、 麻疹易感人群 D、麻疹疫苗接种后的阳转人数 我的答案:B 2【单选题】比较两个率时,不需要进行率的标准化的情况有( ) A、未知各年龄别人口数 B、缺乏各年龄别死亡人口 C、不易寻找标准人口构成 D、内部构成相同 我的答案:D 3【单选题】一种新的治疗方法可以延长生命,但不能治愈该疾病,则会发生以下那种情况( ) A、 患病率增加 B、患病率减少 C、发病率增加 D、发病率减少 我的答案:A 4【单选题】反映某一事件发生强度的指标应选用( ) A、 构成比 B、 变异系数 C、绝对数 D、 率 我的答案:D 5【单选题】 反映事物内部组成部分的比重大小应选用( ) A、 构成比 B、 变异系数 C、绝对数 D、 率 我的答案:A 6【单选题】 计算某地某年肺癌发病率,其分子应是( ) A、 该地体检发现的肺癌患者 B、该地某年新发生肺癌患者 C、该地某年就诊肺癌患者 D、该地某年新老肺癌患者 我的答案:B 7【单选题】在使用相对数时,容易犯的错误是( ) A、 将构成比当作率看待 B、 将构成比当作相对比看待 C、 将率当作相对比看待 D、 将标化率当作构成比看待 我的答案:A 8【单选题】某地2016年肝炎发病人数占当年传染病发病人数的9.12%,该指标为( ) A、构成比 B、变异系数 C、绝对数 D、率 我的答案:A 9【单选题】以下说法正确的是( ) A、 样本含量足够大时,概率可以作为频率的估计值 B、 样本含量足够大时,频率可以作为概率的估计值 C、 样本含量足够大时,概率可以作为构成比的估计值 D、 样本含量足够大时,概率与频率可以互相转换 我的答案:B 10【单选题】 定基比和环比指标属于( )。
A、 构成比 B、 相对比 C、绝对数 D、 率 我的答案:B 应用常用相对数时需要注意哪些问题? 答:计算率和构成比时分母不宜过小。率反映的是事物的发生、发展强度;
构成比是内部构成,总和为100%。
5.2率的标准化 当比较两组计数资料时,如果其内部各小组率明显不同,且各小组观察例数的构成比,如年龄、性别、病情轻重等也明显不同时,直接比较两个合计率是不合理的。这时,需要对两组资料进行率的标准化后再比较。
常见的标准化方法有直接标准化法和间接标准化法。标准化后的标准化率并不能反映当地的实际水平,只是表示相互比较的资料见的相互水平。两样本标准化率存在抽样误差,当样本含量较小时,还应做假设检验 1【单选题】已知男性的钩虫感染率高于女性。欲比较甲、乙两乡居民的钩虫总感染率。但甲乡人口女性多于男性,则适当的比较方法是( ) A、分性别进行比较 B、 两个率比较的卡方检验 C、不具可比性,不能比较 D、 对性别进行标准化后再比较 我的答案:D 2【单选题】要比较甲乙两厂某工种工人的某种职业病患病率的高低,采取标准化法的原理是( ) A、假设两厂的工人数相同 B、 假设两厂患职业病的工人数相同 C、假设两厂职业病的患病率相同 D、假设两厂的某工种工人的工龄构成比相同 我的答案:D 3【单选题】某广告称“在服用本制剂的100名肠道感染的人群中,有97人在48小时内症状缓解”。以此推断本药治疗肠道感染是有效的。这个推断( ) A、 不正确,因为所做的比较不是按率算的 B、 不正确,因为未设对照组或对比组 C、 不正确,因为未作统计学假设检验 D、 不正确,因为症状并没有完全被治愈 我的答案:B 4【单选题】要比较甲乙两厂某供认某种矽肺患病率的高低,对工龄进行标准化,其标准构成的选择是( ) A、 甲乙工人的年龄构成 B、 甲乙两场合并的工人的工龄构成 C、当地较稳定人口的年龄构成 D、 甲乙两厂合并的工人的年龄构成 我的答案:B 5【单选题】标准化死亡比SMR是指( ) A、 实际死亡数/预期死亡数 B、 预期死亡数/实际死亡数 C、 实际发病数/预期发病数 D、预期发病数/实际发病数 我的答案:A 6【单选题】经调查得知,甲乙两地的恶性肿瘤粗死亡率均为89.93/10万,但经标准化后,甲地恶性肿瘤的死亡率为82.74/10万,乙地为93.52/10万,发生此现象最有可能的原因是( ) A、 乙地的恶性肿瘤防治工作做的比甲地好 B、 甲地的老年人口在总人口中所占的比例比乙地多 C、 乙地的老年人口在总人口中所占的比例比甲地多 D、 甲地诊断技术比乙地更高 我的答案:C 请以实例说明为什么使用率的标准化法,以及直接标准化法和间接标注化法的区别。
答:某医院用A、B两种疗法治疗某病, 对象有普通型和重型两类患 者,病人数和治愈数分别如表39所示,试比较这两种疗法的治愈率。关键在于,这两个治疗组病人的病型分布有很大不同,A疗法组的 普通型病人多于重型病人,B疗法组相反,普通型病人少于重型病人, 两个治疗组的粗治愈率无可比性。这时就必须克服两组治疗对象病型分布不同的困难,办法之一就是 标准化法。若要对比的两组对象内部构成的差别足以影响结论时,需要对率进行标准化。
直接法:已知被观察人群中各年龄组的患病率等资料,适用于两组资料中某事物发生率的互相对比。
间接法:适用于仅已知各年龄组的观察单位数和总患病率的资料医学教育|网编辑整理。
6、 几种离散型变量的分布 6.1二项分布已完成 在概率论和统计学中,二项分布是n个独立的是/非试验中成功的次数的离散概率分布。事实上,单次是/非试验称为伯努利试验。详细地说,在每次试验中只有两种可能的结果,两种结果发生与否互相对立、相互独立,并且与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保持不变。这样重复n次独立的伯努利试验则是二项分布。
在医学领域中,有很多随机事件服从二项分布,例如:病人治疗结果的有效与无效,某种化验结果的阳性与阴性,接触传染源后感染与未感染等。通过二项分布,我们可以计算疾病的发生率、治愈率,比较干预措施的疗效、研究非遗传性疾病的家族聚集性等。
1【单选题】某人群中某疾病发生的阳性数X服从二项分布,则从该人群随机抽出n个人,阳性数X不少于k人的概率为( ) A、 P(k)+P(k+1)+…+P(n) B、P(k+1)+ P(k+2)+…+P(n) C、P(1)+ P(2)+…+P(k) D、P(0)+ P(1)+…+P(K) 我的答案:A 2【单选题】某常规药物治疗非传染性疾病的有效率为0.70,今改用一种新药治疗该疾病患者10人,发现9人有效,则( ) A、新药优于常规药物 B、常规药物优于新药 C、两者疗效相同 D、尚不能认为新要疗效优于常规治疗 我的答案:D 3【单选题】某学者再对某湖沼地区做钉螺感染血吸虫的流行病学研究中,收集钉螺标本2000只,将其分成200个群,每群10只。经检验,这200群中发现120个群是阳性群,则该地区钉螺的血吸虫感染率是( D ) A、40% B、10.87% C、20% D、0.5% 我的答案:D 4【单选题】对于二项分布图片其对应的样本率P近似正态分布的条件是( D ) A、 B、或 C、 D、且图片 我的答案:D 5【单选题】以下说法正确的是( )。
A、当图片接近1或0时,二项分布图形是近似对称的 B、当图片时,二项分布的图形是偏态的 C、随着图片的增大,二项分布近似正态分布 D、当n>200时,二项分布近似正态分布 我的答案:B 在某项对45-50岁男性人群胃癌发病情况的调查研究中,甲地调查了8000人,胃癌患者42人,乙地调查了7600人,胃癌患者25人。请问甲乙两地的发病率是否可比?哪个地区的发病率较高? 答:进行率的标化后,甲乙两地的发病率数值可比的 ;
甲地发病率较高 6.2泊松分布已完成 Poisson分布可以看作是二项分布的一种极限情况,即总体率很小,很样本含量(试验次数)趋于无穷时,二项分布近似于poisson分布。Poisson分布是描述稀有时间发生规律的一种重要分布。医学上,它可以用来研究单位时间、空间内罕见时间发生次数的分布,如单位溶剂内细菌数、罕见非传染性疾病的发病程度等。
1【单选题】Poisson分布的标准差和均数的关系是 A、 B、 C、 D、 我的答案:C 2【单选题】用计数器测得某放射性物质10分钟内发出的脉冲数为500个,据此可估计该放射性物质平均每分钟脉冲计数的95%可信区间为( ) A、 B、 C、 D、 我的答案:B 3【单选题】 随机变量X服从以为参数的Poisson分布,其方差为,则Poisson分布近似正态分布的条件是( ) A、接近0或1 B、较小 C、π接近0.5 D、 我的答案:D 4【单选题】当n很大,二项分布在下列条件下可用Poisson分布近似( )。
A、 B、 C、 D、 我的答案:A 5【单选题】以下说法错误的是( ) A、当n很大,且π很小,nπ=时,二项分布近似poisson分布 B、当≥20时,poisson分布近似正态分布 C、poisson分布具有可加性 D、对于m个服从Poisson分布且互相独立的随机变量,其均数也服从poisson分布 我的答案:D 简述poisson分布、二项分布、正态分布之间的联系。
答:当 n 足够大,p 足够小,二项分布逼近泊松分布,λ=np,一个被广泛接受的经验法则是如果 n≥20,p≤0.05,可以用泊松分布来估计二项分布值。
至于正态分布是一个连续分布 当实验次数 n 再变大,几乎可以看成连续时二项分布和泊松分布都可以用正态分布来代替。
7、 卡方检验 7.1卡方检验的基本思想 卡方检验以卡方分布为理论基础,是计数资料组间比较的基本方法。卡方检验通过比较实际频数偏离理论频数的程度,来判断是否接受无效假设,深入理解卡方检验的基本思想是正确应用的基础。本知识点,我们首先介绍卡方检验的用途及卡方分布的特点,然后以两个率的比较为例,介绍卡方检验的基本思想及卡方统计量的计算,要求同学们掌握理论频数及卡方统计量的计算,掌握卡方检验的具体应用,为后续内容的学习及应用打下基础。
1【单选题】已知治疗某病的新方法的疗效不会低于常规疗法,为确定新方法可否取代常规疗法,试验者将两疗法进行平行观察后,应选择( )。
A、卡方检验; B、t检验; C、方差分析; D、单侧检验; E、双侧检验 我的答案:D 2【单选题】为了了解某药对嗜酸性白细胞的影响程度,试验者观察到如下结果:用药前血检时计数125颗白细胞,其中嗜酸性白细胞数为42颗;
用药后血检时计数118颗白细胞中嗜酸性白细胞数为22颗。为了检验用药前后嗜酸性白细胞变动是否有显著性意义,可选用( )。
A、对计量资料的t检验; B、对计数资料的卡方检验; C、样本率比较的卡方检验; D、F检验; E、秩和检验 我的答案:C 3【单选题】分布的形状( )。
A、同正态分布; B、同t分布; C、为对称分布; D、与样本含量n有关; E、与自由度υ有关 我的答案:E 4【单选题】甲乙两篇文献都是研究同样药物的疗效,甲文观察结果为χ2>χ20.01,1,乙文的观察结果为χ2>χ20.05,1,因此可认为( )。
A、两文的研究结果有矛盾,结论不相同; B、两文的结论是一致的 C、甲文的结论更可信赖 D、乙文的结论更可信赖 E、甲文的治疗效果较乙高 我的答案:B 5【单选题】两样本率比较,,P>0.05,在α=0.05水准处接受H0,此结论的含义为( C )。
A、根据现有的资料,有充足理由认为两总体率相等 B、根据现有的资料,有充足理由认为两样本率相等 C、根据现有的资料,没有充足理由认为两总体率不相等 D、根据现有的资料,没有充足理由认为两样本率不相等 E、根据现有的资料,没有充足理由认为两总体率相等 我的答案:C 6【单选题】两样本率比较,χ2>χ20.05,1,P<0.05,在α=0.05水准处拒绝H0,接受H1,此结论的含义为( )。
A、根据现有的资料,有充足理由认为两总体率不相等; B、根据现有的资料,有充足理由认为两样本率不相等; C、根据现有的资料,没有充足理由认为两总体率相等; D、根据现有的资料,没有充足理由认为两样本率相等; E、根据现有的资料,没有充足理由认为两总体率不相等 我的答案:A 7【单选题】χ2检验中,计算χ2值时必须用( )。
A、率 B、绝对数 C、相对数 D、比 E、以上都不对 我的答案:B 8【单选题】卡方检验中自由度的计算公式是( ) A、行数×列数 ; B、n-1 C、N-k D、(行数-1)(列数-1); E、行数×列数-1 我的答案:D 9【单选题】作四格表卡方检验,当N>40,且( )时,应该使用校正公式。
A、T<5 B、T>5 C、T<1 D、T≥5 E、1<T<5 我的答案:E 10【单选题】若X2≥X2 0.05,(ν)则( )。
A、P≤0.05 B、P≥0.05 C、P<0.05 D、P=0.05 E、P>0.05 我的答案:A 11【单选题】对四格表资料做卡方检验时,如果将四个表的行与列对调,则对调前后的 A、校正卡方值不等;
B、非校正卡方值不等;
C、确切概率检验的P值不等;
D、非校正卡方值相等;
E、非校正卡方值可能相等,也可能不等 我的答案:D 12【单选题】χ2 的取值范围( )。
A、—∞<χ2 <+∞;
B、χ2≤1;
C、0<χ2<∞χ2≥1;
D、—∞<χ2 <0 我的答案:C 13【单选题】 分布只有一个参数自由度υ,当( )时,χ2 分布趋近于正态分布。
A、自由度趋近于无穷大时; B、自由度趋近于无穷小时;
C、自由度为0;
D、自由度为1 我的答案:A 行乘列表资料卡方检验的基本思想?卡方分布的特点有哪些? 答:基本思想:若检验假设H0 成立,则实际频数与理论频数相差不应该很大,因而算出的卡方值也不会很大,即出现较大卡方值的概率P很小。若P≤α,则可认为A与T的差别已超出了抽样误差可以解释的范围,即有理由怀疑H0 的正确性,继而拒绝H0,接受其对立假设H1,即π1≠π2.若P>α,则尚无充分理由拒绝H0.分布特点:曲线下面积大于1,自由度一定时,P值越小,卡方值越大;
当P值一定时,自由度越大,卡方值越大。
7.2 四格表卡方检验 进行两个样本率比较时,我们常用卡方检验。两个率比较时,资料可以整理成四格表形式,因此,两个率的比较也称作四格表资料的卡方检验。本知识点,我们将通过两个率比较的实例,介绍卡方检验的基本步骤及连续型校正的条件和方法,要求同学们掌握两个率比较卡方检验的步骤、统计量的计算及校正的条件,掌握四格表资料卡方检验的基本公式、专用公式和校正公式,以便在实际运用中正确选择。
1【单选题】四格表的自由度( )。
A、不一定等于1 B、一定等于1 C、等于行数×列数 D、样本量减1 E、以上都不对 我的答案:B 2【单选题】当四格表的周边合计不变时,如果某格的实际频数有变化,则其理论频数( )。
A、增大 B、减小 C、不变 D、不确定 我的答案:C 3【单选题】乙法一致的检出率为35%,问两种方法何者为优? ( )。
A、不能确定 ; B、甲、乙法一样; C、甲法优于乙法 D、乙法优于甲法 我的答案:A 4【单选题】用两种方法检查已确诊的乳腺癌患者120例,甲法检出率为60%,乙法检出率为50%,甲乙两法一致的检出率为35%,则调整为四格表后,表中的d值(即两法均未检出者)为 ( )。
A、30 B、18 C、24 D、48 E、42 我的答案:A 5【单选题】四格表χ2检验的基本公式的适用条件是 A、A>5 B、T>5; C、T>5且n≥40 D、A>5且n≥40; E、以上都不对 我的答案:C 6单选题】四格表χ2检验的自由度为1,是因为四格表的四个理论频数( )。
A、受一个独立条件限制; B、受二个独立条件限制; C、受三个独立条件限制; D、四个独立条件限制; E、受任何限制 我的答案:C 7【单选题】对于总合计数为500的5个样本率的资料作χ2检验,其自由度为( )。
A、 499 B、496 C、1 D、4 E、9 我的答案:D 8【单选题】对四格表资料作卡方检验,对调四格表的行与列,则对调前后( )。
A、非校正卡方值不等; B、校正卡方值不等; C、确切概率法的P值不等; D、非校正卡方相等; E、非校正卡方可能相等,也可能不等 我的答案:D 9【单选题】四格表χ2检验的基本公式的适用条件是( )。
A、A>5 B、T>5 C、T>5且n≥40 D、A>5且n≥40; E、以上都不对 我的答案:C 10【单选题】当四格表资料需要进行连续性校正,而未校正时( )。
A、所得到的χ2 偏小; B、会增大犯第Ⅰ类错误的概率; C、会增大犯第Ⅱ类错误的概率; D、结论不会有改变 E、无法确定 我的答案:B 11【单选题】四格表中四个格子基本数字是( )。
A、两个样本率的分子和分母; B、两个构成比的分子和分母; C、两对实测数和理论数; D、两对实测阳性绝对数和阴性绝对数; E、两对理论数 我的答案:D 12【单选题】 在两样本率比较的X2检验中,无效假设(H0)的正确表达应为( )。
A、μ1≠μ2 B、μ1=μ2 C、π1=π2 D、π1≠π2 E、B=C 我的答案:C 13【单选题】用两种方法检查某疾病患者120名,甲法检出率为60%,乙法检出率为50%,甲、乙法一致的检出率为35%,问两种方法何者为优? ( )。
A、不能确定 B、甲、乙法一样 C、甲法优于乙法 D、乙法优于甲法 我的答案:A 两个率比较时,在哪些情况下要进行连续型校正?为什么? 答:如果理论数T<5但T≥1,并且n≥40,用连续性校正的卡方进行检验;
因为频数分布是不连续的,因此计算的卡方值也是不连续的,而卡方界值表是依据卡方分布,是连续的,若不进行校正,查界值表获得的P会偏小,会增加I型错误的风险。
7.3 配对卡方检验 计数资料的配对设计在医学领域应用较多,常用于进行两种检测方法、两种诊断方法、两种培养方法等的比较,目的是评价两种方法诊断结果、检测结果及培养结果的一致性,对于此类设计的分析方法应采用配对四格表资料的卡方检验,而不能用四格表资料的卡方检验。本知识点,我们首先介绍了配对四格表资料卡方检验的基本思想,然后介绍了配对四格表资料卡方检验及应用中应注意的问题,要求同学们掌握配对四格表资料卡方检验的过程及注意事项。
1【单选题】本来是配对四格表卡方检验的资料,误作一般四格表卡方检验,则( )。
A、本来差别无显著性,可能判断为差别有显著性; B、本来差别有显著性,可能判断为差别无显著性; C、可能增大第Ⅰ类错误概率; D、第Ⅰ类错误和第Ⅱ类错误概率不变; E、可能减小第Ⅱ类错误概率 的答案:B 2【单选题】假定两种方法检测结果的假阳性率和假阴性率都很低。现有50份血样用甲法检查阳性25份,用乙法检查阳性35份,其中两法同为阳性和阴性的分别为23和13份。为检验两种方法检查结果之间的差别是否有显著性意义,应选用( )。
A、配对t检验; B、2×3表卡方检验; C、配对卡方检验; D、u检验; E、四格表卡方检验 我的答案:C 3【单选题】配对卡方检验的备择假设:( )。
A、B=C B、B≠C C、P1=P2 D、P1≠P2 E、β1≠β2 我的答案:D 4【单选题】作配对χ²检验时,得到0.05<P<0.01,则意味着该结论( )。
A、犯第Ⅰ类错误的概率小于5%; B、犯第Ⅰ类错误的概率大于5%; C、犯第Ⅱ类错误的概率小于5%; D、犯第Ⅱ类错误的概率大于5%; E、犯第Ⅱ类错误的概率小于1% 我的答案:A 5【单选题】配对卡方检验四格表自由度是:( )。
A、1 B、 3 C、 4 D、 2 我的答案:A 6【单选题】配对卡方检验的校正公式:( )。
A、 x2=(b-c)2/b+c B、 x2=((b-c)-1)2/b+c C、 x2=(b+c)2/b-c D、x2=((b+c)-1)2/b-c 我的答案:B 7【单选题】某学校抽样检查两个年级学生的乙肝表面抗原,资料如下:
调查人数 阳性人数 甲年级 15 0;
乙年级 31 4;
用的统计分析方法为( )。
A、四格表卡方检验 ; B、秩和检验; C、直接概率计算法 ; D、不能检验; E、不必检验 我的答案:C 8【单选题】当比较下表两药治愈率时,进行卡方检验,所选用的方法( )。
疗效 甲药 乙药 合计 治愈 21 9 30 未愈 14 0 14 合计 35 9 44 A、 四格表卡方检验; B、连续性校正卡方检验; C、直接概率计算法; D、不能检验; 我的答案:C 9【单选题】分析四格表时通常在什么情况下需要用Fisher确切概率法( )。
A、T<1或n<40; B、T<5; C、 1≤T<5且n≥40; D、 T≤1或n≤100; E、1≤T<5 我的答案:A 10【多选题】分析四格表时,不是Fisher精确概率法的应用条件( )。
A、1<T<5; B、n>40; C、 T<5; D、 T>5; E、T<1; 我的答案:ABCD 11【多选题】四格表如有一个实际频数为0,下列说法错误的是( )。
A、就不能作χ2检验; B、不能决定是否可作χ2检验; C、定可作χ2检验; D、用校正χ2和确切概率法为宜; E、只能计算确切概率 我的答案:ABC 12【多选题】Fisher确切概率描述正确的是:( )。
A、当实际频数<1时,无法计算确切概率 B、当理论频数<1 时可采用计算fisher 确切概率 C、直接计算出有利于拒绝H0的概率就为Fisher确切概率 D、校正卡方检验和fisher确切概率法检验把握度相同 我的答案:BC 13【多选题】使用四格表χ2检验校正的条件是( ) ,而在( )条件下,应取Fisher确切概率法的计算结果为宜。
A、n≥40且有1≤T<5; B、N<40或T<1; C、1≤T<5; D、N<40 我的答案:AB 配对四格表资料卡方检验在医学领域有哪些应用? 答:两种检测方法、两种诊断方法、两种培养方法等的比较,目的是评价两种方法诊断结果、检测结果及培养结果的一致性,对于此类设计的分析方法应采用配对四格表资料的卡方检验. 7.4 行乘列表卡方检验 在进行四格表资料卡方检验时,当样本量小于40,或者理论频数小于1,P接近检验水准时,需进行Fisher概率检验,Fisher概率法的理论依据是超几何分布,它已经超出了卡方检验的范畴,是对卡方检验的补充。本知识点,我们首先介绍了Fisher概率法的基本思想,然后通过实例介绍了Fisher概率的基本过程,要求同学们掌握Fisher概率法的应用条件及其注意事项,掌握计算的基本过程。
1【单选题】R×C表χ2检验的自由度为( )。
A、R-1. B、C-1. C、R×C-1 D、(R-1)*(C-1) E、(R×C)-2 我的答案:D 2【单选题】行×列表χ2检验应注意( )。
A、任一格理论数小于5则要用校正公式; B、任一格理论数小于5则要用校正公式; C、任一格理论数小于5则将相应组合并; D、任一格实际数小于5则将相应组合并; E、以上都不对 我的答案:E 3【单选题】R×C列联表χ2检验的自由度是( )。
A、R-1 ; B、C-1 ; C、R×C-1 ; D、R×C-1 E、(R-1)(C-1) 我的答案:E 4【单选题】样本率与总体率差别的假设检验可用( )。
A、四格表X2 检验; B、四格表直接概率计算法; C、秩和检验; D、由样本率计算总统率的可信区间来判断; E、t检验 我的答案:D 5【单选题】作两样本率比比较的χ2检验时,得到0.05<P<0.01,则意味着该结论( )。
A、犯第Ⅰ类错误的概率小于5%; B、犯第Ⅰ类错误的概率大于5%; C、犯第Ⅱ类错误的概率小于5%; D、犯第Ⅱ类错误的概率大于5%; E、犯第Ⅱ类错误的概率小于1%; 我的答案:A 6【单选题】甲乙两篇文献都是研究同样药物的疗效,甲文观察结果为χ2>χ20.01,1,乙文的观察结果为χ2>χ20.05,1,因此可认为( )。
A、两文的研究结果有矛盾,结论不相同;两文的结论是一致的; B、甲文的结论更可信赖; C、乙文的结论更可信赖 ; D、甲文的治疗效果较乙高 我的答案:C 7【单选题】两样本率比较,χ2<χ20.05,1,P>0.05,在α=0.05水准处接受H0,此结论的含义为( )。
A、根据现有的资料,有充足理由认为两总体率相等;根据现有的资料,有充足理由认为两样本率相等; B、根据现有的资料,没有充足理由认为两总体率不相等; C、根据现有的资料,没有充足理由认为两样本率不相等; D、根据现有的资料,没有充足理由认为两总体率相等 我的答案:C 8【单选题】两样本率比较,χ2>χ20.05,1,P<0.05,在α=0.05水准处拒绝H0,接受H1,此结论的含义为( )。
A、根据现有的资料,有充足理由认为两总体率相等;根据现有的资料,有充足理由认为两样本率相等; B、根据现有的资料,没有充足理由认为两总体率不相等; C、根据现有的资料,没有充足理由认为两样本率不相等; D、根据现有的资料,没有充足理由认为两总体率相等 我的答案:A 9【单选题】对于总合计数为200的4个样本率的资料作χ2检验,其自由度为( )。
A、 199;
B、 196;
C、 1;
D、 3;
E、 9 我的答案:D 10【单选题】做5个样本率的χ2 检验时,每组样本量均为50,其自由度为( )。
A、249;
B、246;
C、1;
D、4 我的答案:D 两个率比较时在哪些情况下要进行Fisher确切概率法检验?其理论基础是什么? 答:当出现n<40或T≤1,或用其他检验方法所得的概率接近检验水准时,用四个表的确切概率法。其基本思想:在四个表周边合计频数固定不变的条件下,变动4个格子内的实际频数,列出所有可能组合的四格表。各组合四格表的概率服从超几何分布,计算超几何分布尾部累计概率,依据预先设定的检验水准,做出统计推断结论。
7.5 多重比较 在进行多个样本率比较,两组或多组构成比比较时,资料可整理成多行多列,称为行乘列表,此时的组间比较应采用行乘列表资料的卡方检验,行乘列表资料卡方检验的基本思想和过程与四格表资料卡方检验的相同。本知识点,我们通过实例介绍了多组率比较的卡方检验、多组构成比比较的卡方检验,以及行乘列表资料卡方检验的注意事项,要求同学们掌握行乘列表资料卡方检验的基本公式和通用公式,以及应用时的注意事项,以便在实际应用时能够根据资料类型和分析目的,正确选择分析方法。
1【单选题】卡方检验多个试验组进行两两比较,自由度α'怎么计算( )。
A、 B、 C、α'= K(K-1)α/2 D、2α-1 我的答案:B 2【单选题】当多个样本率比较的 检验,推断结论为拒绝 H0,接受H1 时,要进一步推断哪两个总体率有差别用那种方法:( )。
A、直接用四格表资料的 检验进行多重比较 B、分割法把R×2表分割成多个独立的四格表进行两两比校正检验水准α C、不能比较 D、分割法把R×2表分割成多个独立的四格表进行两两比较,检验水准α 不变 我的答案:B 3【单选题】卡方检验多组比较时的无效假设为:( )。
A、μ1≠μ2 B、μ1≠μ2 C、Cπ1=π2; D、πi≠πj 我的答案:D 4【单选题】四个样本率做比较,χ2>χ20.05,(3),可认为( )。
A、各样本率不相等 B、各样本率相等 C、各总体率均不相等 D、各总体率相等 我的答案:C 5【单选题】当多个样本率比较的 χ2检验,推断结论为拒绝 H0,接受H1 时,可认为:( )。
A、多个样本总体率不同,多个样本总体率两两不同 B、多个样本总体率相同,多个样本总体率两两不同 C、多个样本总体率相同 D、多个样本总体率不同,个样本两两总体率不一定不同 我的答案:D 6【单选题】多个样本率比较时,若多次用两两比较的χ2 检验( )。
A、会增大犯第Ⅰ类错误的概率 B、降低犯一类错误的概率 C、增大犯二类错误概率 D、 降低犯二类错误概率 我的答案:A 7【多选】5个样本率作比较,χ2>χ20.01,4,则在α=0.05的检验水准下,下列说法不正确的是( )。
A、各总体率不全等; B、各总体率均不等; C、 各样本率均不等; D、各样本率不全等; E、至少有两个总体率相等 我的答案:BC 8【多选题】多个样本率比较的χ2验,可选用下列公式计算χ2( )。
A、χ2 =Σ(A-T)2/T; B、χ2 =(ad-bc)2 n/(a+b) (c+d)(a+c)(b+d) ; C、χ2=N(ΣA2/nrnc-1); D、χ2=(|b-c|-1)2/b+c; E、χ2 =(|ad-bc|-2/n)2 n/(a+b) (c+d)(a+c)(b+d) 我的答案:ACD 对于有序分类资料进行统计分析时,如何进行统计分析方法的选择? 答:两组或多组计量资料的比较1.两组资料:1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验2.多组资料:1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。
7、6多个样本率比较的卡方检验 当多个样本率比较的卡方检验,推断结论为拒绝 H0,接受H1时,要进一步推断哪两个总体率有差别,若直接用四格表资料的 χ2检验进行多重比较,将会加大犯Ⅰ类错误的概率,此时可采用卡方分割法进行多重比较。本知识点,我们通过实例介绍了不同分析目的时,卡方分割法的检验水准的不同校正方法,要求同学们掌握卡方分割法的基本步骤及检验水准的矫正目的和方法。
多个样本率比较时,为什么要进行多重比较?多组构成比较时,如何进行多重比较? 答:当多个样本率比较的卡方检验,推断结论为拒绝 H0,接受H1时,要进一步推断哪两个总体率有差别,若直接用四格表资料的 χ2检验进行多重比较,将会加大犯Ⅰ类错误的概率,此时可采用卡方分割法进行多重比较。
8、 非参数检验 8.1非参数检验基本概念 非参数检验是一类重要的假设检验方法。本知识点介绍了秩转换的非参数检验相关的几个重要概念、非参数检验与参数检验的特点以及非参数检验的适用场合。要求重点掌握秩转换的过程以及非参数检验的适用场合。
非参数检验与参数检验有什么区别? 答:参数检验是针对参数做的假设,非参数检验是针对总体分布情况做的假设,这个是区分参数检验和非参数检验的一个重要特征。
参数检验和非参数检验的本质区别:
1.参数检验要利用到总体的信息(总体分布、总体的一些参数特征如方差),以总体分布和样本信息对总体参数作出推断;
非参数检验不需要利用总体的信息(总体分布、总体的一些参数特征如方差),以样本信息对总体分布作出推断。
2.参数检验只能用于等距数据和比例数据,非参数检验主要用于记数数据。也可用于等距和比例数据,但精确性就会降低。
参数假设检验又称统计假设检验,是一种基本的统计推断形式,也是数理统计学的一个重要的分支,用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
非参数检验是统计分析方法的重要组成部分,它与参数检验共同构成统计推断的基本内容。参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。
1【单选题】两小样本比较的假设检验,首先考虑( ) A、t检验; B、秩和检验; C、t检验或秩和检验 D、资料符合t检验条件还是秩和检验条件 ; E、u检验 我的答案:D 2【单选题】某试验者同时用A、B两种测声计在同一时间内同时测定了10个场地的噪声,现选用秩和检验,对两种测声计的测定结果做出检验,此时H0假设为( ) A、差值的总体均数为0; B、差值的总体中位数为0; C、μA=μB; D、两总体分布位置相同 E、两总体分布位置不同 我的答案:B 3【单选题】等级资料的比较宜用( ) A、t检验; B、χ2检验 C、秩和检验; D、F检验; E、u检验 我的答案:C 4【单选题】秩和检验与检验相比,其优点是( ) A、 计算更简便; B、公式更为合理; C、检验效能高; D、抽样误差小; E、不受分布限制 我的答案:E 5【单选题】随机单位组设计,如果资料方差不齐,应采用的检验方法为( ) A、 Wilcoxon秩和检验 ; B、 Kruskal-Wallis秩和检验; C、 Wilcoxon符号秩和检验 ; D、 Friedman秩和检验; E、Mann-Whitney U检验 我的答案:D 6【单选题】对两样本均数作比较时,已知n1、n2均小于30,总体方差不齐且分布呈偏态,宜用( ) A、 t检验 ; B、 u检验; C、 秩和检验; D、 F检验; E、 以上方法中任选一种 我的答案:C 7【单选题】下列何种情况时,两样本比较应选用非参数统计方法( ) A、 正态分布资料,n不相等; B、正态分布资料,两样本方差都比较大 ; C、 两组等级资料比较; D、两组百分比资料的比较 ; E、 以上都可以 我的答案:C 8【单选题】样本1,2,3,5,6,5,6,9中数据5的秩是( )。
A、 3.5 B、 4.5 C、 5.5 D、 6.5 E、 7.5 我的答案:B 9【单选题】某研究试验组用新药“胃灵丹”,对照组用公认的“胃苏冲剂”,并将胃炎患者分成三个年龄段,随机分配至新药组或对照组,现拟采用非参数检验,此时H0假设为( ) A、差值的总体均数为 0 B、差值的总体中位数为0 ; C、μA=μB; D、两总体分布位置相同 ; E、两总体分布位置不同 我的答案:D 10【多选题】对于统计分析中是否选用非参数统计方法,下列不正确的说法是( ) A、要根据研究目的和数据特征决定; B、 可在算出几个统计量后选择 ; C、看哪一个统计结论更符合专业要求; D、 看哪一个P值更小; E、 以上都可以 我的答案:BCDE 11【多选题】在统计检验中是否选用参数统计方法 A、要根据研究目的和数据特征作决定 ; B、可在算出几个统计量和得出初步结论后进行选择 ; C、要看哪个统计结论符合专业理论; D、要看哪个P值更小; E、只看研究目的 我的答案:BCDE 8.2 配对样本比较的Wilcoxon符号秩检验 当配对样本资料不满足配对t检验的条件时,适宜用配对样本比较的Wilcoxon符号秩检验进行假设检验,目的是推断配对样本差值的中位数和0是否有差别,或者推断单个样本中位数和总体中位数是否有差别。要求掌握Wilcoxon 符号秩检验的假设检验步骤,重点掌握秩转换、求秩和以及确定P值等关键环节。
配对设计资料在什么情况采用非参数检验? 答:当配对样本资料不满足配对t检验的条件(样本总体服从正态分布、方差齐性)时采用非参数检验。
1【单选题】配对比较的秩和检验的基本思想是:如果检验假设成立,则对样本来说( ) A、 正秩和的绝对值小于负秩和的绝对值; B、 正秩和的绝对值大于负秩和的绝对值; C、 正秩和的绝对值与负秩和的绝对值不会相差很大; D、 正秩和的绝对值与负秩和的绝对值相等; E、以上答案都不对 我的答案:C 2【单选题】设配对设计资料的变量值为X1和X2,则配对资料的秩和检验( ) A、 把X1和X2的差数绝对值从小到大编秩; B、 把X1和X2综合从小到大编秩; C、把X1和X2综合按绝对值从小到大编秩; D、 把X1和X2的差数从小到大编秩; E、把X1和X2的和值的绝对值从小到大编秩 我的答案:E 3【单选题】配对样本的Wilcoxon符号秩检验是( ) A、 按照差值大小进行比较 B、 按照差值大小排序 C、 按照差值绝对值大小排序 D、 按照差值绝对值大小比较 我的答案:C 4【单选题】配对设计的秩和检验中,其假设为( ) A、差值的总体均数为0; B、差值的总体中位数为0; C、μd≠0 ; D、Md≠0; E、以上都不对 我的答案:D 5【单选题】成组设计两样本比较(例数不等)的秩和检验,其检验统计量T是( )。
A、 以秩和较小者为T B、 以秩和较大者为T C、 以例数较小者秩和为T D、 以例数较大者秩和为T E、 取任意一个秩和为T均可 我的答案:C 6【单选题】配对设计的秩和检验中,其假设为( ) A、差值的总体均数为0; B、差值的总体中位数为0; C、μd≠0 ; D、Md≠0; E、 以上都不对 我的答案:D 8.3 两个独立样本比较的Wilcoxon秩和检验 Wilcoxon秩和检验用于推断计量资料或等级资料的两个独立样本所来自的总体的分布位置是否有差别。包括计量资料为原始数据的两样本比较、频数表资料和等级资料的两样本比较。适用于计量资料不满足两独立样本t检验的条件、计量资料频数表资料和等级资料组间强弱程度差别的比较。要求掌握Wilcoxon秩和检验的适用场合及假设检验步骤,理解其假设检验的基本思想。
两个独立样本比较的Wilcoxon秩和检验,当n1>10或者n2-n1>10时用u检验,这时检验是属于参数检验还是非参数检验,为什么? 答:两组比较的秩和检验,当n大时,秩和分布近似正态分布,此时不必要再编制比n更大的T检验界值表,而利用秩和分布随n增大渐近正态分布的性质,进行u检验,故仍属于非参数检验。
1【单选题】在进行成组设计两样本秩和检验时,以下检验假设正确的是( ) A、 H0:两样本对应的总体均数相同; B、H0:两样本均数相同; C、 H0:两样本对应的总体分布位置相同; D、H0:两样本的中位数相同; E、H0:两样本差值的中位数相同 我的答案:C 2【单选题】在进行Wilcoxon符号秩和检验时,以下备择假设(双侧)中正确的是 A、H1:两样本对应的总体均数不同; B、H1:样本的差数应来自均数为0的非正态总体; C、H1:两样本对应的总体分布不同; D、H1:两样本的中位数不同; E、H1:差值的总体中位数不为0 我的答案:E 3【单选题】对成组设计两样本比较的秩和检验,描述正确的是 A、将两组数据统一由小到大编秩; B、遇有相同数据,若在同一组,按顺序编秩; C、 遇有相同数据,若不在同一组,按顺序编秩; D、遇有相同数据,若不在同一组,取平均秩次; E、遇有相同数据,若在同一组,取平均秩次 我的答案:E 4【单选题】等级资料两样本比较的秩和检验,使用正态近似法在计算u值时,如相同秩次过多,应计算校正Uc值,校正的结果是 A、u值减小,P值减小; B、 u值增加,P值增加; C、 u值减小,P值增加; D、u值增加,P值减小; E、u值,P值不变 我的答案:D 5【单选题】成组设计两样本比较的秩和检验,其检验统计量T为 A、以秩和较小者为T ; B、以秩和较大者为T; C、 以例数较小者秩和为T ; D、以例数较大者秩和为T; E、当两样本例数不等时,可任取一样本的秩和为T 我的答案:C 6【单选题】两样本资料差别的秩和检验,用 A、Kruskal-Wallis法; B、 Wilcoxon法; C、Friedman法; D、Dilcoxon-Mann-Whitney法; E、 Nemenyi法 我的答案:B 7【单选题】两样本秩和检验的无效假设是 A、两样本秩和相等; B、两总体分布相等; C、两样本分布相同; D、两总体秩和相等; E、两总体分布不等 我的答案:B 8【多选题】在统计检验中,若无效假设是两总体分布相同,统计效能高的意思是指 A、对的无效假设容易被拒绝; B、错的无效假设容易被接受; C、对的备择假设容易被接受; D、错的备择假设容易被接受; E、以上都不对 我的答案:ACDE 9【多选题】3组比较的秩和检验,样本例数均为5,确定P值不应查 A、χ2 界值表; B、H界值表; C、 T界值表 D、 M界值表; E、以上均不可 我的答案:ACDE 10【多选题】以下检验方法除( )外,其余均属参数统计方法。
A、t检验 B、H检验; C、 M检验; D、χ2检验; E、符号秩和检验 我的答案:BCDE 8.4 多个独立样本比较的kruskal-wallis H 检验 kruskal-wallis H 检验用于推断计量资料或等级资料的多个独立样本所来自的多个总体的分布位置是否有差别。包括计量资料为原始数据的多个样本比较、频数表资料和等级资料的多个样本比较。适用于计量资料不满足方差分析的条件时的多个样本的组间比较,计量资料为频数表资料、等级资料多个样本组间强弱程度差别的比较。要求掌握kruskal-wallis H 检验的适用场合及假设检验步骤,理解其假设检验的基本思想。
1【单选题】按等级分组的资料作秩和检验时,如果用H值,而不用校正后的Hc值,则会 A、提高检验的灵敏度; B、会把一些无差别的总体推断成有差别; C、会把一些有差别的总体推断成无差别; D、第一、二类错误概率不变 ; E、以上都不对 我的答案:C 2【单选题】3组比较的秩和检验,样本例数均为5,确定P值应查 A、χ2 界值表; B、H界值表; C、T界值表; D、M界值表 ; E、以上均不可 我的答案:B 3【单选题】多个样本比较的等级资料宜采用 A、 Kruskal-Wallis法; B、Wilcoxon法; C、Friedman法; D、Wilcoxon-Mann-Whitney法; E、Nemenyi法 我的答案:A 4【单选题】多个样本比较的等级资料,无效假设H0:
A、多个样本率的总体分布位置相同 B、多个样本总体率不同 C、多个样本率总体分布位置不同 D、多个样本总体率位置相同 我的答案:A 5【单选题】 3组人的血浆总皮质醇的测定值资料如表所示:
欲检验3组人的血浆皮质醇含量有无区别,宜选用的方法是( )。
A、t检验; B、方差分析; C、 Wilcoxon秩和检验; D、 Kruskal-Wallis秩和检验; E、 Friedman秩和检验 我的答案:D 6【单选题】随机区组设计多个样本比较的Friedman M检验,备择假设H1如何写? A、 检验假设H1为多个总体分布位置相同 B、备择假设H1为多个总体分布位置不同或不全相同 C、检验假设H1为多个样本分布位置相同 D、备择假设H1为多个样本分布位置不同或不全相同。
我的答案:B 7【多选题】多个样本计量资料比较,数据分布类型不明时,不应选择 A、方差分析; B、秩和检验; C、u检验; D、χ2检验; E、 t检验 我的答案:ACDE 等级资料的比较为什么不能采用卡方检验? 答:若采用RxC表资料的卡方检验,则只能推断组间构成比的差别,不能推断组间等级强度的差别。
9、 双变量回归与相关 9.1直线回归 直线回归(linearregression),是指建立一个描述应变量依自变量变化而变化的直线回归方程,并要求各实测点与该回归直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种。借助样本信息和最小二乘原理,可得到直线回归方程。直线回归分析的4个前提条件为:线性、独立、正态性及等方差。
1【单选题】若分析肺活量和体重之间的数量关系,拟用体重值预测肺活量,则采用( )。
A、直线相关分析 B、秩相关分析 C、直线回归分析 D、卡方检验 E、方差分析 我的答案:C 2【单选题】对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义(P<0.05),则( )。
A、b无统计学意义 B、 b有高度统计学意义 C、 b有统计学意义 D、不能肯定b有无统计学意义 E、 a有统计学意义 我的答案:C 3【单选题】同一双变量资料,进行直线相关与回归分析,有( ) A、??3.png B、r>0,b>0 C、r<0,b>0 D、r与b的符号总是相反 E、r与b的符号毫无关系 我的答案:B 4【单选题】在直线回归分析中,得到回归系数为-0.30,经检验有统计学意义,说明( )。
A、 Y增加一个单位,X平均减少30% B、 X增加一个单位,Y平均减少30% C、X增加一个单位,Y平均减少0.30个单位 D、Y增加一个单位,X平均减少0.30个单位 E、X对Y的影响占Y变异的30% 我的答案:C 5【单选题】分析两个变量的回归关系,如果散点分布呈直线趋势,X增加时Y减少,则可初步判断为( )。
A、两变量呈正相关关系 B、两变量呈负相关关系 C、两变量无相关关系 D、b>0 E、 b<0 我的答案:E 1. 用什么方法考察回归直线是否正确? 答:(1)直线必须通过点(,)。2)若纵坐标、横坐标无折断号,将此线左端延长与纵轴相交,焦点的纵坐标必等于截距。(3)直线是否在自变量X的实测范围内。
2. 直线回归分析时怎样确定自变量和因变量? 答:(1)Ⅰ型回归中,x为精密测定和严格控制的变量,y为正态变量。表示原因的为x,表示结果的为y。
(2)Ⅱ型回归中,x、y均为服从正态分布的随机变量,互为因果,可计算两个回归方程。何者为x,何者为y,根据研究目的确定。如身高、体重两变量,若目的只是由身高估计体重,则确定为身高x,为体重y。
9、2直线回归方程的假设检验 对直线回归方程进行假设检验有2种方法:方差分析和t检验,两者均对总体回归系数β是否为0进行假设检验,两者检验结果完全等价。
直线回归方程主要用于估计和预测,常用于估计β的可信区间、总体条件均数的可信区间以及总体回归线的可信带估计、个体Y预测值及其预测区间的估计等。
1. 简述回归分析中Y的标准差Sy与剩余标准差Sy,x的区别和联系。
答:Sy表示在总体中,当x为某一定值时,个体值y的波动范围。而剩余标准差Sy,x是指当x对y的影响被扣除后,y方面仍有变异。这部分变异与x无关,纯属抽样变异。当x与入x平均接近且充分大时,可用Sy,x代替Sy。
2. 简述Sy与Sy0的区别。
答:Sy是反映其抽样误差大小的标准误;
Sy0是反映个体值y的容许区间大小的,也就是说当总体中x为某定值时,y值由于随机误差影响在y0上下波动的范围的大小就取决于标准差Sy0 9、3直线相关 直线相关(linear correlation)用于双变量正态分布资料。相关性分为正相关、负相关和零相关,直线相关性可由散点图直观说明。相关系数又称积差相关系数(coefficient of product-moment correlation),以符号 r 表示样本相关系数,ρ表示总体相关系数。它是说明具有直线关系的两个变量间相关关系的密切程度与相关方向的指标。相关系数没有单位,r的取值范围为-1 ≤r ≤1。其绝对值愈接近1,两个变量的直线关系愈密切。
相关系数r的假设检验有查表法(r界值表法)和公式法(t检验法)。实际应用中应注意直线回归与直线相关的区别与联系。
1. 应用直线相关与直线回归时时应注意哪些问题? 答:1).两变量作直线回归分析时,要求应变量Y服从正态分布,通常自变量X为可以精确测量或严格控制的因素. 2)作回归分析时要有实际意义,不能把毫无关联的两事物或现象进行回归分析. 3)在进行回归分析前,应绘制散点图,若各散点分布呈直线趋势时,才适宜用直线回归分析.另外,还要注意有无异常点(outlier),即残差绝对值特别大的观察点,若是错误所致,应予以修正或去除. 4)回归方程适用范围一般以自变量X实际取值范围为限,不能任意外推.因为超出自变量X取值范围时,两变量间就不一定呈原有的直线关系。
2.直线相关与直线回归的区别和联系有哪些? 答:(1)应用不同:直线回归用于说明两变量间数量依存变化的关系,描述y如何依赖于x而变化;
直线相关用于说明两变量间的直线相关关系,此时两变量的关系是平等的。
(2)资料要求不同:直线回归要求应变量y是来自正态总体的随机变量,而x可以是来自正态总体的随机变量,也可以是严密控制、精确测量的变量;
相关分析则要求x,y是来自双变量正态分布总体的随机变量。
(3)b和r的含义不同:b表示x每改变一个单位,y平均增(减)b个单位;
r说明具有直线关系的两个变量间相关的密切程度与相关方向。
联系 (1)对同一样本,若同时计算b和r,其正负号是一致的。
(2)对同一样本,b和r的假设检验是等价的,二者的t值相等,即tb=tr。
(3)用回归解释相关。r的平方称为决定系数R2,它反映在应变量y的总变异中能用x与y的回归关系解释的比例。R2取值在0到1之间,且无单位。R2越接近于1,表明回归方程的效果越好。
9、4 秩相关,又称等级相关(rank correlation),用于说明两个变量间相关的程度和方向。以符号 表示样本秩相关系数,表示总体秩相关系数。的取值范围为-1 ≤ ≤1。秩相关适用以下情况:(1)不服从双变量正态分布而不宜作一般积差相关分析的资料;
(2)总体分布类型未知的资料;
(3)用等级表示的资料;
(4)分布端点无确定数值的资料。回归与相关在实际应用中有一些注意事项以及莫用与慎用直线相关的情况。
简述Spearman相关系数与Pearson相关系数的区别与联系。
答:两者区别在于:spearman相关只能计算等级数据,但pearson相关却既可以用来算等级相关,也可以算连续数据的相关,只不过一般默认用pearson相关计算连续数据的相关。
1、pearson相关通常是用来计算等距及等比数据或者说连续数据之间的相关的,这类数据的取值不限于整数,如前后两次考试成绩的相关就适合用pearson相关。
2、spearman相关专门用于计算等级数据之间的关系,这类数据的特点是数据有先后等级之分但连续两个等级之间的具体分数差异却未必都是相等的,比如第一名和第二名的分数差就未必等于第二名和第三名的分数差。
10、 统计图表 10.1 统计表 统计表(statistical table)是描述性统计分析的最基本工具,它将研究指标或统计指标及其取值以特定表格的形式列出,以简洁明了、条理清晰的方式表达数据,便于阅读、比较和计算,从而揭示数据资料的主要特征和分布规律。主要讲授统计表的基本结构、基本内容、制表原则和注意事项。要求同学们掌握编制统计表的基本原则、能够正确制作统计表。
1【单选题】关于统计表的制作,叙述正确的是 A、横标目在表体(数字)的上面、纵标目在表体的右侧 B、横标目在表体(数字)的左侧、纵标目在表体的上面 C、表中应只有顶线与底线;合计项应该把每列数字加起来写在各自下面 D、数字为0时可不填 我的答案:B 2 【单选题】关于统计表中的数字,错误的是 A、暂缺或未记录可空着 B、无数字用“…” C、不必合计时用“—”表示 D、若数字为零则填为“0” E、同一指标的小数位数应一致 我的答案:A 3【单选题】有些资料构造统计表时,下列可以省略的一项是 A、标题 B、标目 C、线条 D、数字 E、备注 我的答案:E 4【单选题】关于统计表的制作,不正确的是叙述是 A、统计表不用竖线和斜线分隔表、标目和数据 B、统计表的标题放在表的上方 C、统计表的内容越多越好 D、统计表中的数字按小数点位对齐 E、统计表一般用纵标目和横标目说明数字的意义和单位 我的答案:C 在制作统计图时最常犯的错误有哪些? 答:常见错误如下:1.统计表过大、内容过多;
2.标目设置不合理,导致统计表内容表述混乱;
3.线条过多,如出现不必要的竖线斜线等;
4.数字区有空项,同一指标小数位不同、未对齐;
5.备注列于统计表中;
6.统计表中基本要素缺失、无标题、少标题;
10.2 统计图 统计图(statistical graph)是展示数据特征与分布规律最重要的工具,是用“点、线、面、体”等各种几何图形来形象化地表达和对比数据,通常与统计表结合使用。主要讲授统计图的基本结构与内容、不同类型统计图适用的数据类型和应用背景,要求同学们能够根据实际问题选择合适类型的统计图,并能够根据制图注意事项绘制正确、美观的统计图。
1【单选题】关于统计图的叙述,错误的一项为 A、统计图应有标题,一般写在图的下方 B、应按资料的性质和分析目的选择合适的图形 C、线图两点之间的连线可根据实际情况选直线或光滑曲线 D、条图、散点图、线图和直方图都有纵轴和横轴 E、条图和直方图纵坐标必须从“0”开始 我的答案:C 2【单选题】不同性质的统计资料,一般来讲( )。
A、连续性资料宜用直方图 B、连续性资料宜用圆图或百分条图 C、连续性资料不能用散点图 D、表示各部分的比重的资料宜用直方图 E、表示连续变量的频数分布可用直方图 我的答案:E 3【单选题】说明事物在时间上的发展变化速度,可用 A、散点图 B、条图 C、百分条图 D、圆图 E、线图 我的答案:E 4【单选题】 表明某连续变量的频数分布,可用 A、直条图 B、圆图 C、直方图 D、散点图 E、线图 我的答案:C 5【单选题】现有甲、乙、丙三地1990年,1995年,2003年哮喘的发病率,现用统计图表达时宜绘制 A、普通线图 B、复式条图 C、单式条图 D、半对数线图 E、散点图 我的答案:B 6【单选题】关于半对数线图,错误的一项是 A、半对数线图用于表示事物的发展速度 B、纵坐标可以没有零点 C、由相对比来反映发展速度 D、 纵轴是对数尺度 E、通过绝对差值来反映发展速度 我的答案:E 7【单选题】分析体重与肺活量是否有相关关系时,要先绘制 A、两个变量的直方图 B、复式条图 C、应变量的直方图 D、散点图 E、线图 我的答案:D 8【单选题】圆图和百分条图可分析 A、相互独立资料 B、构成比资料 C、有相关性资料 D、连续性资料 E、频数表资料 我的答案:B 9【单选题】关于箱式图和误差限图,错误的是 A、箱式图可以描述两组或多组资料的平均指标与变异指标 B、误差限图可以描述两组或多组资料的平均指标与变异指标 C、误差限图是在线图或条图的基础上用上下延长线表示误差范围 D、箱式图用于比较两个或多个样本分布的中心位置和散布范围 E、箱式图的上限和下限一定是样本资料的最大值和最小值 我的答案:E 10【单选题】某地1900-1940年伤寒、副伤寒与呼吸系统结核病死亡专率(1/10万)见下表,为了反映这两种疾病的死亡专率随时间推移的变化速度,应选用 A、条图 B、 半对数线图 C、直方图 D、圆图 E、复式条图 我的答案:B 11【单选题】某地478名卫生技术人员年龄构成表,见下表,为了反映不同类型卫生技术人员年龄构成,应选用 A、条图 B、半对数线图 C、直方图 D、圆图 E、百分条图 我的答案:E 如何正确选用和绘制统计图? 答:1.明确资料类型和研究目的;
2.分析数据特征;
3.熟练运用软件;
11、 生物信息学中的统计方法 11.1 序列对比方法概念 序列比对(sequence alignment)是生物信息学的核心研究内容之一,也是进行各种序列分析任务的基本方法。在生物学研究过程中,为了确定新测序列的生物属性,经常需要进行序列同源性分析,就是将新的序列加入到一组与之同源,但来自不同物种的序列中进行多序列同时比较,以确定该序列与其他序列间的同源性大小。这是理论分析方法中最关键的一步,完成这一工作通常使用序列比对的方法。本节主要介绍序列比对的相关概念。
1【单选题】生物医学信息学研究重点体现在( )。
A、基因组学和蛋白质学 B、生理学 C、生化学 D、细胞学 我的答案:A 2【单选题】序列比对测定的是( ) A、蛋白质 B、核酸 C、线粒体 D、细胞 我的答案:B 3【单选题】几个重要的核酸序列数据库除外( )。
A、NCBI 数据库 B、DDBJ 数据库 C、EMBL数据库 D、MIPS 数据库 我的答案:D 4【单选题】关于Genebank 说法正确的是( )。
A、 Genebank拥有所有可以公开的获得的DNA序列 B、Genebank以幂数增长 C、Genebank核酸碱基数目大概每四个月翻一倍 D、Genebank拥有30万个碱基 我的答案:A 5【单选题】DDBJ 数据库建立的国家是( ) A、美国 B、澳大利亚 C、中国 D、日本 我的答案:D 6【单选题】下列不属于蛋白质序列数据库的是( ) A、PIR数据库 B、MIPS数据库 C、DDBJ 数据库 D、PIR-International数据库 我的答案:C 7【单选题】下列关于序列数据库形似性搜索的重要用途说法不正确的是( ) A、能够确定一个新的核酸或蛋白质序列是否曾经报导 B、不能够判定设计的寡核苷酸探针特异性 C、分析序列是否属于某个蛋白质家族,从而决定查询序列的生物学重要性 D、能够研究查询序列的分子进化关系 我的答案:B 8【单选题】关于A序列和B序列的同源性说法正确的是( ) A、A序列和B序列是同源序列 B、A序列和B序列既是同源序列,又不排除非同源序列 C、A序列和B序列同源性为80% D、A序列和B序列同源性为50% 我的答案:A 9【判断题】蛋白质序列测定效率高于核酸序列测定。
我的答案:× 10【判断题】生物序列的相似性是一种质的判断。
我的答案:× 11【判断题】生物序列的同源性是一种很直接的量化关系。
我的答案:√ 序列比对的概念和目的是什么,在哪些研究中需要用到这种方法? 答:通过序列比对可以发现生物序列中的功能、结构和进化的信息。在序列分析中, 将未知序列同已知序列进行相似性比较是一种强有力的研究手段,从序列的片段测定, 拼接, 基因的表达分析, 到RNA和蛋白质的结构功能预测。物种亲缘树的构建都需要进行生物分子序列的相似性比较。生物信息学中的序列比对算法的研究具有非常重要的理论意义和实践意义。
11.2 序列相似性比较算法 本节主要介绍序列相似性比较的算法。序列相似性比较的算法主要有相似分数、对齐、整体比对、局部比对等方法。当我们采用一种算法检索一个序列数据库时,其实质是将检索序列与数据库中的所有序列一一比较,两两序列之间均存在相似分数。序列分析是以研究核酸、蛋白质序列间相似性(similarity)为基础的。因为只有通过发现新序列与已知序列间相似,才能获得关于新序列的遗传、结构信息。讨论如何以数量的方式描述序列的相似性,即对齐方法。对齐有时很有用,但并不普遍实用,因为在序列比较中,两个序列常常有不同的长度;
其次在遗传进化中,DNA序列中删除、插入突变并不罕见。比对可分为整体比对(global alignment)和局部比对(local alignment),整体比对即为将两个序列的全长去做比对,找出两完整序列间的最佳相似区。因此,会列出几个序列完全并列的分析,也会在中间插入许多的间隔;
局部比对只需要找寻两序列间部分相似的片段,尽量不插入间隔,不需要由两段比对序列的起点到终点做延伸,倘若累积到某个点的积分为负,这个比对将被中止并开始新的比对。
1【单选题】关于相似分数说法不正确的是( ) A、相似分数评价关注数据库中真正与检索序列存在遗传和结构关系的相似分数 B、相似分数评价也关注检索序列不存在相似关系的相似分数 C、两两序列之间均存在相似分数 D、当采用一种算法检索一个序列数据库时,其实质是将检索序列与数据库中的部分序列进行比较 我的答案:D 2【单选题】不属于序列对齐的缺点的是( ) A、有时很有用,但并不普遍实用 B、在序列比较中,两个序列常常有不同的长度 C、序列对齐讨论如何以数量的方式描述序列的相似性 D、采用Hamming Distance夸大了序列间的距离 我的答案:C 3【单选题】对齐编辑过程中单个字符的编辑方式不正确的是( ) A、( a ,a ) Match表示需改变S,F B、( a ,b ) Replace表示S中的a被F中的b替代 C、( a, _ ) Deletion表示删除S中的a D、( _ ,b ) Insertion表示在S中插入b 我的答案:A 4【单选题】比对可划分为( ) A、50%比对 B、整体比对和局部比对 C、80%比对和20%比对 D、70%比对和30%比对 我的答案:A 5【单选题】关于序列比对的统计检验说法正确的是( ) A、序列比对通过改变某些参数不可以得到不同比对结果 B、序列比对的结果并不能作为两者之间一定存在同源关系的依据 C、序列长度差异和字母表复杂度不会影响比对结果 D、常用序列比对程序不会给出一些统计值表示结果的可信度。
我的答案:B 6【判断题】整体比对是将两个序列的全长去做比对,找出两完整序列间的最佳相似区。
我的答案:√ 7【判断题】局部比对只需要找寻两序列间部分相似的片段,尽量不插入间隔。
我的答案:√ 整体比对和局部比对各自在什么情况下使用? 答:整体比对即为将两个序列的全长去做比对,找出两完整序列间的最佳相似区。因此,会列出几个序列完全并列的分析,也会在中间插入许多的间隔;
局部比对只需要找寻两序列间部分相似的片段,尽量不插入间隔,不需要由两段比对序列的起点到终点做延伸,倘若累积到某个点的积分为负,这个比对将被中止并开始新的比对。
11.3 基因表达谱数据的获取及标准化 本节主要讲授基因表达谱数据的获取及标准化。基因芯片指将大量寡核苷酸探针或靶DNA固定于支持物(substrate)上,然后与标记的样品进行杂交,通过检测杂交信号的强弱进而判断样品中靶分子的数量和序列信息。它的特点是快速,高通量,微型化,自动化,低成本。通过基因芯片技术可以获得不同类型的数据。基因芯片数据的标准化实质就是校正并减少系统变异产生的误差,使得基因表达数据真实地反映测量样品的生物学差异,使其处理后的数据更加具有合理性和可比性;
同时保留由真正生物学原因引起的基因表达水平高相关性。标准化关键之处就是如何找出标准化因子 (normalization factor, NF) 1【单选题】基因芯片的特点不包括( ) A、快速 B、高通量 C、微型化 D、自动化 E、高成本 我的答案:E 2【单选题】基因表达谱数据标准化方法不包括( )。
A、参照点标准化 B、总强度标准化 C、局部加权线性回归标准化 D、最小加权法标准化 我的答案:D 3【单选题】DNA微阵列数据常见的误差来源包括( ) A、mRNA样本 B、杂交反应 C、PCR扩增 D、探针性能 E、荧光标记 我的答案:A 4【多选题】基因芯片主要包括( ) A、测序芯片 B、表达谱芯片 C、诊断芯片 D、检测芯片 E、预测芯片 我的答案:ABCD 5【多选题】基因芯片的设计需要考虑(ABDE) A、敏感性和特异性 B、互补性 C、稳定型 D、可控性: 设置质量控制探针 E、可读性: 通过探针布局,使杂交信号便于观察理解 我的答案:ABDE 6【判断题】标准化关键之处就是如何找出标准化因子。
我的答案:√ 在你们的研究中,都是如何获得基因表达谱数据的? 答:在基因芯片的实验中,首先选取来自不同状态的样本,如正常组织与肿瘤组织、不同发育阶段组织,或用药前后的细胞或组织等。其中一种被称为实验样本,另一种就是相应地被称为参考样本。实验样本和参考样本mRNA在逆转录过程中,分别用不同的红、绿荧光基团标记,并将它们混合,与微阵列上的探针序列进行杂交,经过适当的洗脱步骤后,用激光扫描仪对芯片进行扫描,获得对应于每种荧光的荧光强度图像,通过专用的图像分析软件,可获得微阵列上每个点的红、绿荧光强度(Cy5和Cy3),其比值(Cy5/Cy3)称为该基因在实验样本中的表达水平。
11.4 差异表达基因的筛选 差异表达基因就是在若干实验组中表达水平有明显差异的基因,也称作“显著性基因”;
是指在不同组织中表达发生明显变化的基因,它是导致细胞状态发生变化的关键基因,是芯片分析的主要对象。基因表达谱芯片实验的主要目的之一是发现两个样本间差异表达基因。通常采用基因在实验组和对照组中信号的比值作为衡量基因在两种状态下基因的表达差异,在双色荧光系统中,用Cy5/Cy3的比值来衡量基因的表达差异,也称表达差异值。噪声和芯片本身的一些因素以及生物学本身的特点给筛选差异表达基因带来了很大的麻烦。必须设定一个差异表达基因的判定标准,这个筛选的标准就称为差异表达基因的阈值。
常用的差异表达基因的筛选方法有倍数分析法(Ratio分析)、两样本t检验法、Wilcoxon秩和检验、SAM方法SAM(significance analysis of microarray)方法,以及Bonferroni校正法、Sidak校正法等方法。
1【单选题】倍数分析法的特点不包括( )。
A、具有生物学和统计学支持 B、容易产生假阳性和假阴性 C、未考虑样本量和变异 D、简单直观 我的答案:A 2【多选题】差异表达基因常用的筛选方法包括( )。
A、倍数分析法(Ratio分析) B、两样本t检验法 C、Wilcoxon秩和检验 D、SAM方法 我的答案:ABC 3【判断题】t检验的标准误可用单个基因数据进行估计, 也可用所有基因数据进行估计。
我的答案:√ 4【判断题】t检验标准误用单个基因数据进行估计,估计的标准误稳定、检验效能高。
我的答案:× 5【判断题】Wilcoxon秩和检验由于相对较为保守,所以对识别真正差异表达的基因有时不够灵敏。
我的答案:√ 6【判断题】SAM方法算法是基于传统的卡方检验和方差分析。
我的答案:× 差异表达基因的筛选方法有哪些方法?它们各自适用什么情况? 答:1.SAM方法适用于不同设计和资料类型的微阵列数据差异表达基因的筛选。2.两样本t检验,即两组独立样本t检验。t检验法是确定两组间差异表达基因的最简单统计推断方法。t检验的标准误可用单个基因数据进行估计, 也可用所有基因数据进行估计。3.Bonferroni校正法是控制FWER最常用的方法之一,属于Single-step 方法。设同时检验m 个原假设:H01 , H02 , …, H0m,相应的单假设检验的P值为: P1 , P2 ,…, Pm 。α为需要控制的检验水准。Single2step 方法不考虑原始P 值的大小顺序,平等的对待所有原假设。Bonferroni校正的P值为.Pi =min(m Pi , 1) 。此方法等价于:如果.Pi ≤α,则拒绝H0 i。
4.Sidak校正法也是控制FWER常用的方法,属于Single-step方法。假设如前,当原始P值独立且服从均匀分布U [ 0, 1 ]时,Sidak方法可控制FWER,若Pi ≤1 - (1 -α) 1 /m, 则拒绝H0 i。Sidak方法校正的P值为.Pi = 1- ( 1 - Pi ) m 。此方法等价于:如果.Pi ≤α, 则拒绝H0 i。
5.Hochberg法是控制FWER的Step-up方法。
6.在检验统计量相互独立且有连续分布,即原始P值相互独立,且服从均匀分布U [0, 1 ]条件下,将FDR控制在水平m0α/m的方法(以下简称为BH法) ,从而也可将FDR控制在水平α。
11.5 基因表达的聚类分析方法 基因聚类分析的主要任务是确定相似表达模式的基因,相似的基因可能具有共同的特征,就是通过各种不同的数学模型,对具有相同统计行为的多个基因进行归类。常见基因聚类方法有:1.系统聚类,又称层次聚类 (hierarchical clustering),本质上是将有相似表达模式的类聚合在一起, 并以分层的系统形式表示出来。2. K-均值聚类( K-means clustering),该方法需要先根据预先指定的类数k来选择初始凝聚点, 根据欧式距离将每个样本归到最接近或相似的凝聚点形成类, 再用各类的重心代替初始凝聚点重新分配, 将每个样品不断地归类直至分类达到稳定。3. 模糊聚类,通过建立一个判别函数,解决了模糊C-均值聚类算法中,参数C的确定问题。4. 自组织图聚类( SOM clustering),SOM聚类本质是由Teuvo Kohonen 提出的一种人工神经网络聚类分析模型,它是一种结构简单的单层竞争性神经网络, 通过自身的训练自动对输入模式进行分类。
1【多选题】常见基因聚类方法包括( ) A、系统聚类 B、B K-均值聚类 C、模糊聚类 D、自组织图聚类 E、动态样品聚类 我的答案:ABCD 2【多选题】不属于K-均值聚类优点的是( ) A、用于数量较大的样品聚类,计算速度快 B、提供统计检验比较类间的差异 C、不能自动确定类别数,根据经验确定或不断调整类别(k)得到结果 D、不能输出树状图的信息,不直观 我的答案:CD 3【判断题】基因聚类分析的主要任务是确定相似表达模式的基因,通过各种不同的数学模型,对具有相同统计行为的多个基因进行归类。
我的答案:√ 4【判断题】K-均值聚类用于数量较小的样品聚类。
我的答案:× 基因表达的聚类分析的目的是什么? 答:确定相似表达模式的基因,相似的基因可能具有共同的特征,就是通过各种不同的数学模型,对具有相同统计行为的多个基因进行归类。
11.6 基因调控网络分析 一个基因的表达受其它基因的影响,而这个基因又会影响其它基因的表达,这种相互影响、相互制约关系构成了复杂的基因表达调控网络。基因表达数据之中隐含基因之间的相互作用关系,因而可以通过分析基因表达数据,构建基因调控网络。常用的基因调控网络模型方法有布尔网络模型、PBN (Probabilistic Boolean Network)模型、加权矩阵模型(Weight matrices)、线性组合模型、相关系数模型以及整数非线性规划模型等。
1【单选题】不属于布尔网络模型的特点( )。
A、布尔网络可以将模型任务理想简单化 B、在不知道定量细节情况下,研究基因共有的调控行为 C、布尔网络可以捕获典型的遗传行为 D、是布尔网络和马氏链(Markov chains)结合 我的答案:D 2【单选题】PBN模型是在( )基础上增加了对父代基因集合的概率选择。
A、布尔网络模型 B、时序布尔网络模型 C、贝叶斯网络模型 D、加权矩阵模型 我的答案:A 3【多选题】基因调控网络模型方法包括( )。
A、布尔网络模型 B、PBN模型 C、加权矩阵模型 D、线性组合模型 E、相关系数模型 我的答案:ABCDE 4【多选题】不属于线性组合模型缺点的是( )。
A、不能精确地描述基因之间的调控关系 B、比较有效而实用 C、权重的处理上不够细致 D、不能判断基因之间的调控指向 我的答案:BD 5【判断题】相关系数模型能够分析两基因之间是否有调控关系。
我的答案:√ 6【判断题】相关系数模型能够判断基因之间的调控指向。
我的答案:× 7【判断题】加权矩阵模型用于基因组的模型进行模拟不受限制。
我的答案:× 8【判断题】线性组合模型正权表示基因促进作用,负权表示基因有抑制作用,0表示两基因之间存在相同的调控关系。
我的答案:× 9【判断题】基因表达数据之中不隐含基因之间的相互作用关系。
我的答案:× 常用的基因调控网络模型方法有哪些,各有自的适用条件是什么? 答:常用的基因调控网络模型方法有布尔网络模型、PBN (Probabilistic Boolean Network)模型、加权矩阵模型(Weight matrices)、线性组合模型、相关系数模型以及整数非线性规划模型等。
12、 循证医学与系统评价 12.1 循证医学与系统评价的概念 循证医学Evidence-basedmedicine (EBM)的概念自1991年被提出以来,其方法学理念日益受到重视,已经成为医学科研中被广泛接受的获取证据、评价证据并利用这些证据指导应用的重要方法论。循证医学的最早定义是由McMaster大学的Sackett教授提出的,他是这样定义的:认真地、明确地、谨慎地应用现有的最佳证据,结合临床专业知识和病人的价值取向,对病人的治疗进行决策,以获得最优的治疗结果和生存质量。因此,循证医学实质上是一种遵循证据进行决策的方法学,因应用于临床医学领域,故称循证医学。系统评价和meta分析是循证医学研究的主要手段或平台,系统评价是针对某一特定问题,对与之有关的所有初始证据进行甄别、评价和综合的一种规范方法。
1【单选题】 循证医学实践的核心是( )。
A、素质良好的临床医生 B、最佳的研究证据 C、患者的参与和合作 D、必要的医疗环境和条件 我的答案:B 2【单选题】循证医学研究的主要手段或平台是( )。
A、系统评价 B、一般综述 C、临床实践 D、探索研究 我的答案:A 3【单选题】Systematic review指的是( )。
A、传统综述 B、系统评价 C、系统回顾 D、一般综述 我的答案:B 4【单选题】文献资料的可靠性由好到差可分为5个等级,其中( )的可靠性最差。
A、专家意见 B、样本量足够的RCT单个研究结果 C、无对照的病例观察结果 D、设有对照组但没有随机分组的单个研究结果 E、多个RCT研究结果的系统综述结论 我答案:A 5【单选题】文献资料的可靠性由好到差可分为5个等级,其中( )的可靠性最强。
A、专家意见 B、样本量足够的RCT单个研究结果 C、无对照的病例观察结果 D、设有对照组但没有随机分组的单个研究结果 E、多个RCT研究结果的系统综述结论 我的答案:E 6【单选题】 循证医学是( )。
A、系统评价 B、Meta分析 C、查找证据的医学 D、最佳证据、临床专业知识和病人价值取向的有机结合 我的答案D 7【单选题】在进行系统评价时,下列哪一项是错误的( )。
A、有明确的检索策略 B、不全面原始文献来源 C、对研究结果分析和评价后得到的是定量的综合性结论 D、有严格的评价方法 我的答案:B 8【多选题】循证医学的应用领域包括( )。
A、卫生经济 B、卫生技术 C、病因学研究 D、敏感基因研究 我的答案:ABCD 9【多选题】在进行系统评价时,下列( )项是正确的。
A、提出的问题涉及面较广 B、全面的原始文献来源 C、对研究结果分析和评价后得到的是定量的综合性结论 D、有明确的检索策略 我的答案:BCD 10【多选题】有关循证医学的叙述,正确的有( )。
A、循证医学实质上是一种遵循证据进行决策的方法学 B、循证医学的基本思想是以证据为核心 C、循证医学研究的步骤包括立题、寻找证据、评价证据、应用证据和应用评估 我的答案:ABC 循证医学与系统评价的关系是怎么样的? 答:循证医学实质上是一种遵循证据进行决策的方法学,因应用于临床医学领域,故称循证医学。系统评价和meta分析是循证医学研究的主要手段或平台,系统评价是针对某一特定问题,对与之有关的所有初始证据进行甄别、评价和综合的一种规范方法。
系统评价是在循证医学和临床流行病学指导下对文献进行的二次评价,是具体的实践过程,如果没有循证医学作为指导,对文献的利用只会是自发、零乱、单一、孤立的,其结果相对不可靠,而质量高的系统评价是循证医学的要求和基础。
12.2 系统评价与一般综述/meta分析的联系与区别 系统评价与一般综述综述在选题、检索文献、文献评价、筛选文献标准、非公开研究个例、作者观点、报告格式、定量综合分析和持续更新等方面都有区别。Meta分析的定义是汇集同类研究的多个相互独立的研究结果进行定量分析,以期获得一个综合性结论的统计方法,又称综合分析、二次分析、集粹分析、荟萃分析等,即meta分析。那么,系统评价和mata分析的关系在于,二者是一对姊妹方法,甚至有时候可以看做是同义词,在很大程度上是重叠的。不同之外在于,系统评价主查非定量化的综合评价,比如病例报告的系统评价以及其它描述性分析的系统评价。而Meta分析主要以获取综合效应量为目的的分析,比如说样本量估计的参数依据、与外部证据的比较以及多中心/多处理的表达等。
1【单选题】在进行一般综述时,下列哪一项是错误的( )。
A、针对某一专题 B、部分检索文献 C、有文献评价 D、不考虑非公开研究个例 我的答案:C 2【单选题】在进行系统评价时,下列哪一项是正确的( )。
A、针对某一专题 B、部分检索文献 C、有筛选文献标准和文献评价 D、作者观点偏主观 我的答案:C 3【单选题】下列有关系统评价与一般综述的区别,正确的是( )。
A、系统评价选题针对某一专题,一般综述选题针对具体(临床)问题 B、系统评价有文献评价,一般综述没有文献评价 C、系统评价没有筛选文献标准,一般综述有筛选文献标准 D、系统评价与一般综述都不考虑非公开研究个例 我的答案:B 4【单选题】下列有关系统评价与一般综述的区别,错误的是( )。
A、系统评价检索全部文献,一般综述检索部分文献 B、与一般综述相比,系统评价的作者观点更客观 C、系统评价和一般综述都没有定量综合分析 D、系统评价有持续更新,一般综述没有更新。
我的答案:C 5【单选题】关于meta分析,下列哪项描述是正确的( )。
A、对多个相互独立的研究结果进行定性分析 B、可以比较和综合多个不同类别研究的结果 C、又称综合分析或二次分析 D、等同于系统综述,二者没有区别 我的答案:C 6【单选题】关于Meta分析,下列哪项描述是错误的( )。
A、可以比较和综合多个同类研究的结果 B、Meta分析不需要持续更新 C、属于二次研究 D、是系统综述中使用的一类统计学方法 我的答案:B 7【单选题】关于Meta分析意义的描述中,下列哪项是错误的( )。
A、可以合理解释同类研究出现矛盾结果 B、评估不同研究之间的变异程度 C、无法改善研究结论的普遍意义 D、增加统计的检验效能 我的答案:C 8【单选题】在临床试验中Meta分析的应用中,下列哪项是错误的( )。
A、可以给出样本量估计所需效应量参数的来源 B、临床试验中任何研究的结果都能进行Meta分析 C、比较研究结果与已公开发表的同类研究结果 D、用Meta分析的森林图表达多中心/多处理结果 我的答案:B 9【判断题】系统评价的报告格式是论著。
我的答案:√ 10【判断题】 系统评价的作者观点偏主观。
我的答案:× 系统评价与meta分析是一回事吗? 答:不是一回事。
系统评价与一般综述综述在选题、检索文献、文献评价、筛选文献标准、非公开研究个例、作者观点、报告格式、定量综合分析和持续更新等方面都有区别。Meta分析的定义是汇集同类研究的多个相互独立的研究结果进行定量分析,以期获得一个综合性结论的统计方法,又称综合分析、二次分析、集粹分析、荟萃分析等,即meta分析。那么,系统评价和mata分析的关系在于,二者是一对姊妹方法,甚至有时候可以看做是同义词,在很大程度上是重叠的。不同之外在于,系统评价主查非定量化的综合评价,比如病例报告的系统评价以及其它描述性分析的系统评价。而Meta分析主要以获取综合效应量为目的的分析,比如说样本量估计的参数依据、与外部证据的比较以及多中心/多处理的表达等 12.3 系统评价与meta分析的步骤 系统评价与mate分析的一般步骤有以下几步:制定研究方案;
文献检索;
文献筛选与评价;
数据提取;
综合效应量分析(meta分析);
撰写研究报告。
1【单选题】如果各独立研究的结果是同质的,可以采用下列哪种方法计算合并后的综合效应( )。
A、随机效应模型 B、固定效应模型 C、混合效应模型 D、A、B、C均不可 我的答案:B 2【单选题】下列有关齐性检验,错误的是( )。
A、齐性检验是推断不同研究的结果是否来自同一人群 B、若为齐性,则无需考虑研究人群方面的差异,可选用固定效应模型 C、若为异质性,则需找出混杂因素进行校正 D、若为异质性,既可选用固定效应模型,也可以采用随机效应模型 我的答案:D 3【单选题】Q统计量近似服从( )分布。
A、 k-1的卡方分布(k为研究的个数) B、k-1的t分布(k为研究的个数) C、 k-2的卡方分布(k为研究的个数) D、k-2的t分布(k为研究的个数) 我的答案:A 4【单选题】下列有关Q检验的结论,正确的是( )。
A、通常设a=0.05, P≤0.05,研究结果齐性 B、通常设a=0.05, P>0.05,研究结果存在异质性 C、通常设a=0.1, P≤0.1,研究结果不存在异质性 D、通常设a=0.1, P>0.1,研究结果齐性 我的答案:D 5【单选题】下列有关异质性检验,错误的是( )。
A、异质性的程度用I2表示 B、I2的取值范围[0, ∞] C、 I2表示研究个例中不一致者所占的比例,越大说明不一致程度越高 D、通常当I2大于50%时可认为异质性存在 我的答案:B 6【单选题】异质性检验的目的是( )。
A、评价研究结果的不一致性 B、检查各个独立研究的结果是否具有一致性 C、 增加统计学检验效能 D、评价一定假设条件下所获效应合并值的稳定性 我的答案:B 7【单选题】Meta分析最突出的问题是( )。
A、各研究结果不一致 B、发表偏倚 C、各研究效应大小的差 D、各研究样本含量的不同 我的答案:B 8【单选题】发表偏倚是指( )。
A、有“统计学意义”的研究结果较“无统计学意义”和无效的研究结果被报告和发表的可能性更大 B、世界上几个主要的医学文献检索库绝大部分来自发达国家,发展中国家比例很小 C、研究者往往根据需要自定一个纳入标准来决定某些研究的纳入与否 D、研究结果的筛选过程中筛选者主观意愿的影响而引入的偏倚 我的答案:A 9【单选题】下列Meta分析说法正确的是( )。
A、文献的同质性较好,可采用随机模型 B、若漏斗图呈对称的倒漏斗状,则无发表偏倚 C、 Meta分析可将多个不同类研究的结果进行合并 D、齐性检验的结果如果是异质性,应采用固定效应模型 我的答案:B 10【单选题】Meta分析结果中,如果漏斗图呈明显的不对称,说明( )。
A、统计学检验效能不够 B、各个独立研究的同质性差 C、合并效应值没有统计学意义 D、可能存在发表偏倚 我的答案:D 假设你想做一项系统评价与meta分析,结合你的专业,谈谈你的计划? 答:遵循基本步骤:制定研究方案;
文献检索;
文献筛选与评价;
数据提取;
综合效应量分析(meta分析);
撰写研究报告。
12.4系统评价与Meta分析的报告规范 系统评价与meta分析的报告主要遵循PRISMA (Preferred Reporting Items forSystematic Reviews and Meta-Analyses)规范。这个规范在题目、摘要、正文的各个部分(背景、方法、结果、讨论、基金资助)等方面都都做了详细的规定。
1【单选题】系统评价或Meta分析报告条目清单中, 有关方法项目中叙述不正确的是( ) 。
A、如果已有研究方案,则说明方案内容并给出可获得该方案的途径 B、纳入标准需要说明指定的研究特征和报告的特征,并给出合理的说明 C、不需要说明资料库的检索方法 D、信息来源方面,针对每次检索及最终检索的结果描述所有文献信息的来源 我的答案:C 2【单选题】为避免Meta分析是因为没有收集到足够的“阴性”结果而出现假阳性错误,需要对可能遗漏的“阴性”结果文献数量做一个估计,即( )。
A、敏感性分析 B、亚组分析 C、抽屉文件分析 D、异质性检验 我的答案:C 3【单选题】系统评价或Meta分析报告条目清单中, 有关结果项目中叙述不正确的是( )。
A、不需要提高报告初筛的文献数和最终纳入研究的文献数 B、说明每一个被提取资料的文献的特征 C、说明每个Meta分析的结果,包括可信区间和异质性检验结果 D、提供单个研究的结果,针对所有结局指标,说明每个研究的各干预组结果的简单合并以及综合效应值及其可信区间 我的答案:A 4【单选题】有关系统评价或Meta分析报告条目清单的叙述不正确的是( )。
A、在方法中,需要说明至少一个资料库的检索方法 B、在结果中,需要说明研究间可能存在偏倚的评价结果 C、在讨论中,需要探讨研究层面和结局层面的局限性 D、如果有资金支持,不需要列出资金来源 我的答案:D 请仔细研究PRISMA规范,然后谈谈你的感想。
答:随着系统评价/Meta分析方法学的不断完善,大量的系统评价/Meta分析发表,但许多报告质量存在严重问题。PRISMA规范有助于提高文章质量,严格要求作者,具有科学性,是有价值,合理,合法以及真实的。保证了领域的专业性 13、 Logistic回归 logistic回归属于概率型非线性回归,它是研究二分类(可扩展到多分类)观察结果与一些影响因素之间关系的一种多变量分析方法。在流行病学研究中,经常需要分析疾病与各危险因素之间的定量关系,如食管癌的发生与吸烟、饮酒、不良饮食习惯等危险危险的关系,为了正确说明这种关系,需要排除一些混杂因素的影响,用logistic回归分析可以较好的实现。logistic回归的应用已经有多年历史,最具代表性的是Truett等人1967年成功地用于冠心病危险因素的研究。本节介绍logistic回归的基本概念、回归模型和模型参数的意义。
根据一组实际观察资料估计logistic回归模型的参数时,通常用最大似然估计(maximum likelihood estimate, MLE),即建立一个样本似然函数。然后根据最大似然原理,在一次抽样中获得现有样本的概率应该最大,即似然函数L应该达到最大值,为了简化计算,通常取似然函数的对数形式,形成要计算的目标函数lnL,然后采用Newton-Raphson迭代方法使对数似然函数达到最大值,从而得到回归系数的估计值,同时得到参数估计值的方差-协方差矩阵。在得到logistic回归方程后,还需要对其回归系数进行假设检验,常用的方法有似然比检验、Wald检验等。
logistic回归中,变量的筛选是一个重要内容。当自变量较多时,为了使建立的logistic回归模型比较稳定和便于解释,应尽可能将回归效果显著的自变量选入模型中,将作用不显著的自变量排除在外。除了专业上的选择外,在统计上,可以采用前进法、后退法和逐步法。Logistic逐步回归和线性逐步回归基本类似。
条件logistic回归是针对配对资料分析的一种方法。在流行病学的病例-对照研究中,为了控制一些重要的混杂因素,常把病例和对照按照年龄、性别等条件进行配对,形成多个匹配组(每一个匹配组可视为一个层)。从原理上讲,各匹配组的病例数和对照人数是任意的,但最常用的是每组中有一个病例和多个对照,即1:M配对研究(M一般小于等于3)。分析方法是首先构建条件logistic回归模型,然后通过条件似然函数进行参数估计。
logistic回归主要应用于流行病学危险因素分析、临床试验数据分析或者分析药物或毒物的剂量反应关系。在应用logistic回归时,需要注意以下几点:一是变量的取值形式。尽可能的采用分类变量的形式,可以保证参数的含义更明确。二是样本含量。logistic回归的所有统计推断都是建立在大样本的基础上的,因素要求有足够的样本量。三是变量的选择。在自变量比较多的情况下,可以用专业方法和逐步回归进行筛选。最后要注意模型的检验。
推荐访问: 统计学 题库