统计学模拟题五 6页

  • 366.62 KB
  • 2022-09-01 发布

统计学模拟题五

  • 6页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
统计学模拟题五模拟题五一、单项选择题1.若要对某工厂生产设备状况进行调查,则某工厂“全部生产设备”是(调查对象)。P372.居民收入与消费支出之间的相关系数可能是(选项二)。P235选项一:-1.5;选项二:0.9;选项三:-0.9;选项四:1.53.拒绝域的大小与我们事先选定的(选项三)有一定关系。选项一:临界值;选项二:置信水平;选项三:显著性水平;选项四:统计量注:这里“拒绝域的大小”理解为拒绝域的面积,拒绝域的面积等于显著性水平?。4.某变量数列,其末组为开口组,下限为600,又知其相邻组的组中值为550,则末组的组中值是(650)。P50pvalue5.如果要拒绝原假设,则下列式子(选项四)必须成立。P188选项一:pvalue;选项二:F=1;选项三:FF;选项四:pvalue6.在同一次假设检验中,当显著性水平0.01时,原假设被拒绝。若用0.05,则(原假设一定会被拒绝)。P1667.一般情况下,商品销售量指数和工资水平指数的同度量因素分别为(单位商品销售价格、职工人数)。P333注:同度量因素又称为权数。工资水平指数=(报告期职工人数*报告期工资水平)/(基期职工人数*基期工资水平)。8.构成统计总体的个别事物称为(总体单位或个体)。P159.下列指标属于连续变量的是(选项四)。P24选项一:工厂数;选项二:设备台数;选项三:人口数;选项四:净产值10.抽样平均误差反映了样本指标与总体指标之间的(平均误差的程度)。P11711.两组数据的均值不等,但标准差相同,则(均值小的差异程度大)。P99注:对于不同均值的两组数据,其差异程度用标准差系数衡量,等于标准差/平均数。12.统计表的结构从形式上看包括(总标题)、横行标题、纵栏标题、数字资料四个部分。P7113.下面的陈述中哪一个是正确的(选项一)。P235选项一:相关系数的绝对值不会大于1;选项二:相关系数不会取负值;选项三:相关系数是度量两个变量之间线性关系或非线性关系强度的统计量;选项四:相关系数数值越大,说明两个变量之间的关系就越强14.在统计史上被认为有统计学之实而无统计学之名的统计学派是(政治算术学派)。P615.如果CPI为(101)%,表明从总体上说,若不增加工资收入,居民的生活水平有所下降。P34116.在方差分析中,进行多重比较的前提是(拒绝原假设)。P18817.在下列质量管理工具中,能对产品形成过程进行检验的工具是(控制图法)。18.现有某公司2007年各季度在各个地区销售各种产品的情况,数据库的四个字段是:地区、季度、商品、销售额。如果要反映各种商品在各地区和各季度的销售情况,应该绘制(地区、季度和商品的三维透视图)。P651\n统计学模拟题五19.如果某个工人的工资为2000元,而居民消费价格指数为110%,则该工人的实际工资为(1818)元。P33820.某厂生产的零件直径服从正态分布,且其标准均值为3厘米。某天测得20个零件的平均直径为3.1厘米,若要检验与设计的标准是否有所变化,假设形式应该是(H:3H:3)。P1550121.若有多个成数资料可供参考时,确定样本容量时计算成数的方差应该使用(数值最接近或等于0.5的那个成数)。P14522.在出勤率、废品量、劳动生产率、商品流通费用额和人均粮食生产量五个指标中,属于数量指标的有几个(二个)。P19注:出勤率、劳动生产率用相对数表示,是质量指标(具体来说,是质量指标中的相对指标),人均粮食生产量用平均数表示,也是质量指标(具体来说,是质量指标中的平均指标),废品量和商品流通费用额用绝对数表示,是数量指标。23.若拉氏物价指数为99%,派氏物价指数为98%,则用理想公式计算的指数为(98.5%)。P33624.影响平均数大小的因素有(选项四)。P88选项一:变量;选项二:变量的个数;选项三:数量标志;选项四:变量值25.对等距分组绘制的直方图中,纵轴常常以(频率(次数))表示。P7526.总体的变异性是指(总体单位之间在某一标志表现上有差异)。P16注:变异性即差异性。27.2008年与2007年相比,同样多的货币只能购买90%的商品,说明物价指数上升(11.11)%。注:对于同一物品,基期价格为a,则报告期的价格为a/0.9。物价指数等于物品价格的变动比,因此物价指数=报告期价格/基期价格=(a/0.9)/a=1/0.9=111.11%。28.用Excel汇总一个月中上、中、下三旬的资料,用(合并计算)功能。P6629.受极端数值影响最大的变异指标是(极差)。P96注:标志变异指标又称为标志变动度,是反映变量离散程度的指标。30.在统计上,将我国的31个省市自治区分为东部地区、中部地区、西部地区、东北地区。要检验不同地区的居民收入水平是否相同,在每类地区各随机抽取一个样本。某一地区中样本数据之间的误差属于(随机误差)。P180二、多项选择题1.统计调查方案的主要内容包括(调查目的、调查对象、调查单位、调查项目、调查时间)。P372.位置平均数是指(众数、中位数)。P933.下列关于统计数据收集与整理的各项表述中,不准确是(选项三、选项四)。选项一:指标对比通常是描述性统计分析的切入点;P84选项二:统计分析中的对策建议是原因分析的自然延伸;选项三:统计调查工作环节是用统计分组表收集原始数据;选项四:统计数据整理是把原始数据整理成统计分析模型;P45选项五:原始数据通常称为观测值或测量值注:统计调查是根据统计任务的要求,运用科学的调查方法,有计划、有组织的向社会搜2\n统计学模拟题五集统计资料的过程。统计调查搜集来的资料有两种:一种是对调查单位未做任何加工整理的原始资料,又称为初级资料;另一种是次级资料,即已经经过某个部门或地区加工整理过了的综合说明某个部门或地区综合情况的统计资料。数据的整理,是根据统计研究的目的,对所收集到的大量、零星分散的原始资料进行科学加工与综合,使之系统化、条理化、科学化,为统计分析提供反映事物总体综合特征资料的工作过程。4.计算抽样平均误差时,若缺少总体方差和总体成数,可用的资料有(选项一、选项二、选项四、选项五)。选项一:过去抽样调查得到的相应资料;选项二:样本资料;选项三:重点调查得到的资料;选项四:小规模调查得到的资料;选项五:过去全面调查得到的资料注:重点调查是指在调查对象中,选择一部分重点调查单位收集统计资料的一种非全面调查。和抽样调查不同的是,重点调查取得的数据只能反映总体的基本发展趋势,不能用以推断总体。5.按相关的形式,相关关系可以分为(非线性相关、线性相关)。P2316.南京市统计局住户处收集了5000户居民八月份消费的详细情况,如果按各个区被调查的户数来反映这次抽样调查的结构,用()表现比较合适?选项一:茎叶图;选项二:散点图;选项三:折线图;选项四:直方图;选项五:饼图7.是非标志又称(交替标志、0-1标志)。P1018.在CPI的分类指数中,如果城市为106.8,农村为107.7,则全国指数可能为(选项一、选项四)。P342选项一:106.9;选项二:214.5;选项三:0.9;选项四:107.1;选项五:105.4注:全国指数为城市指数和农村指数的加权和,所以全国指数介于城市指数和农村指数之间。9.对两个总体均值之差进行检验时()。P162选项一:两个总体之间的样本要独立抽取;选项二:使用t检验时,自由度小于两个样本量之和;选项三:两个正态总体,方差未知但相等的小样本时,应用t检验;选项四:无论方差是否已知,大样本时都可以用Z检验统计量进行检验;选项五:使用t检验时,自由度是两个样本量之和注:P167例6.8是相关样本的检验。10.下列指标中包含有随机性误差的是(全选)。选项一:MSA;选项二:SSE;选项三:MSE;选项四:SST;选项五:SSA三、计算题1.数据库9.4_g存放着计36棵白云杉样本的齐胸高处树的直径(单位:厘米)和树的高度(单位:米)的数据。(1)做散点图,判断两者的关系是(正线性相关)。(2)计算两者的相关系数为(0.8105)。(3)根据计算得到的相关系数,我们认为(需检验才能判断)。3\n统计学模拟题五(4)检验统计量为(t=8.0685)。(5)结论是(p=1.04463E-09,正线性相关)。注:考查相关分析(P232-P238)。问题(1),用散点图大致判断变量间的相关方向。问题(2),利用“相关系数”数据分析工具得到样本相关系数。问题(3),在有些情形下,样本相关系数的值很大,但是两个总体变量却是独立的(可参看教材P237)。因此总体的相关系数需要经过正式的假设检验,才能做出比较可靠、科学的判断和结论。问题(4),要对总体相关系数进行检验,即检验和0之间的关系,采用的是t检Rn2验。检验统计量为T。当=0时,T服从自由度为n2的t分布。检验统计21Rrn2量的观测值为t,其中r为样本相关系数。21r问题(5),根据四个选项知,检验的是两个变量间是否是正线性相关或者负线性相关,即总体相关系数0还是0。根据问题(2)知,样本相关系数是正的,所以要判断的是总体相关系数是否大于0。原假设和备择假设分别为H:0或者0,H:001如果利用p值判断,首先计算p值,因为是单侧t检验,并且T服从自由度为n2的t分布,所以p值=T.dist.rt(tn,2)=1.04463E-09。因为显著性水平p值,所以拒绝原假设,接受备择假设,认为总体相关系数显著大于0,即两个变量间是正线性相关的。2.某研究者估计其所在市居民家庭的电脑拥有率大于30%。现随机抽查了200个家庭,家庭拥有电脑情况见数据库6.21,在回答中1代表有,0代表无。试问研究者的估计是否可信(0.05)?(1)你所选取的原假设最好是(≤30%,为城市家庭电脑拥有率,下同)。(2)你计算出的Z=(1.85164)。(3)你计算出的p值=(0.03204)。(4)你得到的结论是(拒绝≤30%)。(5)若选用=0.01,你得到的结论是(无理由拒绝≤30%)。注:考查总体成数的大样本区间估计。问题(1),将想要证明的放在备择假设上,备择假设的相反假设就是原假设。问题(2),先利用“countif”函数(格式为“=COUNTIF(B2:B201,1)”)得到样本中拥有电脑的家庭数量为72,进而得到样本成数p=72/200=0.36;再代入公式p0z得到z值。问题(3),因为是右侧z检验,所以p值=1-Norm.s.dist(1)00n(,true)z。问题(4)和问题(5),如果p值,则拒绝原假设;否则,不能拒绝原假设。3.数据库5.24中存放着从某城市所有汽车中随机抽取400辆调查其动力状况调查数据(单位:马力)。(1)被调查汽车的平均马力是(195.05)。(2)被调查汽车马力的标准差是(105.65)。4\n统计学模拟题五(3)汽车马力在280元及以上的汽车数有(102)辆。(4)以95.45%的置信水平推断该城市汽车平均马力所在的范围是(184-206)。(5)以95.45%的置信水平推断动力在280马力及以上汽车在全部汽车中比重所在的范围是(21.1%-29.9%)。注:(1)和(2)用“描述统计”数据分析工具,问题(3)用countif函数,具体输入为“=COUNTIF(A2:A401,">=280")”。问题(4)考查非正态总体均值的大样本区间估计,置信s上下限为xz。问题(5)考查总体成数的大样本区间估计,置信上下限为2npp(1)pz。两种情形下,置信水平都为95.45%,因此10.9545,即2n10.9545=0.0455,所以分位数为zz。20.022754.某SARS研究所对31名自愿者进行某项生理指标测试,自愿者分为SARS患者、SARS疑似者和非患者,假定测试指标值服从正态分布,且方差相同。考查三类人该指标值是否相同(=0.05)。测试结果如数据库7.5。,,(1)该方差分析的备择假设是(123不全相等)。(2)均方MSE为(0.055)。(3)总离差平方和SST的自由度是(30)。(4)误差项离差平方和SSE的自由度是(28)。(5)这三类人的该项生理指标有差别吗?(有差异)。注:考查单因素方差分析,利用“方差分析:单因素方差分析”数据分析工具,注意数据的排列方式,输入如下:5.数据库3.14中存放着某企业人力资源部的数据。按“性别”和“2007考核”计算各工作岗位相应的人数和平均工资(工作岗位:1-生产员工;2-服务员工;3-技术与管理员工)。(1)根据透视表,技术与管理员工中的女性考核为“优”的有(2)人。(2)根据透视表,技术与管理员工中的男性考核为“优”的有(27)人。(3)根据透视表,技术与管理员工中的女性考核为“优”的平均工资为(39675.00)元。(4)根据透视表,技术与管理员工中的男性考核为“优”的平均工资为(68443.50)元。注:考查制作“三维透视表”。将“性别”、“2007年考核”、“工作岗位”分别放在行字段、列字段和页字段,将“薪水”放在值字段,默认值汇总方式为“数值项求和”。5\n统计学模拟题五因为问题涉及的都是技术与管理员工(用3表示),所以筛选页字段的值为3。将值汇总方式改成“计数项”,可得(1)和(2)。将值汇总方式改成“平均值”,可得(3)和(4)。问题(4),答案确切应为68443.52。6.数据库12.11中上半部分存放着各地区农业生产资料价格分类指数,下半部分存放着部分地区各类指数的权重。总指数是通过综合十个类指数得到的。(1)不考虑十个类指数的重要性,计算河北、山西、内蒙古的总指数。它们是(106.06,106.78,108.21)。(2)考虑十个类指数的重要性,计算河北、山西、内蒙古的总指数。它们是(106.67,107.39,109.44)。(3)河北某地区的农民用1亿元来购买农业生产资料,根据加权指数,与全国水平相比,总体上说,他们(少花4百万)。(4)根据加权指数,从支出角度看,河北、山西、内蒙古和辽宁四省农民的境况较差的是(辽宁)。注:考查指数的合并和意义。(1)不考虑十个类指数(单位是%)的重要性指的是,每个类指数的重要性都相等,即权数都等于1/10。此时,求总指数相当于求十个类指数的算术平均数。先用average函数算出河北总指数(单位是%),再用向下填充得到山西和内蒙古的总指数(单位是%)。??(2)考虑十个类指数(单位是%)重要性的情形下,总指数=∑(类指数?对应权数)。??首先用“sumproduct”函数计算出河北总指数(单位是%),套用格式为“=SUMPRODUCT(C5:L5,C40:L40)/100”其中除以100是因为权数的单位是“%”。接着,用向下填充得到山西和内蒙古的总指数。(3)根据Excel数据,河北和全国的价格指数分别为106.67%、110.63%。因为1亿*(1-110.63%/106.67%)=-3712384元≈−400万这意味着,相比全国水平,河北农民少花400万。具体推导过程见模拟题1,关键是记住公式,尤其是记清括号内的分数是用全国指数/河北指数,不要颠倒了。(4)河北、山西、内蒙古的加权指数在问题(2)中已经给出,从Excel数据中得到辽宁的加权指数为113.2802%。显然,辽宁指数最高。因为这是价格指数,所以指数越高,意味着买同样的东西,该省花费越多,因此生活境况越差。6

相关文档