统计学原理-统计整理 80页

  • 1.55 MB
  • 2022-08-13 发布

统计学原理-统计整理

  • 80页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
第三章统计整理统计整理的概念和内容统计分组变量数列变量数列的表示方法统计汇总的组织与技术统计表\n第三章统计整理重点:统计分组的方法变量数列与统计表的概念和编制运用计算机进行数据资料的处理和图表的制作难点:频数分布的编制;组限的表现形式;组距和组中值的计算\n引例按百分制记分,某班30位学生《统计学》考试成绩(分)资料如下:928578516388607187705697806877756472898798819583798376897286\n某班学生《统计学》考试成绩表成绩(分)人数频数(人)频率(%)50-6026.760-70413.370-8093080-901136.790-100413.3合计30100\n第一节统计整理的概念与内容一、统计整理的概念统计整理是根据统计研究的目的和任务,对统计调查所搜集到的大量原始资料进行科学的分类和汇总,为统计分析提供系统化和条理化的综合统计资料的过程。\n统计整理的意义统计调查所搜集的反映个体量的原始资料是分散的,不是集中的;是零碎的,不是系统的。根据这些资料。人们难以从总体上分析和认识现象的数量表现。至于某些已经加工的综合资料,则往往由于资料在分组方法、总体范围或指标涵义、口径、计算方法等方面不同,而不能满足统计分析的要求,也必须先通过统计整理,才能据以从总体上分析社会经济现象的数量表现,\n二、数据整理的内容分组汇总编制统计图表\n统计资料整理的内容进行统计分组——统计整理的基础进行资料的汇总——统计整理的中心内容编制统计表或统计图——统计整理的有效表达形式\n第二节统计分组一、统计分组的意义和作用统计分组就是根据统计研究目的和任务,按照选定的变异标志将总体划分为若干部分或组别,使组与组之间具有差别性,而同一组内单位保持相对的同质性一种统计方法。统计分组的意义在于:总体经过分组,能够突出组与组之间的差异而抽象掉组内各单位之间的差异,使数据变得条理化,便于进一步分析研究。\n一、统计分组的意义和作用统计分组的作用⒈区分社会经济现象的类型-类型分组⒉研究现象的内部结构-结构分组⒊分析现象之间的依存关系-分析分组\n某地区2008年底各类工业企业数按所有制性质分组企业数(个)比重(%)全民所有制企业320464.08集体所有制企业128625.72私营企业1523.04中外合资企业2124.24外商独资企业1022.04其他企业440.88合计5000100.00\n企业规模与流通费用率依存关系商品销售额/万元企业单位数/个流通费用率/%400以下400-500500-600600以上3101523.843.092.661.94\n13社会经济现象之间不同程度的存在着相互依存关系,通过统计分组,可以从数量上研究现象之间依存关系的规律性。居民家庭随着月收入的增加而月支出也在增加的相关关系家庭月收入(元)家庭户数(户)家庭月平均支出(元)1600以下410001600-1700710901700-1800212001800-1900915701900-2000716602000以上111690\n统计分组的要求三个要素:母项、子项、分组标志三个基本要求:周延性、互斥性、分组标志的同一性二、统计分组的要求和方法\n统计分组例1:从业人员按文化程度分组小学毕业中学毕业(含中专)大学毕业文盲或识字不多小学毕业中学毕业(含中专)大专毕业大学及大学以上(√)(×)\n例2:某商场把服装分为①男装、女装、童装。(×)② 成年装(男女装)儿童装(男女装)统计分组(√)\n统计分组的方法1、分组标志的选择根据统计研究的具体任务和目的,选择分组标志。在若干个标志中,选择能反映问题本质的重要标志进行分组。结合研究现象所处的具体历史条件或社会经济发展的条件选择分组标志。二、统计分组的要求和方法\n统计分组的方法2、按品质标志和数量标志分组二、统计分组的要求和方法按地区分组上期本期增减%甲县乙县丙县丁县360002400028000200005200034000410002600044.441.746.730.0合计10800015300041.7经调查,某地年末货币流通量为15.3亿元,比上年增加4.5亿元。\n统计分组的方法2、按品质标志和数量标志分组二、统计分组的要求和方法按地区分组上期本期增减%甲县乙县丙县丁县360002400028000200005200034000410002600044.441.746.730.0合计10800015300041.7经调查,某地年末货币流通量为15.3亿元,比上年增加4.5亿元。\n工人平均日产量(件)工人数绝对数比重(%)2345610153040208.713.026.134.817.4合计115100某厂第二季度工人平均日产量\n213、简单分组、复合分组和分组体系根据分组选择标志的多少不同,统计分组又可分为:简单分组简单分组是指对统计总体仅按一个标志进行分组复合分组复合分组是指对同一总体采用两个或两个以上的标志重叠起来进行分组分组体系对于复杂的研究对象,必须从各个方面进行观察和分析研究,以获得对事物全貌的认识,因此要采用一系列相互联系、相互补充的标志对现象进行多种分组,这些分组结合起来构成一个体系,称为分组体系。\n22简单分组按行业结构分组上期本期增减%集团单位库存现金农民手持现金城镇居民手持现金其他流动人口手持现金27000430003100070003500071000370001000029.665.019.042.6合计10800015300041.7\n复合分组按性别分类按职称分类按年龄分类男女高级中级初级青年中年共计12组2×3×2对教师的分类\n分组体系对教师的分类按性别分类男性女性按职称分类按年龄分类高级中级初级青年中年共计7组2+3+2\n第三节变量数列一、变量数列的概念在统计分组的基础上,将总体的所有单位按组归类整理,形成总体中各个单位数在各组间的分布,这种表明总体单位数在各组分配情况的分组资料,成为次数分布,又称分配数列分布在各组的个体单位数叫次数或频数,各组次数占总次数的比重叫频率\n第三节变量数列一、变量数列的概念数量标志数列品质标志数列分类异距数列等距数列离散型变量数列连续型变量数列组距数列单项数列\n按品质标志分组—品质数列,一般是单项式分组某班学生的性别构成情况按性别分组绝对数人数比重(%)男女30107525合计40100\n工人平均日产量(件)工人数绝对数比重(%)2345610153040208.713.026.134.817.4合计115100某厂第二季度工人平均日产量\n工人完成生产定额分组(%)工人数绝对数比重(%)80~9090~100100~110110~120120~130304060302016.722.233.316.711.1合计180100某工厂工人完成生产定额情况表\n人口按年分组人口数(万人)1岁以下(婴儿组)11~7岁(幼儿组)67~17岁(学龄儿童组)1218~55岁(有劳动能力的人口组)24.655岁以上(老年组)8.1合计51.7某市人口结构组成\n某企业职工按工资分组表按工资分组(元)职工人数比重(%)500以下12010.00500-80028023.33800-100050041.671000-150020016.671500以上1008.33合计1200100.00\n组距数列中的几个概念1、组数2、组限3、组距组距=本组上限-本组下限组距=本组上限–本组下限+1思考:开口组的组距?4、组中值\n二、变量数列的编制1、阵列,求全距2、确定变量数列的形式3、确定组距和组数4、确定组限5、计算各组单位数\n二、变量数列的编制0123411133334515053344344332233223322222\n50607176809152647277819954627377829263727883946573798496677476866875758764757485\n某车间50名工人日加工零件数117122124129139107117130122125110118123126133134127123118112108131125117122133126122118108112134127123119113120123118112137114120128124115139128124121\n50名工人分组步骤确定组数k=1+3.322lg50≈7计算组距=(139-107)/7=4.6≈5确定组限,编制频数分布表\n工人日加工零件频数分布表按零件数分组工人数频率(%)105-11036110-115510115-120816120-1251428125-1301020130-135612135-14048合计50100\n第四节变量数列的表示方法一、列表法即用统计表格形式表述变量数列的内容,这种表式也叫做次数分布表。\n累计频数(频率)从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。向上累计向下累计从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。\n41向上累计——较小制累计指各组频数或频率由变量值低的组向变量值高的组累计。累计数反映各组上限以下的累计频数或频率。如右表:学生考试成绩分布考分人数(人)比重(%)向上累计人数(人)比重(%)50—6060—7070—8080—9090—1002711826.6723.3336.6726.676.67292028306.6730.0066.6793.33100.0合计30100.0——\n42向下累计——较大制累计指各组频数或频率由变量值高的组向变量值低的组累计。累计数反映各组下限以上的累计频数或频率。如右表:学生考试成绩分布考分人数(人)比重(%)向下累计人数(人)比重(%)50—6060—7070—8080—9090—1002711826.6723.3336.6726.676.67302821102100.093.3370.0033.336.67合计30100.0——\n销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)较小累计较大累计较小累计较大累计0~55~1010~1515~2020~2525~30410161343820322686合计50100——\n销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)向上累计向下累计向上累计向下累计0~55~1010~1515~2020~2525~30410161343820322686414304347505046362073828608694100100927240146合计50100————\n二、图示法次数多边形图次数直方图累计次数分布图次数分布曲线图\n次数多边形图及次数直方图\n累计次数(频率)分布图在直角坐标点系上将各组组距的上限与其相应的累计频数(频率)构成坐标点,依次用直线(或光滑曲线)相连。向上累计曲线向下累计曲线在直角坐标点系上将各组组距的下限与其相应的累计频数(频率)构成坐标点,依次用直线(或光滑曲线)相连。\n累计次数(频率)分布图\n49次数分布曲线图\n50特征:”两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两边的变量分布次数少,形若古钟。根据其偏斜情况分为对称钟型分布、左偏钟型分布和右偏钟型分布。(一)钟型分布次数分布曲线图\n51对称钟型分布,也叫正态分布,以中心变量值为对称轴呈对称分布。人数年龄\n*52左偏钟型分布,也叫正偏钟型分布,变量值小的次数较变量值大的次数多。人数年龄\n53右偏钟型分布,也叫负偏钟型分布,变量值大的次数较变量值小的次数多。人数年龄\n*54特征:靠近中间的变量值分布的次数少,靠近两端的变量值分布次数多,形成“两头大,中间小”的U字型分布。如人口死亡率按年龄分组。(二)U型分布人数年龄\n*55正J型分布:其特征是随着变量值的增大,分布次数也随之增多,若根据变量数列绘成线图,形若英文字母“J”。如老年人口按年龄分组的死亡人数分布曲线多呈正J型。(三)J型分布人数(人)年龄\n*56反J型分布:其特征是随着变量值的增大,分布次数也随之减少,若根据变量数列绘成线图,形若反写的英文字母“J”,如按年龄分组的人口总体的次数分布曲线多呈反J型。反J型分布人数(人)年龄\n*57洛伦兹曲线又称集中曲线,用以检验社会收入分配的平等程度。可拓展用于研究总体各单位标志分布集中状况或平均性的其他社会经济现象。(四)洛伦兹分布\n*58洛伦兹曲线以累计频率为横轴,以标志值累计比重为纵轴。(四)洛伦兹分布标志值累计比重(%)累计频率(%)ba\n第五节统计汇总的组织与技术一.汇总前的审核审核方面:及时、完整、准确审核方法:计算检查、逻辑检查\n第五节统计汇总的组织与技术二.统计汇总的组织形式逐级汇总集中汇总\n第五节统计汇总的组织与技术三.统计汇总的技术方法手工汇总划记法过录法折叠法卡片法电子计算机汇总\n第六节统计表一.统计表的概念和构成从广义上说,统计表是以纵横线条交叉结合成的表格,用来表现统计资料的一种形式,包括统计工作各个环节所用的别哦啊个。本节侧重讨论由统计资料汇总整理而成的统计表的内容。\n第六节统计表一.统计表的概念和构成总标题2007年2008年金额(亿元)比重(%)金额(亿元)比重(%)速度(%)(92为100)生产总值24363100.031380100.0113.4第一产业580023.8665021.2104.0第二产业1170048.01624551.8120.4第三产业686328.2848527.0109.3主词栏宾词栏某地区2007和2008生产总值表\n按宾词指标平行排列的统计表分组企业数职工人数性别工龄男女5年以下5~10年10年以上(甲)(1)(2)(3)(4)(5)(6)(7)\n按宾词指标层叠排列的统计表分组企业数(个)职工人数工龄5年以下5~10年10年以上男女计男女计男女计男女计(甲)(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)(11)(12)(13)\n二、统计表的种类简单表分组表复合表\n简单表2005-2008某省国内生产总值亿元年份国内生产总值20052006200720085155.256004.216680.347199.95\n*68简单表国家位次旅游收入收入(亿美元)占世界比重(%)美国西班牙意大利法国英国德国中国奥地利加拿大墨西哥12345678910730.0315.0310.0307.0209.7165.0141.0112.0102.878.516.06.96.86.74.63.63.12.52.31.71999年国际旅游收入居世界前十名的国家\n*69简单分组表厂别合格品数量(辆)甲厂乙厂50007000合计120001998年某公司所属两企业自行车合格品数量表\n复合分组表2009年末某地区人口数人数绝对数/万人比重/%城镇男性女性27831419136472.737.135.6农村男性女性104353251127.313.913.4全地区人口合计3826100\n三、统计表的设计原则\n练习:某医院急诊病人就诊等待时间如下14192419162024202122241817232622232525191816152421261921232022221616161225192420要求分5组。1)构筑频数分布;2)需急诊服务的病人的等待时间在20分钟以上的所占的比例;3)绘制直方图;4)上述数据显示了需急诊服务病人等待时间的何种状况。\n练习:电子协会雇员选择开始工作的时间7:008:309:008:007:307:308:308:307:307:008:308:308:008:007:308:307:009:008:308:00汇总数据,构建:a、频数分布b、百分数频数分布c、饼形图d、汇总结果表明弹性时间系统中雇员有什么偏好?\n练习:某班学生统计学考试成绩的分配数列如下表按成绩分组(分数)学生数60以下660-701270-803080-901090以上4\n1.某企业对某所属车间的生产计划完成百分比采用如下分组,请指出哪项是正确的()。A80__89B80%以下C80%以下D85%以下90_99%80.1__90%80__100%85__95%100__109%90.1__100%100__110%95__105%110%以上100.1__110%110%以上105__115%单选题\n2.在进行组距式分组时,凡遇到某单位的标志值刚好等于相邻两组上下限的数值时,一般是(),A)将此值归入上限所在组B)将此值归入下限所在组C)将此值归入上限或下限所在的组均可D)另行分组\n3.品质分组和变量分组的区别在于()。A)分组的任务和作用不同B)选择分组标志的多少不同C)选择分组标志的性质不同D)组数的多少不同\n4.下列分组哪些是按品质标志分组()。A)职工按文化程度分B)固定资产按用途分组C)工人按工资分组D)学生按性别分组E)企业按生产计划完成程度分组多选题\n5.下列哪些分组是按数量标志分组()。A)工人按出勤率分组B)学生按健康状况分组C)企业按固定资产原值分组D)家庭按收入水平分组E)人口按年龄分组\n6.在次数分配数列中,()。A)各组的频数之和等于100B)各组的频率大于0C)频数越小,则该组的标志值所起的作用越小D)总次数一定,频数和频率成反比E)频率表明各组标志值对总体的相对作用程度

相关文档