统计学的对象和方法 53页

  • 548.81 KB
  • 2022-09-01 发布

统计学的对象和方法

  • 53页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
第一章统计学的对象和方法第一节什么是统计第二节统计学的种类及其性质第三节统计学的基本概念1\n第一节什么是统计一、无处不在的统计有人利用“搜狗”对互联网进行搜索,得到的结果是:包含“统计”这一词汇的网页高达34,692,925项,包含“粮食”这一词汇的网页有5,045,290项,前者是后者的60多倍。在诺贝尔经济学获奖者中,三分之二以上的研究成果与统计和定量分析有关。因此,著名经济学家萨缪尔森在其经典的教科书,《经济学》12版中特别提到:“在许多与经济学有关的学科中,统计学是特别重要的”。2\n美国杜邦公司的总经理理查德曾经指出“现代公司在许多方面是根据统计来行事的。”(转引自《马夸德特谈统计学家的重要作用》,《统计教育》1994年第3期)。美国前总统布什的年薪已经达到40万美元,在各国元首中名列首位,但根据美国《工作等级年鉴》一书的排名,总统一职并未进入最好工作之列。根据该书的统计,在美国,工作环境最好的工作是:统计学家。(转引自2002年3月7日《扬子晚报》)3\n1981年,首届国际《红楼梦》研讨会在美国召开,威斯康星大学讲师陈炳藻独树一帜,宣读了题为《从词汇上的统计论〈红楼梦〉作者的问题》的论文。他从字、词出现频率入手,通过计算机进行统计、处理、分析,对《红楼梦》后40回系高鹗所作这一流行看法提出异议,认为120回均系曹雪芹所作。4\n统计数字大仲马的作品多曲折感人,而大仲马又多私生子,所以,取笑讥讽他的人,往往把他的作品比作他的私生子。最使他头痛的是巴黎统计学会的秘书长李昂纳,这人是大仲马的朋友,每次举统计数字的例子,总是说大仲马的情妇和私生子有多少。5\n有一年该统计学会开年会,大仲马估计,李昂纳又要大放厥词,说他的坏话了。于是他请求参加年会,获得了批准,果然不出大仲马所料,李昂纳又举他的情妇和私生子的例子。李昂纳报告完毕,请大仲马致词。一向不愿在大庭广众之下发表演讲的大仲马,这次却破例登台说:“所有统计数字都是撒谎的,包括有关本人的数字在内。”听众哄堂大笑。6\n关于统计数字的政治笑话能想象为这样一个机构效力吗?该机构的统计数字如下:*29人曾被控虐待配偶;*7人曾因诈骗被捕;*19人曾被控开空头支票;*117人曾被控直接或间接搞跨至少两家企业;*3人曾因大打出手而坐牢服刑;*71人因信用不佳拿不到信用卡;*74人曾因被控吸毒或贩毒而被捕;7\n*8人曾因入店行窃被捕;*21人现时官司缠身;*84人一年来因酒后驾车被捕;能猜出这是什么机构吗?这就是有535名议员的英国国会,这帮家伙每年炮制出数百项新法律条文让大家遵守!!8\n统计学家有个从未管过自己孩子的统计学家,在一个星期六下午妻子要外出买东西时,勉强答应照看一下4个年幼好动的孩子。当妻子回家时,他交给妻子一张纸条,上写: “擦眼泪11次;系鞋带15次;给每个孩子吹玩具气球各5次,每个气球的平均寿命10秒钟;警告孩子不要横穿马路26次;孩子坚持要穿过马路26次;我还想再过这样的星期六0次。”9\n数学家的幽默统计学家调侃数学家:你们不是说若X=Y且Y=Z,则X=Z吗!那么想必你若喜欢一个女孩,那么这个女孩喜欢的男生你也喜欢吧? 数学家反问道:那么你把左手放到一锅一百度的开水中,右手放到一锅零度的冰水里想来也没事吧!因为它们平均不过是五十度而已!10\n二、统计(Statistics)的涵义统计是人们认识客观世界总体数量变动关系和变动规律的活动的总称,是认识客观世界的有力工具。统计的研究对象的特点:(一)数量性。统计数据是客观事物量的反映。(二)总体性。统计的数量研究是对现象总体中各单位普遍存在的事实进行大量观察和综合分析。(三)变异性。总体各单位的特征表现存在着差异,而且这些差异并不是事先可以预知的。11\n日常生活中,“统计”的3种含义统计工作(又称统计实践)是搜集、整理、分析和提供关于社会经济现象的数字资料工作的总称。英文中的统计statistics与“国家”同一词根,可以说,自从有了国家,就有统计实践活动。统计数据是统计实践活动的成果。如:经济增长速度、价格指数等。对统计数据要求:客观性、准确性和及时性。12\n统计学是研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。统计学与统计实践活动的关系是理论与实践的关系,理论源于实践,理论又高于实践,反过来又指导实践13\n三、统计研究的基本环节统计设计收集数据整理与分析资料积累开发应用统计学理论与相关实质性学科理论描述统计推断统计统计调查、实验14\n统计研究的全过程包括以下基本环节:(一)统计设计根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。同时提出收集、整理和分析数据的方案和工作进度等。搞好统计设计不仅要有统计学的一般理论和方法为指导,而且还要求设计者对所要研究的问题本身具有深刻的认识和相关的学科知识。15\n(二)收集数据统计数据的收集有两种基本方法。对于大多数自然科学和工程技术研究来说,有可能通过有控制的科学实验去取得数据,这时可以采用实验法。对于社会经济现象来说,一般无法进行重复实验,要取得有关数据就必须进行调查观察。16\n(三)整理与分析描述统计是指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。推断统计是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或检验总体的数量特征。推断统计是现代统计学的主要内容。17\n(四)统计资料的积累、开发与应用对于已经公布的统计资料需要加以积累,同时还可以进行进一步的加工,结合相关的实质性学科的理论知识去进行分析和利用。如何更好地将统计数据和统计方法应用于各自的研究领域是应用统计学研究的一个重要方面。18\n第二节统计学的种类及其性质一、统计学的产生与发展(一)政治算术学派最早的统计学源于17世纪英国。其代表人物是威廉.配第。他在《政治算术〉一书中,写到:本书“不用比较级、最高级进行思辨或议论,而是用数字……来表达自己想说的问题……借以考察在自然中有可见的根据的原因。”政治算术学派主张用大量观察和数量分析等方法对社会经济现象进行研究的主张,为统计学的发展开辟了广阔的前景。19\n(二)国势学派最早使用“统计学”这一术语的是德国国势学派。国势学派虽然创造了统计学这一名词,但他们主要使用文字记述方法对国情国力进行研究,其学科内容与现代统计学有较大差别。20\n(三)社会统计学派1850年,德国的统计学家克尼斯(K.G.A.knies)发表了题为《独立科学的统计学》的论文,提出统计学是一门独立的社会科学,是一门对社会经济现象进行数量对比分析的科学,他主张以“国家论”作为国势学的科学命名,而以“统计学”作为“政治算术”的科学命名。在德国、日本和前苏联,社会统计学派都曾有相当大的影响。21\n各国学者在社会经济统计指标的设定与计算、指数的编制、资料的收集与整理、统计调查的组织和实施、经济社会的数量分析和预测等方面做出的贡献已成为现代统计学的重要组成部分。例如,“恩格尔系数”,至今仍为人们广泛使用。国民收入和国内生产总值的核算方法被称为“20世纪最伟大的发明之一。”22\n(四)数理统计学派创始人是比利时统计学家凯特勒(1796—1874年)。他所著的代表作《社会物理学》等将概率论和统计方法引入社会经济方面的研究。认为统计学是一门通用的方法论科学。23\n从19世纪中叶到20世纪中叶,数理统计学得到迅速发展。英国生物学家高尔顿提出并阐述了“相关”的概念;皮尔逊提出了计算复相关和偏相关的方法。戈塞特建立了“小样本理论”,即所谓的“t分布”;费歇尔:样本相关系数的分布、方差分析、实验设计等方面的研究中做出了重要贡献。到20世纪中期,数理统计学的基本框架已经形成。数理统计学派成为英美等国统计学界的主流。24\n二、理论统计学和应用统计学历经300多年的发展,统计学目前已经成为横跨社会科学和自然科学领域的多科性的科学。“统计学是有关如何测定、收集和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。”从横向看,各种统计学都具有上述共同点,因而能够形成一个学科“家族”。从纵向看,统计学方法应用于各种实质性科学,同它们相结合,产生了一系列专门领域的统计学。由此可见,现代统计学可以分为两大类:一类是以抽象的数量为研究对象,研究一般的收集数据、整理数据和分析数据方法的理论统计学。另一类是以各个不同领域的具体数量为研究对象的应用统计学。25\n理论统计学把研究对象一般化、抽象化,以数学中的概率论为基础,从纯理论的角度,对统计方法加以推导论证,其中心内容是以归纳方法研究随机变量的一般规律。理论统计学的特点是计量不计质,它具有通用方法论的理学性质。应用统计学是有具体对象的方法论。所谓应用既包括一般统计方法的应用,更包括各自领域实质性科学理论的应用。应用统计学从所研究的领域或专门问题出发,视研究对象的性质采用适当的指标体系和统计方法,解决所需研究的问题。应用统计学不仅要进26\n行定量分析,还需要进行定性分析。所以应用统计学通常具有边缘交叉和复合型学科的性质。理论统计学和应用统计学总是互相促进,共同提高的。理论统计的研究为应用统计提供方法论基础,应用统计学在对统计方法的实际应用中,又常常会对理论统计学提出新的问题,开拓理论统计学的研究领域。27\n社会经济统计学是一门以社会经济现象的数量方面为特定研究对象的应用统计学。要在社会经济领域应用统计方法,必须解决如何科学地测定社会经济现象即如何科学地设置指标的问题。要对社会经济问题进行统计分析,也必须以有关的经济与社会理论为指导。因此,社会经济统计学的特点是在质与量的紧密联系中,研究事物的数量特征和数量表现。28\n由于社会经济现象所具有的复杂性和特殊性,社会经济统计学不仅要应用一般的统计方法,而且还需要研究自己独特的方法,如核算的方法、综合评价的方法等等。通过社会经济统计,国家可以准确、及时、全面、系统地掌握国民经济和社会发展情况,对国民经济和社会运行监督和预警,为宏观调控和决策提供依据。企业可以及时了解商品市场和要素市场运行的状况和企业自身的经营动态,为企业营销决策、投资理财提供参考。29\n三、统计学与有关学科的联系与区别1、数学与统计学。数学与统计学都是研究数量规律的,都要利用各种公式进行运算。数学中的概率论,为统计学提供了数量分析的理论基础。统计学中的理论统计学以抽象的数量为研究对象,其大部分内容也可以看作是数学的分支。统计学与数学的区别从研究对象看,数学以最一般的形式研究数量的联系和空间形式。统计学特别是应用统计学则总是与客观的对象联系在一起的。30\n从研究方法看,数学主要是逻辑推理和演绎论证的方法。而统计学则采用归纳的方法。统计学家特别是应用统计学家需要深入实际,进行调查或实验去取得数据,研究时不仅要运用统计的方法,而且还要掌握某一专门领域的知识。31\n统计学与经济学统计学与相关的实质性学科如经济学等,有密切的联系。统计学是开展经济研究不可或缺的重要工具。通过统计的实证研究,可以帮助人们认识有关的数量规律,同时检验经济学理论的真实性和完善程度。经济学等实质性学科对经济统计学起着重要的指导作用。不仅统计指标的设定离不开实质性学科的指导,而且应用统计方法也在很大的程度上受所研究对象性质的影响。32\n统计学与相关实质性学科的区实质性学科研究该领域现象的本质关系并对有关规律作出合理的解释和论证。统计学只是为实质性学科研究和认识数量规律提供专门的方法和工具,并不直接对规律产生的原因和机理作进一步的分析。33\n统计学家未必是经济学家,经济学家也未必是统计学家。但经济统计学家应当既是统计学家又是经济学家。经济学数学统计学34\n图1-2统计学学科体系经济学社会学教育学其他社科物理学生物学医学其他理工农经济统计社会统计教育统计其他社科统计统计学物理统计生物统计医药统计其他理工农统计35\n第三节统计学的基本概念一、总体与总体单位统计总体是根据一定目的确定的所要研究的事物的全体。它是由客观存在的、具有某种共同性质的许多个别事物构成的整体。例如要研究全国城镇居民的收支情况,就以全国城镇居民作为一个总体。。同质性是确定统计总体的基本标准,它是根据统计的研究目的而定的。36\n研究目的不同,则所确定的总体也不同,其同质性的意义也随之变化。例如,研究城镇居民贫困户的生活状况,那么,贫困线下的城镇居民户则构成了统计总体,贫困线下的城镇居民户是同质的,而贫困线上的城镇居民户是非同质的。统计总体还应具备大量性。统计总体应该由足够数量的同质性单位构成。37\n总体单位(简称单位)是组成总体的各个个体。根据研究目的的不同,单位可以是人、物、机构等实物单位,也可以是一种现象或活动等非实物单位。总体和单位的概念是相对而言的,随研究目的不同,总体范围不同而变化。同一研究对象,在一种情况下为总体,但在另一情况下又可能变成单位。根据总体所包含的单位数量,总体可以分为有限总体和无限总体两类。有限总体是由有限量的单位构成的总体。当总体单位数难以确定,其数量可能是无限时,便构成无限总体。38\n二、样本当总体单位数量很多甚至无限时,不必要或不可能对构成总体的所有单位都进行调查。这时,需要采用一定的方式,从由作为研究对象的事物全体构成的总体(又称母体)中,抽取一部分单位,作为总体的代表加以研究。这种由总体的部分单位组成的集合称为样本(又称子样)。样本也由一定数量的单位构成的,样本所包含的总体单位数称为样本容量。三、标志总体各单位普遍具有的属性或特征称为标志。例如每个工人都具有性别、工种、文化程度、技术等级、年龄、工龄、工资等属性和特征,这些就是工人作为总体单位的标志。39\n标志分为品质标志和数量标志两种。品质标志表明单位属性方面的特征,品质标志的表现只能用文字、语言来描述如工人的性别。数量标志表明单位数量方面的特征,可以用数值来表现,如年龄。如果一个总体中各单位有关标志的具体表现都相同,称之为不变标志。例如在工人这一总体中,职业是不变标志。在一个总体中,当一个标志在各单位的具体表现有可能不同时,这个标志便称为变异标志。例如各人的工龄可能表现不同,因而是可变标志。一个总体至少要有一个不变标志,才能够使各单位结合成一个总体。不变标志是总体同质性的基础。作为总体,同时必须存在变异标志,这表示所研究的现象在各单位之间存在着差异,才需要进行统计研究。40\n四、统计指标与指标体系统计指标是反映统计总体数量特征的概念和数值。统计指标由两项基本要素构成,即指标的概念(名称)和指标的取值。指标的概念(名称)是对所研究现象本质的抽象概括,也是对总体数量特征的质的规定性。确定统计指标必须有一定的理论依据,使之与社会经济或科学技术的范畴相吻合。同时,又必须对理论范畴和计算口径加以具体化。指标的数值反映所研究现象在具体时间、地点、条件下的规模和水平。在观察指标数值时,必须了解其具体的时间状态、空间范围、计量单位、计量方法等限定,同时注意由于上述条件的变化而引起数值的可比性问题。41\n指标与标志的关系标志反映总体单位的属性和特征,而指标则反映总体的数量特征。标志和指标的关系是个别和整体的关系。需要通过对各单位标志的具体表现进行汇总和计算才能得到相应的指标。总体和单位的概念会随着研究目的不同而变化,因此指标与标志的概念也是相对而言的。42\n例如,所要研究的是全国工业企业的情况,则各企业的职工人数、固定资产、工业增加值等都是总体单位(即各个企业)的标志;如果研究目的变成研究某一企业的职工状况,则该企业变成一个总体,企业职工人数变成了统计指标,每个职工的文化程度、技术等级、性别等就成为标志。43\n统计指标可以分为数量指标和质量指标。凡是反映现象总规模、总水平的统计指标称为数量指标。例如人口总数、企业总数、商品进出口总额等等,这些指标反映现象或过程的总规模和水平,所以也称为总量指标,用绝对数来表示。凡是反映现象相对水平和工作质量的统计指标称为质量指标,例如职工平均工资、人口密度、工人出勤率等等。质量指标是总量指标的派生指标,用相对数或平均数来表示,以反映现象之间的内在联系和对比关系。统计指标体系是由一系列相互联系的统计指标所组成的有机整体。用以反映所研究现象各方面相互依存相互制约的关系。例如,工业企业统计指标体系。44\n五、统计数据(一)变量与变量值说明现象的某一数量特征的概念被称为变量,变量的具体取值是变量值,统计数据就是统计变量的具体表现。例如,固定资产是一个变量,各企业固定资产的具体数值是变量值。连续型变量是指变量的取值在数轴上连续不断,无法一一列举,即在一个区间内可以取任意实数值。例如,气象上的温度、湿度,零件的尺寸等。离散型变量是指变量的其取值是整数值,可以一一列举。例如,企业数,职工人数等。45\n确定性变量是受确定性因素影响的变量,即影响变量值变化的因素是明确的,是可解释和可控制的。随机变量则是受许多微小的不确定因素(又称随机因素)影响的变量。变量的取值无法事先确定。(二)数据的计量尺度统计数据是总体单位标志或统计指标的具体数量表现。根据对研究对象计量的不同精确程度,人们将计量尺度由低到高、由粗略到精确分为四个层次:46\n1.定类尺度是按照客观现象的某种属性对其进行分类。这一场合的所使用的数值只是作为各种分类的代码,并不反映各类的优劣、量的大小或顺序。例如,人口按性别分为男女,用“1”表示男性,用“0”表示女性。定类尺度的主要数学特征是“=”或“≠”。在统计处理中,对于不同的类别,虽然可以计算单位数,但它不能表明第一类的一个单位可以相当于第二类的几个单位。47\n2.定序尺度是对客观现象各类之间的等级差或顺序差的一种测度。利用定序尺度不仅可以将研究对象分成不同的类别,而且还可以反映各类的优劣、量的大小或顺序。例如,学生成绩可以分为优、良、中、及格和不及格等五类。在这里,定序尺度虽然无法表明一个优等于几个良,但却能确切地表明优高于良,良又高于中……。定序尺度的主要数学特征是“<”或“>”。48\n3.定距尺度是对现象类别或次序之间间距的测度。定距尺度不但可以用数表示现象各类别的不同和顺序大小的差异,而且可以用确切的数值反映现象之间在量方面的差异。定距尺度使用的计量单位一般为实物单位(自然或物理)或者价值单位。定距尺度的主要数学特征是“+”或“–”。统计中的总量指标就是运用定距尺度计量的。49\n4.定比尺度。定比尺度是在定距尺度的基础上,确定相应的比较基数,然后将两种相关的数加以对比而形成相对数(或平均数),用于反映现象的结构、比重、速度、密度等数量关系。例如,将一个企业创造的增加值与该企业的职工人数对比,计算全员劳动生产率,以此反映该企业的生产效率。定比尺度的主要数学特征是“×”或“÷”。50\n(三)数据的类型横截面数据又称为静态数据,它是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。时间序列数据又称为动态数据,它是指在不同时间对同一总体的数量表现进行观察而获得的数据。例如,2005年全国各省市自治区的国内生产总值就属于横截面数据。而“十五”期间我国历年的国内生产总值就属于时间序列数据。51\n(四)数据的表现形式1、绝对数。现象的规模、水平一般以绝对数形式表现。绝对数的计量单位一般为实物单位或价值单位,有时也采用复合单位。实物单位可以是自然计量单位,也可以是物理计量单位,如人口数用人计量,机器数用台计量,对于一些化工产品和燃料,常常还折合成标准实物单位计量。复合计量单位是由两种或两种以上计量单位复合而成的,如以“吨公里”为货物周转量的计量单位,以“千瓦时”为用电量的计量单位。52\n2、相对数。相对数由两个互相联系的绝对数对比求得。常用的相对数包括:结构相对数、动态相对数、比较相对数、强度相对数、计划完成相对数等。3、平均数。平均数反映现象总体的一般水平或分布的集中趋势。53

相关文档