• 1.54 MB
  • 2022-09-01 发布

《统计学正态分布》PPT课件

  • 57页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
正态分布及其应用Normaldistributionanditsapplications统计学中最重要的理论分布之一\n主要内容(Content)随机变量的概率分布正态分布的概念及图形正态分布的特征正态分布曲线下面积的规律标准正态分布正态分布的应用总结2\n随机变量变量和随机变量变量取值的相对频率说明了具有某个性质的观察对象出现的可能性。随机变量离散型:性别、血型、子女数、事故数连续型:身高、体重3\n例:密度函数和分布函数抛两枚硬币,密度函数分布函数4\n例:密度函数和分布函数x5\n随机变量的概率分布概率函数(ProbabilityFunction),或者说概率密度函数(ProbabilityDensityFunction)、密度函数。在统计学中,我们说变量具有分布函数(DistributionFunction)。用此函数的大小来说明变量取某些值的可能性。当变量的取值包括了所有可能的取值时,分布函数为1。当变量具备了以上两个函数之后,称它具有某种分布(Distribution)6\n正态分布Normaldistribution德国数学家Gauss发现最早用于物理学、天文学Gaussiandistribution7\n(a)(b)(d)(c)正态分布的概念及图形8\n\n正态分布的概率密度函数如果随机变量X的概率密度函数则称X服从正态分布,记作X~N(,2),其中,为分布的均数,为分布的标准差。(-∞<X<+∞)10\n正态分布图示X0.1.2.3.4f(X)11\n方差相等、均数不等的正态分布图示31212\n均数相等、方差不等的正态分布图示21313\n正态分布的特征单峰分布;高峰在均数处;以均数为中心,均数两侧完全对称。正态分布有两个参数(parameter),即位置参数(均数)和变异度参数(标准差)。有些指标本身不服从正态分布,但经过变换之后可以服从正态分布。正态曲线下的面积分布有一定的规律。14\n正态曲线下某一区域的面积用定积分来求:正态曲线下的面积15\n正态曲线下的面积规律X轴与正态曲线所夹面积恒等于1。对称区域面积相等。S(-,-X)S(+X,)=S(-,-X)16\n正态曲线下的面积规律对称区域面积相等。S(-x1,-x2)-x1-x2+x2+x1S(-x1,-x2)=S(+x1,+x2)17\n正态曲线下的面积规律-4-3-2-101234-3-2-++2+3S(-,-3)=0.0013S(-,-2)=0.0228S(-,-1)=0.1587S(-,)=0.5S(-,+3)=0.9987S(-,+2)=0.9772S(-,+1)=0.8413S(-,)=118\n正态曲线下的面积规律-4-3-2-101234-3-2-++2+31-S(-3,+3)=0.00261-S(-2,+2)=0.04561-S(-,+)=0.317419\n正态曲线下的面积规律-4-3-2-101234-3-2-++2+3S(-,-3)=0.0013S(-,-2)=0.0228S(-,-1)=0.1587S(-,)=0.5S(-,+3)=0.9987S(-,+2)=0.9772S(-,+1)=0.6587S(-,)=120\n正态曲线下的面积规律-3-2-++2+3S(-,-3)=0.0013S(-,-2)=0.0228S(-,-1)=0.1587S(-,-0)=0.5S(-3,-2)=0.0115S(-2,-1)=0.1359S(-1,)=0.3413-4-3-2-10123421\n正态曲线下的面积规律-3-2-++2+3S(-,-3)=0.0013S(-,-2)=0.0228S(-,-1)=0.1587S(-,-0)=0.5S(-3,-2)=0.0115S(-2,-1)=0.1359S(-1,)=0.3413-3-2-1012322\n正态曲线下的面积规律-3-++3-2+2S(-3,-2)=0.0115S(-2,-1)=0.1359S(-1,)=0.3413S(-,-3)=0.0013S(-,-2)=0.0228S(-,-1)=0.1587S(-,-0)=0.523\n正态曲线下的面积规律-1.96+1.962.5%2.5%95%24\n正态曲线下的面积规律-1.64+1.645%5%90%25\n正态曲线下的面积规律-2.58+2.580.5%0.5%99%26\n正态曲线下的面积规律正态分布的一个显著特点其曲线下面积完全决定于以标准差为单位从点x到µ的离差。27\n231X2=-σ2X2X1=-σ1X1X3=-σ3X30.15870.15870.158728\n正态曲线下的面积规律正态曲线下面积总和为1;正态曲线关于均数对称;对称的区域内面积相等;对任意正态曲线,按标准差为单位,对应的面积相等;-1.64~+1.64内面积为90%;-1.96~+1.96内面积为95%;-2.58~+2.58内面积为99%。小于-3的面积为0.13%;小于-2的面积为2.28%;小于-的面积为15.87%。29\n正态分布转换为标准正态分布若X~N(,2),作变换:则u服从标准正态分布。u称为标准正态离差(standardnormaldeviate)30\n标准正态分布标准正态分布(standardnormaldistribution)是均数为0,标准差为1的正态分布。记为N(0,1)。标准正态分布是一条曲线。概率密度函数:(-∞<u<+∞)31\n标准正态分布曲线下面积(u)u0.00-0.02-0.04-0.06-0.08-3.00.00130.00130.00120.00110.0010-2.50.00620.00590.00550.00520.0049-2.00.02280.02170.02070.01970.0188-1.90.02870.02740.02620.02500.0239-1.60.05480.05260.05050.04850.0465-1.00.15870.15390.14920.14460.1401-0.50.30850.30150.29460.28770.281000.50000.49200.48400.47610.46810u32\n正态分布的应用估计频数分布质量控制确定临床参考值范围33\n总结正态分布是描述个体变异的重要分布之一,也是统计学理论中的重要分布之一;正态分布是一簇分布,由两个参数决定:均数和标准差;正态分布曲线下的面积是有规律的,且与标准正态分布曲线下的面积对应(以标准正态离差为单位)。34\n需要掌握的内容正态分布的性质正态曲线下面积的分布规律参考值范围确定的原则和方法35\nThankyou36\n估计频数分布某项目研究婴儿的出生体重服从正态分布,其均数为3150g,标准差为350g。若以2500g作为低体重儿,试估计低体重儿的比例。首先计算标准离差:查标准正态分布表:(-1.86)=0.0314结果:估计低体重儿的比例为3.14%.37\n质量控制质量控制的意义监控日常工作、科研过程、生产过程中误差的变化,分析变化的趋势是否出现异常,从而引起警觉和注意,以便分析原因,并及时采取措施。38\n质量控制图(qualitycontrolchart)UCL(上控制限)UWL(上警戒限)CL(中心线)LWL(下警戒限)LCL(下控制限)样本编号、取样时间M+3SDM+2SDMM-2SDM-3SD39\n质量控制图(qualitycontrolchart)UCL(上控制限)UWL(上警戒限)CL(中心线)LWL(下警戒限)LCL(下控制限)样本编号、取样时间M+3SDM+2SDMM-2SDM-3SD40\n质量控制图(qualitycontrolchart)UCL(上控制限)UWL(上警戒限)CL(中心线)LWL(下警戒限)LCL(下控制限)样本编号、取样时间M+2.58SDM+1.96SDMM-1.96SDM-2.58SD41\n质量控制图(qualitycontrolchart)123456789101112131415取样时间M+3SDM+2SDMM-2SDM-3SD42\n参考值范围(referenceinterval)参考值范围又称正常值范围(normalrange)。什么是参考值范围:是绝大多数正常人的某观察指标所在的范围。绝大多数:90%,95%,99%等等。确定参考值范围的意义:用于判断正常与异常。“正常人”的定义:排除了影响所研究的指标的疾病和有关因素的同质的人群。43\n参考值范围的估计方法:正态分布法2.5%2.5%95%-1.96+1.9644\n参考值范围确定的原则选定足够例数的同质的正常人作为研究对象控制检测误差判断是否分组(性别,年龄组)单、双侧问题选择百分界值(90%,95%)确定可疑范围45\n单侧与双侧参考值范围根据医学专业知识确定!双侧:白细胞计数,血清总胆固醇,单侧:上限:转氨酶,尿铅,发汞……下限:肺活量,IQ,46\n正常人病人假阳性率假阴性率正常人与病人的数据分布重叠示意图(单侧)47\n正常人病人假阳性率假阴性率正常人与病人的数据分布重叠示意图(单侧)48\n正常人病人假阳性率假阴性率病人正常人与病人的数据分布重叠示意图(双侧)49\n参考值范围的估计方法:百分位数法P2.5P97.550\n参考值范围的估计方法方法双侧单侧下限单侧上限正态分布法百分位数法P2.5~P97.5>P5