医学统计学重点笔记 12页

  • 72.12 KB
  • 2022-08-13 发布

医学统计学重点笔记

  • 12页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
医学统计学-重点-终极笔记MedicalStatistics[Introduction]医学统计工作的内容L实验设计:最关键、最重要2.收集资料:最基础[原始资料]实验数据,现场调查资料,医疗卫生工作记录、报告、报表质量控制:精度和偏倚3.整理资料:资料的逻辑、一致性检查,原始数据的加工(频数分布表)4.分析资料:统计描述(表、图、离散趋势、集中趋势)和统计推断资料的类型⑴计量资料:定量方法测定数值大小所得的资料⑵计数资料:按性质或类别分组,然后计数⑶等级分组资料:具有计数资料的特性,又有半定量的性质(“+,-”表示)变异:不同个体在相同环境下,对外界环境因素发生的不同反应,即个体差异总体:同质的个体所构成的全体。[同质性,大量性,差异性]样本:从总体中抽取部分个体的过程称为抽样,所抽得的部分是样本样本包含的个体数目称为样本含量样本的特征:⑴代表性⑵随机性⑶可靠性*抽样的要求:代表性,随机性,可靠性,可比性完全随机设计:将受试对象随机分配到各处理组或对照组中,或分别从不同总体中随机抽样进行研究。可为两样本或多样本得比较,但样本含量不宜相差太大。\n随机区组设计:也称配伍设计,是配对设计的扩展。配对设计的每一“对子”中的受试对象分别随机分到两个处理组中,而配伍组设计中的每个“配伍组”,包含多个受试对象,要将它们分别随机分到各处理组中。误差:泛指观测值与真实值之差,以及样本统计量与总体参数之差⑴系统误差:在收集资料过程中,由于仪器调整、试剂校验、医生对疗效的掌握等因素,造成观察结果倾向性的偏大活偏小。要尽量查明原因,必须克服。⑵随机测量误差:在收集资料过程中,即使系统误差已经避免,由于各种偶然因素的影响造成对同一对象多次测定的结果不完全一致。譬如操作员技术、电压、环境温度的差异。没有固定的倾向,时高时低;应采取措施加以控制。⑶抽样误,由抽样不同引起的样本均数与总体均数之间的差异。原因是个体之间存在变异,抽样时只能抽取总体的一部分作为样本。不可避免,要用统计方法进行正确分析。概率:描写某一事件发生可能性大小的一个度量。频率:样本实际发生率小概率事件:P<=0.05(差别有统计学意义)或P<=0.01(差别有高度统计意义)的事件变量:观察单位的某些特征变量值:观察、测定的结果【集中趋势的统计描述】频数表(计量资料):同时列出观察指标的可能取值区间及各区间的频数集中趋势:变量值的集中位置离散趋势:变量值围绕集中位置的分散情况平均数:描述一组观察值集中位置或平均水平的统计指标。常作为一组数据的代表信用于分析或进行组间比较。[适用条件]:对称分布或偏度不大的资料,尤其适合正态分布算术均数(X):简称均数,说明一组观察值平均水平或集中趋势(描述计量资料)几何均数(G):描述观察值间按倍数关系变化的资料的平均水平,如滴度、浓度、血清效价、细菌计数。中位数(M):观察值按从小到大排列时,居于中心位置的数值。n为奇数时,M=l(n+1)/2项n为偶数时,M=1n/2项和第(n/2+1)项的平均值\n[适用条件]:分布明显呈偏态;频数分布的一端或两端无确切值百分位数(P):在一组数据中找到一个数值Px,全部观察值的x%」、于Px0P25,P75描述资料的离散程度P2.5,P97.5规定医学95%勺参考值范围【变异程度的统计描述】极差(R):即全距,观察值中最大值与最小值之差。不去用于开口资料\n四分位数间距|(Q):一组观察值按大小排序后,分成四个数目相等的段落,每段观察值占总例数的25%去掉两端含有极端数值的25%取中间50%勺数据范围即为Q。(适用于偏态分布&开口资料)[Q=P75-P25]Q越大,则数据变异越大平均偏差:各观察值偏离平均数的平均差距。即各观察值与均数之差的绝对值XX之和的平均。平均偏差=n一2离均差平方和:通过取平方避免正负抵消SSXX方差:离均差平方和再取平均,分母用自由度v=n-1代替*自由度(v):在所有的n个离均差平方项中,只有n-1个是独立的。标准差(S):将方差取平方根,还原为与原始观察值单位相同的变异量度(反映样本值的离散程度)S\n1标准差变异系数(CV):均数相差较大或单位不同的几组观察值的变异程度的比较s-CVS100%(百分数,可能大于1)X正态分布曲线下的面积横轴:(f)f=2.58,1.96,1,0(居中)对应99%,95%,68.3%单侧,f=2.33,1,645,1,0正态分布的特征均数处最高,以均数为中心,两端对称中心以对应的f(x)最大;x越远离—f(x)越趋近于0,但不会为0永远不与x轴相交的钟型曲线有两个参数:均数一一位置参数;标准差一一形状(变异度)参数正态曲线下的面积分布有一定规律正态分布具有可加性标准正态分布:均数N=0,标准差(T=1的正态分布。转化公式:u--☆适用条件总结:①样本标准差正态,对数正态\n②变异系数单位不同或均数相差较大③四分位数间距偏态医学参考范围:也称正常值范围,正常人的解剖、生理、生化L免疫及组织代谢产物的含量等各数据的波动范围。(习惯上是包含95婿照总体的范围)[单侧][双侧]参考范围对应的百分位数(Px=)5,95;1,992.5,97.5;0.599.5参考范围对应的正态分布区间(f=)1.65;2.331.96;2.58[XfS]【抽样误差与假设检验】抽样误差:由抽样造成的样本均数和总体均数的差异。是不可避免的☆中心极限定理:在样本含量n很大(>=50)的情况下,无论原始测量变量服从什么分布,X的抽样分布都近似服从正态分布N(p,2/n)反映样本均数间变异的标准差。(反映样本均数间的离散程度,也反映样本均数与总体均数的差异)理论值X/品估计值SXS品参数估计:由样本统计量估计总体参数。点估计:使用单一的数值直接作为总体参数的估计值。如用又估计相应的N(未考虑抽样误差的影响)区间估计:按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。可信度:事先给定的概率1-a(通常取0.95或0.99);计算得到的是可信区问95%T信区间(X1.96X,X1.96X)假设检验:即显著性检验,是统计推断的重要内容,比较总体参数之间有无差\n首先对所需比较的总体提出一个无差别假设,然后通过样本数据去推断是否拒绝这一假设。基本步骤:⑴建立假设和确定检验水准⑵选择检验方法和计算检验计量⑶确定P值,作出统计推断无效假设:H0,指需要检验的假设,如**值治疗前后无差别即时:dd=0通常与我们要验证的结论相反,是计算检验统计量和P值的依据备择假设:是在H0成立证据不足的情况下而被接受的假设即Hi:ndw0双侧检验:无论正或负方向的误差,若显著超出检验水准则拒绝H0单侧检验:仅在正方向或负方向误差超出规定的水准时拒绝HoP值:假设检验下结论的主要依据,是指在原假设成立的条件下,观察到的样本差别是由于机遇所致的概率。P>0.05不显著0.010.05,可认为总体方差齐)t'检验u检验:总体标准差已知,或样本量较大时,样本均数与总体均数的比较t检验中的注意事项1,样本资料必须能代表相应总体2.t检验以正态分布为基础;非正态数据尝试变换为正态,或用非参数检验3.完全随机设计的两样本均数比较,要求两组方差齐4.对同一资料作单侧检验更容易获得显著结果5.假设检验用于推断总体均数间是否相同;可信区间用于估计总体均数所在范围☆假设检验中的两类错误第一类错误;当心为真时,拒绝也接受Hi。又称假阳性错误,,阳性指两者总体参数有差异。检验水准a是预先规定的犯错概率的最大值第二类错误:当Ho为假时,不拒绝H。。又称假阴性错误。概率大小用B表示,只取单侧,一般未知。可证,a越大B越小,a越小B越大。增大样本含量可同时减小两类错误。【方差分析】方差分析:将全部观测值的总变异按影响因素分为相应的若干部分变异,在此基础上,计算假设检验的统计量F值,实现对总体均数是否有差别的推断。条件:来自于正态分布总体,且总体方差相等的k个样本均数的比较(k>=3)完全随机设计:又称单因素方差分析,将实验对象随机分配到不同处理组的单因素设计方法。只考虑一个处理因素总变异SST.n个观测值的离均差平方和组向变异SSrR,组内均值与总均值之差的平方和组内变异SSE.组内各个观测值与本组内均值之差的平方和\n(反映各组内样本的随机波动)完全随机设计的方差分析表(自由度F=t2m个区k个处理组随机区组设计:又称配伍组设计,先将受试对象按条件相同或相近组成组,每个区组中有k个受试对象,再将其随机地分到中。(属于无重复数据的两因素方差分析)随机区组设计的方差分析表(自由度)【相对数及其应用】目对数:比较分析现象间的发展关系。把基数化作相等,便于比较*绝对数:研究事物现象的基本资料构成比某一事物的观察单位数同一事物各组成部分的观察单位总数100%☆相对数使用的注意事项L构成比只能说明某事物内部各组成部分的比重和分布,不能说明该事物某一部分发生的强度和概率。2.分母过小时相对数不稳定3.用以比较的资料应是同质的,4.要考虑存在的抽样误差,对总体进行推断时应作统计学检验「率的标准化:为了比较两个不同人群的患病率、发病率、死亡率等资料时,消除其内部构成(年龄、性别、工龄、病程长短等)的影响。标准构成:⑴选取有代表性、较稳定、数量较大的人群构成为标准⑵选择相互比较的各组例数合计为标准构成⑶从比较的各组中任选其一作为标准构成\n死亡率:某地某年每1000人中的死亡率年龄别死亡率:某地某年龄组每1000人口中的死亡数死因别死亡率:某年每10万人中,由于患某疾病死亡的人数死因构成:相对死亡比,某种死因引起的死亡人数占总死亡人数的百分比发病率:某一时期内特定人群中患某病新病例的频率患病率:某一时点某人群中患某病的频率(可大于100%病死率:某期间内,某病患者因某病死亡的频率治愈率:接受治疗的病人中治愈的频率【2检验】2检验:英国统计学家Peason提出的一种用途广泛的假设检验方法。该检验以2分布为理论依据,可以推断两个(或多个)总体率以及构成比之间有无差异。四格表资料的2检验理论频数Trc(nR?nJ/n四格表资料2检验专用公式四格表2检验校正公式22(adbc)2n(ab)(cd)(ac)(bd)(adbcn2)2n(ab)(cd)(ac)(bd)通常规则:①n40且所有的T5基本公式(或专用公式)②n40但有1T<5校正公式③n<40,或T<1Fisher确切概率法配对四格表资料的2检验观察结果的四种情况:①A+,B+回②A+,B-[b]③A-,B+[c]④A-,B-[d]公式:㈠2(b-c)-,=1(b+c)40㈡2(b^£=1(b+c)<40\n行列表资料的2检验.一..cA2.一…专用公式:2n—1,=(行数-1)(歹I」数-1)nRnc条件:⑴1