社会统计学复习资料 34页

  • 36.89 KB
  • 2022-09-01 发布

社会统计学复习资料

  • 34页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
社会统计学复习资料  微体谬误:分析单位指的是研究对象的个体,也就是研究所观察的单位,它可以是个人、群体、组织或者社会事件。在研究中,针对不同分析单位的结论,不可以在不同分析单位的研究对象间推论,否则就会产生两种谬误:区群谬误和微体谬误。前者是指以群体或其他整体为分析单位的研究结论推广到个体单位时犯的错误;后者是指以个体为分析单位的研究结论推广到较大分析单位时犯的错误。  描述计统:是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。  推论统计:是统计学乃至于心理统计学中较为年轻的一部分内容。它以统计结果为依据,来证明或推翻某个命题。具体来说,就是通过分析样本与样本分布的差异,来估算样本与总体、同一样本的前后测成绩差异,样本与样本的成绩差距、总体与总体的成绩差距是否具有显著性差异。  怎么样设计抽样?方案一:  一、调查设计和初步计划  在这一阶段,我们必须确定研究的目的和如何在时间和资源有限的前提下达成这一目的。\n  1、确定研究的目的1)检验某一假设?  2)检验一系列相关假设组成的因果模型?例如,a.具有传统价值观的人使用安非他命的可能性较小;b.有吸毒朋友的人更有可能使用安非他命;c.具有传统价值观的人有吸毒朋友的可能性较小。  3)估计具有某种信仰或具有某种特定行为的人的比例?例如,总体中花在专业学习上的时间每周为40个小时的人的比例是多少?  4)是为了研究某些特定的问题或人口中某一群体的态度或行为随时间的变化而变化的情况,还是为了解我们是否能找到一些干预手段来纠正人们的某些行为?  在上述各种不同的调查目的中,有许多是典型地需要对成年人口总体的常规调查研究,而有些则可能与一般人口的调查研究无关,只是与某些特定的子群体有关。例如,大学教员对加入工会组织持什么态度?外来移民工花费在看病上的钱占其收入的比例是多少?我们的研究目的也可能与个人完全不相干,但却与组织、群体、企业或政府机构有关。例如,某一类组织的会员年费?每一所高中低年级和高年级学生的辍学率?调查目的的确定将为下面的一系列决策提供框架:什么人或什么事情是我们感兴趣的总体?我们应该采用什么样的方法来收集数据?2、确定抽样计划或方案1)界定总体\n  在这一阶段,我们必须回答的基本问题是:什么样的人或什么事情是我们感兴趣的总体?  a.对个体进行研究时,我们必须考虑的基本问题有三个:合格的被调查人的年龄范围;研究结果想要概括的地理区域;总体包括的是那些住在家里的人,住在集体宿舍的人,还是无家可归者,或这三类人的某些组合。例如,如果我们在做一项有关公众对公共交通工具上犯罪的感觉方面的调查,那么,我们的被调查人应该包括哪些人呢?  b.在研究的对象是某些群体时,我们必须确定谁是群体或组织中能为我们提供精确信息的最为关键的人物。  另一个必须考虑的问题是调查的地理区域是否有代表性。我们必须确定我们的调查包含的面究竟应该有多广?例如,上述的公共交通系统问题究竟应该仅限于市中心,还是整个地区?  决策的依据是清晰的研究框架和可资利用的有关资源。2)制定抽样框  抽样框与总体的关系有三种情况:a.抽样框与研究总体完全匹配;  b.抽样框所包含的内容可能比总体更多;c.抽样框没有包括全部合格的总体成员。\n抽样框在很多情况下都未能包括合格总体中的所有个体。在这种总体定义与抽样框不相匹配时,我们需要考虑以下问题:丢失的总体究竟有多少?丢失的究竟是一些什么人?如果将他们排除在外,那么对因变量的结果的影响究竟有多大?实际上,我们要考虑的问题是,我们的调查允许存在的偏倚究竟有多大?  在调查中,是否需要把缺失的总体包括进来,依我们研究的我们研究的问题、可资利用的资源和研究进行的地点而定。例如,在各种一般人口总体调查中,电话薄是诸多使用最为普遍的抽样框之一。但电话薄并没有把所有的人口包括进来,这样,利用电话薄抽样是存在偏误的。但有很多研究者在进行抽样时,往往忽视了这一点。他们之所以这样做,原因有三:一是他们认为没有电话的住户对最终结果的影响是微不足道或可以忽略不计的;二是将无电话户包含进来的费用巨大,更何况他们只占总人口的非常小的一部分;三是,总的样本结果才对研究者具有最重要的意义,而子群体的结果则不是那么重要的。3、设计问卷  问卷设计阶段必须回答的两个问题是:  a.我们需要从被调查人那里收集什么样的信息?b.如何最清楚地将我们的想法表达出来?  在这里涉及问卷中开放式问题与封闭式问题的比重,是否问及有关态度、知识或行为方面的问题,需要什么类型的人口学信息,问题形式与调查类型的关系,等等。  我们总是希望能使被调查人要做的工作变得尽可能地简单容易,从而最大程度地避免无回答情况的发生。\n  4、确定可以支配的经费和时间  经费和时间决定了样本量的大小、调查员和编码员的聘请数量、调查涉及的地理范围。从经费来看,互联网调查是最快捷和最经济的,其次是邮寄式调查和电话调查,面访式调查是最昂贵的。从时间来看,电话调查比面访调查更为快捷,但完成这两种调查所需的时间在一定程度上都取决于样本地理分布范围的大小;互联网调查和邮寄式调查受这些变量的影响较小;邮寄式调查的时间进度是固定的,通常会持续8-10周。5、分析数据和报告研究结果这里需要考虑的问题是:  a.为回答研究提出的问题,我们需要选择哪些分析方法?b.准备研究报告、论文或其他研究成果所需的时间。二、试调查  调查过程的第二个阶段是对调查的初步设计进行测试。  1、草拟问卷  在草拟问卷之初,可以从其他较成功的研究中借用一些问题。当然,我们在借用之前,要了解他们是如何定义他们的概念和使用什么问题来测度这些概念的。借用他人研究中的问题有两种方式,一是全部借用,二是部分借用;这样的做的前提是没有版权问题。  关于问卷设计,我们必须注意:\n  a.不要当然地认为借用别人使用过的问题来测量我们的调查对象必定没有问题。不论我们从其他调查中借用的问题有多少,我们都必须在正式开始收集数据之前进行试调查。试调查,好比正式演出前的彩排,是调查最为重要的组成部分之一。  b.问卷只有在经过许多稿之后,才有望解决它存在的所有问题,并使调查对象对问题的理解趋于一致。高质量的研究和粗制滥造的研究的区别在于,前者在努力寻找或预见问题,而后者假设只要问题被回答便是有效的。  2、使用调查员在这一阶段,我们要注意三个问题:  a.起草和编写调查员培训材料,使调查员了解我们希望他们做什么。无论我们使用的是专业调查员,还是第一次做调查的学生,编写培训材料和培训调查员都是我们必须要做的工作。  b.遴选和雇佣调查员的工作必须与样本的选择密切配合。一个原则:调查员最好能生活在入选住户的附近,以最大程度地减少与调查对象联系所需的通勤时间和费用。  c.分配给试调查的时间决定了试调查中的需要调查员的人数。例如,如果我们用一个星期的时间进行试调查,需要调查的人数是30个,那么我们可能需要聘用和培训6个调查员,每个调查员需要调查5个调查对象。\n如果可能,我们应当使用最优秀的调查员,因为我们需要从他们那里得到有关我们问卷中可能发生的问题或调查方法和程序方面的批评性的反馈。3、听取调查员汇报  在每次试调查结束的时候,研究者应该安排会见所有的调查员,听取他们的汇报。调查员的汇报应包括问卷中的所有问题和所有调查步骤,发现存在的问题,并提出解决问题的建议。来自汇报会的反馈,加上审读实际调查记录将为问卷的进一步修改提供依据。4、确定试调查的方法在试调查的最初阶段,其目的在于收集对一个个问卷题目的反馈,而在以后阶段的目的则在于测试整个问卷和调查的方法步骤。  可以通过各种正式的和非正式的途径,来测试问卷题目:  a.非正式途径:找家庭成员、朋友或其他学生填写问卷,听取他们对问题的意见。b.正式途径:在经过非正式的试验后,觉得问卷可以拿得出手的时候,我们便可以在调查地区的正式调查对象中进行正式的试验。  在问卷改进过程中,有两种方法现在已被越来越多地使用:一种是认知访谈,另一种是焦点组。\n  认知访谈是一种一对一式的交谈方式,即只有一个调查员和一个访谈对象在场的访谈。调查员询问调查对象有关他们对所提问题的想法。在这过程中,调查员常常追问调查对象对某一特定词汇的涵义的理解,或要求他们对问题进行解释,以此判断他们是否理解这些词汇或题目。了解调查对象在回答问题时的认知过程,将有助于我们更好地撰写问题,从而收集到质量更高的数据。  例如,您认为食品的安全性的含义是什么?您个人认为食品的安全性有多么重要?  焦点组是为了帮助我们编写问题或使调查更为有效,而集合起来讨论某些议题、问题或其他事情的一群人。焦点组访谈有两种比较重要的用途:  a.在问卷设计完成之前,它可以保证正在或将要设计的问卷不遗漏重要的问题,同时也可以使我们对将要开展的研究题目有更深更多的了解;  b.可以作为一种测试问卷草稿的工具,特别是设计用于自填式问卷调查的问卷草稿的工具。在这个意义上,我们可以要求焦点组成员先根据自己的理解填写问卷,然后再对问卷进行小组讨论。一般讲,小组8-10个具有相同特征的人组成:全部是男性、女性、年轻工人、经理人员等。小组的组成在一定程度上取决于调查的主题,其组成方式应该以能使小组成员在交谈的时候感到不拘束为宜。我们对问卷的草稿已经感到满意后,应该找一些真正的调查对象进行测试。一个试调查通常要调查20-40个调查对象。人数是否超过这个数目,则取决于如下方面:我们感兴趣的子群体数、这些子群体对问题的理解程度、我们对我们已经在多大程度上测量了想要测量的概念的把握程度、时间进度和经费预算等。\n  在完成试调查并听取了调查员们的汇报之后,我们必须要对问卷和调查的方法步骤进行修改。试调查阶段可能延续一个月,甚至更长的时间。三、终结调查设计和计划  试调查的结果可以用于改进调查设计和执行计划。例如,在一个涉及四个医疗专业群体电话调查的试调查中,某一研究人员设计的问卷得到的回答率在40%-50%。那么在随后与医务人员的焦点组访谈中,我们就可以集中讨论如何提高回答率的问题。讨论之后得到的建议是,应该给医务人员在配合完成调查的问题上以选择的机会:他们既可以选择填写邮寄式问卷,也可以接受电话调查,因为这样可以让每一位医务人员选择最适合自己工作日程的调查方法。后来,整个正式调查的回答率上升到了67%。试调查也可以在确定邮寄式调查跟踪联系的时间间隔,或与调查对象的最后一次联系是使用邮件还是电话等方面给我们帮助。在抽样调查中几乎不存在什么确定而快捷的法则。为了提高回答率和数据质量,研究者必须因时因地制宜,随时做出各种调整。  在这一阶段,抽样计划、问卷、调查培训方法和培训材料、数据编码方案和数据分析方案等问题应做最后的调整。四、数据收集在这一阶段,我们需要对抽样的结果和数据收集过程进行监控,并开始编码和准备数据文件。  a.\n要确保所有个案合符规范地被抽取,及对所有这些个案的调查能顺利完成。电话调查和面访调查中无响应的调查对象应该在本周的另一天或同一天的另一个时间再一次进行联系。拒绝接受调查、无法联系、不合格的完成调查的比例各是多少?数据是否有作假的迹象?一般来说,我们要对每一个调查员完成的工作的10%-20%,通过督导再次与调查对象联系,对完成的调查进行验证。回访主要是了解调查是否确实进行过,而且要了解进行的时间的长短。我们也可采用隔周或每周样本处理情况报告的办法,以便尽早发现和解决调查中发生的问题,避免问题成堆,无法收拾。  b.检测调查员。一是深入全面地检查每一个调查员最初完成的那几份问卷,以确保没有任何问题被遗漏,得到的信息是完整的,且所有关于调查的规定都得到了遵守。重要的是我们必须把检查的结果及时反馈给每一个调查员,以便他们能在问题和错误成为定势之前予以纠正。二是检查调查员对分配调查任务的完成情况。因为没经验的调查员很可能因轻信调查对象诸如“我实在太忙”或“我对调查的问题不感兴趣”这样拒绝接受调查的借口而放弃对既定个案的调查。如果一个调查员的拒访人数比例异常高,那么我们就应当和那个调查员一起对那些个案一一加以检查,并找到对调查对象进行回访的方法或以后在遇到类似问题  时的处理方法。优秀的研究人员总是想法设法通过使用训练有素的调查员对拒访者进行回访,并促使他们转变态度接受调查,从而最大限度地减少持不合作态度的人数。通常情况下,初次拒访者能转化20%-40%。\n在完成数据收集后,我们必须对他们进行编码,并把完成的调查信息做成电脑数据文件。五、数据编码、数据文件的建立、数据分析和最终研究报告  研究时间进度表实例    1000户随机数码拨号电话调查的时间进度表  工作内容  需要的时间/周  起止时间/周  文献检索和起草问卷  8  1-8征求10名调查对象对问卷草稿的意见  1-2  8-9修改问卷  2  10-11进行第一次试调查  1  12听取调查员的汇报,修改问卷  3  13-15进行第二次试调查  1  16听取调查员的汇报,修改问卷和编写培训材料  4  17-20选取样本  12  8-19进行正式的数据收集  8  21-28数据编码和准备数据文件  12  21-32分析数据和撰写报告  开放,时间不限  开放  方案二:一、调查目的  了解大学生使用信用卡的情况及信用卡在大学生中的分布,并据此分析信用卡在大学生中的市场潜力和需求,并预测大学生信用卡的发展趋势。二、调查范围和内容1、目标总体和调查总体  目标总体指所有长沙市的大学生。具体包括中南大学湖南大学长沙理工大学湖南农业大学湖南中医药大学湖南师范大学中南林业科技大学长沙学院长沙医学院\n湖南涉外经济学院湖南商学院就读的各年级在校大学生。调查总体为根据长沙市的大学生实际情况设计形成的抽样框。2、调查内容  调查内容包括被调查人的性别和年级、大学生对信用卡的态度、大学生持有信用卡的原因、大学生在何种情况下使用信用卡、大学生期望的信用卡透支额、期望的还款日期、未持卡大学生不办卡的原因及大学生的消费支出等。三、抽样调查设计第一步:确定抽样方法  调查决定采用多阶段抽样与整群抽样相结合的抽样方法进行方案设计,调查的最小单元为大  学生。决定调查的各个阶段为学校、寝室、学生,在寝室利用随机数表抽取学生。第二步:确定样本量及各阶段样本量的配置  按简单随机抽样时,在置信度为t=95%时,绝对误差为d=5%,取方差大到最大的比例,则全市的样本量应为:  n0=t2*P*Q/d2≈22**/=400(人)  根据以往的经验,估计回答的概率为a=90%,因此调整样本量为:n1=n0/a=400/≈445(人)  于多阶段抽样的效率比随机抽样的效率低,取设计效应deff=,则全市范围内应调查的样本学生为:  n2=n0*deff=445*=600各阶段的配置分别为:初级单元:6个学校\n  二级单元:150个寝室,每个学校抽25个寝室三级单元:600个学生,每个寝室抽4名学生1、抽样方法  以全长沙市的在读大学生为总体,采用多阶段抽样方法抽取样本。  第一阶段,先以长沙市的每个高等院校为初级单元。按不等概的PPS抽样从中抽取6个学校。  第二阶段,在每个被抽中的学校中,将全校所有的寝室依次进行编号,赋予每个寝室一个与编号一样的代码;根据所有的寝室数除以样本量25,确定抽样间距;然后对代码进行随机起点的等距抽样,则被抽中的寝室为样本寝室。  第三阶段,分别在每个样本寝室中,按随机二维数列表抽取4名学生。四、实地调查及调查时间  受时间、经济等因素的影响,我们无法调查足够的学校,只是在铁道校区进行了切实有效的调查。在调查中要确切到达每一个被抽中的寝室,要保证调查的质量,获得真实有效的资料。调查时间:20XX年12月1日21:00---23:00  调查人员及地点:小组的人员分别到被抽中的寝室同时进行调查。五、问卷与数据的审核  对实地调查后取得的数据资料,首先整理审核。审核步骤:\n  (一).查对所有抽中的样本是否都进行了调查,调查问卷有无遗漏。本次调查共发出问卷100份,收回97份,作废3份,有效问卷共计94份。  (二).对更换的样本点检查其代表性,出现较大差异的,重新更换调查;  (三).审查调查问卷指标有缺项的,采用填充法补齐,具体方法是联系上下问题的答案进行预测性填充。  (四).对填报指标进行逻辑审查,如出现前后矛盾的答案,根据其回答整个问卷的态度推断错选项,去除错选项。  (五).评估调查指标是否准确真实。对审核后的调查表仔细录入,杜绝录入差错。(六)、数据录入与分析和提交结果的方式1.数据的录入方式:  将原始数据转化成计算机认可的数据,将ABC等选项依次编号为123等录入;对开放式的问题编码,在备选框里注明解释项;对于多选题,如Q2,一共有6个选项,则设置六个0-1变量,依次为,如选了此项,则标记为1,以备SPSS中进行多  响应二分变量法分析;2.整理分析数据:  本次分析借助EXCEL和SPSS软件进行作图和分析。3.对数据进行解释;4.写出调查报告。  5.提交结果的方式:以书面的形式提交调查报告。  从一个总体中抽出一个具有代表性的样本,可按下列程序进行.  方案三:  一、确定抽样方法\n  随机抽样包括简单随机抽样、系统抽样、分层抽样三种抽样方法.其关系如下表.类型简单随机抽样系统抽样共同点各自特点相互联系适应范围每个个体被抽到从总体中逐个抽最基本的随机抽总体中的个体数样本中的机会是取样方法目较少均等的将总体均匀分成在第一部分抽样总体中的个体数几部分,按事先确时采用简单随机目较多定的规则在各部抽样分抽取分层抽样将总体分成几层,各层抽样时采用总体差异明显分层进行抽取简单随机抽样或的几部分组成系统抽样  于三种抽样方法适应的范围不同,对于给定的抽样问题首先要选择相匹配的抽样方法.只有理解三种抽样方法的含义,才会做到这一点.看下面的几个例子:  问题1:某市为了支援西部教育事业,现从报名的18名志愿者中选取6人组成志愿小组.为了保证对每个志愿者的公平性,如何确定志愿小组的名单.  问题2:某学校有在编教师160人.其中老年教师16人,中年教师112人,青年教师32人.教育部门为了了解教师的健康状况,要从中抽取一个容量为20的样本.试确定用何种方法抽取.  问题3:某工厂平均每天生产某种零件大约1000件,要求产品检验员每天抽取50件,检查其质量状况.试问运用那种抽样方法最合理.\n  剖析:问题1的总体中的个体数目较少,运用简单随机抽样法抽样;简单随机抽样法有两种,分别为抽签法和随机数法,两法皆适合此题;问题2中的总体差异明显的几部分组成,故采用分层抽样法抽样;问题3中的总体容量大,样本容量也大,可用系统抽样法抽样.  二、设计抽样的方法步骤  明确了一个抽样问题采用的抽样方法后,接下来根据选择的抽样方法的特点设计抽样的方法步骤.那么上述三个问题如何设计抽样的方法步骤呢  问题1的抽样方法常常设计为以下几个步骤.  采用抽签法:  (1)编号:将18名志愿者编号,号码为01,02,,18.  (2)制签:将号码分别写在一张纸条上,揉成团,制成号签.  (3)搅匀:将做成的号签方入一个不透明的袋子中,并充分搅匀.  (4)抽签:从袋子中依次抽取6个号签,并记录上面的编号.  (5)定样:所得号码对应的志愿者就是志愿小组的成员.  简记为五步走:编号、制签、搅匀、抽签、定样.  采用随机数法  (1)编号:将18名志愿者编号,号码为00,01,,17(同抽签法编号一致也可,但号码的位数要相同).\n  (2)数表定位:在随机数表中任选一数,如第1行第1列的数0.  (3)读表并录号:从选定的数0开始向右读(读数的方向也可向左、向上、向下),得到一个两位数03,于(03理解为3),说明号码在总体内,将它记录;继续向右读,得到47,于,将它去掉,按照这种方法继续向右读,直到记录的号码为03,16,11,14,10,07.  (4)定样:所得号码对应的志愿者就是志愿小组的成员.  简记为四步走:编号、数表定位、读表录号、定样.  问题2的抽样方法常常设计为以下几个步骤.  (1)计算抽样比,其中表示样本容量,表示总体中个体的数目,下同.  (2)样本容量的分配:样本中的老年教师人数为;样本中的中年教师人数为;样本中的老年教师人数为.  (3)层内抽样:运用抽签法在16位老年教师中抽取2人,运用系统抽样法在112位中年教师中抽取14人,:运用抽签法在32位青年教师中抽取4人  (4)定样:把层内抽样得到的教师汇在一起,得到所求的样本.  说明:在样本容量分配时,名额一定取正整数.一旦出现小数,要四舍五入.但名额之和等于样本容量(有时需权衡取整).  问题3的抽样方法常常设计为以下几个步骤.\n  (1)编号:把1000个零件编号,号码为000,001,002,,999.  (2)确定段数及间隔数k:把编号分成50段,间隔数k=1000|50=20.  (3)确定首码:在第1段编号为000~019的个体中,用简单随机抽样法确定样本中首个个体编号i(i<019)  (4)确定样本中个体编码:按照一定的规律,通常是首个个体编号加上间隔数得到第2个个体编号(i+20),在加20得到第3个个体编号(i+40),依次下去,直到得到最后一个个体编号(i+980),共50个编号.  (5)定样:所得编好对应的零件组成样本.  说明:当间隔数k不是整数时,需要在编号之前在总体中随机剔除个体数为,其中[N|n]表示不超过N|n的最大整数.  怎样抽样?如何确定抽样方法  在设计一个抽样调查时,我们通常需要做的工作是:定义总体及抽样单元、确定或构置抽样框、选择抽样技术、确定样本量的大小、制定实施细节并实施。这里我们着重介绍一下定量研究的抽样方法和样本量这两个技术环节。  最基本的定量研究的抽样方法分为两类,一类为非概率抽样,一类为概率抽样。  一、非概率抽样\n  非概率抽样是不能计算抽样误差的,因为它是靠调研者个人的判断来进行的抽样。它包括偶遇抽样或者方便抽样、判断抽样、配额抽样、雪球抽样等。偶遇抽样(方便抽样)  常见的未经许可的街头随访或拦截式访问、邮寄式调查、杂志内问卷调查等都属于偶遇抽样的方式。偶遇抽样是所有抽样技术中花费最小的。抽样单元是可以接近的、容易测量的、并且是合作的。但尽管有许多优点,这种形式的抽样还是有严重的局限性。  许多可能的选择偏差都会存在,如被调查者的自我选择、抽样的主观性偏差等。这种抽样不能代表总体和推断总体。因此,当我们在进行街头访问或邮寄调查时,一定要谨慎对待调查结果。判断抽样  判断抽样是基于调研者对总体的了解和经验,从总体中抽选\有代表性的\典型的\单位作为样本,例如从全体企业中抽选若干先进的、居中的、落后的企业作为样本,来考察全体企业的经营状况。如果判断准,这种方法有可能取得具有较好代表性的样本,但这种方法受主观因素影响较大。配额抽样\n  配额抽样是根据总体的结构特征来给调查员分派定额,以取得一个与总体结构特征大体相似的样本,例如根据人口的性别、年龄构成来给调查员规定不同性别、年龄的调查人数。配额保证了在这些特征上样本的组成与总体的组成是一致的。一旦配额分配好了,选择样本元素的自度就很大了。唯一的要求就是所选的元素要适合所控制的特性。这种抽样方法的目的是使样本对总体具有更好的代表性,但仍不一定能保证样本就是有代表性的。如果与问题相关联的某个特征未被考虑进配额,配额样本可能就不具有代表性,但在实施中包括太多的控制特征是十分困难的。另外,用这种方法进行选择时,往往存在调查员的选择偏好,因而也难以避免主观因素的影响。如果在严格控制调查员和调查过程的条件下,可使配额抽样获得与某些概率抽样非常接近的结果。在进行配额抽样时,要特别注意配额与调查结果之间的密切联系。雪球抽样  雪球抽样是先选择一组调查对象,通常是随机地选取的。访问这些调查对象之后,再请他们提供另外一些属于所研究的目标总体的调查对象,根据所提供的线索,选择此后的调查对象。这一过程会继续下去,形成一种滚雪球的效果。此抽样的主要目的是估计在总体中十分稀有的人物特征。于后来被推荐的人可能类似于推荐他们的那些人,因此这种方式的调查也是非概率的。二、概率抽样  非概率抽样包括简单随机抽样,分层抽样,等距抽样,整群抽样等,每个样本的中选概率是已知的,因此可以计算抽样误差。通常的实地调查中,是把这几种抽样方法相互结合。简单随机抽样\n  总体中的每一个元素都有一个相等的被抽中概率。简单随机抽样可以通过抽签法和随机数字表方法来实现。先确定或搜集一个抽样框,将抽样框中的每个元素都编上号。然后把所有抽签抽中的号码的元素或随机数字对应的号码的元素做为样本进行调查。等距抽样  按照某种顺序给总体中所有单元编号,然后随机地抽取一个编号作为样本的第一个单元,样本的其它单元则按照某种确定的规则抽取,这种抽样方法称为系统抽样。其中最常用最简单的系统抽样叫等距抽样。分层抽样  分层抽样的特点是先将总体按照某种特征或指标分成几个排斥的又是穷尽的子总体,或层,然后在每个层内按照随机的方法抽取元素。其原则是子总体内元素间差异可能小,而不同子总体间差异大。整群抽样  整群抽样首先将总体划成许多相互排斥的子总体或群,然后以群为初级抽样单元,按某种概率抽样技术,如简单随机抽样,从中抽取若干个群,对抽中的群内的所有单元都进行调查。  多级抽样  也叫多阶段抽样。它是在第一阶段从所有群中抽取若干群,在每个抽中的群中,再抽取若干单元进行调查。它与分层抽样的区别在于第一层是抽取部分,与整群抽样的区别在于第二阶段是抽取部分。这在实际实施中是最为常见的一种抽样方式。同时它的抽样精度比整群抽样高,操作性更强。\n什么时候用概率抽样,什么时候用非概率抽样,应当根据各种条件来决定,例如研究的性质、对误差容忍的程度、抽样误差与非抽样误差的相对大小、总体中的变差、以及统计上的操作上的考虑等。尽管非概率抽样不能推断总体,不能计算抽样误差,但在实际调查中仍常被应用。一方面是操作的考虑,减少非抽样误差的发生,另一方面也是因为所调查内容不需投射总体,而且一般总体的同质性较强。如概念测试、包装测试、名称测试以及广告测试等,这类研究中,主要的兴趣集中在样本给出各种不同应答的比例。概率抽样用于需要对总体给出很准确的估计的情况,例如要估计市场占有率、整个市场的销售量、估计某个地区的电视收视率等。还有全国性的市场跟踪研究,以及用户的心理特征和人口分布的研究等,都采取概率抽样。但在概率抽样时要特别注意控制调查过程中的非抽样误差。  微体谬误:分析单位指的是研究对象的个体,也就是研究所观察的单位,它可以是个人、群体、组织或者社会事件。在研究中,针对不同分析单位的结论,不可以在不同分析单位的研究对象间推论,否则就会产生两种谬误:区群谬误和微体谬误。前者是指以群体或其他整体为分析单位的研究结论推广到个体单位时犯的错误;后者是指以个体为分析单位的研究结论推广到较大分析单位时犯的错误。\n  描述计统:是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。  推论统计:是统计学乃至于心理统计学中较为年轻的一部分内容。它以统计结果为依据,来证明或推翻某个命题。具体来说,就是通过分析样本与样本分布的差异,来估算样本与总体、同一样本的前后测成绩差异,样本与样本的成绩差距、总体与总体的成绩差距是否具有显著性差异。  怎么样设计抽样?方案一:  一、调查设计和初步计划  在这一阶段,我们必须确定研究的目的和如何在时间和资源有限的前提下达成这一目的。  1、确定研究的目的1)检验某一假设?  2)检验一系列相关假设组成的因果模型?例如,a.具有传统价值观的人使用安非他命的可能性较小;b.有吸毒朋友的人更有可能使用安非他命;c.具有传统价值观的人有吸毒朋友的可能性较小。  3)估计具有某种信仰或具有某种特定行为的人的比例?例如,总体中花在专业学习上的时间每周为40个小时的人的比例是多少?\n  4)是为了研究某些特定的问题或人口中某一群体的态度或行为随时间的变化而变化的情况,还是为了解我们是否能找到一些干预手段来纠正人们的某些行为?  在上述各种不同的调查目的中,有许多是典型地需要对成年人口总体的常规调查研究,而有些则可能与一般人口的调查研究无关,只是与某些特定的子群体有关。例如,大学教员对加入工会组织持什么态度?外来移民工花费在看病上的钱占其收入的比例是多少?我们的研究目的也可能与个人完全不相干,但却与组织、群体、企业或政府机构有关。例如,某一类组织的会员年费?每一所高中低年级和高年级学生的辍学率?调查目的的确定将为下面的一系列决策提供框架:什么人或什么事情是我们感兴趣的总体?我们应该采用什么样的方法来收集数据?2、确定抽样计划或方案1)界定总体  在这一阶段,我们必须回答的基本问题是:什么样的人或什么事情是我们感兴趣的总体?  a.对个体进行研究时,我们必须考虑的基本问题有三个:合格的被调查人的年龄范围;研究结果想要概括的地理区域;总体包括的是那些住在家里的人,住在集体宿舍的人,还是无家可归者,或这三类人的某些组合。例如,如果我们在做一项有关公众对公共交通工具上犯罪的感觉方面的调查,那么,我们的被调查人应该包括哪些人呢?  b.在研究的对象是某些群体时,我们必须确定谁是群体或组织中能为我们提供精确信息的最为关键的人物。\n  另一个必须考虑的问题是调查的地理区域是否有代表性。我们必须确定我们的调查包含的面究竟应该有多广?例如,上述的公共交通系统问题究竟应该仅限于市中心,还是整个地区?  决策的依据是清晰的研究框架和可资利用的有关资源。2)制定抽样框  抽样框与总体的关系有三种情况:a.抽样框与研究总体完全匹配;  b.抽样框所包含的内容可能比总体更多;c.抽样框没有包括全部合格的总体成员。抽样框在很多情况下都未能包括合格总体中的所有个体。在这种总体定义与抽样框不相匹配时,我们需要考虑以下问题:丢失的总体究竟有多少?丢失的究竟是一些什么人?如果将他们排除在外,那么对因变量的结果的影响究竟有多大?实际上,我们要考虑的问题是,我们的调查允许存在的偏倚究竟有多大?\n  在调查中,是否需要把缺失的总体包括进来,依我们研究的我们研究的问题、可资利用的资源和研究进行的地点而定。例如,在各种一般人口总体调查中,电话薄是诸多使用最为普遍的抽样框之一。但电话薄并没有把所有的人口包括进来,这样,利用电话薄抽样是存在偏误的。但有很多研究者在进行抽样时,往往忽视了这一点。他们之所以这样做,原因有三:一是他们认为没有电话的住户对最终结果的影响是微不足道或可以忽略不计的;二是将无电话户包含进来的费用巨大,更何况他们只占总人口的非常小的一部分;三是,总的样本结果才对研究者具有最重要的意义,而子群体的结果则不是那么重要的。3、设计问卷  问卷设计阶段必须回答的两个问题是:  a.我们需要从被调查人那里收集什么样的信息?b.如何最清楚地将我们的想法表达出来?  在这里涉及问卷中开放式问题与封闭式问题的比重,是否问及有关态度、知识或行为方面的问题,需要什么类型的人口学信息,问题形式与调查类型的关系,等等。  我们总是希望能使被调查人要做的工作变得尽可能地简单容易,从而最大程度地避免无回答情况的发生。  4、确定可以支配的经费和时间  经费和时间决定了样本量的大小、调查员和编码员的聘请数量、调查涉及的地理范围。从经费来看,互联网调查是最快捷和最经济的,其次是邮寄式调查和电话调查,面访式调查是最昂贵的。从时间来看,电话调查比面访调查更为快捷,但完成这两种调查所需的时间在一定程度上都取决于样本地理分布范围的大小;互联网调查和邮寄式调查受这些变量的影响较小;邮寄式调查的时间进度是固定的,通常会持续8-10周。5、分析数据和报告研究结果这里需要考虑的问题是:\n  a.为回答研究提出的问题,我们需要选择哪些分析方法?b.准备研究报告、论文或其他研究成果所需的时间。二、试调查  调查过程的第二个阶段是对调查的初步设计进行测试。  1、草拟问卷  在草拟问卷之初,可以从其他较成功的研究中借用一些问题。当然,我们在借用之前,要了解他们是如何定义他们的概念和使用什么问题来测度这些概念的。借用他人研究中的问题有两种方式,一是全部借用,二是部分借用;这样的做的前提是没有版权问题。  关于问卷设计,我们必须注意:  a.不要当然地认为借用别人使用过的问题来测量我们的调查对象必定没有问题。不论我们从其他调查中借用的问题有多少,我们都必须在正式开始收集数据之前进行试调查。试调查,好比正式演出前的彩排,是调查最为重要的组成部分之一。  b.问卷只有在经过许多稿之后,才有望解决它存在的所有问题,并使调查对象对问题的理解趋于一致。高质量的研究和粗制滥造的研究的区别在于,前者在努力寻找或预见问题,而后者假设只要问题被回答便是有效的。  2、使用调查员在这一阶段,我们要注意三个问题:  a.\n起草和编写调查员培训材料,使调查员了解我们希望他们做什么。无论我们使用的是专业调查员,还是第一次做调查的学生,编写培训材料和培训调查员都是我们必须要做的工作。  b.遴选和雇佣调查员的工作必须与样本的选择密切配合。一个原则:调查员最好能生活在入选住户的附近,以最大程度地减少与调查对象联系所需的通勤时间和费用。  c.分配给试调查的时间决定了试调查中的需要调查员的人数。例如,如果我们用一个星期的时间进行试调查,需要调查的人数是30个,那么我们可能需要聘用和培训6个调查员,每个调查员需要调查5个调查对象。如果可能,我们应当使用最优秀的调查员,因为我们需要从他们那里得到有关我们问卷中可能发生的问题或调查方法和程序方面的批评性的反馈。3、听取调查员汇报  在每次试调查结束的时候,研究者应该安排会见所有的调查员,听取他们的汇报。调查员的汇报应包括问卷中的所有问题和所有调查步骤,发现存在的问题,并提出解决问题的建议。来自汇报会的反馈,加上审读实际调查记录将为问卷的进一步修改提供依据。4、确定试调查的方法在试调查的最初阶段,其目的在于收集对一个个问卷题目的反馈,而在以后阶段的目的则在于测试整个问卷和调查的方法步骤。  可以通过各种正式的和非正式的途径,来测试问卷题目:\n  a.非正式途径:找家庭成员、朋友或其他学生填写问卷,听取他们对问题的意见。b.正式途径:在经过非正式的试验后,觉得问卷可以拿得出手的时候,我们便可以在调查地区的正式调查对象中进行正式的试验。  在问卷改进过程中,有两种方法现在已被越来越多地使用:一种是认知访谈,另一种是焦点组。  认知访谈是一种一对一式的交谈方式,即只有一个调查员和一个访谈对象在场的访谈。调查员询问调查对象有关他们对所提问题的想法。在这过程中,调查员常常追问调查对象对某一特定词汇的涵义的理解,或要求他们对问题进行解释,以此判断他们是否理解这些词汇或题目。了解调查对象在回答问题时的认知过程,将有助于我们更好地撰写问题,从而收集到质量更高的数据。  例如,您认为食品的安全性的含义是什么?您个人认为食品的安全性有多么重要?  焦点组是为了帮助我们编写问题或使调查更为有效,而集合起来讨论某些议题、问题或其他事情的一群人。焦点组访谈有两种比较重要的用途:  a.在问卷设计完成之前,它可以保证正在或将要设计的问卷不遗漏重要的问题,同时也可以使我们对将要开展的研究题目有更深更多的了解;  b.\n可以作为一种测试问卷草稿的工具,特别是设计用于自填式问卷调查的问卷草稿的工具。在这个意义上,我们可以要求焦点组成员先根据自己的理解填写问卷,然后再对问卷进行小组讨论。一般讲,小组8-10个具有相同特征的人组成:全部是男性、女性、年轻工人、经理人员等。小组的组成在一定程度上取决于调查的主题,其组成方式应该以能使小组成员在交谈的时候感到不拘束为宜。我们对问卷的草稿已经感到满意后,应该找一些真正的调查对象进行测试。一个试调查通常要调查20-40个调查对象。人数是否超过这个数目,则取决于如下方面:我们感兴趣的子群体数、这些子群体对问题的理解程度、我们对我们已经在多大程度上测量了想要测量的概念的把握程度、时间进度和经费预算等。  在完成试调查并听取了调查员们的汇报之后,我们必须要对问卷和调查的方法步骤进行修改。试调查阶段可能延续一个月,甚至更长的时间。三、终结调查设计和计划  试调查的结果可以用于改进调查设计和执行计划。\n例如,在一个涉及四个医疗专业群体电话调查的试调查中,某一研究人员设计的问卷得到的回答率在40%-50%。那么在随后与医务人员的焦点组访谈中,我们就可以集中讨论如何提高回答率的问题。讨论之后得到的建议是,应该给医务人员在配合完成调查的问题上以选择的机会:他们既可以选择填写邮寄式问卷,也可以接受电话调查,因为这样可以让每一位医务人员选择最适合自己工作日程的调查方法。后来,整个正式调查的回答率上升到了67%。试调查也可以在确定邮寄式调查跟踪联系的时间间隔,或与调查对象的最后一次联系是使用邮件还是电话等方面给我们帮助。在抽样调查中几乎不存在什么确定而快捷的法则。为了提高回答率和数据质量,研究者必须因时因地制宜,随时做出各种调整。  在这一阶段,抽样计划、问卷、调查培训方法和培训材料、数据编码方案和数据分析方案等问题应做最后的调整。四、数据收集在这一阶段,我们需要对抽样的结果和数据收集过程进行监控,并开始编码和准备数据文件。  a.要确保所有个案合符规范地被抽取,及对所有这些个案的调查能顺利完成。电话调查和面访调查中无响应的调查对象应该在本周的另一天或同一天的另一个时间再一次进行联系。拒绝接受调查、无法联系、不合格的完成调查的比例各是多少?数据是否有作假的迹象?一般来说,我们要对每一个调查员完成的工作的10%-20%,通过督导再次与调查对象联系,对完成的调查进行验证。回访主要是了解调查是否确实进行过,而且要了解进行的时间的长短。我们也可采用隔周或每周样本处理情况报告的办法,以便尽早发现和解决调查中发生的问题,避免问题成堆,无法收拾。  b.\n检测调查员。一是深入全面地检查每一个调查员最初完成的那几份问卷,以确保没有任何问题被遗漏,得到的信息是完整的,且所有关于调查的规定都得到了遵守。重要的是我们必须把检查的结果及时反馈给每一个调查员,以便他们能在问题和错误成为定势之前予以纠正。二是检查调查员对分配调查任务的完成情况。因为没经验的调查员很可能因轻信调查对象诸如“我实在太忙”或“我对调查的问题不感兴趣”这样拒绝接受调查的借口而放弃对既定个案的调查。如果一个调查员的拒访人数比例异常高,那么我们就应当和那个调查员一起对那些个案一一加以检查,并找到对调查对象进行回访的方法或以后在遇到类似问题  时的处理方法。优秀的研究人员总是想法设法通过使用训练有素的调查员对拒访者进行回访,并促使他们转变态度接受调查,从而最大限度地减少持不合作态度的人数。通常情况下,初次拒访者能转化20%-40%。在完成数据收集后,我们必须对他们进行编码,并把完成的调查信息做成电脑数据文件。五、数据编码、数据文件的建立、数据分析和最终研究报告  研究时间进度表实例    1000户随机数码拨号电话调查的时间进度表  工作内容  需要的时间/周  起止时间/周  文献检索和起草问卷  8  1-8征求10名调查对象对问卷草稿的意见  1-2  8-9修改问卷  2  10-11进行第一次试调查  1  12听取调查员的汇报,修改问卷  3  13-15进行第二次试调查  1  16\n听取调查员的汇报,修改问卷和编写培训材料  4  17-20选取样本  12  8-19进行正式的数据收集  8  21-28数据编码和准备数据文件  12  21-32分析数据和撰写报告  开放,时间不限  开放  方案二:一、调查目的  了解大学生使用信用卡的情况及信用卡在大学生中的分布,并据此分析信用卡在大学生中的市场潜力和需求,并预测大学生信用卡的发展趋势。二、调查范围和内容1、目标总体和调查总体  目标总体指所有长沙市的大学生。具体包括中南大学湖南大学长沙理工大学湖南农业大学湖南中医药大学湖南师范大学中南林业科技大学长沙学院长沙医学院湖南涉外经济学院湖南商学院就读的各年级在校大学生。调查总体为根据长沙市的大学生实际情况设计形成的抽样框。2、调查内容  调查内容包括被调查人的性别和年级、大学生对信用卡的态度、大学生持有信用卡的原因、大学生在何种情况下使用信用卡、大学生期望的信用卡透支额、期望的还款日期、未持卡大学生不办卡的原因及大学生的消费支出等。三、抽样调查设计第一步:确定抽样方法  调查决定采用多阶段抽样与整群抽样相结合的抽样方法进行方案设计,调查的最小单元为大\n  

相关文档