公文阅读网    > 工作总结

第二章医学统计描述技术总结.ppt

作者:yxw213   时间:2021-03-02 08:45:21   浏览次数:次 关键词: 医学技术总结 第二章 描述 统计

(七)、应用标准化率注意事项 1、应用直接法计算标准化率时,由于所选定的标准人口不同,算得的标准化率也不同,因此,比较几个标准化率时,应采用同一标准人口。

 2、当各年龄组的率出现明显交叉时,宜直接比较各年龄组的发生率,而不宜用标准化法 。

  甲乙两厂某工种某病患病率 工龄 甲 厂 乙 厂 (年)工人数 患者数 患病率(%)工人数 患者数 患病率(%) <3 400 12 3.0 100 1 1.0 ≥3 100 10 10.0 400 72 18.0 合计 500 22 4.4 500 73 14.6 <3 ≥3 (工龄) 20 15 10 5 交叉 3、两样本标准化率的比较应作假设检验。

 4、采用间接法计算所得的标准化率仅能与所选标准比较,两个间接法标准化率不能互相比较。

  5、标化后的标准化率不反映实际水平,只是用于比较的相对水平。

 第五节 动态数列及其分析指标 动态数列 是一系列按时间顺序排列起来的统计指标(绝对数、相对数、平均数),用以说明事物在时间上的变化和发展趋势。

  一个国家或地区各年的人口数,某种传染病逐年的发病率,这些资料也称时间序列。

  动态数列分析的指标 一、绝对增长量 ①累计增长量,以某一年为基数(第一年),以后各年与之相减即得; ②逐年增长量,以下一年数量减上一年数量即得。

  二、发展速度和增长速度 发展速度和增长速度均为比,说明事物在一定时期的速度变化。

  发展速度 表示报告期指标的水平相当于基期水平的百分之多少或若干倍。

  增长速度 说明某现象增长程度的相对比 增长速度=发展速度-1。

  1、发展速度 (1) 定基发展速度 以某个时间(基期a0)的指标作基数,各个时间(报告期ai)的指标与之相比; a1/a0, a2/a0, …, an/a0 2000年:6997/4721=1.482 (2)环比发展速度 以前一个时间的指标作基数,以相邻的后一年的指标与之相比。

  a1/a0, a2/a1, …, an/an-1 2000 年:6997/5884=1.189 2、增长速度 (1) 定基增长速度 以累积增长量与基期指标相比。或定基发展速度-1 Δa1/a0, Δ a2/a0, …, Δ an/a0 2000年:2276/4721=0.482=48.2% (2)环比增长速度 以逐年增长量与相邻 前一年的指标相比。或环比发展速度-1 Δ a1/a0, Δ a2/a1, …, Δ an/an-1 2000年:1113/5884=0.189=18.9% 三、平均发展速度和平均增长速度 平均增长速度=平均发展速度-1 a0为基期指标,an为第n年指标 平均增长速度=1.103-1=0.103=10.3% 本例 根据动态数列,尚可以进行预测: 如根据本例资料,预测今后未来几年里医护人员数量的方法: 如预测2005年的医护人员数量:n=9 为从1996起,第n年的医护人员数量(即所预测的值),n为年数。

 (人) 即根据该地1996—2000年的平均发展速度,预计到2005年该地的医护人员数量可达11408人。

  身高(cm) 频数(f) 组中值(x) f x f x2 95- 1 96.5 96.5 9312.25 98- 7 99.5 696.5 69301.75 101- 10 102.5 104- 18 105.5 107- 25 108.5 110- 21 111.5 113- 15 114.5 116- 15 117.5 119- 7 120.5 122-125 1 123.5 合计 120(∑f ) 13218(∑fx) 1460046 (∑fx2) 3.8 509.2 1743.76 * 某医院1980年与1982年各科病床情况 科别 1980年 1982年 病床数 构成比 病床数 构成比 内科 200 50.0 300 60.0 外科 100 25.0 100 20.0 儿科 100 25.0 100 20.0 合计 400 100.0 500 100.0 (三)、?相对比(Ratio) 相对比是A、B两个有关指标之比,说明A是B的多少倍或百分之几。

     A与B的性质可以相同,也可以不同。可以是绝对数也可以是相对数或平均数。

  人口密度、性比例、医护比,医技比 二、 应用相对数的注意事项 1、计算相对数的分母不宜过小 分母过小则计算所得的相对数不稳定,不可靠,容易产生误解。

 临床资料至少30例才好计算率 动物实验10例也可以计算率! 2、构成比不能代替率(分析时不能以比代率 ) 在实际应用中经常出现以构成比代替率进行分析的错误。

 有下表资料 年龄(岁)0~ 10~ 20~ 30~ 40~ 50~ 60~ 70~ 合计 沙眼人数 47 198 330 198 128 80 38 8 1027 % 4.6 19.3 32.1 19.3 12.4 3.7 7.8 0.8 100.0 某文章作者根据上述资料认为,沙眼在20~组的患病率最高,以后随年龄增大而减少。

 犯了以比代率的错误 3、正确计算合计率(总率) 对观察单位数不等的几个率,不能直接相加求平均率 正确的方法:总的发生数除以总的观察单位数。

  某医院各科的病死率 科别 患者数 死亡数 病死率(%) 外 科 1500 180 12.0 内 科 500 20 4.0 传染科 400 24 6.0 合计 2400 224 7.3 (12.0+4.0+6.0)/3×100%=7.3% 平均率=224/2400×100%=9.3% 决定率(或构成比)的因素很多,除所研究的因素外,尚有许多重要的影响因素;两个或两个以上的率(构成比)相比较时,其他重要的影响因素要相同或相近(即所谓的具有可比性),否则就不能直接对率进行比较。一般的,两个地方的出生率、死亡率、发病率,不同级别医院某病的治愈率等不能直接比较。

  4、注意资料的可比性 率(或构成比)的比较是否具有可比性,通常注意以下两个方面: (1)观察对象同质,研究方法相同,观察时间相等,以及研究对象所处的地区、民族、职业、生活条件和习惯要一致;影响率的其它因素在各对比组的内部构成是否相同。

  (2)同一地区不同时期资料的相对数比较,应注意条件有无变化。

  两医院乳腺癌手术后的5年生存率(%) 腋下淋巴 省医院 市医院 结转移 病例数 构成 生存数 生存率 病例数 构成 生存数 生存率 无 45 6.0 35 77.77 300 78.3 215 71.67 有 710 94.0 450 63.38 83 21.7 42 50.60 合计 755 100.0 485 64.24 383 100.0 257 67.10 不能直接比较两院总的生存率(应标化后再比) 两院乳腺癌病人有无淋巴结转移构成比较 有转移 无转移 省医院 710/755=0.940 45/755=0.060 市医院 83/383=0.217 300/383=0.783 ? 5、率或构成比的比较要遵循随机抽样的原则,要做假设检验。

 即两组或多组率比较,要作假设检验再下结论。

  三、 率的标准化法 两医院乳腺癌手术后的5年生存率(%) 腋下淋巴 省医院 市医院 结转移 病例数 生存数 生存率 病例数 生存数 生存率 无 45 35 77.77 300 215 71.67 有 710 450 63.38 83 42 50.60 合计 755 485 64.24 383 257 67.10 不能直接比较两院总的生存率(应标化后再比) (一)、标准化法的意义和基本思想 率的标准化:是指在比较两个或多个总率时,采用一个共同的内部构成标准,将两个或多个样本不同的内部 部构成调整为相同的内部构成,以消除因内部构成不同对总率产生的影响,使算得的标准化率具有可比性。采用标准化方法计算得到的率简称标化率,又调整率。

  基本思想:采用统一的标准内部构成(年龄、性别),在相同的内部构成条件下,计算预期的发生率(死亡率); 目的:消除因内部构成不同对总率产生的影响,使标化率具有可比性。

  (二)、标化率的计算 标化率的计算,常用的有直接法和间接法。

  1、直接法计算标化率 当已知被标化组内部各小组的率时(即pi), 采用直接法。

 为标准组的人口数 P’代表标准化率,Ni为标准组各个年龄人口数,N为标准组总人口数;pi为被标化组各年龄组的发生率。∑ Ni pi为预期发生数;Ni/N为标准组年龄构成。注意:不能用N×p 求出预期发生数。

 2、间接法计算标化率 P为标准组总死亡率(发生率),Pi为标准组各年龄组死亡率(发生率),r为被标化组实际死亡数(发生数),r/ΣniPi为被标化组实际死亡数与预期死亡数之比,称为标准化死亡比,用SMR表示; 若SMR>1,说明被标化组人群死亡率高于标准组;若SMR<1, 说明被标化组人群死亡率低于标准组。间接法标化率仅用于被标化人群与标准组比较,两个间接法标准化率不能直接比较(没对年龄进行调整)。

  (三)标准化率的计算步骤 1、选择直接法或间接法 直接法:已知内部各组的率时选用; 间接法:已知各年龄组的人口数和总死亡数时选用。

 2、选择标准 直接法:选择标准的人口数; 间接法:选择标准的死亡率或患病率 3、按公式计算标化率 (四)、标准人口选择方法: (1)选择有代表性的、较稳定的、数量较大的人群,如全世界的、全国的、全省的、本地区的历年人口数; (2)选择相互比较的人群合并做标准; (3)选择相互比较的人群某一组做标准。

  相互比较时,标准要相同。例如,国际间的比较要采用世界通用的标准。

  (五)用直接法计算标准化率 当已知被标化组内部各小组的率时,可以采用直接法计算标准化率。

 已知内部各分率,可用直接法 乙两医院乳腺癌手术后的5年生存率(%) 腋下淋巴 省医院 市医院 结转移 病例数 生存数 生存率 病例数 生存数 生存率 无 45 35 77.77 300 215 71.67 有 710 450 63.38 83 42 50.60 合计 755 485 64.24 383 257 67.10 两组合并为标准 两医院乳腺癌手术后的5年生存率(%) 淋巴 省医院 市医院 结转移 标准人数 原生存率 预期生存数 原生存率 预期生存数 无 345 77.77 268.3 71.67 247.3 有 793 63.38 502.6 50.60 401.3 合计 1138 — 770.9 — 648.5 1、用标准人数计算 省医院标化生存率= ——————×100% 预期生存总数 标准病人总数 = ———×100% 770.9 1138 =67.74% 市医院标化生存率= ———×100% =56.99% 1138 648.5 2、用标准人口构成计算 345/1138=0.3032 793/1138=0.6968 (六)间接法计算标准化率 已知被标化组内部各小组的人数以及总的死亡人数或发病人数时,采用间接法计算标准化率。

  例 2-20 用间接法计算标准化率 已知两医院治疗各种病型的人数以及五年总的生存人数:485人和257人。不知各种病型的五年生存率,则只能用间接法。

 省医院SSR>1,说明其生存率高于标准组;市医院SSR<1,说明其生存率低于标准组。

 反映离散程度的常用指标: 1、极差 2、四分位数间距 3、方差 4、标准差 5、变异系数 一、极差(全距)R 1、计算公式:R=最大值-最小值 2、意义:R愈大,离散度愈大, R愈小,离散度愈小。

  3、优点:计算简单,意义明了 4、缺点:(1)不能反映每一个观察值的变异; (2)样本例数越大,R可能越大; (3)R抽样误差大,不稳定。

  二、四分位数间距(简记Q) 1、计算公式: 四分位数间距Q=QU-QL P25:下四分位数,简记QL P75:上四分位数,简记QU 2、意义:反映中间一半观察值的极差,意义与R相 似。

  3、特点:(1) 比R稳定,但仍未考虑每一个观察 值的变异; (2) 常用于描述偏态资料的离散度。

  120名链球菌咽峡炎患者潜伏期,求M, Q Q=P75-P25=64.8-38.7=26.1(小时) 三、方差(总体方差简记 ,样本方差简记 ) 一组观察值的离均差平方和,取其均数,即方差。

  ∑(X-X)=0 (离均差和) ∑(X-X)2≠0 (离均差平方和) 缺点:与例数多少有关 1、计算公式(直接计算法): 2、意义:方差越大,离散度越大; 方差越小,离散度越小。

  3、缺点:单位被平方,不便于使用 四、标准差(总体标准差简记σ,样本标准差简记S) 方差的开平方,即标准差。

  1、计算公式: 2、意义:与方差的意义相同 (注:n-1为自由度) 3、计算方法: (1)直接法: (2)加权法: X为组中值 X为组中值 4、用途: (1)用于表示正态或近似正态分布资料的离散度,说明均数的代表性; (2)结合均数描述正态分布的特征; (3)结合均数计算变异系数,结合样本含量计算标准误,估计参考值范围。

  标准差 甲组:262+282+302+322+342=4540 乙组:242+272+302+332+362=4590 丙组: 262+282+302+322+342=4534 求150名男婴出生体重的标准差。

  五、变异系数(简记CV) 1、计算公式: 2、用途: (1)比较度量衡单位不同的多组资料的变异度(离散度) (2)比较均数相差悬殊的多组资料的变异度(离散度) 3、特点:CV没有单位,是相对数,便于资料间的比较。

  变异系数 身高: cm, s=4.95cm 体重: kg, s=4.96kg ? CV身高= =2.98% CV体重= =9.23% 100名20岁健康男子的身高和体重的均数、标准差如下,比较其变异度。

  某地不同年龄儿童身高(cm)的变异程度 ━━━━━━━━━━━━━━━━━━━━━ 年龄组 人数 均数 标准差 变异系数(%) ───────────────────── 1-2月 100 56.3 2.1 3.7 5-6月 120 66.5 2.2 3.3 3-3.5岁 300 96.1 3.1 3.2 5-5.5岁 400 107.8 3.3 3.1 ━━━━━━━━━━━━━━━━━━━━ 集中趋势指标 资料 抗体滴度 G、S 否 偏态、开口 M、Q 否 X、S 是 是 选择判断的步骤: 离散趋势指标 单位不同 均数相差悬殊 CV 医学统计学 第四节 分类资料的统计描述 一、 常用的相对数 分类资料常采用相对数进行描述。

  收集到的分类资料,表现为绝对数。绝对数说明事物发生的实际水平,是进行统计分析的基础,但不便于事物进行深入地分析比较。

  例如:某年甲乙两村发病情况如下: 甲村:发病人数 100 人。

 乙村:发病人数 300 人。

 发病情况乙村比甲村严重? 甲村:人口数:1000人 发病人数:100 人 发病率:10.0%。

 乙村:人口数:5000人 发病人数:300 人 发病率:6.0% 。

 甲村比乙村严重! 相对数:是两个有联系指标之比,说明事物发生的相对水平,便于对分类资料进行分析和比较。

  常用的相对数:率、构成比、相对比 率(Rate)又称频率指标,是指在一定时间内发生某现象的观察单位数与可能发生该现象的总观察单位数之比。它说明某现象发生的频率或强度。

  (一)、率 K为比例基数,可以是百分率(%)、千分率(‰)、万分率(1/万)或十万分率(1/10万),可根据习惯或使计算出的率保持一、二位整数。

  人口出生率、死亡率、自然增长率、婴儿死亡率等采用千分率; 肿瘤的死亡率采用十万分率。

  习惯用法: 计算率时,注意分母和时间。只有可能发生某事件的观察单位才能做分母。时间一般以年为间期,也有月、周等。

 注意 例如: 麻疹发病率 = ——————————×1000 ‰ 某年新发麻疹病例数 同年麻疹易感儿总数 不应该是儿童总数 构成比(Proportion)又称构成指标,说明一事物内部各个组成部分所占的比重或分布,常以百分数表示,又称百分比。

  (二)、构成比 表 4.1 资料 某地2000年5种慢性疾病的构成 1999年中国农村死亡原因构成 (%) 构成比两个特点:  1)一组构成比之和等于100%或1; 2)某部分构成增加或减少,则其它部分构成就相应减少或增加。

  第二节 集中趋势的描述 描述计量资料分布特征的指标 集中趋势指标 离散趋势指标 平均数 R、Q、S、S2、CV 平均数指标 常用的平均数指标: 算术均数、几何均数、中位数 平均数:用于描述一组同质计量资料平均水平(集中位置)的指标,是一组计量资料的代表值。

  一、算术均数(均数) 总体均数用 表示,样本均数用 表示。

  适用资料:对称分布,尤其是正态分布的资料。

  算术均数:说明一组同质计量资料在数量上的平均水平。

  加权法: 1、计算方法: 直接法: f: 频数,x 为组中值=(上限+下限)/ 2 例2-3 10名12岁健康男童体重(Kg)分别为:39.6、33.2、32.1、29.9、43.7、33.8、35.1、37.8、32.4、38.5。求平均体重。

 例 2-4 求150名男婴平均体重(用加权法)。

 注意:x 为组中值=(上限+下限)/ 2 组中值是每一个组段的平均值 2、均数两个重要特征  1、各离均差(各观察值X与均数之差)的总和等于零;             2、离均差的平方和小于各观察值X与任何数a之差的平方和。

        说明均数是一组观察值最好的代表值。

  3、均数的应用 ⑴ 反映一组同质观察值的平均水平 ⑵ 描述正态分布特征的重要参数 原始数据的分布为偏态分布,但经对数变换后的分布呈正态分布 二、几何均数(geometric mean, 简记为 G) 1、适用资料: (1)等比级数资料 (2)对数正态分布资料 (某些微量元素资料) (血清抗体滴度资料) 2、计算方法: (1)直接法 (2)加权法 例2-4 8名病人的血清抗体滴度为:1:5、1:10、1:20、 1:40、 1:40、 1:80、1:160 、1:320 ,求平均滴度。

  平均滴度为:1:40.0 抗体滴度 人数f 滴度倒数X lgX flgx 1:8 5 8 0.9031 4.5154 1:16 11 16 1.2041 13.2453 1:32 12 32 1.5051 18.0618 1:64 20 64 1.8061 36.1236 1:128 9 128 2.1072 18.9649 1:256 3 256 2.4082 7.2247 合计 60 98.135779 表2-4 60名麻疹易感儿童血凝抑制抗体滴度 不需计算组中值 血凝抑制平均抗体滴度为: 1:43.2。

 3、应用几何均数注意事项: (1)观察值不能有0; (2)观察值不能同时有正负值; (3)同一资料求得的G< 三、中位数(M)和百分位数(Px) (一)、定义 1、中位数: 将一组观察值从小到大按顺序排列,位次居中的数值就是中位数。

  在全部观察值中,大于和小于中位数的观察值的个数相等。

  2、百分位数:将一组观察值从小到大按顺序排列,将该数列分为一百等份,在某百分位置上的值,就是百分位数,用Px表示。

 一个百分位数将全部观察值分为两部分,理论上有x%的观察值比它小,有(100-x)%的观察值比它大。P50分位数也就是中位数。

  (二)、中位数和百分位数的适用范围 (1)偏态分布资料 (2)分布不明资料 (3)分布末端无确定值资料(开口资料) 百分位数用于描述一组数据某百分位置上的水平。

  理论上,中位数可用于描述任何分布的计量资料的平均水平, 但实际应用中常用于偏态分布,特别是开口资料。

  某市238名健康人发汞含量 发汞值(μg/g) 人数 〈0.3 3 0.3- 17 0.7- 66 1.1- 60 1.5— 48 1.9— 18 2.3— 16 2.7— 6 3.1— 1 3.5— 1 ≥3.9 2 合计 238

总胆红素 人数 (μmol/L) 一般组 重症组 <17 4 0 17~ 10 0 80~ 15 3 160~ 1 9 240~ 0 2 320~ 0 4 400~ 0 4 合计 30 22 两组肝炎婴儿的血清总胆红素测定结果 (三)计算方法 1、直接法:适用于观察数少资料 (仅计算中位数) n为奇数时, M= 3, 4, 6, 7, 9, 10,26 x1 x2 x3 x4 x5 x6 x7 M n为偶数时, M= x1 x2 x3 x4 x5 x6 x7 x8 3 5 7 8 9 10 13 27 M(8+9)/2=8.5 百分位数(PX)直接计算法 Px=(X int(nx%)+ X int(nx%)+1)/2 ⑴当 nx%=int(nx%) 时: 注:式中 int(nx%) 为n与x%乘积的整数部分 ⑵当 nx%>int(nx%) 时: Px= X int(nx%)+1 注:式中 int(nx%) 为n与x%乘积的整数部分 nx%=150×20%=30=int(150×20%), 即 P20=(X30+X31)/2=(3.2+3.2)/2=3.2(kg) 例2.11 根据表2.2资料,求P20 、P75 nx%=150×75%=112.5>int(nx%), 即 P75=X112+1=X113=3.6(kg) 2、频数表法:适用于频数表资料 步骤: ①从小到大计算累计频数和累计频率; ②确定百分位数和中位数所在组段; ③计算百分位数Px和中位数M L: Px或M所在组段的下限 i: Px或M所在组段的组距 fx: Px或M所在组段的频数 :小于L各组段的累计频数 例2-10 求:M 、P25、 P75 12 2 24 20 36 36 48 28 60 10 72 2 22 58 (M) 86 96 ( 60 ) 4、中位数和百分位数的用途 (1)中位数描述一组偏态资料的集中趋势; 百分位数描述一组资料在某百分位置的水平, 在对称分布资料中, (2)百分位数也用于确定医学参考值范围。

  集中趋势指标的选择判断步骤 资料 抗体滴度 G 否 偏态、开口 M 否 X 是 是 常用平均数的意义及其应用场合 ━━━━━━━━━━━━━━━━━━━━━━━━━ 平均数 意 义 应用资料 ─────────────────────────────────── 均 数 平均数量水平 应用甚广,最适用于对称分布, 特别是正态分布; 几何均数 平均增(减)倍数 (1)等比资料,(2)对数正态分布 中位数 位次居中的观察 (1)偏态分布,(2)分布不明,(3) 值水平。

  分布末端无确定值(开口资料) ━━━━━━━━━━━━━━━━━━━━━━━━━ 第三节 离散趋势的描述 甲组 26, 28, 30, 32, 34. 乙组 24, 27, 30, 33, 36. 丙组 26, 29, 30, 31, 34. 注意:三组数据的平均水平相同,但各组数据的匀称程度(离散程度)不一样,应考虑这个问题。

 广西医科大学卫统教研室黄志碧编 广西医科大学卫统教研室黄志碧编 广西医科大学卫统教研室黄志碧编 广西医科大学卫统教研室黄志碧编 医学统计学 第二章 医学资料的统计描述 主讲:黄志碧 本章重点 1、频数分布特征和分布类型; 2、描述集中趋势和离散趋势的指标及其应用(平均数指标及变异指标); 3、常用的相对数及其注意事项; 4、率的标准化法及其应用,直接法计算标准化率,应用标准化率的注意事项。

 统计描述—用适当的统计图(表)和统计指标(如均数、标准差、有效率、治愈率等)来描述资料的分布规律(图表)和数量特征(统计指标)。

 目的:用直观的、简单的形式来表达数据资料所蕴藏的信息。

 广西人均卫生事业费在全国位次(1998年) 1999年中国农村死亡原因构成 (%) 第一节 频数分布表与频数分布图 一、频数分布表 资料 按某种标准或标志分组 统计不同组别的观察值个数 1,2,3,… A 8个 B 11个 C 15个 依次类推 频数分布表 原始资料分组 计量资料频数分布表 计数资料频数分布表 按数量分组 按性质或属性分组 计数资料频数分布表 下表是甲、乙两医院治疗同一种疾病的情况,比较甲、 乙两医院的总治愈率有无差别。

        甲 医 院          乙 医 院 病情 治疗人数 治愈人数 治愈率(%)  治疗人数 治愈人数 治愈率(%) 轻 100 80 80.0 300 210 70.0 重 300 180 60.0 100 50 50.0 合计  400 260 65.0 400 260 65.0 甲、 乙两医院某病治愈率比较 计量资料频数分布表 计量资料 离散型资料 连续型资料 变量取值可以一一列举 变量取值为一定范围内的取值 每一育龄妇女现有的子女数;每分钟的脉搏数 身高(cm)、体重(kg)、总胆固醇(mmol/L) 结果为整数 结果有度量衡单位 (一)离散型计量资料的频数表 以变量取值为标志分组,列出各组别的频数 (二)连续型计量资料的频数表的编制 某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。

  潜伏期(小时) 12- 24- 36- 48- 60- 72- 84- 96- 108- 合计 病例数 1 10 18 14 5 4 4 2 2 60 分组标志 频数列 1、求极差(全距) ? R=最大值-最小值 ? =4.2-2.5=1.7(kg) ? 例 2-2 150名男婴体重,试编频数分布表。

 2、确定组距和组段 (2)确定组距(i):相邻两个组段之间距离。

  i=极差/10=1.7/10=0.17≌0.2(也可取i=0.15) (1)确定组段数 根据例数多少来确定,以能反映频数分布特征为原则,一般分8-15组。

  确定各组段的上下限 原则:第一组段包括最小值,最后组段包括最大值。

  每一组段都有上限和下限 下限:组段的起点(最小值) 上限:组段的终点(最大值) 一般只列出下限! 3、统计各组段的频数 将所有观察值按其数值大小归入各组。

  组段 划记 频数 2.5~ 2.7~ 2.9~ 3.1~ 3.3~ 3.5~ 3.7~ 3.9~ 4.1~4.3 2.5 3.9 归组方法:对号入座 表2-2 150名男婴体重频数分布 3.1 频数表的用途: 1、作为统计资料的表达的形式(频数表资料); 2、揭示资料的分布特征和分布类型; 3、便于进一步计算指标和统计分析; 4、便于发现特大或特小的可疑值。

  频数分布的特征 1、集中趋势:数据向某一数值集中的倾向; 2、离散趋势:数据的数值大小不等的倾向。

  二、频数分布图 以观察变量(组段)为横轴,频数或频率为纵轴绘制统计图,可直观地反映频数分布的特征。

 三、频数分布的类型 对称分布 偏态分布 正偏态 负偏态 正态分布 1、对称分布:集中位置(高峰)居中,左右两侧频数分布大体对称,其中的正态分布是重要的分布形式。

  2、偏态分布 集中位置(高峰)不居中,偏向某一侧。

 (1)正偏态:集中位置(高峰)偏向数值较小的一侧。

  (2)负偏态:集中位置(高峰)偏向数值较大的一侧。

 广西医科大学卫统教研室黄志碧编 广西医科大学卫统教研室黄志碧编 广西医科大学卫统教研室黄志碧编 广西医科大学卫统教研室黄志碧编 *


[第二章医学统计描述技术总结.ppt]相关文章