微信公众号 联系我们 关于我们 3618客服热线:020-32784919   推广热线:020-32780069
资讯
频道
当前位置:首页 > 医疗器械资讯 > 行业资讯 > 非诊断试验平行组设计定量资料统计分析----描述性统计

非诊断试验平行组设计定量资料统计分析----描述性统计

文章来源:www.3618med.com发布日期:2013-06-18浏览次数:27825

         平行组设计是医疗器械临床试验中常用的一种试验设计类型,本章将对平行组设计定性资料的统计描述、及有关的假设检验方法进行介绍。主要终点变量可能为二值变量,多值有序变量等定性变量,对于这类资料的统计分析包括统计描述、参数估计和假设检验。    

         一、描述性统计    

         (一)集中趋势的描述
         为了用简捷的方式表达一组性质相同的许多定量资料的平均水平,常用的方法就是求其平均值。它说明一组观察值的集中趋势、中心位置或平均水平。通常我们计算的总和除以例数得到的是算术平均值,除此之外,还有几何平均僮、调和平均值、中位数和众数。由十一组 性质相同的定量数据的表现不同(在统计学上称为“分布”),因此我们需要选用不同的平均指标来表达它们。    

         1.算术平均值的定叉与计算算术平均值:n个性质相同的定址数据之和除以n所得的结果叫做算术平均值。算术平均值见式(7- 1)。

         式(7-1)中的χi为第i个观测值,n为样本大小(或样本含量即全部数据的个数),∑为求和符号,求和范围为i=1到i=n。利用频数分布表计算算术平均值见式(7-2)

         式( 7-2)中,k为频数分布表的组数,n为样本大小,χj为第,组数据的组中值,fj为第j组的频数算术平均值适用于一组性质相同的、单峰的、且近似服从别称分布的。如图7- l。    

         2.几何平均值的定义与计算几何平均值:对n个性质相同的定齄数据分别取对数变换后,按算术平均值计算,然后再求其反对数所得的结果,叫做几何平均值。 利用全部原始数据计算几何平均值见式(7-3)。

         利用频数分布表计算几何平均值见式(7-4)。

         式(7-3)中,“lg”代表取常用对数,“lg-1”代表取常用对数的反对数,也可用自然列数“In”代替;

   

         式( 7-4)中,k为频数分布表的组数,n为样本大小,χj为第J组数据的组中值,fj为第j组的频数
         几何平均值适用于一组性质相同的、单峰的、且服从正偏态分布的(好是服从对数正态 分布的,即数据取对数变换后服从正态分布)定量资料,如图7- 2所示。

         3.调和平均值的定义与计算调和平均值:对n个性质相同的定量数据分别取倒数变换后,按算术平均值计算,然后再求其倒数所得的结果,叫做调和平均值。   利用全部原始数据计算调和平均值见式(7-5)。

         式(7-5)中1/χi就是求χi的倒数。利用频数分布表计算调和平均值见式(7-6)

 

 
          式(7-6)中,k为频数分布表的组数,n为样本大小,xj为第j组数据的组中值,fj为第j组的频数调和平均值可应用于表达一组性质相同的呈极严重正偏态分布(即高峰出现在全部数据取值范围的中心点左边)的定量资料的平均水平。对于小样本资料,调和平均值常用于求类似 “速度”数据的平均水平。    

         4.中位数的定义与计算  中位数:n个性质相同的定量数据按由小到大顺序排列后,居中的数据就叫做这组数据的中位数。 利用全部原始数据计算中位数的公式见式(7-7)。

         式(7-7)中的n/2,n/2+1、(n+l)/2为数据由小到大排列后的位次 利用频数分布表计算中位数的公式见式(7-8)。

         式(7-8)中的Lm,im,fm分别代表中位数所在组的下限、组距、频数,n为总频数,C为中位数所在组之前的所有组(不含中位数所在组)内的频数之和中位数可以应用于任何定量资料,通常用于不适合用几何平均值和调和平均值的偏态资料中,尤其适用于包含不完全信息的资料中。例如临床上随访资料经常包含一些中途失访患
者的某些数据;有时因受仪器和试剂的灵敏度的限制,指标的含量过低时无法准确测得,只知 道一组数中有几个数低于某数值。    

         5.众教的定义与计算众数:n个性质相同的定量数据中出现次数多的那个数,就叫做 这组数据的众数。     由众数的定义可知,只需找出一组原始数据中重复出现次数多的那个数据,它就是这组定量资料的众数;若是频数分布表资料,频数大的那一组的组中值就是这组定量资料的众数。    

         若定量资料是以原始数据形式呈现的,则众数可应用于包含两个或多个相同数据的定量资料中;若定量资料是用频数分布表形式呈现的,则只要各组中的频数不全是l,就可以应用众数。在医学上,众数常用来表示某病或某次食物中毒的潜伏期,在实际的医疗器械临床研究 中,该指标运用的较少。    

         (二)离散趋势的描述
         仅用平均指标来描述一组定量资料的全貌是不完善的,因为平均指标仅能反映一组定量 资料的平均水平,而无法反映其离散程度(即各观测值偏离平均值的程度)的大小。例如,F'面 的两组数的算术平均值是完全相等的,但它们的离散程度却相差很大。

         上面这丽组数据的算术平均值虽然都是27,但组数据彼此之间离开平均值27的距离都比较小,而第二组数据彼此之间离开平均值27的距离都比较大。度量一组定世资料中的 每一个离开其算术平均值的离散程度大小的常用的变异指标叫做标准差(就是上面用S表 示的数)。除了标准差外,还有方差、标准误、变异系数、四分位数间距、极差等。

         1.极差一组性质相同的定量数据中大值与小值之差,叫做极差。公式见式(7-9)。

         极差计算反应的数据离散趋势的信息量较少,因而较少使用。    

         2.方差一组性质相同的定量数据中的每一个与其样本算术平均值的差量的平方和除 以数据个数与1的差量,所得的结果叫做样本方差。用原始数据计算见式(7-10),用频数分布表计算见式(7-11)。

         式(7-10)和(7-11)中,k为频数分布表的组数,n为样本大小,xj为第j组数据的组中值,fj为第j组的频数
         一组性质相同的定量数据巾的每一个与其总体算术平均值的差量的平方和除以数据个 数,所得的结果叫做总体方差。用原始数据计算见式(7-12).用频数分布表计算见式(7-13)。

         式(7-12)和(7-13)中,k为频数分市表的组数,N为样本大小,xj为第j组数据的组中值,
         fj为第j组的频数,μ为总体算术平均值    

         3.标准差方差的算术平方根叫做标准差,可分为样本方差和总体方差,分别见式(714)和式(7-15)。

         式(7-14)中S2的汁算见式(7-10)和式(7-11);式(7-15)中σ2的计算见式(7-12)和式(7—13)
         在可以计算标准差和方差的资料中,为了反映资料的离散度大小时,通常只用标准差,而 不用方差,仅在对定量资料作统计分析(如方差分析)时要用到方差(称作均方)。    

         4.变异系数  标准差与算术平均值之比值(通常以百分散形式给出),叫做变异系数, 记作CV。其计算公式见式(7-16)。

 

         标准差与变异系数的用法比较:当比较两组或多组定量资料的离散度大小时,在下面两种 情形下不适合使用标准差,而必须使用变异系数。    

         情形一,当各组定世资料的单位(或叫量纲)不同时。    

         情形二,当各组定量资料的算术平均值相差悬殊时。    

         5.标准误 为了明确地给出标准误的定义,需要知道两个重要的名词。它们分别是“统计量”和“参数”。    

         参数:反映总体中数据舒布特征的嚣,称为参数。如总体平均值μ、总体标准差σ等。    

         统计量:由样本数据确定的,不含任何未知参数的统计指标,叫做统计量。如样本平均值 x.样本标准差S,样本率,样本变异系数等。    

         标准误:统计址的标准差,叫做标准误。样本平均值的标准误记作S,,样本率的标准误记作S。,变异系数的标准议记作Scv。它们的计算公式分别见式(7-17)擎式(7-20)。

         式(7-18)是在大样本(n至少要>30,好>100)条件F样本标准差的标准洪,儿中σ为总体标 准差
         标准差与标准误的用法比较:标准差适合用米反映一组陆质相川的定艟数据离外其算术 平均值的波动大小,它反映了在相同条件下试验的度的重现性好坏(即精密度的高低);而平均值的值大小的推测。因此,在表达几组类似实验结果离散度在小时,建议使用杯准差,而不要盲目 使用平均值的标准误。因为对同一组定量资料而言,标准误小于标准差,容易掩盖实际存在的 较大的离散度,使哪些原奉水适台埔近似正志分布法表达和处理的资料,都错误地运用了这些方法。    

         6.分位数间距 先用分位数法求出两个关于中位数对称的同类分化数,如四分位数(Q1)与第三四分位数(Q3),令QR=Q3 -Q1,则QR就叫做四分位数问距,这个数值的大小,标志着一组呈偏态分布定量资料居中的50%数值的离散度的大小。那么,我们可以用(P97.5一P2.5)来反映一组呈偏态分布定量资料居中的95%数值的离散度的大小。    

         极差与四分位数间距的用法比较:四分位数间距反映了一组性质相同的定量数据中居中的50%的数据所在的范围,它比极差更有参考价值。    

         标准差与四分位数间距的用法比较:在偏态分布资料中,一般不适合使用标准差,此时可 用四分位数间距取代标准差。