统计学变量类型汇总十篇

时间:2023-08-01 17:19:44

序论:好文章的创作是一个不断探索和完善的过程,我们为您推荐十篇统计学变量类型范例,希望它们能助您一臂之力,提升您的阅读品质,带来更深刻的阅读感受。

统计学变量类型

篇(1)

1.1根据资料类型初步确定方法

临床研究中产生的各种不同原始资料,而不同数据资料类型采用的统计分析方法也不同。定量资料常用的方法有t检验、方差分析、非参数检验、线性相关与回归分析等。定性资料可用的方法有χ2检验、对数线性模型、logistic回归等,影像医师可根据不同需要选用不同统计方法。值得一提的是有些资料类型确定后,统计方法的选用对其有序性有相应要求;而多种方法联合应用或者使用部分少见的分析方法时还需要在选定统计方法后,利用统计软件(如SAS、SPSS)对应的不同命令进行初步分析试验。

1.2根据研究目的选择方法

1.2.1差异性研究

差异性分析是指评价比较组间均数、频数、比率等的差异。根据研究需要可选用的方法有χ2检验、t检验、方差分析、非参数检验等。临床上研究两组、多组样本比率或构成比之间的差别关系时最常用χ2检验,也是针对计数资料进行假设检验的一种常用的统计学方法,而对两组定量资料分析常用t检验和秩和检验,多组资料分析则常用方差分析;Fisher精确概率法主要适用于总体样本频数小于40或四格表中最小格子T值<1。虽然Fisher精确检验不属于χ2检验,但仍可以作为有效的补充,而也有人认为在统计软件普遍易得的当下,Fisher精确概率法也同样适用于大样本四格表的资料。如彭泽华等[6]在探讨冠状窦-左心房肌连接的双源CT冠状动脉成像(DSCTCA)形态特征时针对冠状窦-左心房肌连接的类型在两组类别变量采用联表的χ2检验,结果差异无统计学意义(χ2=0.115,P=0.944)。Teefey等[7]在研究超声表现及白细胞计数预测急性胆囊炎坏疽变化关系时使用Fisher精确分析。t检验适用于两组定量资料分析且资料满足方差齐性和正态性两个基本条件;同样t检验适用于完全随机设计的单因素两水平的资料,在选用t检验时应注意对资料进行相应的变量变换,若资料不能满足基本条件则选用适合分析偏态分布的非参数检验(如:秩和检验)进行分析。如Wang等[8]在研究不同侵袭性的前列腺癌组织和正常前列腺组织以及外周带前列腺癌Gleason评分与肿瘤信号对比时采用t检验。Kung等[9]在研究化脓性髋关节炎的临床和放射学预测指标时也使用t检验分析。秩和检验包括基本秩和检验(Wilcoxon等级检验、Mann-WhitneyU-检验)和高级秩和检验(Kruskal-Wallis、Friedmantests、Kolmogorov-Smirnov拟合检验)。当研究资料为两方差齐且呈正态分布的总体,而总体分布类型未知或者不满足参数检验的条件时,采用t检验对样本进行比较;但若无需比较总体参数只比较总置的分布是否相同且总体资料分布类型未知时需要采用非参数的Wilcoxon秩和检验进行比较。针对两组或多组样本的定性资料使用秩和检验比较时,需要混合两样本数据、编秩(从小到大)、计量T值、查表或计算求得P值。如Saindane等[10]在对“空蝶鞍”的临床意义判定因素研究中针对颅内压增高和偶然发现空蝶鞍患者两组资料对比时采用Wilcoxon秩和检验。Filippi等[11]在研究DTI测量儿童Ι型神经纤维瘤病胼胝体派生指标时运用Wilcoxon秩和检验。事实上在影像资料分析中经常见到多重组间比较的情况,方差分析(analysisofvariance,ANOVA)就是用来推断两个或者多个总体之间是否有差别的检验,又称F检验。多重组间比较不能单纯选用两样本均数比较的t检验,但是可以根据资料类型选用ANOVA检验。若来自两个随机样本资料呈正态分布且方差齐性同的定量资料,应采用两因素(处理、配伍)方差分析(two-wayANOVA)或配对t检验。通过F检验可以比较可能由某因素所至的变异或随机误差,同时可了解该因素对测定结果有无影响。当不满足方差分析和t检验条件时,可对数据进行变换或采用随机区组设计资料的FriedmanM检验。Obdeijn等[12]在研究乳腺术前MRI能减少术中切缘和乳腺保守术后再次手术,使用ANOVA分析两组资料,结果对照组(29.3%)相比术前MRI病例组(15.8%)有效减少切缘和再次手术(P<0.01)。

1.2.2相关性分析

相关性分析不等同因果性,也不是简单的个性化相比,其涵盖的范围和领域较为广泛。统计学意义中的相关性分析包含相关性系数的计算,其过程为:每个变量转化为标准单位后,乘积的平均数即为相关系数。相关性分析可以用直观地用散点图表示两个或者多个变量的离散,当其紧密地靠近于一条直线时,即变量间存在很强的相关性。相关分析常用的方法有Pearson相关性分析、Spearman等级相关分析和卡方检验。临床中对两个或者多个均为定量变量的资料,且变量均呈正态分布时可选用Pearson相关分析,但多数情况下Pearson相关分析适用于两组资料的相关性分析。判断两变量之间线性关系的密切程度主要用Pearson积差相关系数,其范围为-1~+1。若相关系数的绝对值越接近1,即两变量间相关性越密切;反之,相关系数的绝对值越接近0,其相关性越差。实际上在高质量期刊论文中使用Spearman等级相关分析的研究也很常见,其通过相关系数进行变量间线性关系分析来判定两个变量间相关性的密切程度。而密切程度的量化指标则通过计算样本相关系数r,根据实际计算r绝对值所属范围来推断两个来自总体变量的线性相关程度,从而推断总体的相关性。根据实际分析需要,将相关关系密切程度分为6等:当IrI=0时,说明两变量完全不相关:当0<IrI<0.3时,说明两变量不相关;当0.3<IrI<0.5时,说明两变量低度相关;当0.5<IrI<0.8时,说明两变量显著相关;当0.8<IrI<1说明两变量高度相关:当IrI=l时,说明两个变量完全相关。王效春等[13]在研究磁敏感加权成像与动态磁敏感加权对比增强MR灌注加权成像联合应用在脑星形细胞瘤分级中的价值一文应用Spearman等级相关分析,结果显示肿瘤内磁敏感信号与相对血容量最大值和病理分级呈正相关(IrI分别为0.72、0.89,P值均<0.01),相对血容量与病理分级呈显著正相关(r=0.78,P<0.01)。又如Lederlin等[14]在比较几何参数、相关功能与组织学特性在哮喘患者的支气管壁CT衰减性关系中同时使用Pearson相关分析和Spearman等级相关分析,其r=0.39~0.43,表明与对照组相比常规CT衰减参数在哮喘患者平常支气管的CT参数、气道壁衰减方面更好的区分哮喘患者,同时也更好地区分气道梗阻。值得提及的是对资料有序或无序无法作出初步判定,且明确资料类型为定性资料时还可以选择使用卡方检验和Spearman等级相关分析。

1.2.3影响性分析

由于事物之间的联系是多种多样的,而某一结局可能受到来自其他多个方面的影响,此时为分析某一结局发生的影响因素可采用的资料分析方法有线性回归(一元或多元)、logistic回归、Cox比例风险回归模型(生存分析)等。在影像资料分析中一元线性回归是将影像资料中一个最主要影响因素作为自变量来解释因变量的变化。多元回归定义为某一因变量的变化受多个重要因素的影响,而此时需要用两个或多个影响因素作为自变量来解释因变量的变化,且多个自变量与因变量之间是线性关系(多个因变量之间相互独立)。实际研究中多元线性回归模型在影像资料分析应用较为广泛。Langkammer等[15]在磁敏感系数绘图在多发性硬化中应用研究中使用多元线性分析,结果显示各种影响因素中年龄是预测磁化率影响最强的因素。Logistic回归是研究二分类和多分类观察结果与某些影响因素自己建关系的一种多变化分析方法,其经常需要分析疾病与各影像指标之间的定量关系,同时又需要排除一些混杂因素影响。Logistic回归在统计学上属于概率型非线性回归,其分析思路与线性回归大致相同,能有效解决过高或过低水平因素以及分析因素少而样本量大等问题。相比多元线性回归,Logistic回归在处理分类反应数据方面更为常用,且适用于结局为定性影像资料。如Lee等[16]研究高分辨率CT在发现小蜂窝样特发性间质肺炎纤维化的连续变化和预后应用中使用logistic回归分析,结果表明高分辨率CT在网状和磨玻璃状范围内评价普通肺炎与非特异性纤维化肺炎之间差别明显(P<0.01)。在临床实际工作中常常需要分析生存时间与影像资料之间的关系,Kaplan-Meier法就是常用的一种分析方法,其又称乘积极限法,对大小样本资料分析均适用。实践中习惯上以时间为横轴、生存率为纵轴回执的阶梯状图称为Kaplan-Meier生存曲线(survivalcurve),也称K-M曲线。Cox比例风险回归模型是另一种生存分析方法,包括参数与半参数模型两类,其主要是进行多因素生存分析的一种方法,同时可分析众多变量对生存时间和生存结局的影响。Saad等[17]在经颈静脉肝内门体静脉分流术在肝移植受者的技术分析和临床评估研究中比较成功施行肝移植与非移植病人开展门体分流术(transjugularintrahepaticportosystemicshunt,TIPS)后的临床疗效评估,使用了Kaplan-Meier法,结果显示6~12个月、12~24个月、24个月以上,移植成活率分别为43%、32%和22%。生存期大于1年的晚期肝脏疾病模型存活评分低于17分、等于17分或大于17分的存活率分别为54%和8%(P<0.05)。

2其他适用方法

2.1ROC曲线

ROC(receiveroperatingcharacteristic)曲线是欧美影像学期刊中应用较为常见的统计学方法,国内期刊应用相对较少。ROC曲线根据一系列不同的分界值以真阳性率(灵敏性)为纵坐标,假阳性率(特异性)为横坐标绘制的曲线。ROC曲线分析结合灵敏度(sensitivity)和特异度(specificity)广泛应用于医学诊断,也应用于影像诊断及人群筛查。ROC曲线根据曲线下面积(areaundertheROCcurve,AUC)的大小对诊断试验作定量分析。理论上,AUC值在0~1间。根据实际情况将诊断分为不符合诊断(AUC<0.5)、无诊断价值(AUC=0.5)、低准确性(0.5<AUC<0.7)、一定准确性(0.7<AUC<0.9)、较高准确性(0.9<AUC<1),AUC越接近于1,表明诊断准确性越高。Hyodo等[18]在研究乏血管少结节的慢性肝脏疾病患者发展成富血管性肝细胞癌风险因素一文中使用ROC曲线分析,结果显示后续发展成血管性结节平均增长率明显高于非血管过渡性结节。

2.2Kappa检验

Kappa检验主要用于评价不同资料间一致性程度,常用Kappa值评价一致程度。Kappa系数适用于两项和多项无序分类变量资料。在影像学试验中常需要判断多名医师测量同一研究对象或者同一医师多次测量同一对象的一致性,Kappa一致性检验便是最佳选择。Kappa检验还可通过计算Kappa值对两种非金标准的诊断方法进行诊断结果一致性分析。一般而言,评价Kappa一致性需要计算Kappa系数,但在研究考察新的诊断试验方法是否优于金标准,或者检验是否与金标准一致时,还需要计算特异度、灵敏度、阳性预测值和阴性预测值等指标。目前公认的Kappa系数分为六个区段即一致性极差(Kappa值<0),一致性微弱(Kappa值0~0.2),一致性弱(Kappa值0.21~0.40),中度一致Kappa值(0.41~0.60),高度一致(Kappa值0.61~0.80),一致性极强(Kappa值0.81~1.00)。

篇(2)

【中图分类号】 R 179 R 395.6 R 163 【文献标识码】 A 【文章编号】 1000-9817(2007)08-0699-02

Relationship Between the Internet Addiction and School Management/CHANG Guo-sheng*, LI Yong-zhan, ZHAO Shan-ming. * No.9 People's Hospital of Zhengzhou, Zhengzhou(450001), China

【Abstract】 Objective To study the situation of the internet addiction disorder (IAD) among the senior middle school, and to explore the influence of school management type on the incidence of the internet addiction disorder.MethodsEight hundred and fifty students were sampled from six senior middle schools by cluster sampling. They were tested by IAD Scale and a self-designed inventory. Results The incidence of IAD was 6.1%, and it had no significant differences in gender, grade and original location, but it had significant differences between IAD and school nature or school management type. The results of logistic regression and linear regression indicated that school management type had the greatest predictability to the variation of the IAD. ConclusionIAD of senior middle school students is related with school management type, and close management can be a valid way to IAD prevention.

【Key words】 Internet;Behavior,addictive;Organization and administration;Students

如今,大学生网络成瘾(IAD)现象日趋突现, 越来越多的中学生也开始加入到上网大军之中[1],成为另一个网络成瘾的高危群体[2]。因沉迷网络所致的学习成绩下降和心理、行为异常现象已经引起了社会的广泛关注[3-5]。中学生身心发展不平衡,容易出现较多的心理问题[6],加之好奇心强、自制力弱、人生观和价值观尚未形成,面对包罗万象的网络虚拟世界,网络成瘾的危险性更大[7]。笔者以郑州市高中生为被试,调查其网络成瘾状况,并分析学校管理类型与网络成瘾的关系,以期为干预网络成瘾提供理论依据。

1 对象与方法

1.1 对象 随机选取郑州市重点、普通、职业中学各2所,按年级随机抽取高一至高三年级共18个教学班的学生850人为调查对象,获有效答卷806份,有效应答率为94.82%。被试中一年级262人,二年级261人,三年级283人;男生457人,女生349人;重点中学学生310人,普通中学学生277人,职业中学学生219人。年龄14~19岁,平均年龄(16.12±1.25)岁。

1.2 方法 采用网络成瘾诊断问卷和自编的网络使用调查问卷对所有调查对象进行测试。网络成瘾诊断问卷又称网络成瘾诊断标准,是1996年由美国心理学家K.S.Young参照《美国精神障碍诊断与统计手册》第4版(DSM-IV)中关于赌博成瘾的标准编制而成[8]。问卷由8个问题组成,得5分及5分以上即可判定为网络成瘾(IAD)。自编网络使用调查问卷系参考已有的网络成瘾研究所用的调查问卷,并结合本研究的目的编制的,项目包括年龄、性别、年级、学校性质、学校管理类型、生源等内容。上述2套问卷由课题组成员统一发给被试,进行不记名集体测试。采用SPSS 10.0软件对数据进行统计与分析。

2 结果与分析

2.1 网络成瘾诊断问卷得分情况及网络成瘾率 在806名被试中,得分大于或等于5分的IAD者有49名,非IAD者有757名,网络成瘾率为6.1%。

2.2 不同人口社会统计学特征高中生网络成瘾率比较 由表1可知,只有职业高中学生网络成瘾人数显著大于期望值(P=0.014)。开放式管理的学校学生与封闭式管理的学校网络成瘾率差异有统计学意义。

2.3 网络成瘾与各统计变量之间的相关分析 结果显示,网络成瘾与性别、年级、生源均无显著性相关,而与学校性质和学校管理类型的相关均具有统计学意义(r值分别为0.106和0.089)。

2.4 网络成瘾倾向与各统计变量的多元线性回归分析 以网络成瘾总分为因变量,以性别、年级、生源、学校性质、学校管理类型为自变量进行多元线性回归分析,结果显示:网络成瘾总分和学校管理类型、生源有线性回归关系;学校管理类型首先进入回归模型,其次进入的是生源。模型的回归方程为y=-0.685+0.906x1+0.377x2,其中x1为学校管理类型,x2为生源。见表2。

3 讨论

调查结果显示,郑州市高中生网络成瘾率为6.1%,低于已有研究的结果[9-10]。可能是由于各研究所采用的网络成瘾诊断量表不同所致,也可能与各研究所调查的样本范围及研究的时间不同有关。

男、女生网络成瘾率差异无统计学意义,与已有的研究结果不一致[9-10]。可能是随着网络的日渐普及,女生上网人数也与日俱增,使更多的女生网络成瘾。

结果还显示,职业高中的网络成瘾率显著高于重点与普通高中,开放式管理的学校网络成瘾率显著高于封闭式管理的学校。说明学校性质与学校管理类型应该与网络成瘾有关。相关性分析也提示,学校性质和学校管理类型与网络成瘾呈显著正相关。

多元线性回归分析显示,学校管理类型对网络成瘾倾向的影响在各变量中最大。提示在干预高中生网络成瘾方面,学校实行封闭式教学管理可能是一项有效的措施。当然,人格、生理、家庭教养方式、社会支持等因素都可能是网络成瘾的预测变量,但单从可操作性来考虑网络成瘾的干预措施,实施封闭式学校管理应该说是具有一定可行性的。

4 参考文献

[1] 中国互联网络发展状况统计报告.中国互联网信息中心(CNNIC),2006.

[2] 李煜光.中学生网络成瘾和学校教育:上海市中学生网络成瘾现象分析.四川教育学院学报,2005,21(4):3-12.

[3] 张晓阳,席震芳,严红妹.城市初中生网络成瘾与其网络行为的相关研究.中国学校卫生,2004,10,25(5):607-608.

[4] 席震芳,张晓阳.初中生网络成瘾倾向与家庭教养方式的关系.中国学校卫生,2005 ,26(2):153-155.

[5] 李晓驷,李泽爱,谢雯,等.合肥市中学生网络成瘾流行病学调查报告.中国心理卫生杂志,2006,20(1):51-54.

[6] 王宇中.医学心理学.兰州:兰州大学出版社,2003:237.

[7] 龚银清,杨容,张斌.中学生网络成瘾的心理治疗方法与技术.中国学校卫生,2005 ,26 (5):408-409.

[8] YOUNG KS.Internet Addiction: the emergence of a new disorder.Cyber-psychol behavi,1998,1(3):237-244.

[9] 黄少南,胡武昌,周先华,等.九江市城区中学生网络成瘾状况调查.山东精神医学,2005,18 (1):35-37.

篇(3)

二、应用SPSS软件的基本统分析

教学材料第二、三章内容为资料的整理与特征数的计算、概率和概率分布,结合教学内容SPSS上机实验课应设置基本统计分析课程,该部分包括数据汇总报告和描述性统计分析两方面的内容。基本统计分析可通过菜单栏的分析(Analyze)窗口进入,点击分析栏之后,鼠标放置数据汇总报告(Reports)栏,即可显示分层报告(OLAP—OnlineAna-lyticalProcessing)、数据汇总(CasesSummarize)、行汇总报告(ReportSummariesinRows)、列汇总报告选项(ReportSummariesinColumns)。其中分层报告主要用于中位数、最大值、最小值、方差、偏度系数等统计描述;数据汇总可用于对编辑窗口中的数据在结果窗口中罗列出来,以便浏览和打印,同时也可对数据的基本特征进行描述;行汇总报告可罗列原始数据,其格式是以观察单位和统计量为行标目,以报告变量为列标目;列汇总报告主要用来生成按列显示统计量计算结果的报告,同时也可以完成许多统计计算。当鼠标放置描述性统计分析(DescriptiveStatistics)位置后,选中响应的功能即可进入频数分析(Frequen-cies)、描述性分析(Descriptives)、探索性分析(Ex-plore)、多维交叉表分析(Crosstabs)、比值分析(Ratio)窗口从而根据自己的目的进行响应的数据分析。

三、应用SPSS软件的均值比较和方差分析

生物统计学基本知识熟悉之后,在随后在课堂教学中会开始进行统计推断和方差分析部分的内容。SPSS实验课在此部分结合课堂教学相应的设置均值比较和方差分析上机内容。均值比较可通过菜单栏的分析(Analyze)窗口进入,点击分析栏之后,鼠标放置数据均值比较(Com-pareMeans)上即可显示相应分析栏:平均数基本分(Means)可用于定量资料的统计分析,按分组变量计算因变量的描述统计量值,如均值、方差、标准差、偏度、峰度等统计量,并显示结果;单样本T-test(One-SampleTTest)单样本t检验主要用于样本平均数和已知总体平均数的比较;独立样本T-tes(tInde-pendent-SamplesTTest)可用于检验两个独立样本的总体平均数之间是否有显著差异;配对样本T-test(Paired-SamplesTTest)用于配对计量资料的比较,检验配对样本差值的总体均数与0的差异有无显著意义,以及配对样本是否相关方差分析包括单因素方差分析和多因素方差分析。其中单向方差分析(One-WayANOVA)可通过均值比较(CompareMeans)进入,其用于完全随机设计资料的多个样本均数比较和样本均数间的多重比较,也可进行多个处理组与一个对照组的比较。多因素方差分析可通过分析栏里的多因素方差分析(GeneralLinearModel)选项进入,进入之后会设置四个不同要求的选择:单变量多因素方差分析(Univariate)可用于一个因变量受一个或多个自变量影响的方差分析;多因变量方差分析(Multivariate)主要用于多个因变量受一个或多个因素变量或协变量影响的方差分析;多因变量方差分析(Multivariate)对同一因变量进行重复测量的方差分析;混合效应分析(VarianceCompo-nents)用来估计每个随机因素对因变量方差的贡献。在分析过程中可根据不同的需要和要求,选择相应的方差分析。

篇(4)

科研设计包括专业设计和统计研究设计。专业设计主要包括基本常识和专业知识的正确、全面、巧妙地运用;而统计研究设计包括实验设计、临床试验设计和调查设计。值得注意的是:在很多科研人员所做的科研课题中,不仅严重忽视统计研究设计,就连专业设计也有严重错误,主要表现在犯了基本常识错误和违背专业知识错误。这类错误所发生的频率还相当高,是一种不能容忍的不正常现象!

在统计研究设计所包含的3种研究设计中,实验设计是最重要的,因为很多关键性的内容都包含在其中,其核心内容是“三要素”、“四原则”和“设计类型”。所谓“三要素”就是受试对象(或调查对象)、影响因素(包括试验因素和重要的非试验因素)和实验效应(通过具体的观测指标来体现);所谓“四原则”就是随机、对照、重复和均衡原则,它们在选取和分配受试对象、控制重要非试验因素对观测结果的干扰和影响、提高组间均衡性、提高结论的可靠性和说服力等方面将起到“保驾护航”的作用;所谓“设计类型”就是实验中因素及其水平如何合理搭配而形成的一种结构,它决定了能否多快好省且又经济可靠地实现研究目标。科研人员若对重要非试验因素考虑不周到、对照组选择不合理、设计类型选择不当或辨别不清,导致科研课题的科研设计千疮百孔、数据分析滥竽充数、结果解释稀里糊涂、结论陈述啼笑皆非。下面笔者就“实验设计”环节存在的问题辨析如下。

1 在分析定量资料前未明确交代所对应的实验设计类型

人们在处理定量资料前未明确交代定量资料所对应的实验设计,对数千篇稿件进行审阅后发现,大多数人都是盲目套用统计分析方法,其结论的正确性如何是可想而知的。这是一条出现非常频繁的错误,应当引起广大科研工作者的高度重视。

2 临床试验设计中一个极易被忽视的问题——按重要非试验因素进行分层随机化

例1:原文题目为《气管舒合剂治疗支气管哮喘的临床观察》。原作者写到:“全部病例均来源于本院呼吸专科门诊和普通门诊,随机分为治疗组40例和对照组30例。其中治疗组男21例,女19例;年龄21~55岁,平均(36.28±9.36)岁;病程2~23年,平均(10.31±17.48)年;病情轻度者16例,中度24例。对照组30例,男16例,女14例;年龄20~53岁,平均(35.78±9.53)岁;病程3~24年,平均(11.05±6.47)年;病情轻度者13例,中度者17例。两组间情况差异无显著性,具有可比性。”请问这样随机化,其组间具有可比性吗?

对差错的辨析与释疑:显然,研究者在试验设计时未对重要非试验因素采用分层随机保证各组之间的可比性。这条错误的严重程度为不可逆,出现不可逆错误意味着原作者的试验设计具有无法改正的错误,必须重做实验!究其原因,主要是原作者未理解统计学上随机的概念。统计学上随机化的目的是尽可能去掉人为因素对观测结果的干扰和影响,让重要的非试验因素在组间达到平衡。稍微留意一下原作者随机化分组,明显带有人为的痕迹,治疗组40人比对照组30人多出10人;治疗组病程的标准差17.48是对照组病程的标准差6.47的近3倍。笔者很疑惑怎样的随机化才能达到如此的不平衡?事实上随机化有4种:子总体内随机、完全随机、分层随机和按不平衡指数最小原则所进行的随机,原文条件下应当选用分层随机,即以两个重要的非试验因素(性别和病情)水平组合形成4个小组(男轻,女轻,男中,女中),然后把每个小组内的患者再随机均分到治疗组和对照组中去,这样分层随机的最终结果一定是治疗组和对照组各35人,且使2组间非试验因素的影响达到尽可能的平衡,从而可大大提高组间的可比性。在本例中,若“病程”对观测结果有重要影响,在进行分层随机化时,在按“性别”和“病情”分组的基础上,还应再按“病程”(设分为短、中、长)分组,即共形成12个小组,将每个小组中的患者随机均分入治疗组与对照组中去,这是使“性别、病情、病程”3个重要非试验因素对观测结果的影响在治疗组与对照组之间达到平衡的重要举措,也是所有临床试验研究成败与否的最关键环节!

3 实验设计类型判断错误

例2:某作者欲观察甘草酸、泼尼松对慢性马兜铃酸肾病(AAN)肾损害的干预作用,于是,进行了实验,数据见表1。原作者经过用甘草酸和泼尼松分别与同期正常对照组和模型组比较,一个P<0.05,另一个P<0.01,于是得到甘草酸、泼尼松对慢性AAN肾损害具有一定程度的保护作用,且泼尼松的效果更佳。请问原作者的结论可信吗?表1 各组大鼠血BUN及SCr变化比较(略)注:与正常对照组同期比较,*P<0.05,**P<0.01;与模型组同期比较,P<0.05,P<0.01

对差错的辨析与释疑:本例错误极为典型,通常科研工作者欲观察某种药物是否有效,习惯上会建立正常对照组、模型组(即该药物拟治疗的病态组)和在模型组基础上的用药组(如本例中甘草酸组和泼尼松组)。这样的设计本身并没有错,但这仅仅是专业上的“实验安排(可称为多因素非平衡组合实验[1])”,而并非是统计学中所说的某种标准实验设计类型。写在“组别”之下的4个组,并非是一个因素的4个水平,而是2个因素水平的部分组合。这2个因素分别是“是否建模(即正常与模型2个水平)”和“用药种类[即不用药(相当于安慰剂)、用甘草酸和用泼尼松3个水平]”。2个因素共有6种水平组合,即“组别”之下缺少了“正常基础上用甘草酸”和“正常基础上用泼尼松”。这样设计的实验才可能反映出“是否建模”与“用药种类”2个因素之间是否存在交互作用。

在本课题研究中,由于未在实验前作出正确的实验设计,处理数据时错误就悄然产生了。具体到本例,从原作者在表1的注解中可以看出,通过单因素方差分析分别比较同期(即相同观测时间点)的甘草酸组和泼尼松组与正常对照组和模型组之间的差别是否有统计学意义。这样的做法有3个严重错误:第一,严格地说,在模型组基础上的用药组是不适合直接与正常对照组相比较的,因为这样的比较解释不清到底是药物的作用还是由于模型未建成功而造成的假象;第二,将各个时间点割裂开分别比较破坏了原先的整体设计,数据利用率降低,误差估计不准确,导致结论的可信度降低。将一个重复测量实验的各个时间点割裂开来考察,就等于在各个片段上估计实验误差、作出统计推断,好像盲人摸象一样,摸出来的结果差别何其之大;第三,要想说明两种药物哪个效果更佳,在得出差别具有统计学意义的基础上,衡量的标准是应看组间平均值的差量的大小而不应看P值是否足够地小,不能说P<0.01时就比P<0.05时更有效,这种忽视实验误差、忽视绝对数量和脱离专业知识的想法和做法都是不妥当的。

如何正确处理表1中的实验资料呢?关键要正确判定该定量资料所对应的是什么实验设计类型。由前面的分析可知,表1定量资料对应的是“多因素非平衡组合实验”,而不是某种标准的多因素实验设计类型。明智的做法是对“组别”进行合理拆分,即根据专业知识和统计学知识,对“组别”之下的所有组重新进行组合,应使每种组合对应着一个标准的实验设计类型。正确地拆分结果分别见表2和表3。表2 正常对照组与模型组大鼠血BUN及SCr变化的测定结果(略)表3 模型组和2个用药组大鼠血BUN及SCr变化的测定结果(略)

事实上,由科研习惯形成的这一套实验方案笔者形象地称之为多因素非平衡的组合实验,或者说,它是实验设计的表现型。通常可以进行统计分析的都必须是标准型(即统计学上所说的某种实验设计类型),因此需要能看出代表表现型本质的原型(本例中组别之下应该有6个组,这6个组构成一个2×3析因设计结构,但原作者少设计了2个组)。通常需要将表现型或/和原型拆分成标准型后再选择合适的统计分析方法进行数据分析。本例根据原作者的意图,可以将表1拆分成2个标准型,形成2个具有一个重复测量的两因素设计定量资料,见表2和表3。相应的统计分析方法就是具有一个重复测量的两因素设计定量资料的方差分析。此处请读者注意:第一,具有一个重复测量的两因素设计定量资料的方差分析和一般的方差分析虽然都叫方差分析,但它们的计算公式却有本质区别,绝不可混用;第二,重复测量因素(本例中为时间)不要与实验分组因素(表2中叫“是否建模”;表3中叫“药物种类”)同时列入左边,它们是本质不同的两种因素,一般应该把“重复测量因素”放到表头横线下方。

通过本例可以看出,在实验前明确实验设计是多么重要的一件事情。试想,若让本例原作者写明他的实验设计类型,他必然就会对基本的实验设计类型作一番调查和学习,自然就能发现他所“设计”的实验并不是统计学上相应的实验设计。那么通过咨询相关人士必能做出比较正确的实验设计,不仅可以提高科研设计水平,而且可以大大提高科研课题和论文质量。

例3:原文题目为《土荆芥-水团花对胃溃疡大鼠黏膜保护作用的研究》。原作者使用单因素多水平设计定量资料方差分析处理表4中的数据。请问原作者这样做对吗?表4 各组黏膜肌层宽度、再生黏膜厚度变化(略)注:与正常组比较,aP<0.05;与NS组比较,bP<0.05;与CP 10 mg·kg-1 组比较,cP<0.05

对差错的辨析与释疑:本例涉及到统计学三型理论[1]中的一些概念,简单地说就是可以直接进行统计分析的来自标准设计的数据表叫标准型,反映问题本质但并非是标准型的数据表叫原型,而掩盖了原型信息的数据表叫表现型。“组别”之下的6个组,似乎是某个因素的6个水平,其实不然!这6个组涉及到多个试验因素,应对“组别”拆分重新组合后,再分别判定各种组合所对应的实验设计类型,并选用相应的统计分析方法。组合1:空白对照组(正常)、阴性对照组(NS),这是单因素两水平设计(简称为成组设计)。由于正常组无实验数据,故该组合无法进行统计分析;组合2:NS组、RA组、CP(20/mg·kg-1)组,这是单因素3水平设计,因素的名称叫“药物种类”;组合3:NS组、CP(10/mg·kg-1)组、CP(15/mg·kg-1)组、CP(20/mg·kg-1)组,这是单因素4水平设计,因素名称叫CP的剂量(其中,NS组可视为CP的剂量为0)。

对于组合2和组合3,若定量资料满足参数检验的前提条件,可选用相应设计定量资料的方差分析,否则,需要改用相应设计定量资料的秩和检验。

4 人为改变设计类型且数据利用不全

例4:某作者使用表5中的数据进行分析,欲比较治疗组和对照组在治疗后的各个时间点的疗效情况,使用的分析方法为一般卡方检验,请问原作者这样做对吗?

对差错的辨析与释疑:从给出的统计表可以看出,该作者有意或者无意之间收集了一类相当复杂的实验设计类型下的定性资料,结果变量为多值有序变量的具有一个重复测量的两因素设计定性资料,处理这个设计下收集的定性资料要使用相应设计定性资料的统计模型分析法。由于上述方法过于复杂,因此,通常在实际运用中,实际工作者将重复测量因素武断地视为实验分组因素,从而使该资料变为结果变量为多值有序变量的三维列联表资料。在已经出错的前提下,原本应当使用CMH校正的秩和检验或者有序变量的多重logistic回归分析处理资料。然而,该作者显然在此基础上进一步合并了数据,将结果变量变成二值变量(有效、无效),也就是说,原作者实际使用的仅仅是最后一列数据(即总有效率),并且最为严重的错误是将三维列联表资料强行降维成二维列联表资料,使用一般χ2检验进行分析。经过一系列的简化与错误合并,最后结论的可信度还剩下多少呢?表5 原作者对2组疗效比较的试验设计及数据表达(略)注:与对照组同期比较,*P<0.05

由于篇幅所限,这类错误笔者只给出1例,实际上此类例子在很多杂志中普遍存在。这说明在进行实验设计时,很多研究人员并未做到心中有数;分析数据时,按自己熟悉的简单统计分析方法所能解决的数据结构强硬地改造数据,严格地说,在用表格表达实验资料的那一刹那就已人为改变了资料所对应的实验设计类型,这种做法的科学性和得出结论的正确性都将受到质疑[2]。

5 正交设计及数据处理方面的错误

人们在进行正交设计和对正交设计定量资料进行统计分析时,常存在下列3个误区:很多人过分强调用正交设计可以大大减少实验次数,因此,无论各实验条件(正交表中的每一行)下的实验结果波动有多大,都不做重复实验,这是第1个误区;将正交表各列上都排满试验因素,用对实验结果影响最小的试验因素所对应的标准误作为分析其他因素是否具有统计学意义的误差项,导致误差项的自由度较小,结论的可信度较低,这是第2个误区;在对正交设计定量资料进行方差分析后,即使存在多个无统计学意义的因素,仍对少数几个有统计学意义的因素进行解释,未将无统计学意义的因素合并到误差项中去重新估计实验误差,以获得具有较大自由度的误差项,这是第3个误区。

篇(5)

卒中预后与血脂关系的研究结果差异很大, 认识尚未统一。研究发现脑卒中患者预后的独立预测因素是血清胆固醇水平, 而另有研究却认为脑卒中死亡的独立预测因素血清甘油三酯水平, 预测因素中TC水平不作为独立因素, 预后较好时患者TG水平高[1]。本实验研究分析260例脑卒中患者神经功能缺损的程度和急性期血脂的水平, 探讨不同类型脑卒中患者血脂水平与疾病严重程度的关系。

1 资料与方法

1. 1 一般资料 选择2006年12月~2012年12月于本院住院、病程0.05), 具有可比性。

1. 2 方法

1. 2. 1 血脂测定 所有研究对象测甘油三酯、总胆固醇、低密度脂蛋白、高密度脂蛋白、载脂蛋白B(APOB)、载脂蛋白A1(APOA1)均通过东芝T-40型全自动生化分析仪测定, 低TC指TC

1. 2. 2 疾病严重程度评价 所有患者评定神经功能的缺损程度均为入院24 h内采用SSS, 评分0~58分。重度SSS

1. 3 统计学方法 数据分析应用SPSS17.0统计学软件。计量资料用均数±标准差( x-±s)表示, 采用t检验;计数资料用率表示, 采用χ2检验;多因素分析采用多元逐步Logistic回归分析。P

2 结果

2. 1 不同卒中类型的疾病严重程度、血脂水平评分比较 出血性脑卒中患者的血清TG、TC和LDL-C水平与缺血性脑卒中患者比较明显降低, 差异有统计学意义(P

2. 2 血脂水平与SSS的关系 218例低TC患者, SSS为(30.76±16.73)分, 与血清TC≥6.00 mmol/L的患者(42例)[SSS(42.63±13.53)分]相比明显较低, 差异有统计学意义(P12.0 mmol/L患者(104例)[SSS(44.95±11.25)分]相比明显较低, 差异有统计学意义(P

2. 3 多元逐步回归分析 以入院24 h内神经功能缺损评分(SSS)为应变量, 以年龄、性别、文化程度、脑卒中类型及各血脂指标为自变量, 进行多元逐步回归分析, 进入方程的变量有年龄、脑卒中类型、TC及LDL-C, 其中年龄与SSS评分呈负相关(r=-0.34, P

3 讨论

脂质代谢紊乱包括血清TG升高、TC升高、LDL-C升高或者高密度脂蛋白胆固醇(HDL-C)降低, 在动脉粥样硬化的形成和发展过程以及心脑血管疾病发生当中是很重要的。且类型不一样的脑卒中脂质的代谢也不同。本研究发现入院时患者的脑卒中类型和血脂水平相关, 出血性脑卒中患者的血清TG、TC和LDL-C水平明显低于缺血性脑卒中患者。

脂质代谢紊乱作为冠心病的主要危险因素已被人们所认识, 然而血脂水平与脑卒中的相关性至今还存有争议[2, 3]。本研究发现急性期脑卒中患者病情较重的都是血清TC和TG水平较低的患者, 其机制尚未清楚。目前认为TC可能通过调节乙酰胆碱酯酶的活性和r-谷氨酰转移酶起效达到神经保护作用。高TC饮食可降低乙酰胆碱酯酶的活性, 提高r-谷氨酰转移酶的活性, 从而可降低兴奋性氨基酸的神经毒性作用。TC也可中和部分氧自由基作为一种缓冲剂, 从而提高细胞的恢复能力和限制病灶的扩大。通过氧化氢培养大鼠脑切片的实验研究表明, TC阻碍应激反应的效果明显。而TG致动脉粥样硬化作用很强大, 其导致动脉硬化的机制尚不明确。另TG易受其他因素的影响, 尤其是糖尿病和肥胖。最近的一项TG基因在肥胖核心家庭分析中, 发现血清TG在极端肥胖者中水平明显增加, 说明肥胖、高TG、糖耐量异常三者之间的关系复杂, 以上均是代谢综合征的重要组成部分。因此认为TG的在脑卒中的发病因素并非独立的, 而是几种病因综合起来的共同作用导致。本研究对入院24 h时SSS评分与血脂指标进行多元逐步回归分析, 结果表明TC及LDL-C水平与SSS评分密切相关, 且与SSS评分呈正相关, 提示TC及LDL-C水平可能是预测急性脑卒中病情严重程度独立变量。

本组研究中不同类型卒中比较, 神经功能缺损程度评分差异有统计学意义(P

参考文献

[1] 李伟, 刘鸣, 王丽春.脑卒中患者急性期血脂水平与病情严重程度的关系.临床神经病学杂志, 2007, 20(3):222.

篇(6)

统计学如何为数据挖掘服务,这是在“数据挖掘”飞速发展的今天,统计工作者必须回答的一个问题,我国厦门大学的朱建平教授提出:“统计学应该随时关注数据分析,哪里有数据,哪里就应该有统计分析。”统计学是搜集、展示、分析和解释数据的学科,它拥有非常深厚的理论基础,并在社会生活的各个领域发挥着巨大的作用。近代统计学方法与信息处理的关系日益密切,作为信息处理的一个基本工具,统计学方法将发挥越来越重要的作用。

数据挖掘是近十几年里发展起来的一门崭新的学科,由于它与统计学都关心从数据中发现某种结构,因而从数据挖掘诞生之日起,就与统计学有了千丝万缕的联系。

一、统计学与数据挖掘的涵义

统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察的系统数据,进行量化的分析、总结,进行推断和预测,为相关决策提供依据和参考;它分为描述统计和推断统计。描述统计包括对客观现象的度量、调查方案的设计,对所收集的数据资料进行加工整理、综合概括,通过图示、列表等方式进行分析和描述。推断统计是在搜集、整理监测样本数据的基础上,对有关总体做出推断,其特点是根据随机性的观测样本数据以及问题的条件和假定,对未知事务做出以概率形式表述的推断。

数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的,人们事先不知道的,但又具有潜在价值的信息和知识(模型或规则)的过程。这个定义包括以下含义:数据源必然是真实的、大量的、含噪声的;发现的知识可接受、可理解、可运用,并不要求发现放之四海皆准的知识,仅支持特定的发现问题。它能高度自动化的分析原有数据,做出目的性推理,从中挖掘出潜在的模式,从而帮助决策者调整策略,做出正确的决策。它融数据库技术、人工智能技术、数理统计技术和可视化技术为一体,是一个多学科相互交叉又融合所形成的一个新兴的具有广泛应用前景的研究领域。

二、统计学与数据挖掘的联系

(一)数据挖掘虽不同于统计分析,但许多挖掘技术又来源于统计分析,数据挖掘中有许多工作可以由统计方法来完成。比如预言算法(回归)、抽样、基于经验的设计等。

(二)数据挖掘不是为了替代传统的统计分析技术,相反,数据挖掘是统计分析方法的扩展和延伸。大多数的统计分析技术都基于完善的数学理论和高超的技巧,其预测的准确程度还是令人满意的,但对于使用者的知识要求比较高。而随着计算机能力的不断发展,数据挖掘可以利用相对简单和固定程序完成同样的功能。

(三)数据挖掘技术的出现为统计学提供了一个崭新的应用领域,也对统计学的理论研究提出了挑战。数据挖掘技术有相当大的比重是由高等统计学中的多变量分析所支撑。

(四)统计学与数据挖掘的结合日益紧密。数学是传统意义上统计学方法的首要工具,而计算机和网络为代表的信息技术,正逐渐成为统计学应用的首要工具。随着数据源的不断膨胀和数据结构的日益复杂,单纯依靠数据挖掘技术,已渐露力不从心之态,而统计学的同步发展,正不断充实、完善着数据挖掘技术。因此,随着信息化水平的提高,统计学与数据挖掘的应用平台渐趋统一。

三、预测性挖掘中常用的统计学方法

数据挖掘中应用的统计学预测性方法主要有判别分析和回归分析。其中,判别分析用于对离散型目标变量的预测,而回归分析则主要用于对连续性目标变量的预测。

篇(7)

人际信任是个体将他人的言词、承诺以及口头或者书面的陈述认为可靠的一种概括化的期望。人际信任对大学生人际交往有一定的影响,比如大学生人际信任的高低,会影响大学生与同伴交谈,生活中的交际和交友,体现在与人接触的能力。良好的人际信任对大学生的成长有促进作用,对心理健康发展也有帮助。为了解大学生人际信任在职务、生源地和家庭类型上的差异现状,调查研究情况如下。

一、对象与方法

(1)对象。 随机抽取190名大学生进行调查, 获得有效样本190份,回收率100%。其中,职务:担任班级职务的大学生56人,没有担任班级职务的大学生134人;平均年龄21.04±1.40岁;生源地:来自城市的大学生29人,来自农村的大学生161人;家庭类型:属于独生子女家庭的有27人,非独生子女家庭的有170人。调查时间为2014年10月。

(2)方法。采用自行设计调查表,调查基本情况,包括职务、生源地和家庭类型。采用Rotter编制的人际信任(ITS)量表调查,并做相应访谈。

(3)统计学处理。采用SPSS16.0进行描述统计分析和独立样本t检验。

二、结果

(一)不同职务、生源地、家庭类型大学生人际信任差异比较(表1)

表1 不同职务、生源地、家庭类型大学生人际信任评分结果比较(x±s)

注:*代表p(双侧)< 0.05,**代表p(双侧)< 0.01,下同

表1所示,从职务自变量上看,大学生人际信任在特殊信任因子、普遍信任因子及人际信任总分上的得分,没有统计学意义上的差异(p>0.05)。从生源地自变量上看,大学生人际信任在普遍信任因子及人际信任总分上的得分,差异有统计学意义(p0.05)。从家庭类型自变量上看,大学生人际信任总分上的得分,差异有统计学意义(p0.05)。

三、讨论

(1)班级职务差异。研究发现,是否担任班级职务,大学生人际信任的特殊信任、普遍信任因子及信任总分,没有显著差异。通过访谈发现,原因是班干部和非班干部是同龄人,他们和父母、同伴的交流方式有90后的时代特点,渴望情亲和友情,但是相处中矛盾较多,等等的时代共同点和受教育环境的相似,故差异不显著。

(2)生源地差异。研究发现,来自城市的大学生,人际信任在普遍信任因子及人际信任总分显著高于来自农村的大学生。通过访谈发现,原因是城市大学生大都是独生子女,是每个公寓的唯一孩子,父辈和祖辈给予的爱和关注更多,成长环境更安逸,在与人相处中更容易信任陌生人,故城市大学生人际信任的总体得分也较高。

(3)家庭类型差异分析。研究发现,独生子女家庭的大学生,人际信任总分显著高于非独生子女家庭的大学生。访谈发现,独生子女大学生,父母给予他们的期望和爱较多,在成长过程中,指导和保护也较多,独生子女大学生他们的社会实践参与的较少,对人的评价也较多的往积极方面考虑,故他们的人际信任总得分较高。

四、建议

社会方面,社会大环境中,弘扬正气,法制健全,提高整体国民素质水平,社会的整体人际信任高,在这样的安全的环境下,大学生的人际信任会得到全面发展,特殊信任和普遍信任都会有所提高。学校方面,可以多让大学生参加集体活动,在理论教育的同时,让大学生有更多的参加生活实践的机会,增加独生子女和非独生子女的互动交流,让大学生与朋友家人和睦相处的同时,也能结交更多的新同学新朋友,为其步入社会的人际信任发展打下基础。家庭方面,家长首先认识到大学生已经是成年人,可以独立承担家庭一部分责任,并且有能力;其次,给大学生与人交流交往的机会和信任,家庭有重大决定可以和其商量,然后共同决定;最后,父母的交流互动模式是大学生人际信任发展的第一课堂,父母在生活中有良好的互动方式是有必要的。个人方面,大学生认识到自己已经长大成人,自己有主动与人交往交流的能力,能人际信任发展的能力,不仅能与家人和睦相处,在生活中也能和陌生人打交道。

篇(8)

1  资料与方法

1.1  诊断标准

1.1.1  西医诊断标准  (1)按中国抗癌协会编制的1999年版《新编常见恶性肿瘤诊治规范》[1]的诊断,利用胃镜或手术病理学明确诊断为胃癌。(2)胃癌分期标准依据1997年国际抗癌联盟UICC胃癌TNM分期标准。

1.1.2  中医辨证标准  依据胃癌辨证分型的文献资料统计的结果[2],参考国家技术监督局的《中华人民共和国国家标准·中医临床诊疗术语证候部分》GB/T16751.21997[3]、卫生部1997年制定的《中药新药临床研究指导原则》第三辑[4]、上海市卫生局统编的2003年第二版《上海市中医病证诊疗常规》[5]、中国中医研究院广安门医院主编的1989年版《中医诊疗常规》[6]以及1984年第五版《高等医药院校教材·中医诊断学》[7]中脏腑辨证内容,制定胃癌中医辨证标准。(1)脾虚:食少,腹胀,食后尤甚,或胃脘隐痛,喜温喜按,恶心欲呕,呕吐食物,大便溏薄或排便无力,或久泻,甚则五更泻,完谷不化,下肢浮肿,神疲乏力,舌淡胖或有齿痕,苔白,脉细弱或沉细。(2)肝胃不和:胃脘胀闷疼痛,窜及两胁,情绪抑郁,疼痛与情绪相关,嗳气、吞酸、呃逆,不欲食,舌淡红或红,苔薄白或薄黄,脉弦。(3)瘀阻胃络:胃脘刺痛或如刀割,痛有定处,痛处拒按,可及肿块质硬,吐血,便黑,口唇爪甲紫暗,面色黎黑,舌紫暗或见瘀斑瘀点,脉细涩或涩。(4)胃热阴虚:胃内灼热,胃脘嘈杂,食后脘痛,口干欲饮,饥不欲食,五心烦热,大便干结,舌红或红绛,少苔或光剥苔,脉细数。(5)痰湿凝滞:脘腹痞闷胀痛,恶心欲呕或呕吐痰涎,不欲食,或进食不畅,甚至反食夹有多量黏液,口淡不欲饮,头晕身重,便溏,面黄虚肿,舌淡苔白腻或白滑,脉滑或缓或细缓。(6)气血两虚:形体消瘦,全身乏力,声低气怯,头晕目眩,面色  白或萎黄,唇甲苍白,虚烦不寐,心悸气短,自汗盗汗,下肢浮肿,舌淡苔薄或少苔,脉沉细弱。

1.2  病例选择标准

1.2.1  纳入标准  (1)具有明确病理学诊断的胃癌患者。(2)具有较全面的诊疗记录。(3)同意参加本次调查。

1.2.2  排除标准  (1)多重癌患者。(2)病理诊断为胃恶性淋巴瘤、胃间质瘤和胃平滑肌肉瘤等胃部其他恶性肿瘤。(3)合并有心血管、脑血管、肝、肾和造血系统等严重原发性疾病。(4)孕妇、哺乳期妇女、儿童和精神病患者。

1.2.3  资料来源  2005年7月~2006年4月就诊于上海中医药大学龙华医院、曙光医院、普陀区中心医院的肿瘤科及上海市肿瘤医院中医科的门诊和住院的胃癌患者。

1.3  资料采集与辨证

1.3.1  调查内容及其作为变量的赋值情况  包括姓名、年龄、性别(男性1;女性2)、Karnofsky评分、病理类型(腺癌1;低分化腺癌2;黏液癌3)、临床分期(Ⅰ期1;Ⅱ期2;Ⅲ期3;Ⅳ期4)、手术方式(根治术1;非根治术2;未手术3)、化疗疗程(无0;<6个疗程1;≥6个疗程2)、患病时间(<1年1;1~3年2;>3年3)、远处转移(无1;有2)和复况(无1;有2)。

1.3.2  质量控制  由一位具有中医专业知识的高年资住院医师调查,由两位固定的具有中医专业临床经验的主治医师职称以上的医师依据1.1.2胃癌中医辨证标准进行统一辨证分型。

1.4  临床资料  依据上述标准共获得325例可进行相关统计、有明确病理学诊断的胃癌资料。其中男性197例,女性128例;年龄最小的26岁,最大的83岁,平均年龄(58.36±11.57)岁。其中脾虚型221例,占68%;肝胃不和型28例,占8.6%;瘀阻胃络型15例,占4.6%;胃热阴虚型18例,占5.6%;痰湿凝滞型28例,占8.6%;气血两虚型15例,占4.6%。

1.5  数据录入与统计学方法  采用Microsoft Excel软件进行数据管理,建立本课题相关数据库。通过SPSS 11.5统计软件包,进行统计分析。胃癌证型单因素分析:以胃癌各证型为应变量,年龄为自变量做方差分析。以胃癌证型(如脾虚组=1,非脾虚组=2)为应变量,以Karnofsky评分、临床分期、患病时间、手术方式和化疗疗程为自变量做秩和检验;以性别、病理类型、复发和转移为自变量做卡方检验。

2  结果

   

胃癌证型与年龄的方差分析,与Karnofsky评分、临床分期、手术方式、化疗疗程、患病时间的秩和检验以及与性别、病理类型、复发、转移的卡方检验见表1~3。

表1  胃癌证型与年龄的方差分析(略)

Table 1  Analysis of variance between syndromes and age

表2  胃癌证型与Karnofsky评分、临床分期、手术方式、化疗疗程和患病时间的秩和检验(略)

Table 2  Rank sum test between syndromes and KPS score, clinical stage, surgical mode, course of chemotherapy, suffering time

*Shows mean rank.

篇(9)

【关键词】创伤严重度指数

a preliminary study on factors of trauma outcomes in chinese patients

department of health statistics, school of preventive medicine, fourth military medical university, xian 710033, china

【abstract】 aim: to review some important factors affecting the outcomes of trauma patients and to screen variables for the predictive model of trauma outcomes so that a new trauma scaling model more applicable to chinese patients can be established. methods: the database of discharge abstracts of trauma patients from more than 200 hospitals nationwide was used and a logistic regression model was fitted with the outcomes of patients as response and other 9 factors as predictors, including the anatomic injury severity grade by iss value. a stepwise regression method was used to select the variables and their parameters were estimated. results: six factors, namely, anatomic injury severity grade, complication status, age group, identity, operation status and financial support status were selected into the logistic regression model (p<0.05). several interactive effects were also selected in the model (p<0.05). conclusion: the anatomic injury severity grade is the most important factor affecting the outcomes of trauma patients, followed by the complication status and age. the effects of other factors are not so obvious and should be further analyzed.

【keywords】 trauma severity indices; logistic models; international classification of diseases; abbreviated injury scale; injury severity score

【摘要】 目的: 考察影响创伤结局的重要因素,初步筛选创伤患者结局预测模型的构成变量,为建立新的适合中国患者的创伤严重度评分方法进行有关评分模型的初步探讨. 方法: 利用全国200余所医院的创伤患者病案首页数据,初选出包括iss评分所得严重度在内的9个相关的因素,将患者结局作为应变量拟合logistic回归模型. 逐步回归法筛选变量,并估计其影响作用的大小. 结果: 解剖严重程度、有无并发症、年龄组、身份、是否接受手术、费用类型等6个因素对患者结局的影响有统计学意义(p<0.05),被选入logistic回归模型. 另外,某些因素的交互效应也一并被选入logistic回归模型(p<0.05). 结论: 解剖严重度是影响创伤结局的最重要的因素,其次是有无并发症和年龄等因素. 其余因素是否作为创伤评分模型应考察的因素需作进一步的探讨.

0引言

创伤评分是目前创伤患者伤情评价的基本方法,在世界范围内广泛应用. 我国的创伤评分研究起步晚,目前尚未得到广泛推广和应用,其原因在于多数创伤评分方法操作复杂,应用条件苛刻,且大多数创伤评分模型是基于国外(欧美国家)患者的生理、解剖参数而确定,对于国内患者其适用性较差. 为建立一种适合国内创伤患者的简单易行的创伤评分方法,我室提出基于创伤病种icd9(国际疾病分类)6位数编码的创伤评分方法的构想,并且已经建立全部创伤病种icd9 6位数编码与ais(简明损伤定级)分值的对应关系表[1]. 通过iss评分方法对此对应关系的考察表明,此种通过icd9编码转换的方法所得的ais分值能够很好地体现单个创伤的解剖严重度,可以作为创伤评分的解剖学参数[2]. 我们进一步探讨了国内创伤患者结局的影响因素,为基于icd9 6位数编码的创伤评分方法筛选其他模型变量,并从统计学角度考察各种因素对创伤患者结局的影响程度.

1资料和方法

1.1数据来源全国范围内200余所大、中型医院1998年全年收治的创伤患者病案首页数据. 经数据清洗,排除治疗结果中“未治”、“其他”或为空白的记录,最终得符合研究要求的创伤患者记录共112 749条. 其中男性88 622人,女性24 087人. 按年龄将患者分为3个年龄组,其中0~15岁16 382人,16~54岁87 242人,≥55岁9 125人. 地方人员94 935人,军队人员17 814人. 自费患者81 170人,非自费(公费或医疗保险等)患者31 579人. 单发伤70 345例,多发伤42 404例. 接受手术治疗者54 176例,未接受手术者58 573例. 伴有创伤并发症者582例,无并发症者112 167例. 发生院内感染者1255例,未发生院内感染11 194例. 患者结局(出院时)中存活111 684人,死亡1065人.

1.2创伤评分方法(解剖评分)采用我室编制的icd9 6位数编码与ais分值对应表,以创伤患者的出院诊断icd9编码为基础,换算出每一个出院诊断所对应的创伤的ais分值. 以turner osler的改良iss法[3](即不考虑创伤所在的身体区域,仅以ais分值最高的3处创伤计算iss分值)计算每位患者的iss分值. 再按照iss分值将全部患者分为三个解剖严重程度分组,iss 1~12者为轻,13~19者为中,20~75者为重[4]. 经以上分组后,全部患者中,轻度创伤患者93 343例,中度创伤患者9507例,重度创伤患者9899例.

1.3数据处理方法以患者的结局(存活或死亡)为应变量,将性别、年龄组、身份(军队或地方人员)、费用类型、创伤类型(单发伤或多发伤)、是否接受手术、有无并发症、有无院内感染等因素与解剖严重程度分组一起作为自变量,拟合logistic回归模型,考察各因素对患者结局的影响. 通过逐步logistic回归分析,筛选有统计学意义的影响因素,并计算其对患者结局的作用大小. 为简化计算过程和方便分析结果的专业解释,此次分析仅考察各因素的主效应及其一阶交互效应,其余高阶交互效应假定为零.

2结果

2.1变量筛选结果经逐步logistic回归分析,解剖严重程度、有无并发症、年龄组、身份、是否接受手术、费用类型等6个因素对患者结局的影响有统计学意义(p<0.05),被选入logistic回归模型. 另外,解剖严重度与有无并发症、是否接受手术、费用类型等3个因素的交互效应以及是否手术与有无并发症的交互效应均有统计学意义(p<0.05),一并被选入logistic回归模型.

2.2模型拟合优度及各因素的效应大小使用以上筛选出的变量和交互效应对患者的结局重新拟合logistic回归模型,模型拟合度统计量、自变量及交互效应项对模型的意义见tab 1. 可见费用类型的主效应无统计学意义,但与解剖严重度的交互效应却有统计学意义.表1logistic模型拟合结果

各因素及交互效应项的参数估计值见tab 2. 其中各因素的水平值对应的具体含义见tab 3. 表2各因素及交互效应项的参数估计值(略)表3各因素的水平值对应的具体含义(略)

3讨论

根据以上参数估计值,即可给出创伤患者结局的logistic回归预测模型,各因素对患者结局的影响作用大小也可得以考察和比较. 从结果可以看出,解剖严重度分组是影响创伤结局的最重要的因素,解剖严重度越高,死亡概率越大. 其次是有无并发症和年龄因素,有并发症者死亡概率明显增加,年龄越大,死亡概率越大. 此三个因素应在创伤评分模型中作为主要的因素来考察. 身份因素对结局的影响表现为地方人员死亡概率高于军队人员,这可能与军队人员具有良好的基本医疗保障有关. 费用类型的作用与身份因素存在相似之处,自费患者死亡概率高于非自费患者. 其余因素对结局虽然存在一定的影响,但影响程度均较轻,是否作为创伤评分模型应考察的因素需作进一步的探讨. 各因素之间存在的交互效应,在建立新的创伤评分模型时也须加以重视,在进一步地考察确认之后,应通过适当的模型表达项使之得以充分体现.

以aisiss为基础的解剖严重度评分,是世界范围内广泛应用的创伤评分方法,虽然在对患者结局的预测与评价方面效果有不尽如人意的地方,但可作为改良的创伤评分方法的基础[5]. 有些因素,比如是否手术、是否院内感染等,均是在患者入院后才可收集的信息,不便作为评分模型的组成变量,仅能用作创伤患者结局的预测变量之一. 另外一些重要因素,如患者的血压、心率、呼吸、体温等生理指标,均是影响患者结局的重要因素[6],应当作为创伤评分模型的重要变量,其对患者结局的影响程度也需要进行类似的考察和分析. 由于病案首页数据在此类信息方面的缺失,此次无法一并进行分析,我们将在后续的研究中收集更为全面的数据,对各种有关的因素进行全面地分析.

此研究是建立基于icd9编码的创伤评分模型的一次初步探索,是对部分影响因素的初步考察与分析. 但由于数据信息量的限制,研究的结果尚不能作为创伤评分模型的最终参考依据. 后续的研究工作需要收集更全面的数据,考察更多的因素,从临床和统计学两个方面对各种影响因素的作用进行全面的考察与分析,以期为建立一个合理的创伤评分模型提供依据.

【参考文献】

[1] 薛富波,王玉琨,徐勇勇. 创伤国际疾病分类编码向ais分值转换规则的研究[j]. 中华创伤杂志,2003; 19(7): 385-388.

xue fb, wang yk, xu yy. converting rules from international classification of disease codes of trauma to abbreviated injury scale values [j]. chin j trauma, 2003; 19(7): 385-388.

[2] 王玉琨,薛富波,徐勇勇,等. 基于icd9编码的iss创伤评分方法研究[j]. 创伤外科杂志,2004; 6(1): 28-30.

wang yk, xue fb, xu yy, et al. exploration of a newly developed trauma severity scaling method of iss based on icd9 codes [j]. j traumatic surg, 2004; 6(1):28-30.

[3] osler t, baker sp, long w, et al. a modification of the injury severity score that both improves accuracy and simplifies scoring [j]. j trauma, 1997; 43: 922-925.

[4] mackenzie ej, steinwachs dm, shankar b. classifying trauma severity based on hospital discharge diagnoses. validation of an icd9cm to ais85 conversion table [j]. med care, 1989; 27(4): 412-422.

[5] 杨柳青,任秀清,杨宁,等. 改良创伤评分(rts)与创伤严重度评分(iss)在创伤评估中的应用[j]. 川北医学院学报,1998; 13(2): 20-22.

yang lq, ren xq, yang n, et al. applications of revised trauma score and injury severity score in trauma evaluations [j]. j north sichuan med coll, 1998; 13(2): 20-22.

篇(10)

【中图分类号】 R 641 G 478.2 【文献标识码】 A 【文章编号】 1000-9817(2008)09-0782-03

伤害严重威胁着人类的生命和健康,近年来已成为主要的公共卫生问题之一,并已被列为单独的一类疾病[1]。我国每年约有70万人死于伤害,伤害已成为中小学生的首位死因[2],给人们的身心健康和国家的经济造成了极大负担[3]。随着社会经济的发展和教育体制的改革,寄宿制学校越来越多[4]。通过调查研究,人们逐渐认识到寄宿生特有的生活方式,使他们在心理、体质等很多问题上与普通学校的学生存在差异[5-7],对这一群体的管理和教育方式也应有所侧重。为进一步了解安徽省农村寄宿制学校学生的伤害发生情况,笔者于2007年12月到2008年5月对安徽省5个县农村寄宿制学校的部分学生进行了问卷调查。

1 对象与方法

1.1 对象 采取分层整群抽样法,在安徽省抽取长丰、绩溪、全椒、濉溪和岳西5个县作为调查点,每个县抽取寄宿制学校5所,共计25所。每所学校从符合条件的年级抽取1~3个班,对其所有学生进行调查。共发出调查问卷5 624份,回收并审核后的有效调查问卷5 556份,问卷合格率达98.79%。学生年龄范围9~21岁,平均年龄为(14.97±2.07)岁;其中长丰县958人(17.2%),绩溪县1 008人(18.1%),全椒县1 019人(18.3%),濉溪县1 722人(31.0%),岳西县849人(15.3%);男生3 241名(58.3%),女生2 315名(41.7%);住校生2 607人(46.9%),住家学生2 133人(38.4%),住亲戚朋友家334人(6.0%),租房住者482人(8.7%);小学生721名(五年级377名,六年级344名),初中生3 201名(初一1 011名,初二1 288名,初三902名),高中生1 634名(高一528名,高二490名,高三616名)。

1.2 调查变量与方法

1.2.1 社会人口统计变量 包括性别、独生子女情况、学习阶段(小学、初中和高中)、体型(很瘦、偏瘦、中等、偏胖和很胖)、地区(长丰县、绩溪县、全椒县、濉溪县和岳西县)、住宿类型(住校、住亲朋家、租房住和住家)、自评家庭经济状况(下等、中下、中等、中上等和上等)和父、母文化程度(无父/母、未上或小学未毕业、小学毕业、初中、高中、中专大专及以上)等。

1.2.2 伤害发生情况 问卷中列出10种常见伤害类型,要求学生填写自己在最近1 a的发生情况。调查员到各学校以班级为单位进行现场调查,学生集中填写问卷并当场收回。伤害发生率=(1 a中至少发生过1次伤害的人数/调查总人数)×100%。

1.2.3 伤害的分类及判断标准 参考ICD-10损伤、中毒外因分类,将伤害分为扭伤、跌伤或坠落伤、烧伤或烫伤、溺水、交通事故、刀(或锐器)割伤或刺伤、动物咬伤、中毒、爆炸伤、电击伤和窒息等共10种。凡有以下情况之一者判定为伤害:(1)到校医室或医院处理过;(2)由教师或家长做过紧急处理;(3)因伤缺课0.5 d以上。

1.3 统计方法 用EpiData 3.0建立数据库,SPSS 13.0进行统计分析。用描述性统计分析方法分析一般情况,χ2检验用于分析学生的伤害发生率有无差异。分别以住校和住家2种住宿类型学生总的伤害发生情况为因变量,对单因素Logistic回归分析有统计学意义的因素进行多因素Logistic回归,探讨这2种住宿类型学生伤害发生的主要危险因素。

2 结果

2.1 农村寄宿制学校学生伤害发生情况 被调查者在过去1 a内至少发生1次伤害者2 891人,伤害发生率为52.0%。各类伤害累计发生次数为9 582次,伤害者平均伤害发生频率为1.72次/人。由表1可见,住校、住亲朋家、租房住和住家这4种住宿类型的学生伤害总体发生率差异有统计学意义(χ2=8.44,P<0.05),不同住宿类型学生在交通事故和动物咬伤这2种类型伤害发生率间的差异均有统计学意义。经两两比较可知:住家学生伤害总发生率和交通事故发生率均高于住校生,OR值分别为1.18和1.80,P值均<0.05;住家学生交通事故发生率亦高于住亲戚朋友家的学生(OR=2.63,P<0.05);住家学生动物咬伤发生率高于其他3种住宿类型学生,OR值分别为1.37,2.16和1.53, P值均<0.05。

2.2 农村寄宿制学校学生伤害的分布特征

2.2.1 不同性别学生伤害发生情况 由表2可见,男生伤害总发生率为56.7%,女生为45.5%,差异有统计学意义(χ2=67.28,P<0.01)。在不同类型的伤害发生率上的性别差异均有统计学意义。

2.2.2 不同学习阶段学生伤害发生情况 由表3可见,伤害总发生率在不同学习阶段之间的差异有统计学意义(χ2=66.15,P<0.01),其中初中生伤害发生率(55.9%)和小学生伤害发生率(54.1%)均高于高中生(43.6%)。具体类型中,扭伤、跌伤或坠落伤、烧伤或烫伤、刀(锐器)割伤或刺伤的发生率以初中生最高,而溺水、交通事故和动物咬伤的发生率以小学生最高。

2.2.3 不同地区学生伤害发生情况 由表4可见,不同地区学生伤害总体发生率差异有统计学意义(χ2=95.07,P<0.01)。多种伤害类型发生率的地区间差异均有统计学意义。

2.3 不同住宿类型学生伤害危险因素分析 由表5可见,按α=0.05的标准选取,进入住校生和住家生伤害回归模型的变量相同,分别是地区、学习阶段和性别;将各变量进行赋值,地区(岳西县为对照)、学习阶段(高中为对照)和性别(赋值为男1女2),经多因素非条件Logistic分析(Forward:LR法,纳入、剔除标准分别取0.05和0.10)可知,影响住校生伤害发生率的因素有地区(绩溪县和长丰县高于岳西县)、学习阶段(初中生高于高中生)和性别(男生高于女生),而影响住家学生伤害发生率的因素有性别(男生高于女生)、学龄阶段(初中生高于小学生和高中生)和地区(长丰县高于岳西县)。

3 讨论

许多研究显示,青少年是伤害的高发人群[8-9]。我国中小学生每年发生伤害达4 250万人次,因伤害缺课达2.38亿天,不仅对学生本身的身心健康和学业造成了不良影响,给家庭和社会带来的负担亦是巨大的。调查结果显示,安徽省农村寄宿制学校学生在过去1 a里总的伤害发生率为52.0%,伤害者平均伤害发生频率为1.72次,这一结果高于胡佳等[10]的报道,低于阳本华等[11]的报道结果,可能与所调查的伤害类型和资料来源不同有关,也有可能与调查对象地域差异有关。

本次调查的学校是寄宿制学校,被调查的学生以住校和住家2种居多。调查结果显示,4种住宿类型的伤害发生率存在明显差异,其中住校生的烧烫伤和交通事故发生率均明显低于非住校生,这可能与住校生接触这2类危险的机会较少有关。有关资料显示,交通伤害已成为中小学生伤亡最主要原因之一[12]。因此,对于非住校生,应加强他们的交通安全意识,教育他们养成遵守交通规则的好习惯,以减少交通事故的发生率。虽然减少伤害相关行为的发生是降低伤害发生率的有效手段,但随着年龄增长,从事家务劳动是一个必然趋势,学生在使用煤气、电器的同时,需注意避免烧烫伤、电击伤、中毒等伤害的发生,这就需要教师和家长积极引导和提醒以去除伤害的隐患。另外,地区也是影响伤害发生的一个主要因素,这与他们的地理位置、气候特征以及生活习惯等差异有关,不同地区的有关部门应当根据自身特点制定伤害防范和管理措施。

伤害的发生与性别因素有关,与刘慧慧等[13]多数报道结果一致。调查中女生的伤害发生率大都低于男生,这可能与她们独有的性格、运动强度小、活动范围小有关,并且在日常生活中,社会各方面对男女生的保护和教育方式也不相同,今后应加以注意,降低男生伤害的发生率;伤害的发生在不同的学习阶段之间存在差异。初中生伤害的总体发生率高于小学生和高中生,且跌伤、烧烫伤、刀割伤的发生率也最高,可能与这个年龄段的孩子活动的机会多、强度大,喜欢新鲜和刺激的游戏有关;而小学生溺水、交通事故和动物咬伤的发生率最高,尤其是住校的小学生,是住校生中伤害发生的高危人群,自理能力较弱,心理尚处于未完全成熟阶段,应加强教育以促进他们尽快摆脱幼稚,并做好防范与管理工作;尽管高中生可能由于学业的压力使其伤害发生率最低,但仍然不能放松警惕,缓解压力,促进他们身心健康是必不可少的。此次调查发现,有8.7%的学生在外租房住宿,他们的安全系数大幅度降低,对于这部份学生的身心健康的关注和安全管理也不容忽视。

伤害预防要根据不同的年龄和群体制定有效的安全措施[14]。通过开展各种教育活动提高学生的自理能力、自我保护意识和自我救治技能,以减少伤害的发生和避免不良结局的产生。除此之外,学生的安全问题仅靠学校单方面的努力是不够的,家庭的配合和社会的关注必不可少[15]。只有社会各界共同行动,才能有效减少和预防学生意外伤害的发生。

(致谢:本课题得到安徽省学校体育卫生协会的大力支持,特此感谢!)

4 参考文献

[1] 王春灵,王云霞.766例儿童意外伤害原因分析及预防.华北煤炭医学院学报,2008,10(1):91-92.

[2] 季成叶,陶芳标.儿童青少年非故意伤害预防.中国公共卫生,2005,21(9):1 150-1 152.

[3] 王声.我国伤害流行病学研究亟需开展.中华流行病学杂志,1997,18(3):131-133.

[4] 李士凯.寄宿学生的疾病预防与管理.现代预防医学,2005,32(2):156.

[5] 刘朝军,田素英,寻广磊,等.寄宿制和非寄宿制学校高中生心理健康状况比较.中国临床康复,2004,8(27):5 782-5 784.

[6] 蔡亮亮.寄宿小学生610名健康状况调查.中国学校卫生,2003,24(6):640.

[7] 赵红深,陈雄新,李健芝,等.不同住宿方式学生体质状况比较分析.中国学校卫生,2008,29(4):366-367.

[8] 吴晓红,陈建华,杨楚春,等.黄石市小学生伤害流行病学调查.疾病控制杂志,2004,12(8):519-522.

[9] MACKENZIE SG, PLESS IB. CHIRPP: Canada's principal injury surveillance program. Inj Prev, 1999,5(3):208-213.

[10]胡佳,刘莉,毛军,等.上海浦东新区2003学年中小学生伤害发生情况.中国学校卫生,2005,26(11):976-977.

[11]阳本华,李军,肖和平,等.郴州市中小学生伤害流行病学调查分析.现代预防医学,2001,28(2):152-154.

[12]王声.校园安全与中小学生伤害现况.中国学校卫生,2006,27(2):96-98.

[13]刘慧慧,郝加虎,张国庆,等.宿州市农村中小学生伤害影响因素分析.中国学校卫生,2005,26(6):464-465.

上一篇: 电气工程的重要性 下一篇: 保险公司风险管理研究
相关精选
相关期刊