医学统计学必备知识点分享,常笑医学为医学生答疑解惑|医学生|医学|科研

　　医学统计学作为医学生必修的一门课程,贯穿了医学生的整个职业生涯,在论文撰写、科研课题设计、医学研究职业发展等方面有着不可替代的重要性。

　　但是医学统计的学习门槛很高,大学开设的课程往往只侧重于理论,而没有结合实际工作,导致大部分医学生对于医学统计似懂非懂。

　　特别对于本科生来说,他们没有太大的科研需求,往往都是在毕业季论文设计时才意识到这门课程的重要性,而这时可能之前学过的课本知识都已经还给老师了。

　　常笑医学就医学统计学的常见问题,给医学生们分享一些经验。

　　学习医学统计必须掌握的知识点

　　1.医学生常用的统计软件有哪些?

　　目前供科研使用的统计软件非常多,医学生最常用的医学统计分析软件主要有:SPSS、SAS、R、STATA、MedCalc、Minitab、MATLAB和Python,以及中国人自己开发的主要以药理学计算软件DAS,最后还有专门做meta分析的Review软件。

　　建议医学生可以根据不同研究选择合适自己的软件:

　　①如果自己只想做个简单的基础统计又不想编程就用SPSS软件;

　　②想学一点点编程还又能交互操作的推荐用STATA软件;

　　③想开发一个模型又不想学太多就用R软件里面的各种包;

　　④想着以后相同工作可能重复进行就用SAS;

　　⑤想进行META分析采用Review软件;

　　⑥想做诊断统计学常采用MedCalc软件;

　　⑦如果研究课题偏工程算法类推荐MATLAB软件。

　　2.对于医学统计结果的描述你做对了吗?

　　医学生在进行医学科研时,获取数据后,光看数据库是得不到有价值的信息的!要想了解数据的总体情况或是想得到数据的论证,这时就需要选择恰当的描述方式对每一个要统计分析的变量的分布特征进行统计描述,这也是决定选用何种统计分析方法的基础。

　　医学生在撰写科研论文时对统计描述常套用方法:对计量资料采用均值±标准差来描述数据的集中趋势和离散情况。其实应该首先对数据资料的分布特点进行正态性检验与判断,因为如果不满足正态性,应该用中位数(四分位间距)来描述,对计数资料采用例数(%)百分比表示。

　　事实上,应根据研究设计类型、统计分析目的和数据特征选择恰当的描述方法。如在需要校正某些因素时我们常采用协方差分析,其结果应该采用校正后的均值进行表示。

　　3.什么是标准差?什么是标准误?

　　医学小白在做统计分析过程中,经常会碰到标准差和标准误这两个有区别也有联系的统计量。特别是当它们一起出现的时候,很多人搞不清楚它们之间的差别和连续,经常性地进行一些错误的使用。

　　标准差(Standard Deviation, SD):是离均差平方的算术平均数(即:方差)的算术平方根,反映一个数据集的离散/变异程度。

　　标准误(Standard Error,SE):样本平均数抽样分布的标准差,是描述对应的样本平均数抽样分布的离散程度及衡量对应样本平均数抽样误差大小的尺度。

　　就和中山大学方积乾教授说的一样:他们不是”兄弟“而是“父子”,标准误可以看成是“标准差的标准差”。

　　4.基线分析的主要目的是什么?

　　医学生在进行临床研究,特别是RCT研究时,一般都会先对基线进行统计分析。基线就是研究的总体,在尚未干预情况下的基础数据特征,如常见的年龄、性别、病程等资料。

　　我们进行基线分析的主要目的有:

　　①对目标人群的基本特征信息的描述,了解入选的研究对象是否代表了目标人群。

　　②对基线数据的统计分析可判断其在各处理组间是否均衡可比。如果该基线变量在处理组间是平衡的,则处理组间差别的效应估计是无偏的;若不平衡,则效应估计是有偏的,此时应将其作为协变量进行统计分析,以校正协变量的引起的偏性。

　　③可作为干预后主要观察指标的参照值,以便观察其变化情况。

　　5.统计结果得到P大于0.05,怎么办?

　　通常情况下,临床研究的结果主要是根据P值的大小来判断该研究因素是否有意义。

　　当得知P>0.05时,不用慌张,因为有可能研究对象之间是真实存在差异,只不过是您的样本量不够导致检验效能不足才没有发现它们间真实差异。此时可根据结果反推,计算本次研究的检验效能(1-β),如果它们间确有差异的,本次能够发现差异的检验效能为100%,结论无可厚非!如果发现检验效能较小(如<0.5),这很有可能是样本量不足导致p>0.05,此时可加大样本量为后面的进一步研究提供基础。

　　6.置信区间与P值的关系是什么?

　　医学生在投稿时经常会碰到编辑老师要求除了P值外,还要提供置信区间(特别是SCI),让很多同学都一脸懵!

　　特别是对于非统计专业人士来说,通常大家都只关注P值,很少去认真对待置信区间。而P值只是告诉我们一个概率,即当零假设成立时,出现当前结果(或者更极端结果)的概率,是一个粗暴、武断的结论,它只回答了"到底有没有差别"这个问题。

　　而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。我们所进行的统计推断就是利用样本去估计总体,但估计毕竟不是真实数值,所以我们需要给出一个误差范围来描述这个估计的准确程度。而置信区间不仅可以做出统计结论,还可以提示与零假设的参数偏离有多远,可以提供给我们一些更有实际价值的信息。当P<0.05 ,置信区间可帮助判定项目结论的可靠性。

　　对话医学统计助力医学生成长

　　常笑医学网作为一家致力于为广大医学工作者提供医学学术交流、科研辅助及在线医技提升等多种专业服务的平台,开设了专业的医学统计版块,精选各类统计方法的知识点和小技巧,以及解决问题的具体方法,替大家节省了学习时间、提高了学习效率,并且能帮助您学以致用。