文档介绍:临床科研中数据分析的常见注意事项
毛广运
生物统计中心
提纲
数据处理的一般原则与基本内容
统计方法选择的基本思路
具体案例分析
几种比较实用的方法
附录:常用数据分析的SAS程序
第一部分
数据处理的一般原则与基本内容
数据处理
数据处理
定义:
对数据的采集、存储、检索、加工、变换和传输。
基本目的:
从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。
组成
数据管理(约占全部工作量的60%-80%)
数据分析(约占全部工作量的20%-40%)
缺失数据的处理
缺失值
部分研究指标记录不完整,导致其值缺失
后果:导致研究效率的下降
数据的常见缺失机制
完全随机缺失:缺失资料与完整资料的特征无显著性差异
非随机缺失:缺失资料与完整资料的特征存在显著性差异
常见处理措施
直接剔除:适用于缺失量极少且为完全随机缺失
单独列为一类:适用于缺失量较大,且难以合理填补者
缺失值填补:
均数替代
中位数替代
最后观察值结转
回归算法
多重填补法
统计方法前提条件的检查与描述
统计学最难以掌握之处
数据分析人员最应该首先掌握的技能
熟悉各种统计方法的前提适用条件
合理选择最合适的统计方法
第二部分
统计方法选择的基本思路
统计方法选择的核心要素
研究目的
组间差异
显著性检验?优效性检验?等效性检验?非劣效性检验?
相互关系
相关与回归、关联性分析(OR、RR、AR)、其它
设计类型
完全随机设计? 配对设计? 随机区组设计?
交叉设计? 析因设计? 其它设计?
数据类型
计量资料?分类资料?等级资料?
分布特征
正态分布?对数正态分布?其它偏态分布?