评论文章
对研究过程、数据收集和分析的回顾
苏利耶Raj Niraula *
尼泊尔达兰B.P. Koirala卫生科学研究所公共卫生和社区医学院教授(生物统计学)
*通信地址:Surya Raj Niraula博士,博士后(美国),博士(NPL),教授(生物统计学),公共卫生和社区医学院,B.P. Koirala卫生科学研究所,尼泊尔,Dharan, Tel: +977 9842035218;电子邮件:surya.niraula@bpkihs.edu
日期:提交:2018年12月10日;批准:2019年1月10日;发表:2019年1月11日
如何引用这篇文章:研究过程、数据收集和分析综述。Insights Biol Med. 2019;3: 001 - 006。DOI:10.29328 / journal.ibm.1001014
版权:©2019 Niraula SR.这是一篇根据创作共用署名许必威体育西汉姆联可协议发布的开放获取的文章,该协议允许在任何媒体上无限制地使用、传播和复制,前提是原始作品被正确引用。
出身背景
研究是寻找知识的过程。它是系统地搜索特定感兴趣主题的相关信息。它是一种仔细的调查或调查,特别是通过在任何知识分支中寻找新的事实[1]。这是一种科学的方法来获得研究问题的答案和检验假设。这个研究问题是基于人口中某些事物的不确定性。这可以通过从索引和非索引期刊、书籍、互联网和不同的未发表研究工作中搜索不同的文献来表述。一个好的研究问题应该遵循更精细的标准,即可行、有趣、新颖、道德和相关[2]。betway必威官网手机版必威投注界面
完整的研究是从定义研究问题到撰写报告的整个设计(图1)。研究问题是根据众所周知的概念和理论或以往的研究成果确定的。用假设来表示假设。调查的过程是通过访谈、观察或记录数据来完成的,收集的数据被分析并解释。基本上有两种数据收集方法,定量和定性。定量方法将人类现象看作是专注于客观研究的,即能够被测量的。它植根于实证主义。定量研究方法包括结构化问卷、访谈和观察等数据收集方法以及其他工具。这种方法有助于研究人员量化信息。
另一方面,深度访谈和非结构化观察与定性研究相关。通过定性研究的方法来理解和探索社会污名化和隐藏的问题。事实上,定量研究的目的是测量客观预定的概念或变量,并检验它们之间的数字和统计关系。研究人员必须选择合适的方法来回答他们的问题。
数据从何而来?
基本上有两个数据来源,一级和二级。二级数据通常从国家的不同部门(如卫生、教育、人口)获得,也可能从不同的医院、诊所和学校的记录中收集,可用于我们自己的研究。次级来源可以是私人和基础数据库、市和县政府、政府计划的监视数据和联邦机构统计-普查、NIH等。使用次级数据可以节省我们的调查成本、时间,并且如果政府机构收集了信息,则可能是准确的。然而,它有一些局限性。我们要分析的辅助数据可能已过时。收集时间可能不够长,无法检测趋势,例如,在医院登记的2个月内的生物体模式。一个主要的限制是我们应该根据数据集中变量的可用性来制定研究目标。另一方面,某些观测可能缺少信息。除非捕获并纠正此类缺失信息,否则分析将有偏差。可能存在许多偏差,如样本选择偏差、源选择偏差、退出等。
如果我们看看主要数据源,它比次要数据源有更多的优势。数据可以通过问卷调查、焦点小组、问卷调查、个人访谈、实验和观察研究等方式收集。如果我们有时间设计收集工具,选择我们的人口或样本,预试/驾驶仪器工作的偏见来源,管理工具,和收集/条目的数据,使用数据收集的主要来源,研究人员可能会减少抽样偏差,和其他混杂的偏见。
分析
分析是研究的重要组成部分。数据的分析取决于变量的类型及其性质。数据分析的第一件事是描述变量的特征。具体分析如下:
总结数据:数据是一个或多个变量的值的集合。变量是样本的特征,对不同的对象有不同的值。值可以是数字、计数和类别。连续变量的数值是指那些具有数字意义的数值,测量单位,也可以是分数,如身高、体重、血压、月收入等。另一种类型的变量是离散变量,它是基于计数过程的,如不同班级的学生人数,每天去门诊的病人数量等。
如果变量是数值的,可以通过绘制直方图、蒸汽和叶子图、胡须盒图和正态图来探索它们,以可视化这些值符合正态分布的程度。当变量是分类的时候,它们可以通过饼图或柱状图或仅仅是频率和百分比来可视化。
统计数据是一组值的总和。简单或单变量统计总结了一个变量的值。效果或结果统计总结了两个或多个变量值之间的关系。数值变量的简单统计是
a)平均数:平均水平
b)标准差:典型变异
c)均值标准误差:重复抽样均值的典型变异数除以(样本量)的根。
在正态分布数据中,均值和标准差是最常用的集中趋势和离散度的度量(表1,2)。中位数(中间值或第50百分位数)和四分位数(第25和75百分位数)用于严重非正态分布数据。
常见的统计检验
表1描述了如何针对不同的目的应用不同的测试。分类变量的简单统计是频率、比例或优势比。从Y(依赖)与X(预测器)的统计模型(方程)推导出的效应大小取决于Y和X的类型。
表1:基于变量类型的测试统计。 | |||
Y(响应) | X(预测) | 模型/测试 | 效应统计 |
数字 | 数字 | 回归 | 斜率、截距、相关性 |
数字 | 分类 | t检验、方差分析 | 平均差 |
分类 | 分类 | 卡方,Fisher精确 | 频差或频比 |
分类 | 数字 | 分类 | 频率比 |
a)如果模型是数值与数值的对比,例如收缩压和胆固醇;具有相关系数的线性回归可以用来寻找变量之间的关系,其中效应统计给出了方程直线的斜率和截距,称为参数。相关系数用模型中解释的方差来解释。这提供了适合度的衡量标准。其他统计数据的典型误差或标准误差的估计提供了残差和有效性的基础测量(标准变量在Y轴上)。
b)但如果模型是数字的而不是分类的,例如,医学检查的分数与性别,该模型将对两组进行t检验,对两组以上进行单因素方差分析(表2)。效果统计将是平均值之间的差异,表示为行差、百分比差、或均方根误差的分数也就是两组的平均标准差。表2显示了学习成绩的方差分析结果。
表2:1994年至1996年期间,MBBS学生在不同级别的学习成绩。 | |||||||||
批次(n) | 的意思是±SD | ||||||||
slc | 国际空间站 | ee | MBBSI | MBBSII | 黑带大师三世 | MBBSIV | 黑带大师V | 黑带大师 总计 |
|
1994 (29) | 74.2±6.3 | 71.9±7.8 | 71.3±2.5 | 67.8±5.2 | 71.0±5.1 | 73.3±5.9 | 69.5±4.3 | 65.8±3.0 | 69.5±4.2 |
1995 (29) | 75.2±5.1 | 69.9±8.7 | 52.1±4.0 | 67.3±5.4 | 68.0±4.0 | 65.3±3.5 | 65.3±3.5 | 62.3±17.6 | 65.6±5.6 |
1996 (28) | 76.4±5.3 | 71.2±8.4 | 54.4±4.2 | 69.3±5.1 | 73.2±4.6 | 64.3±3.0 | 65.7±3.2 | 66.5±3.2 | 67.8±3.4 |
F值 | 1.1 | 0.4 | 241.2 | 1.1 | 9.2 | 42.7 | 11.1 | 1.3 | 5.2 |
P值 | NS | NS | < 0.0001 | NS | < 0.0001 | < 0.0001 | < 0.0001 | NS | < 0.01 |
资料来源:Niraula等人,2006[6]。 |
c)如果模型是数值的还是分类的(在不同的时间间隔内重复测量),例如。每个月,模型将进行配对t检验(2个月)和重复测量方差分析,其中一个因素(>2个月),其中效果统计将用行变化、百分比变化或预标准差的分数表示均值变化。
d)如果模型是分类相对于分类,例如吸烟习惯相对于性别,则模型检验将卡方检验或Fisher精确检验,其中效应统计提供相对频率,表示为频率差异、频率比率(相对风险)或优势比。相对风险适用于横断面或前瞻性设计。这是一个群体相对于另一个群体有患某种疾病的风险。优势比适用于病例对照设计,是2X2列联表的交叉乘积。
e)如果模型是名义类别,而>= 2数字,例如心脏病与年龄、性别和定期锻炼,则模型检验将是分类建模,其中效果统计将是相对风险或优势比。这可以使用逻辑回归或广义线性建模进行分析。复杂模型最容易简化为t检验、回归或相对频率。
f)如果模型是控制试验(数字对2个名义类别),例如,强度对试验对组,模型将对变化分数进行非配对t检验(2个试验,2组)或重复测量方差分析与受试者内部和之间的因素(>2试验或组),其中效果统计将主要表达为原始差异,百分比差异,或前标准偏差[5]的分数的变化的差异。
g)如果模型是额外的预测变量,以“控制某事”(数值与>= 2数值)可以使用多元线性回归或协方差分析(ANCOVA)。另一个使用线性回归分析找到MBBS性能的显著预测因子的例子如表3所示。
表3:用于预测MBBS性能的逐步线性回归。 | ||||||
系数 | 共线性统计 | |||||
模型 | 非标准化系数 | 标准化 系数 |
P值 | 宽容 | VIF | |
B | 东南方 | 贝塔 | ||||
(常量) | 57.34 | 4.32 | 0.00 | |||
科学成绩中级 | 0.145 | 0.06 | 0.253 | <0.02 | 1 | 1 |
R2 = 0.064,调整后的R2 = 0.053;F(1,84)=5.77, P<0.02来源:Niraula等,2006[6]。 |
h)如果我们想找出两个数值变量之间的关联程度,我们可以通过相关系数来检验,其值可能从-1到+1。系数为正表示正关联,系数为负表示负关联。另一个使用相关矩阵来显示不同类别中两个分数之间的关联的例子(表4)。
表4:MBBS学生学业成绩的相关矩阵。 | ||||||||
slc | 国际空间站 | ee | MBBSI | MBBSII | MBBSIII | MBBSIV | 黑带大师V | |
国际空间站 | 0.290*3 | |||||||
ee | -0.079 | 0.076 | ||||||
MBBSI | 0.177 | 0.247 * 2 | -0.094 | |||||
MBBSII | 0.167 | 0.208 | 0.025 | 0.770 * 4 | ||||
MBBSIII | 0.075 | 0.245 * 2 | 0.647*5 | 0.299 * 3 | 0.442 * 5 | |||
MBBSIV | 0.151 | 0.197 | 0.362 * 4 | 0.632 * 5 | 0.712 * 5 | 0.755 * 5 | ||
黑带大师V | 0.059 | 0.114 | -0.055 | 0.544 * 5 | 0.404*5 | 0.224 * 1 | 0.512 * 5 | 分数 |
MBBSS | 0.145 | 0.242 * 2 | 0.179 | 0.806*5 | 0.789 * 5 | 0.631 * 5 | 0.872 * 5 | 0.7931 * 5 |
资料来源:Niraula等人,2006[6] |
从样本推广到总体
我们研究一个样本来估计总体参数。样本统计量的值只是真实值(总体)的估计值,而真实值是用95%置信限的精度或不确定性表示的。置信限表示真值的可能范围。有5%的可能性真值超出95%置信区间,也称为显著性水平:I型错误率[7,8]。
统计显著性是一种老式的泛化方法,基于测试真值是否为零或为零。
−null假设:真值为零(null)。
−如果我们观察到某个极值区域的值下降,而该极值区域只会在5%的时间内发生,则我们拒绝零假设。
−即确定真值不可能为零;我们可以说,结果在5%的水平上是显著的。
− 如果观察到的值不在5%的不可能区域内,大多数人会错误地接受零假设:他们得出结论,真实值为零或零!
−p值帮助我们判断结果是否落在不太可能的区域。
如果p<0.05,我们的结果是在不太可能的区域。
p值的一个含义是:当真值为零时,更极端的观测值(正或负)的概率。p值的更好含义是:如果我们观察到一个正的效果,1 - p/2是真值为正的概率,p/2是真值为负的概率。例如:如果我们观察到性能提高了1.5% (p=0.08)。因此,真正的效果是任何“增强”的几率为96%,真正的效果是任何“损害”的几率为4%。这种解释没有考虑到微小的增强和损害。因此,如果我们必须尽可能使用p值,则显示准确的值,而不是p<0.05或p>0.05。元分析师还需要确切的p值(或置信限)。
如果真值为零,则有5%的几率获得统计显著性:I型错误率,或误报率或误报率。还有一种可能性是,最小的有价值的真值将产生一个不具有统计意义的观察值:II型错误率,或误报率或失败报警率。II型误差与研究中样本的大小有关。在老式的研究设计方法中,我们应该有足够的受试者使II型错误率达到20%:也就是说,我们的研究应该有80%的能力来检测最小的有价值的影响。如果我们在一项研究中观察到很多影响,那么至少其中一个影响是错误的可能性就会增加。老式的统计学家喜欢在方差分析中控制I型错误率的膨胀,以确保增加的概率保持在5%。这种做法是错误的。
总结
综上所述,研究过程从定义研究问题开始,然后回顾文献,提出假设,收集数据,分析,解释,最后撰写报告。在数据收集中有可能出现许多偏差。重要的是,研究数据的分析应该非常谨慎。如果研究人员使用统计学检验的显著性,他/她应该显示准确的p值。相反,表现出信心限度也更好。均值的标准误差仅在估计总体参数时显示。通常需要给出被试之间的标准差来表示被试之间的差异。在人口研究中,这个标准偏差有助于传达平均值的差异或变化的大小。在干预中,还要显示受试者内的标准偏差(典型误差),以传达测量的精度。标准偏差有助于传达平均性能的差异或变化的大小。
卡方检验和fisher精确检验用于分类变量(类别与类别)。用相关系数检验两个数值变量。对于模型数值与两类变量,t检验适用于正常数据,方差分析应用于模型数值与>=2类变量。多元回归模型用于找出所有可能预测因子(>=2)对数值响应变量的调整效应。
参考文献
- 《现代英语高级学习者词典》。牛津大学。1952;1069.Ref。https://goo.gl/K7pKvD
- Farrugia P, Petrisor BA, Farrokhyar F, Bhandari M.外科研究的实用技巧:研究问题、假设和目标。J Can Surg. 2010;53: 278 - 281。Ref。https://goo.gl/Rf6DED
- 医学研究中批判性分析的常用统计工具综述。JNMA。2003;42:113 - 119。
- Reddy M V.组织和收集数据。精神卫生保健研究统计。2002; 第1版:13-23。
- Lindman人力资源。实验设计中的方差分析。纽约:斯普林格出版社,1992年出版。Ref。https://goo.gl/jXeec5
- 医学生成绩的批判性分析。卫生教育,2006年;第5 - 13 19:。Ref。https://goo.gl/5dFKUK
- 抽样技术、置信区间与样本大小。印度Natl医学杂志,2000;13: 29-36。Ref。https://goo.gl/1nbNpQ
- 临床试验结果报告的置信区间。Ann Int Med. 1986;105: 429 - 435。Ref。https://goo.gl/acDett