| Home | E-Submission | Sitemap | Contact Us
top_img
J Korean Acad Fundam Nurs > Volume 22(4); 2015 > Article
기본간호학회지 게재 논문의 통계학적 방법 유형과 오류

Abstract

Purpose

In nursing research, studies using statistical methods are required and have increased. In this study, some statistical methods using in nursing study are summarized and appropriate usage is proposed.

Methods

Twenty-five original articles from the Journal of Korean Academy of Fundamentals Nursing were reviewed. Statistical methods used in the Journal of Fundamentals Nursing were classified and common errors were presented.

Results

Seventy-six statistical analysis were performed in the 25 studies. Among the articles, 28 cases contained errors. Most errors occurred in linear regression analysis and nonparametric analysis.

Conclusion

When the use of statistical method is applied inappropriately, the result bring out a serious error. In order to ensure reliability and validity of study, researchers should recognize clear application and usage of statistical methods.

서 론

많은 연구자들이 본인들의 연구 결과에 대한 신뢰도를 높이기 위하여 통계학적 자료들을 가지고 분석을 수행하는 연구가 늘어나고 있는 추세이다. 게다가 근거기반 학문임을 뒷받침하고자 하는 경우에 통계학적 분석을 반드시 요구하는 논문들도 늘어나고 있다. 현대 사회에서는 연구 결과의 근거를 객관적으로 제시하여 타당성을 보장한다는 점에서 통계학의 중요도는 높아지고 있다. 그러므로 연구 설계와 자료 분석을 하기 위하여 필요한 통계분석 기법을 적절하게 적용해야 한다.
현재 간호학 연구에서 통계학적 방법을 사용하는 연구들이 증가하고 있고 연구 설계도 다양해지고 있지만 통계학적 방법의 사용 범위는 이를 따라가고 있지 못하는 것이 현실이다. 통계분석을 통계학자와의 공동연구를 통해 해결하기 보다는 연구자들이 직접 수행하다보니 통계학적 분석 방법에 대한 이해가 부족하거나, 부적절한 분석 방법이 적용되는 경우도 있다. 또한 연구 설계가 기존 연구와 비슷한 경우에 기존 연구자들이 사용한 통계분석 기법들 위주로만 분석이 진행되기 때문에 자료에 대한 충분한 통계학적 분석 결과를 도출해내지 못하는 경우도 있다. 통계학적 분석 기법은 다양하여 연구 목적 및 가설과 자료의 형태에 맞는 분석 기법을 적절하게 적용하고 올바른 통계학적 의사결정으로 결론을 도출하여 보다 타당하고 신뢰도 높은 결과물을 얻고 이를 공유하는 것이 학문 발전을 위해 필수적이다.
본 연구에서는 2015년 22권 1호부터 3호까지 기본간호학회지에 게재된 총 25편의 논문에 대하여 통계학적 분석 기법의 적용과 결과에 대하여 검토하여 게재된 논문에 사용된 통계학적 분석 방법의 유형을 조사하고 사용된 방법들 중 오류가 발생했었던 사례를 정리하여 보고하고자 한다. 이는 추후 간호학 연구에서 통계학적 분석 기법을 올바르게 적용하여 타당성과 신뢰성 있는 결과를 보고하는데 도움이 될 것으로 기대한다.

본 론

기본간호학회지에서 사용된 통계학적 분석 방법의 유형

● 연속형 변수에 대한 분석 기법

∙ t-검정(t-test)

일반적으로 t-검정이라고 하는 분석 방법은 평균을 비교하기 위한 분석 기법으로, t-검정에는 두 가지 종류가 있다. 하나는 two-sample t-test(independent t-test)이고 하나는 paired t-test이다. 전자는 서로 다른 두 집단의 평균을 비교하기 위한 분석 기법으로 평균을 비교하기 이전에 두 집단의 분산이 같은지 등분산 검정을 먼저 시행한 후 평균비교의 결과를 해석해야 한다. paired t-test는 한 집단의 전, 후(변화량) 차이를 비교하기 위한 분석 기법으로 동일한 대상을 전과 후를 측정하여 전과 후의 차이값(변화량)이 통계학적으로 유의한 차이가 있는지 검정하는 분석 방법이다. 다시 말하면 two-sample t-test는 조건이 서로 다른 두 집단을 비교하는 것이고 paired t-test는 동일한 대상의 조건 전과 후를 비교하는 것이다. t-검정을 수행하기 위해서는 연속형 변수가 정규분포를 따른다는 가정이 필요하다. 그리고 t-검정의 결과는 평균을 비교하기 위한 분석 기법이므로 평균과 표준편차를 같이 제시해주어야 한다[1].

∙ 분산분석(ANOVA; Analysis of Variance)

서로 다른 세 집단 이상의 평균이 차이가 있는지 검정하고자 할 때에는 분산분석이 사용된다. t-검정과 마찬가지로 연속형 변수가 정규분포를 따른다는 가정이 필요하고 집단들의 모분산은 모두 동일하다는 가정이 필요하다. 분산분석에서 연속형 변수에 영향을 미치는 요인, 즉 집단에 대한 변수가 하나이면 일요인 분산분석(one-way ANOVA)이라 하고, 요인이 두 개인 경우는 이요인 분산분석(two-way ANOVA)이라고 한다. 분산분석을 수행한 결과 통계학적으로 유의한 차이가 있다고 결론이 나면, 어느 집단에서 유의한 차이가 있는지를 검정하게 되는데 이 절차를 다중비교(multiple comparison) 또는 사후검정(post-hoc)이라고 한다. 다중비교를 하기 위한 분석 방법은 여러 가지가 있는데 Bonferroni 방법, Scheffė 방법, Tukey 방법 등이 있다. 이 중 Tukey 방법은 집단 간 표본수가 모두 같은 경우에만 사용해야 한다[1].
공분산분석(ANCOVA; Analysis of Covariance)은 기저변수를 통제하고 집단 간 차이를 알아보기 위한 분산분석 방법이다. 이 때 분석 결과를 해당 변수의 평균과 표준편차가 아닌 최소제곱평균(least squae mean)과 표준오차(standard error)를 제시하는 것이 적절하다[1]. 반복측정자료의 분산분석(Repeated measures ANOVA)는 동일한 대상을 여러 번 반복 측정한 자료에 대한 분석 방법으로 시점에 따른 변화를 비교하기 위한 분석 방법이고 이 때 집단이 두 개 이상이면 시점에 따른 차이가 있는지, 집단 간 차이가 있는지, 시점에 따른 변화가 집단 간에 차이가 있는지를 분석할 수 있다[1].

∙ 상관분석(Correlation analysis)

연속형인 두 변수들 간의 선형적 상관성이 존재하는지 알아보기 위한 분석 방법으로 변수들의 원인과 결과에 관한 관계를 밝히는 것이 아니라 단순한 상관성 (관계의 유무, 관계의 강도)을 파악하고자 하는 것이 목적이다. 상관관계의 척도로서는 Karl Pearson이 제시한 Pearson 상관계수 (correlation coefficient)가 대표적이다. Pearson 상관계수는 상관관계를 분석하고자 하는 변수가 정규분포를 따른다는 가정이 있어야 한다. 상관계수의 부호에 따라 방향성을 잘 해석해야 하고, 상관계수는 선형적인 연관성의 정도를 나타내는 것이므로 통계학적으로 유의하지 않거나 상관계수가 작은 값이 나오더라도 선형 이외의 다른 관계가 존재할 수도 있기 때문에 두 변수 간에 관련이 없다고 단언할 수 없다는 점을 유의해야 한다[1].

∙ 비모수적인 통계분석(Nonparametric analysis)

관찰된 자료가 정규성을 만족하기 어려운 경우 적용하는 통계분석 방법이다. 모수적인 분석 기법인 t-검정과 ANOVA에서는 자료의 대푯값으로 평균과 표준편차를 쓰지만 비모수적인 분석의 결과를 표현할 때에는 자료의 대푯값으로 중위수와 최소, 최대값 혹은 사분위수범위(IQR; Inter-quartile Range)를 사용한다. two-sample t-test에 대응하는 비모수적인 분석 기법은 Mann-Whitney U test (Wilcoxon rank sum test)를 사용하고, paired t-test에 대응하는 비모수적인 분석 기법은 Wilcoxon signed rank test를 사용한다. ANOVA에 대응되는 비모수적인 분석 기법은 Krukal-Wallis test이고 다중비교 방법으로는 Dunn (1964)이 제시한 방법이 있으며, repeated measures ANOVA에 대응되는 비모수적인 분석 기법은 Friedman test가 있다. Pearson 상관계수에 대응하는 비모수적인 분석 기법은 Spearman 상관계수를 사용할 수 있다[1].

∙ 정규성 검정

통계분석 기법들 중에서는 정규성을 가정한 경우에 사용이 가능한 분석 기법들이 있다. 그래서 정규성 검정을 수행해야 하는 경우가 있는데 이 때 정규성 검정을 하는 분석 기법은 여러 가지가 있다. 대표적으로 Kolmogorov-Smirnov test와 Shapiro-Wilk test가 있는데 표본수가 2000보다 클 때는 Kolmogorov-Smirnov test를 사용하고 2000보다 적을 때는 Shapiro-Wilk test를 사용하는 것이 적절하다고 Royston (1992)가 제안했다[2,3].

● 범주형 변수에 대한 분석 기법

변수의 속성이 여러 범주에 따라 분류하는 경우 이를 범주형 변수라고 한다. 이 때 자료에서 분류된 각 범주(category)에 속한 개체수를 빈도(frequency)라고 하며 전체 개수에 대한 해당 범주의 개체수의 비율(proportion)을 빈도와 같이 표현하는 것이 일반적이다. 이러한 범주형 변수는 분할표(contingency table)를 통해 자료를 정리할 수 있고 범주의 갯수에 따라서 분할표는 r×c로 표현한다. 이러한 범주형 자료에 대하여 차이가 있는지, 즉 독립성 검정 혹은 동질성 검정을 하기 위한 방법으로는 Pearson chi-square test가 대표적이다[4]. 하지만 이 때 적어도 하나의 cell에서 기대빈도가 5 미만인 cell이 있으면 Pearson chi-square test의 대안으로 Fisher's exact test를 수행하는 것이 적절하다. 다른 분석 기법들과 다르게 Fisher's exact test는 통계량이 없이 p-value를 산출해주는 분석 기법이다[5]. 범주형 변수이면서 순서의 의미가 있는 순위형 변수의 경우 경향성(trend)을 나타낼 수 있는 Mantel-Haenszel chi-square test를 적용할 수 있는데 본 연구의 연구 대상 중에는 이 분석 기법을 적용한 논문은 없었다. 이 분석 방법은 순위형 변수에 대하여 비율의 증가 혹은 감소의 경향이 있는지를 검정하는 방법으로 적용할 수 있다. paired t-test의 경우 동일한 대상을 전과 후에 측정하여 검정하는 방법으로 연속형 변수에서만 가능한 분석 기법이다. 범주형 변수에서는 동일한 대상에 대하여 전과 후의 자료를 얻어 검정하는 방법으로 McNemar test가 있다[4]. 이 역시 본 연구의 연구 대상 중에는 이 분석 기법을 적용한 논문은 없었다.

● 선형 회귀분석(Linear regression)

회귀분석이란 변수들 간에 관계를 설정하는 통계학적 방법인데 다른 변수들을 이용하여 한 변수에 대하여 예측을 가능하게 해준다. 종속변수가 연속형 변수인 경우를 선형 회귀분석이라고 한다. 독립변수가 하나이면 단순 선형 회귀분석(Simple linear regression)이라고 하고 독립변수가 두 개 이상이면 다중 선형 회귀분석(Multiple linear regression)이라고 한다. 회귀분석을 수행하는데 있어서 독립변수중 범주가 3개 이상인 범주형 변수인 경우에 가변수(Dummy variable)를 생성하여 분석을 수행함으로써 왜곡되지 않은 결과를 도출할 수 있다. 회귀분석의 결과는 모형에 대한 유의성을 검정한 결과와 개별 회귀계수에 대한 유의성을 검정한 결과를 해석해야 한다. 다중 회귀분석을 수행할 때 독립변수들 사이의 상관관계, 즉 다중공선성(multi-collinearity)를 평가해야 하는데 다중공선성이 높으면 독립변수들 간의 상관관계가 존재하는 것을 의미하므로 하나의 독립변수가 종속변수를 설명할 수 있는 많은 부분이 이미 다른 독립변수들로 대치될 수 있다는 것이다[6]. 통계학적으로 보면 회귀계수의 유의성이 과소평가될 수도 있다는 것을 의미한다.
다중회귀분석을 수행하는 목적은 종속변수에 대한 독립변수들의 효과를 보정(adjust)한 후의 유의성을 알아보고자 할 때 사용되기도 하고 예측모형을 구현하기 위해서 사용되기도 한다. 전자의 경우 위계적 회귀모형(Hierachial multiple regression) 등을 이용하여 관심변수가 가장 유의한 변수인지 혹은 다른 변수들을 보정(adjust)해도 여전히 유의한지를 보여주는 데 의의가 있다. 후자의 경우 회귀분석 결과 추정된 회귀모형에 대한 적합성은 실제 관찰된 자료가 선형회귀모형의 다음의 가정과 일치하는지가 중요하다. 첫째, 회귀식의 선형관계를 만족해야 하고, 둘째, 오차항은 정규분포를 따라야 하고, 셋째, 서로 다른 오차들은 서로 독립이어야 한다. 이러한 예측모형에 대한 진단을 하는 방법들 중에는 잔차를 이용할 수 있는데, 추정된 모형과 실제 관찰치와의 차이를 잔차라고 하고 오차에 대한 추정치로 간주한다. 잔차분석을 수행하는 방법으로 통계량을 이용할 때에는 등분산성 검정을 위해서는 White 검정법을 이용하고, 정규성을 검정하기 위해서는 Shapiro-Wilk 검정법을 이용하고, 독립성을 검정하기 위해서는 Durbin-Watson 통계량을 이용한다. 예측모형을 만들고자 할 때에는 최적의 모형을 만들기 위한 독립변수를 선택하는 것이 중요하다. 이 때 사용되는 방법이 backward method, forward method, stepwise method가 있는데, backward method는 모든 변수를 투입한 이후에 유의하지 않은 것을 제거하면서 최적의 모형을 만드는 방법이고, forward method는 변수를 하나씩 추가하면서 최적의 모형을 만드는 방법이고, stepwise method는 변수는 추가하고 제거하는 과정을 반복하면서 최적의 모형을 만들어주는 변수선택 방법이다. 이러한 최적의 예측모형을 만들고 나서 모형에 대한 타당성을 검정하여 모형의 신뢰성도 확보해야 한다[6].

● 요인분석 및 신뢰도분석

∙ 주요인 분석(Principle component analysis)

여러 변수들 가운데 서로 관련성이 높은 것끼리 묶어 소수의 새로운 영역을 찾아내는 분석 방법이다. 이는 다양하고 해석하기 힘든 여러 변수들을 의미 있는 것들끼리 묶어서 축소시키는 개념이다[7].

∙ 내적 일치도 계수

어떤 측정 수단이나 측정 도구를 다른 연구자가 사용할 때 그 결과가 안정되고 일관성 있는가를 알아보기 위하여 신뢰도 분석을 수행하게 된다. 또한 각 문항간의 일관성을 보기 위해서도 신뢰도 분석을 수행한다. 이 때 각 문항 간에 다른 속성을 내포하는 경우에는 내적 일치도 계수가 의미가 없다. 즉, 신뢰도란 측정하려는 것을 얼마나 안정적으로 일관성있게 오차없이 측정하였는가의 문제이다. 만약 측정 시 오차가 크다면 신뢰성은 떨어지게 된다. 이러한 신뢰도를 평가하기 위하여 내적 일치도를 보기 위한 계수로 Cronbach's alpha coefficient와 KR-20 등이 있고 Cronbach's alpha coefficient은 연속형 변수나 순위형 변수에서 사용하는 계수이고 KR-20은 이분형 변수에서 사용하는 계수이다[8,9].

기본간호학회지에 사용된 통계학적 방법의 오류 사례

Table 1은 2015년 22권 1호부터 3호까지 기본간호학회지에 게재된 논문의 오류 발생 건수를 정리한 것이다. Table 2는 통계학적 분석 방법에 대한 적용 오류에 대하여 정리한 것이며 그 내용을 하나씩 살펴보면 다음과 같다.

● 연속형 변수에 대한 분석 기법

∙ t-검정(t-test)

분석 기법을 언급할 때 t-test라고 제시한 경우는 가장 빈번하게 발생하는 오류의 사례로 꼽힌다. t-test에는 two-sample t-test (independent t-test)와 paired t-test가 있는데 이 두 가지 중 무엇을 사용했는지에 대한 언급이 없는 것이므로 명확하게 기술해야 한다. 더불어 등분산 검정 결과에 따른 two-sample t-test의 p-value를 제대로 반영했는지 주의해야 한다.

∙ 분산분석(ANOVA; Analysis of Variance)

ANOVA를 수행한 후 다중비교를 할 때 다중비교 방법 중 Tukey 방법은 집단 간 표본수가 모두 같은 경우에 쓰이는 방법임에도 불구하고 집단 간 표본수가 다른데도 Tukey 방법을 사용하는 사례가 발생하였다. 또 다른 사례는 ANOVA 분석 결과 유의한 변수가 여러 개 있었는데 다중비교 결과를 제시하지 않는 경우도 있었다. ANCOVA 분석은 기저변수를 통제하는 분석 기법이기 때문에 수행한 후의 결과는 최소제곱평균과 표준오차를 제시하는 것이 적절한데 ANCOVA 분석 기법을 적용한 논문 모두 이에 대한 언급이 없었다. 반복 측정된 자료의 경우 두 번만 반복측정 되었고 서로 다른 두 개의 집단을 대상으로 진행된 연구라면 집단 내 차이는 paired t-test로 분석해도 되고, 집단 간 차이는 변화량을 구한 후 two-sample t-test를 이용해도 된다. 다시 정리하면 repeated measures ANOVA로 분석을 수행하려면 3번 이상 반복 측정한 경우에 적절하다.

∙ 비모수적인 통계분석(Nonparametric analysis)

비모수적인 통계분석 방법은 중위수를 비교하는 분석 방법이므로 중위수와 범위(사분위수 범위나 최소, 최대값)를 제시해야 하는데 평균과 표준편차를 제시하는 오류는 비모수적인 통계분석 방법을 적용한 모든 경우에서 발생하였다. 더불어 비모수적인 통계분석 방법을 사용할 때에는 뚜렷한 근거를 제시해야 한다. 근거를 제시하는 여러 가지 방법 중 하나가 정규성 검정의 결과를 제시하는데 앞서 언급한 대로 표본수가 2000보다 클 때는 Kolmogorov-Smirnov test를 사용하고 2000보다 적을 때는 Shapiro-Wilk test를 사용하는 것이 적절하다. 다만, 정규성을 검정하는 여러 가지 방법 중 위 두 가지만 가지고 정규성을 만족하는지를 쉽게 판단하기에는 한계가 있다. Mann-Whitney U test는 서로 다른 두 집단의 중위수를 비교하는 분석 기법인데 동일한 대상으로 측정된 전후의 비교에 Mann-Whitney U test를 잘못 적용한 사례도 있었다. 어떤 논문은 Mann-Whitney U test를 분산의 동질성 때문에 사용한다고 적절하지 않는 이유를 언급한 경우도 있었다.

● 범주형 변수에 대한 분석 기법

범주형 자료 분석의 경우 cell에 0이 포함되어 있거나 기대빈도가 5 미만인 cell이 존재함에도 불구하고 Fisher's exact test를 사용하지 않은 경우가 있었다.

● 선형 회귀분석(Linear regression)

회귀분석을 사용하는 목적이 앞서 언급한 두 가지가 있는데, 대부분의 경우 다른 변수(보통 일반적인 특성인 연령이나 성별 등의 변수)를 통제하여도 여전히 유의함을 보이는 강력한 변수인지를 파악하기 위해서 회귀분석을 사용한다. 그런데 어떤 논문은 일반적인 특성이 유의함에도 이를 보정(adjust)하지 않고 관심 변수 일부만 가지고 회귀분석을 수행한 경우가 있어 정확한 유의성을 나타내는 결과를 표현하는데 한계가 있었다. 게다가 위의 목적으로 다중 회귀분석을 사용한 것으로 판단되는데, 예측모형을 구현하고자 할 때 회귀분석 모형에 대한 진단을 하기 위하여 잔차 분석을 수행하였다. 이 때 고려하는 사항은 잔차의 독립성, 정규성, 등분산성 세 가지인데 대부분의 논문들이 독립성 검정을 수행한 Durbin-Watson 통계량만 제시하고 등분산성이나 정규성에 대한 언급은 없이 회귀분석을 수행하기 위한 기본 가정을 충족하였다고 언급하는 것은 적절하지 못하다. 또한 잔차 분석은 회귀분석을 수행하기 위한 기본 가정이 아니고 회귀모형에 대한 진단을 하는 것이므로 오용의 대표적인 예라고 할 수 있다. 더불어 이러한 적합한 예측모형을 만들기 위해서 투입된 독립변수들을 선택하는 방법들이 있는데, 이를 기술할 때에는 stepwise multiple regression이라는 용어는 어색하고 multiple linear regression with stepwise method라고 표현하기를 권장한다. 또한 enter method라는 것은 실제 변수선택 법이 아니고 특정 통계프로그램에서 사용하는 용어에 불과하므로 굳이 제시하지 않아도 된다. 독립변수가 이분형 자료인 경우, 즉 예/아니오로 측정한 이분형 변수인데 회귀분석 내용에 가변수라는 용어를 사용한 경우가 있었다. 가변수는 범주가 3개 이상인 경우에 생성해야 하는 변수로 이분형 자료인 원변수에 가변수라는 용어를 붙일 필요는 없다. 하지만 범주가 3개 이상인 독립변수는 반드시 가변수 처리를 하여 분석을 수행해야 한다. 회귀분석의 결과로 대부분 회귀계수를 제시하는데 비표준화 회귀계수는 표준오차(SE)를 같이 제시해주어야 한다. 그리고 비표준화 회귀계수는 “B”로 표현하고 표준화 회귀계수는 “β”라고 표기하는데 이는 특정 통계프로그램에서 사용하는 표시법이지 통계학 분야에서 공식적으로 쓰는 표시법이 아니다[10].

● 기타

자료에 대한 분석 결과를 제시할 때 평균과 표준편차는 ± 기호를 이용하여 평균과 표준편차를 연결하여 표현하는 것을 권장한다. 대부분의 연구자들이 Mean (SD)의 형태로 표현하는데 자료의 대푯값을 나타내는 평균과 표준편차의 표현은 ±로 표현하는 것이 일반적이며 빈도와 비율을 n(%)로 표현하는 것과도 구별이 용이하다[11].
통계분석 방법에 대하여 기술할 때 실제 사용하지 않는 분석 방법을 기술하는 경우가 있는데 이는 계획서 상에서는 언급할 수 있지만 논문은 이미 결과를 도출하여 보여주는 것이므로 실제 사용된 분석 기법만 언급해야 한다.
통계학적 분석은 검증(檢證)이 아니고 검정(檢定)이므로 단어 선택에도 유의해야 한다.

결론 및 논의

지금까지 2015년 22권 1호부터 3호까지 기본간호학회지에 게재된 논문들에서 사용되었던 분석 기법들의 유형에 대하여 소개하고 올바른 사용 방법에 대하여 살펴보았다. 검토한 25편의 논문 중 2편의 논문은 질적 연구 논문으로 통계학적 분석이 사용되지 않았고 90% 이상의 논문에서 통계학적 분석 기법을 활용하였다. 많은 연구들이 통계학적 분석을 통하여 연구 목적에 맞는 결과를 도출하였다. 하지만 일부 논문에서 통계학적 용어나 표기가 부적절한 것 등의 사소한 오류도 있었으나 잘못된 분석 기법을 적용한 경우나 필요한 분석을 수행하지 않은 경우 등의 오류가 발생하여 연구를 통하여 보여주고자 하는 연구 결과가 연구 목적이나 가설에 부합한 결과를 이끌어 내지 못한 점은 아쉬운 부분이라 생각한다[12]. 이러한 오류들은 통계분석 기법의 정확한 의미에 대한 탐구를 하지 않고 의례적으로 쓰이는 용어들이나 유사 연구들에서 쓰인 통계학적 분석 방법이 그대로 답습이 되어 발생한 것으로 파악된다. 하지만 통계학을 전공하지 않은 연구자가 모든 통계학적 방법을 정확히 이해하고 적용하는 것은 쉽지 않은 일이다. 본 연구의 오류 사례 중 비모수적인 통계분석을 적용한 경우는 모두에게서 오류가 발견되어, 전반적으로 비모수적인 통계분석 방법에 대한 이해와 올바른 적용이 특히 요구된다.
다양한 통계학적 분석 기법 중 본인의 연구 목적 및 가설과 자료의 형태에 맞지 않는 분석 기법을 적용하여 왜곡된 결과를 얻게 되는 심각한 오류를 범할 수 있다.
본 연구에서 제시된 통계학적 방법들의 유형과 올바른 적용 기준이 연구자가 통계학적 분석을 수행하고 그 결과를 해석을 하는데 있어서 보다 타당하고 신뢰도 높은 결과물을 얻는데 기여할 것이라 기대한다.

Table 1.
Uses and Errors of Statistical Methods in the Journal of Korean Academy of Fundamentals of Nursing
Statistical method Frequency Error
two-sample t-test 16 8
paired t-test 3 0
ANOVA 12 3
ANCOVA 2 2
Repeated measures ANOVA 4 2
Kolmogorov-Smirnov test 1 1
Mann-Whitney U test 3 3
Kruskal-Wallis test 2 2
frequency analysis 1 0
Chi-square test (Fisher’s exact test) 12 3
Pearson’s correlation coefficient 8 0
linear regression 7 4
Principle component analysis 1 0
Cronbach’s alpha coefficient 1 0
KR-20 1 0

Total 74 28
Table 2.
Type of Errors of Statistical Methods in the Journal of Korean Academy of Fundamentals of Nursing
Statistical method Type of Error
Two-sample t-test The terms of t-test is not clear.

ANOVA The multiple comparison method is not appropriate.
The result of ANOVA is significant, nevertheless the result of multiple comparison is not presented.

ANCOVA Descriptive statistics is not appropriate.

Repeated measures ANOVA This method is not suitable for the data.

Kolmogorov-Smirnov test This method is not suitable for the data.

Mann-Whitney U test This method used without reasonable evidence.
Kruskal-Wallis test Descriptive statistics are not appropriate.

Chi-square test Chi-square test is performed instead of Fisher’s exact test.

Linear regression The analysis was performed without adjusted variables.
The regression coefficient is represented inappropriately.
The standard error of coefficient is not present.
The term of regression model is described inappropriately.
Variable selection methods are used unnecessarily.

References

1. Rosner B. Fundamentals of biostatistics. 6th ed. New York: Thomson; 2006.

2. Shapiro SS, Wilk MB. An analysis of variance test for normality (complete samples). Biometrika. 1965; 52(3):591-611.
crossref
3. Royston P. Approximating the Shapiro–Wilk W-test for non-normality. Statistics and Computing. 1992; 2(3):117-119.
crossref
4. Agresti A. Categorical data analysis. 2nd ed. New York: John Wiley & Sons; 2002.

5. Fisher RA. On the interpretation of χ2 from contingency tables, and the calculation of p. Journal of the Royal Statistical Society. 1922; 85(1):87-94.
crossref
6. Neter J, Kutner MH, Nachtsheim CJ, Wasserman W. Applied linear regression models. 3rd ed. New York: Irwin; 1996.

7. Jolliffe IT. Principal component analysis, series: Springer series in statistics. 2nd ed. New York: Springer; 2002. http://dx.doi.org/10.1007/b98835

8. Cronbach LJ. Coefficient alpha and the internal structure of tests. Psychometrika. 1951; 16(3):297-334.
crossref
9. Kuder GF, Richardson MW. The theory of the estimation of test reliability. Psychometrika. 1937; 2(3):151-160.
crossref
10. Song K. Use and misuse of statistical methods in the Journal of Korean Academy of Nursing Administration. Journal of Korean Academy of Nursing Administration. 2013; 19(1):146-154. http://dx.doi.org/10.11111/jkana.2013.19.1.146
crossref
11. Good PI, Hardin JW. Common errors in statistics (and how to aviod them). 4th ed. New York: John Wiley & Sons; 2012.

12. Lang T. Twenty statistical errors even you can find in Biomedical Research Articles. Croatian Medical Journal. 2004; 45(4):361-370.
pmid