'일원분산분석'에 해당되는 글 2건

  1. 2018.03.15 45. 분산분석 ②
  2. 2016.08.03 경영지도사 시장조사론 기출문제해설_8. 통계적 추론

분산분석은 독립변수로 구분하는 세 개 이상의 집단에 속한 종속변수의 평균에 차이가 있는지 검정하는 분석방법으로 원인이 되는 독립변수는 명목형이나 서열형 척도로 측정한 값이고 결과가 되는 종속변수는 등간척도나 비율척도로 측정한 값일 때 적용 가능합니다. 실험처리 요인인 독립변수가 하나인 경우를 특별히 일원분산분석법(일원배치법; one-way ANOVA)라고 합니다.

신제품 콘셉트 A, B, C에 대한 호감도의 차이를 알아보기 위한 일원분산분석 사례를 통해 분산분석에 대해 좀 더 알아보겠습니다. 일원분산분석법을 적용하기 위해서는 설문조사의 응답자들에게 무작위로 신제품 콘셉트 A, B, C를 노출함으로써 신제품 컨셉트 이외에 호감도에 영향을 미치는 요인이 여러 설문조사 응답자들에게 평균적으로 동일하게 작용하도록 제어하게 됩니다. 이런 의미에서 일원분산분석법을 완전확률화설계(Completely Randomized Design)라고도 하며, 일원분산분석법은 결국 서로 다른 k개의 모집단에서 서로 독립인 확률표본을 추출하는 것과 같습니다. 즉 일원분산분석법은 이표본 가설검정의 확장임을 알 수 있습니다.

일원분산분석법의 모집단 모형은 다음과 같이 설정할 수 있습니다. 오차항이 독립적이고 동일한 정규분포를 따르며 오차항의 평균은 0, 분산은 σ2이라고 해보겠습니다. 오차항의 기대값이 0이므로 관심 있는 독립변수 외의 다른 요인의 영향은 평균적으로 특정 방향으로의 경향성을 가지지 않는 비편향성을 보이며 독립변수의 수준에 관계없이 분산은 동일합니다.

제품 콘셉트별 호감도를 알아보기 위한 분산분석의 자료 구조는 아래와 같습니다. 콘셉트별 열에 해당하는 값들은 각 콘셉트에 대한 호감도 값들이며 제곱합은 각 제품 콘셉트 별로 개별 응답값에 각 제품 콘셉트별 호감도 평균을 차감하여 제곱한 후 그 값을 각 제품 콘셉트 별로 더한 값입니다.

 

만약 제품 콘셉트 간의 호감도에 차이가 있다면 집단 간의 분산 즉 전체 평균과 각 집단별 평균의 차이가 우연한 변동을 반영하는 집단 내 분산보다도 클 것입니다.

일원분산분석법에서는 집단 간 평균들의 분산과 집단 내 관측치들의 분산의 비율을 검정통계량으로 하여 집단 간 평균의 차이를 검정하게 됩니다. 검정통계량 F는 집단 간 분산/집단 내 분산=(집단 간 변량/자유도)(집단 내 변량/자유도)=(집단 간 제곱합/(집단의 수-1)]/[집단 내 제곱합/(전체표본크기-집단의 수)]로 정의하며, 검정통계량 F는 일원분산분석법의 가정과 F분포의 정의에 의해 F분포를 따르게 됩니다. 일원분산분석법의 검정통계량 F는 집단 간 분산과 집단 내 분산의 비율이므로 이 값이 크면 집단 간 평균의 차이가 있는 것으로 판단할 수 있습니다. 실제 조사 결과로부터 계산한 검정통계량 F값을 주어진 자유도와 유의수준 하에서의 임계치와 비교하여 계산한 F값이 임계치보다 크다면 집단 간 평균은 차이가 없다는 귀무가설에 대한 강력한 반증이라고 판단할 수 있습니다.

제품 콘셉트의 선호도에 대한 가상의 데이터 AA를 이용해 실제 일원분산분석법을 적용해 보았습니다. 아래 분산분석표에서 df는 자유도이고 sum sq는 제곱합을 의미합니다. mean sq는 제곱합을 자유도로 나눈 평균 제곱합합니다. 분산분석표에서 p-value가 0.0002로 나와 제품 콘셉트 후보들에 대한 호감도에는 차이가 있다고 판단할 수 있습니다.

이제 제품 콘셉트들의 호감도에 차이가 있다는 것이 밝혀졌으니 어떤 콘셉트의 호감도가 높은지 파악해 보겠습니다.. 그런데 단순한 이표본 검정절차를 사용하게 되면 유의수준을 제어할 수 없으므로 이러한 문제를 해결하기 위해 다양한 검정 절차가 개발되어 있습니다. 그 중 직관적으로 이해하기 쉬운 절차로는 Bonferroni 검정이 있습니다. Bonferroni 검정은 의사결정의 기준으로 개별적으로 허용한 유의수준을 검정한 횟수로 나눈 값을 활용하는 방법입니다. R에서 Bonferroni 검정을 수행한 결과 제품 콘셉트 후보 B와 C의 호감도 차이는 통계적으로 유의하지 않으며 A의 호감도가 다른 제품 콘셉트 후보에 비해 높은 것으로 나타났습니다.

          궁금한 점이 있으면 아래 버튼을 클릭해 주십시오. 데이터테일즈가 성실하게 답변 드리겠습니다.

 

'야행하는 리서치' 카테고리의 다른 글

47. 분산분석 ③  (0) 2018.05.07
46. 리서처가 바라본 빅 데이터  (0) 2018.03.15
44. 분산분석 ①  (0) 2018.01.03
43. 독립표본의 검정과 쌍체 비교  (0) 2017.09.25
42. 이표본 가설검정 ③  (0) 2017.09.13
Posted by dooka
,

2012문제 1다음 물음에 대하여 논하시오.(30)

 

 

(1) Z검정(Z-test)t검정(t-test)의 차이점

 

정규분포 모집단을 가정할 경우 평균에 대한 Z검정은 모분산이 알려져 있을 때 적용함. 표본분산을 검정통계량에 사용하면 t검정 절차를

따르게 됨.  Z검정은 표본크기가 크고 중심극한정리를 적용할 수 있을 경우에는 모집단의 분포에 관계없이 활용할 수 있으나,

t검정의 경우에는 정규분포모집단을 가정하고 있다는 점에서 차이가 있음.

표본크기가 커질수록 t분포는 정규분포에 근사하므로 실무적으로는 t검정을 주로 활용하고 있음.

 

(2) t검정(t-test)와 일원분산분석(one-way ANOVA)의 차이점

두 집단의 평균을 비교할 경우 t검정 절차를 따르게 됨. 그런데 세 집단 이상의 평균을 비교할 때 t검정을 적용하게 되면 경우의 수가

늘어나고 이에 따라 검정 전체의 오차를 제어할 수 없음. 일원분산분석은 단순 평균비교가 아닌 집단간 평균들의 분산과 집단 내 관측치들의 분산을 비교하여 집단간 평균차이를 동시에 검정함으로써 검정 전체의 오차를 제어함

 

(3) 독립표본(independent sample) 평균검정과 대응표본(paired sample) 평균검정의 차이 비교

 

광고노출 후 태도변화나 의약품의 효과와 같이 두 개의 모집단을 비교해야 하는 경우, 처리 자극물인 광고노출이나 의약품 투약 외에

다른 요인은 완전히 동질적인 표본을 찾는 것은 현실적으로 불가능함. 이 때 동질적인 표본추출단위들끼리 하나의 쌍으로 나누어

동질적인 각 쌍에서 무작위로(랜덤하게) 선택한 하나의 표본추출단위에는 처리1을 적용하고 나머지에는 처리2를 적용하는 대용표본

평균검정을 적용하게 됨.

대응표본 평균검정은 독립표본 평균검정에 비해 자유도가 낮아져 신뢰구간이 커지고 검정력이 약화되는 한계가 있으나, 효과적인 쌍으로

구획할 경우 표본표준편차를 감소시켜 자유도의 손실에 다른 검정력 약화를 보전할 수 있음. 결국 잘 구획된 쌍으로 실시하는 대응표본의

평균검정은 독립표본의 평균검정보다 검정력이 우수할 가능성이 있음.

 

<통계적 추론 핵심정리>

 

경영지도사 시장조사론에서 통계적 추론이 독립된 문제로 출제된 경우는 많지 않습니다. 그러나, 회귀분석, 분산분석 등 분석 방법의

차이에도 불구하고 문제가 요구하는 자료의 해석은 통계적 추론과 관련된 지식을 필수적으로 요구하고 있습니다.

통계적 추론을 본격적으로 다루지는 못하더라도 기출문제의 자료 해석에 꼭 필요한 p-value에 대해서는 정확하게 이해해 두는 것이

좋겠습니다.

 

유의확률(p-; p-value, probability-value)


유의확률은 검정통계량의 관측값에 대하여 귀무가설을 기각할 수 있는 최소의 유의수준


보다 작은 유의수준에서 귀무가설을 기각할 수 있을수록 대립가설에 대한 분명한 증거가 될 수 있음.

    즉 유의확률은 통계적 실험의 결과가 대립가설을 반대하는 입증 정도.

 

표본크기가 커지면 표준오차가 0에 근접하게 되므로 사소한 차이도 통계적으로 구분이 가능해짐.

    따라서 귀무가설이 사실이건 아니건 대부분의 경우 귀무가설을 기각하게 됨

  ☞ 귀무가설 하에서의 유의확률을 제시함으로써 유의수준 즉 잘못해서 귀무가설을 기각하는 오류를 허용하는 확률의 상한를

     임의로 정하는 문제를 해결할 수 있음. 유의확률을 제시하게 되면 의사결정자 스스로 본인의 위험에 대한 태도에 기초해

     귀무가설의 기각여부를 결정할 수 있음.

 


Posted by dooka
,