예방의학

클로드가 정리해줌

ㅎㅎㅎㅎ

조회 729

26.02.05

통계 분석방법 - 초등학생 버전! 🎮

1️⃣ 군간의 차이 확인 = “누가 더 센가?” 게임

상황: 100명 vs 100명 싸움 대결!

📊 독립 t-검정 (2팀 대결)

∙ 정규분포팀 (보통 사람들): 평균 혈압 대결!

∙ 예) 당뇨병 있는 팀 vs 없는 팀, 누가 혈압 더 높아?

∙ 비정규분포팀 (특이한 사람들): Wilcoxon이나 Mann-Whitney 검정

∙ 순위로 싸워! “1등, 2등, 3등…” 이렇게!

🎯 일원분산분석/ANOVA (3팀 이상 배틀로얄!)

∙ 예) A반 vs B반 vs C반 vs D반, 누가 혈압 제일 높아?

∙ Kruskal-Wallis 검정: 특이한 팀들끼리 순위 대결

2️⃣ 단순 연관성 평가 = “짝꿍 찾기” 게임 💑

두 변수가 친구인지 확인!

변수 2개의 관계표

|변수 1 타입 |변수 2 타입 |어떻게 확인? |

|---------—|--——----------|----------------------|

|**정규 정규** |정규분표 정규분표 |Pearson 상관 = 일직선으로 친구?|

|**정규 비정규** |정규분표 이상한애 |Spearman 상관 = 순위로 친구? |

|**순서형 순서형**|1등2등3등 1등2등3등|Spearman 상관 |

|**명목형 명목형**|남자여자 좋아싫어 |카이제곱검정, Fisher 정확검정 |

예시: 혈당이 높으면 혈압도 높아? → 산점도(점찍기) 그려서 확인!


3️⃣ 인과적 연관성 평가 = “범인 찾기” 🔍

단순 친구가 아니라 원인→결과 관계 찾기!


🎭 독립적 결과변수 (특별한 분석)

설명변수 종류에 따라:

∙ 정규분표: 회귀분석

∙ 비정규분표: 회귀분석

∙ 순서형: 손차적 로지스틱 회귀분석 (로지스틱 회귀분석의 친척!)

∙ 명목형 (이분형): 로지스틱 회귀분석 ⭐ (제일 중요!)


🎭 의존적 결과변수 (같은 사람 여러번 측정)

예시:

∙ 혼합모형: 같은 환자 아침/점심/저녁 혈압 재기

∙ GEE (조건부 로지스틱): 시간의 흐름대로 측정


🎪 회귀분석 = “범인의 힘” 측정하기

핵심 개념 쉽게!

y = 결과 (혈압)x₁, x₂, x₃… = 범인들 (나이, 몸무게, 운동량 등)

1️⃣ x₁~xₙ 중 x₁만 = 연구에서 진짜 관심있는 범인 (예: DM 유무)

2️⃣ x₂~xₙ = 방해꾼들! (교란변수 = 나이, 성별 같은 것들)

🎯 회귀분석의 마법

y에 각기 다른 x가 독립적으로 어떤 영향을 끼칠 수 있는지 파악!

예시로 이해하기:

∙ 혈압(결과)에 영향 주는 것: 혈당, 나이, 성별, BMI, 운동량…

∙ 근데 나이↑면 혈압↑하잖아? 이게 방해!

∙ 그래서 나이, 성별 등을 “제쳐두고” 순수하게 혈당만의 영향력 측정!


🎲 특별한 회귀분석들

로지스틱 회귀분석 = O/X 퀴즈용!

결과가 “당뇨병 있다(1) vs 없다(0)” 같은 O/X일 때

∙ Odds Ratio(OR) = 확률 비율

∙ OR > 1 → 위험 증가! 😱

∙ OR = 1 → 관계없음 😐

∙ OR < 1 → 보호효과! 😊


🎮 실전 예시: 당뇨병 범인 찾기!

질문: 비만이면 당뇨병 걸릴까?

1. 단순 비교: 비만인 사람 vs 정상인 사람의 당뇨병 비율 (카이제곱검정)

2. 범인 확정: 로지스틱 회귀분석

∙ 결과(y): 당뇨병 있음(1) / 없음(0)

∙ 진짜 범인(x₁): BMI

∙ 방해꾼(x₂~xₙ): 나이, 운동량, 가족력 등

∙ 결과: BMI의 OR = 2.5 → “BMI 1 올라갈 때마다 당뇨병 확률 2.5배!”

💡 핵심 정리

1. 2팀 싸움 → t-검정

2. 3팀 이상 배틀 → ANOVA

3. 짝꿍 찾기 → 상관분석

4. 진짜 범인 찾기 → 회귀분석

5. O/X 범인 찾기 → 로지스틱 회귀분석

꿀팁: 정규분포 = 보통 사람들, 비정규분포 = 특이한 사람들! 특이하면 순위로 싸워! 🏆​​​​​​​​​​​​​​​​

댓글 쓰기

로그인 하고 의견을 남겨주세요

댓글 1

에헤랴

26.02.09

클로드 VS GPT