클로드가 정리해줌
ㅎㅎㅎㅎ
조회 729
26.02.05
통계 분석방법 - 초등학생 버전! 🎮
1️⃣ 군간의 차이 확인 = “누가 더 센가?” 게임
상황: 100명 vs 100명 싸움 대결!
📊 독립 t-검정 (2팀 대결)
∙ 정규분포팀 (보통 사람들): 평균 혈압 대결!
∙ 예) 당뇨병 있는 팀 vs 없는 팀, 누가 혈압 더 높아?
∙ 비정규분포팀 (특이한 사람들): Wilcoxon이나 Mann-Whitney 검정
∙ 순위로 싸워! “1등, 2등, 3등…” 이렇게!
🎯 일원분산분석/ANOVA (3팀 이상 배틀로얄!)
∙ 예) A반 vs B반 vs C반 vs D반, 누가 혈압 제일 높아?
∙ Kruskal-Wallis 검정: 특이한 팀들끼리 순위 대결
2️⃣ 단순 연관성 평가 = “짝꿍 찾기” 게임 💑
두 변수가 친구인지 확인!
변수 2개의 관계표
|변수 1 타입 |변수 2 타입 |어떻게 확인? |
|---------—|--——----------|----------------------|
|**정규 정규** |정규분표 정규분표 |Pearson 상관 = 일직선으로 친구?|
|**정규 비정규** |정규분표 이상한애 |Spearman 상관 = 순위로 친구? |
|**순서형 순서형**|1등2등3등 1등2등3등|Spearman 상관 |
|**명목형 명목형**|남자여자 좋아싫어 |카이제곱검정, Fisher 정확검정 |
예시: 혈당이 높으면 혈압도 높아? → 산점도(점찍기) 그려서 확인!
3️⃣ 인과적 연관성 평가 = “범인 찾기” 🔍
단순 친구가 아니라 원인→결과 관계 찾기!
🎭 독립적 결과변수 (특별한 분석)
설명변수 종류에 따라:
∙ 정규분표: 회귀분석
∙ 비정규분표: 회귀분석
∙ 순서형: 손차적 로지스틱 회귀분석 (로지스틱 회귀분석의 친척!)
∙ 명목형 (이분형): 로지스틱 회귀분석 ⭐ (제일 중요!)
🎭 의존적 결과변수 (같은 사람 여러번 측정)
예시:
∙ 혼합모형: 같은 환자 아침/점심/저녁 혈압 재기
∙ GEE (조건부 로지스틱): 시간의 흐름대로 측정
🎪 회귀분석 = “범인의 힘” 측정하기
핵심 개념 쉽게!
y = 결과 (혈압)x₁, x₂, x₃… = 범인들 (나이, 몸무게, 운동량 등)
1️⃣ x₁~xₙ 중 x₁만 = 연구에서 진짜 관심있는 범인 (예: DM 유무)
2️⃣ x₂~xₙ = 방해꾼들! (교란변수 = 나이, 성별 같은 것들)
🎯 회귀분석의 마법
y에 각기 다른 x가 독립적으로 어떤 영향을 끼칠 수 있는지 파악!
예시로 이해하기:
∙ 혈압(결과)에 영향 주는 것: 혈당, 나이, 성별, BMI, 운동량…
∙ 근데 나이↑면 혈압↑하잖아? 이게 방해!
∙ 그래서 나이, 성별 등을 “제쳐두고” 순수하게 혈당만의 영향력 측정!
🎲 특별한 회귀분석들
로지스틱 회귀분석 = O/X 퀴즈용!
∙ 결과가 “당뇨병 있다(1) vs 없다(0)” 같은 O/X일 때
∙ Odds Ratio(OR) = 확률 비율
∙ OR > 1 → 위험 증가! 😱
∙ OR = 1 → 관계없음 😐
∙ OR < 1 → 보호효과! 😊
🎮 실전 예시: 당뇨병 범인 찾기!
질문: 비만이면 당뇨병 걸릴까?
1. 단순 비교: 비만인 사람 vs 정상인 사람의 당뇨병 비율 (카이제곱검정)
2. 범인 확정: 로지스틱 회귀분석
∙ 결과(y): 당뇨병 있음(1) / 없음(0)
∙ 진짜 범인(x₁): BMI
∙ 방해꾼(x₂~xₙ): 나이, 운동량, 가족력 등
∙ 결과: BMI의 OR = 2.5 → “BMI 1 올라갈 때마다 당뇨병 확률 2.5배!”
💡 핵심 정리
1. 2팀 싸움 → t-검정
2. 3팀 이상 배틀 → ANOVA
3. 짝꿍 찾기 → 상관분석
4. 진짜 범인 찾기 → 회귀분석
5. O/X 범인 찾기 → 로지스틱 회귀분석
꿀팁: 정규분포 = 보통 사람들, 비정규분포 = 특이한 사람들! 특이하면 순위로 싸워! 🏆
댓글 쓰기
로그인 하고 의견을 남겨주세요
에헤랴
26.02.09
클로드 VS GPT
댓글 1개