통계강의(24)
-
국민건강영양조사(국건영) 공공의료빅데이터 분석 실습 - 깜신의 통계 왕초보탈출 44탄
국건영 데이터 슬쩍 맛보기 - 깜신의 통계 왕초보탈출 44탄 한동안의 공백기를 깨고, 다시 데이터과학과 관련한 포스팅을 시작합니다. 뜻하지 않은 코로나19 사태로 말미암아 매우 힘든 시간을 보내고 있는데요. 지친 일상을 이겨내는데, 남 돕는 일만한 게 없는 것 같아요. 의료빅데이터 연구를 시작하시는 많은 분께 미력하나마 도움이 되었으면 합니다. : ) 아래 파일은 질병관리본부(이하 질본)에서 연구자들에게 무료로 분양 중인 국민건강영양조사(이하 국건영) 공공의료데이터를 여러분의 노트북 사양 정도에서 편하게 실습하실 수 있도록 랜덤샘플링을 통해 일부만 추린 파일입니다. 깜신 김종엽 드림.
2020.06.30 -
세 그룹 이상의 평균을 비교하는 방법 - 깜신의 통계 왕초보탈출
세그룹 이상의 평균을 비교하는 방법 김종엽 ANOVA라는 이름, 왠지 익숙하신가요? 학부 시절 커리큘럼에 통계 관련 과목이 하나만 있었어도 여러분은 틀림없이 이 단어를 배우셨을 겁니다. 활용 빈도 또한 무척 높죠. 사실 앞 챕터에서 알아봤던 두 그룹의 평균 비교는 논문을 작성할 때 실험군과 대조군의 나이 등을 비교하면서 자연스럽게 녹아들어가고, 실제로 결과 제출에 이용되는 분석 방법은 이 장에서 소개할 세 그룹 이상의 평균 비교부터일 겁니다. 앞장을 잘 이해하셨다면, 절대 어렵지 않습니다. 일단, 두 그룹의 비교에서처럼, 세 그룹 이상의 평균을 비교할 때 사용하는 통계분석방법도 3가지 뿐입니다. 그리고 고르는 방법도 아래 그림처럼 동일한 순서도를 가집니다. 앞장과 유사한 방법으로 진행하면 되겠죠?! 사실..
2018.12.15 -
두 그룹의 평균을 비교하기
두 그룹의 평균을 비교하기 두 그룹의 평균을 비교하는 일은 거창한 연구가 아니더라도, 정말 자주 활용하는 통계분석입니다. 하지만 이것 마저도 처음에는 쉽지 않죠. 저는 오히려 이것까지만 제대로 따라오시면 나머지도 쉽다고 말씀드리고 싶군요. 두 그룹의 평균을 비교하는 통계분석 방법은 전세계에 딱 3개만 있다고 생각하시면 됩니다. 그중 하나가 t-test고요. 다음 하나는 Wilcoxon rank-sum test , 마지막 하나가 Welch’s test입니다. 다른 통계책을 함께 펼쳐 놓고 공부하다가 Mann-Whitney U test와 Mann Whitney-Wilcoxon(MWW) test라는 이름의 분석 방법을 만나실 수도 있는데요. 이 방법들은 모두 Wilcoxon rank-sum test랑 같은 분..
2018.11.19 -
생존분석(LogRankTest와CoxRegressionTest) - 깜신의 통계 왕초보 탈출 42탄
안녕하세요.깜신 김종엽입니다. 앞 영상에서는 생존분석 결과를 그래프로 미리 살펴봤습니다.물론, 그래프만으로도 결과를 우리는 충분히 유추할 수 있죠.하지만, P value와 Hazard Ratio, 95%신뢰구간이 없으면 뭔가 허전하잖아요?!논문으로 출판할 수도 없고요. 이번 시간에는 그래서Log Rank Test와 Cox Regression Test를 이용해서 해당 통계값들을 찾아보도록 하겠습니다.그럼 여러분의 통계 공부에 포스가 함께 하길 바랍니다.
2018.09.27 -
생존분석결과 그래프로 나타내기 - 깜신의 통계 왕초보 탈출 41탄
안녕하세요.깜신 김종엽입니다. 이번 영상에서는 생존분석결과를 그래프로 그리는 방법을 알아보도록 하겠습니다.생존분석 결과는 실제로 생존을 분석한 경우와 질병의 유병률을 비교하는 경우가 조금 다른데요. 생존분석의 경우는 처음에는 모두 생존해 있는 상태에서 사망하는 환자가 발생하면서 그래그가 점차 감소하는 방향으로 그려지지만유병률 분석에 있어서는 처음에는 모두 질병이 없는 상태에서 시작해서 유병률이 점차 늘어나는 방향으로 그래프가 그려지기 때문이죠 이해 못하셔도 상관 없습니다. 이번 영상을 보시면 모두 쉽게 이해하실테니까요.바로 시작하죠.여러분의 학습에 포스가 함께 하길 빕니다..
2018.09.16 -
생존분석 개념 따라잡기 - 깜신의 통계 왕초보 탈출 40탄
안녕하세요. 깜신 김종엽입니다. 이번 영상에서는 생존분석의 개념에 대해 알아보려고 합니다.언뜻 생각하면, 생존분석은 생존과 사망에 대한 결과만을 비교하는 분석법으로 여기기 쉽습니다. 하지만 그렇지 않죠.특정 조건에서 특정 질환의 유병률을 비교하는 것 또한 생존분석으로 가능한 일입니다. 그래서 암 관련 연구를 하시는 분뿐 아니라, 다양한 임상과에서 적용이 가능합니다.특히, 카이제곱분석과는 달리 많은 교란 변수를 통제할 수 있어서더욱 신뢰할 수 있는 결과를 만들어주죠. 이번 영상에서는 먼저 생존분석의 개념부터 설명드리려고 합니다.이후 2개의 영상을 더 만들어 생존분석 그래프를 그리는 방법과 통계값을 구하는 방법에 대해 알려드리겠습니다. 그럼 오늘도 화이팅입니다.아자아자~
2018.09.08