깜신(217)
-
R마크다운을 활용한 Reproducible research 2019.04.25
-
세 그룹 이상의 평균을 비교하는 방법 - 깜신의 통계 왕초보탈출
세그룹 이상의 평균을 비교하는 방법 김종엽 ANOVA라는 이름, 왠지 익숙하신가요? 학부 시절 커리큘럼에 통계 관련 과목이 하나만 있었어도 여러분은 틀림없이 이 단어를 배우셨을 겁니다. 활용 빈도 또한 무척 높죠. 사실 앞 챕터에서 알아봤던 두 그룹의 평균 비교는 논문을 작성할 때 실험군과 대조군의 나이 등을 비교하면서 자연스럽게 녹아들어가고, 실제로 결과 제출에 이용되는 분석 방법은 이 장에서 소개할 세 그룹 이상의 평균 비교부터일 겁니다. 앞장을 잘 이해하셨다면, 절대 어렵지 않습니다. 일단, 두 그룹의 비교에서처럼, 세 그룹 이상의 평균을 비교할 때 사용하는 통계분석방법도 3가지 뿐입니다. 그리고 고르는 방법도 아래 그림처럼 동일한 순서도를 가집니다. 앞장과 유사한 방법으로 진행하면 되겠죠?! 사실..
2018.12.15 -
두 그룹의 평균을 비교하기
두 그룹의 평균을 비교하기 두 그룹의 평균을 비교하는 일은 거창한 연구가 아니더라도, 정말 자주 활용하는 통계분석입니다. 하지만 이것 마저도 처음에는 쉽지 않죠. 저는 오히려 이것까지만 제대로 따라오시면 나머지도 쉽다고 말씀드리고 싶군요. 두 그룹의 평균을 비교하는 통계분석 방법은 전세계에 딱 3개만 있다고 생각하시면 됩니다. 그중 하나가 t-test고요. 다음 하나는 Wilcoxon rank-sum test , 마지막 하나가 Welch’s test입니다. 다른 통계책을 함께 펼쳐 놓고 공부하다가 Mann-Whitney U test와 Mann Whitney-Wilcoxon(MWW) test라는 이름의 분석 방법을 만나실 수도 있는데요. 이 방법들은 모두 Wilcoxon rank-sum test랑 같은 분..
2018.11.19 -
엑셀파일 CSV로 변환해서 R로 불러오기
엑셀파일 CSV로 변환해서 R로 불러오기 유튜브 영상에 이어 이번에는 강의록을 만들고 있습니다.통계를 독학 하시는 여러분께 도움이 되었으면 하는 바람입니다.김종엽 엑셀파일에 데이터를 모두 담아놓았다면, 통계분석을 위해 모아놓은 데이터를 R로 불어오는 과정이 필요하겠죠. 이 과정이 바로 R에 도전하는 많은 연구자가 진입을 포기하는 그 유명한 단계입니다. 다들 이렇게 이야기하던군요. “R은 어찌나 어려운지, 파일 조차 열어볼 수가 없더라고요.” 맞습니다. R에서 데이터를 불러오는 과정은 지금까지 여러분이 사용하던 여러 프로그램과 사뭇 달라 익숙하지 않습니다. 익숙하지 않으면 어렵고요. 위로의 말씀을 드리자면, 절대 여러분 혼자만 여러운 건 아니라는 사실 입니다. 실제로 유튜브에 올려놓은 제 강의 동영상 중에..
2018.10.26 -
생존분석 개념 따라잡기 - 깜신의 통계 왕초보 탈출 40탄
안녕하세요. 깜신 김종엽입니다. 이번 영상에서는 생존분석의 개념에 대해 알아보려고 합니다.언뜻 생각하면, 생존분석은 생존과 사망에 대한 결과만을 비교하는 분석법으로 여기기 쉽습니다. 하지만 그렇지 않죠.특정 조건에서 특정 질환의 유병률을 비교하는 것 또한 생존분석으로 가능한 일입니다. 그래서 암 관련 연구를 하시는 분뿐 아니라, 다양한 임상과에서 적용이 가능합니다.특히, 카이제곱분석과는 달리 많은 교란 변수를 통제할 수 있어서더욱 신뢰할 수 있는 결과를 만들어주죠. 이번 영상에서는 먼저 생존분석의 개념부터 설명드리려고 합니다.이후 2개의 영상을 더 만들어 생존분석 그래프를 그리는 방법과 통계값을 구하는 방법에 대해 알려드리겠습니다. 그럼 오늘도 화이팅입니다.아자아자~
2018.09.08 -
포아송 회귀분석 따라하기 - 깜신의 통계 왕초보 탈출 39탄
안녕하세요.깜신 김종엽입니다. 이번 포스팅에서는 포아송 회귀분석을 알아봅니다.포아송 또는 푸아송이라고 불리는 회귀분석의 이름은 워낙 이국적이라서 한 번 들어본 분들은 기억 어딘가에 틀림없이 지워지지 않고 남아있을 겁니다. 또한, 활용 빈도도 로지스틱 회귀분석 만큼이나 아주 높고요.로지스틱 회귀분석은 결과가 둘 중 하나로 결정되는 연구에서 사용되었는데요.포아송 회귀분석은 결과가 비율일 때 사용한다는 게 가장 큰 차이점입니다. 예를 들어, 발생률, 사망률 등을 분석할 때 쓰인다는 거죠.보건의료통계에서 얼마나 자주 보일지 감이 오시죠?! 자, 포아송은 로지스틱까지 잘 따라오셨다면 절대 어렵지 않습니다.이번 영상 하나에서 개념설명부터 R스튜디오 따라하기까지 한 번에 보여드리겠습니다.그럼 바로 시작하시죠. 아자아자~
2018.09.03