김종엽(88)
-
강의록이 드디어 책으로 나왔습니다. : )
여러분의 응원과 격려 덕분에 강의록을 묶어, 책으로 펴냈습니다. 강의를 보실 때, 책을 옆에 펼쳐두시면 공부 효율이 배~가 될 거에요. ^^ 출간을 도와준 싸이언스북스에 감사하며, 구독자 분들의 많은 관심과 주위에 홍보 및 구매 독려 부탁드리겠습니다~ 깜신 김종엽 드림
2021.11.10 -
국민건강영양조사(국건영) 공공의료빅데이터 분석 실습 - 깜신의 통계 왕초보탈출 44탄
국건영 데이터 슬쩍 맛보기 - 깜신의 통계 왕초보탈출 44탄 한동안의 공백기를 깨고, 다시 데이터과학과 관련한 포스팅을 시작합니다. 뜻하지 않은 코로나19 사태로 말미암아 매우 힘든 시간을 보내고 있는데요. 지친 일상을 이겨내는데, 남 돕는 일만한 게 없는 것 같아요. 의료빅데이터 연구를 시작하시는 많은 분께 미력하나마 도움이 되었으면 합니다. : ) 아래 파일은 질병관리본부(이하 질본)에서 연구자들에게 무료로 분양 중인 국민건강영양조사(이하 국건영) 공공의료데이터를 여러분의 노트북 사양 정도에서 편하게 실습하실 수 있도록 랜덤샘플링을 통해 일부만 추린 파일입니다. 깜신 김종엽 드림.
2020.06.30 -
R마크다운을 활용한 Reproducible research 2019.04.25
-
세 그룹 이상의 평균을 비교하는 방법 - 깜신의 통계 왕초보탈출
세그룹 이상의 평균을 비교하는 방법 김종엽 ANOVA라는 이름, 왠지 익숙하신가요? 학부 시절 커리큘럼에 통계 관련 과목이 하나만 있었어도 여러분은 틀림없이 이 단어를 배우셨을 겁니다. 활용 빈도 또한 무척 높죠. 사실 앞 챕터에서 알아봤던 두 그룹의 평균 비교는 논문을 작성할 때 실험군과 대조군의 나이 등을 비교하면서 자연스럽게 녹아들어가고, 실제로 결과 제출에 이용되는 분석 방법은 이 장에서 소개할 세 그룹 이상의 평균 비교부터일 겁니다. 앞장을 잘 이해하셨다면, 절대 어렵지 않습니다. 일단, 두 그룹의 비교에서처럼, 세 그룹 이상의 평균을 비교할 때 사용하는 통계분석방법도 3가지 뿐입니다. 그리고 고르는 방법도 아래 그림처럼 동일한 순서도를 가집니다. 앞장과 유사한 방법으로 진행하면 되겠죠?! 사실..
2018.12.15 -
두 그룹의 평균을 비교하기
두 그룹의 평균을 비교하기 두 그룹의 평균을 비교하는 일은 거창한 연구가 아니더라도, 정말 자주 활용하는 통계분석입니다. 하지만 이것 마저도 처음에는 쉽지 않죠. 저는 오히려 이것까지만 제대로 따라오시면 나머지도 쉽다고 말씀드리고 싶군요. 두 그룹의 평균을 비교하는 통계분석 방법은 전세계에 딱 3개만 있다고 생각하시면 됩니다. 그중 하나가 t-test고요. 다음 하나는 Wilcoxon rank-sum test , 마지막 하나가 Welch’s test입니다. 다른 통계책을 함께 펼쳐 놓고 공부하다가 Mann-Whitney U test와 Mann Whitney-Wilcoxon(MWW) test라는 이름의 분석 방법을 만나실 수도 있는데요. 이 방법들은 모두 Wilcoxon rank-sum test랑 같은 분..
2018.11.19 -
엑셀파일 CSV로 변환해서 R로 불러오기
엑셀파일 CSV로 변환해서 R로 불러오기 유튜브 영상에 이어 이번에는 강의록을 만들고 있습니다.통계를 독학 하시는 여러분께 도움이 되었으면 하는 바람입니다.김종엽 엑셀파일에 데이터를 모두 담아놓았다면, 통계분석을 위해 모아놓은 데이터를 R로 불어오는 과정이 필요하겠죠. 이 과정이 바로 R에 도전하는 많은 연구자가 진입을 포기하는 그 유명한 단계입니다. 다들 이렇게 이야기하던군요. “R은 어찌나 어려운지, 파일 조차 열어볼 수가 없더라고요.” 맞습니다. R에서 데이터를 불러오는 과정은 지금까지 여러분이 사용하던 여러 프로그램과 사뭇 달라 익숙하지 않습니다. 익숙하지 않으면 어렵고요. 위로의 말씀을 드리자면, 절대 여러분 혼자만 여러운 건 아니라는 사실 입니다. 실제로 유튜브에 올려놓은 제 강의 동영상 중에..
2018.10.26