깜신의 통계 이야기(61)
-
Power analysis(검정력 분석)에 대한 개념 설명 - 임상시험에서 적정 n수 계산하기
깜신 김종엽입니다.이번 시간에는 드디어 Power analysis에 대해 이야기 나눠보려고합니다.사실, 통계 왕초보 탈출 워크샵의 첫 주제가 바로 검정력 분석, 즉 power analysis였죠. 그런데, 통계 왕초보 분들의 눈높이에 맞춰 설명을 시작하다보니,==> R과 R스튜디오설치부터 ==> 엑셀파일을 CSV파일로 변환하고==> CSV 파일을 R스튜디오로 로딩하는 과정까지말씀드리느라, 정말 돌아돌아 여기까지 왔네요. 이번 시간에는 Power analysis가 무엇인지 왜 필요한거지에 대해 말씀드리려고 합니다.임상시험에서는 늘 실험군과 대조군의 모집이 필요하고,실험군과 대조군의 모집인원에 따라 연구비의 규모가 달라지죠. 가장 이상적인 건, 최소의 인원으로 (통계적으로) 충분히 의미있는 결과를 뽑아내는 ..
2017.05.21 -
CSV파일 R스튜디오로 읽어오기-깜신의 통계 왕초보 탈출 3탄
깜신 김종엽입니다. 이번 시간은 깜신의 통계 왕초보 탈출 3탄! 바로, CSV파일 R스튜디오로 읽어오기입니다. 사실, 윈도우 환경과 같은 그래픽 유저 인터페이스에 익숙하신 분들은,커맨드라인 인터페이스(DOS시절 처럼 커서만 깜빡이는 화면)가 무척 당황스러우실 겁니다.하지만, 적어도 주눅들지는 마세요. 날고 긴다는 석.박사 들도 이런 환경을 처음 접하면 쫄기는 마찬가지입니다. 그래서 다들 파일 읽기 하나가 이렇게 어려우면... 그 다음은 ?!하고, 포기하시죠. 하지만, 이 단계가 가장 어렵고, 오히려 그 다음부터는 조금 쉬워집니다.윈도우 환경에 익숙해지면서 파일 경로를 찾는 과정을 잊어서 그렇지,파일 경로만 다시 찾을 수 있으면, 별반 다를 게 없거든요. 그래서 CSV파일을 읽어들이는 과정만 장장 12분에..
2017.05.20 -
엑셀파일을 CSV파일로 변환하기-깜신의 통계 왕초보 탈출 2탄
깜신 김종엽입니다. 2편에서는 엑셀파일을 CSV파일로 변환하는 방법에 대해 알아보려고 합니다.회계 장부가 필요하다면 엑셀파일이 편하지만,통계를 위해서는 CSV파일이 갑입니다. CSV 파일은 Comma separated values의 약자입니다.1,2,3 이런게 CSV 파일에 담기는 내용의 형식이죠.불필요한 옷을 다 벗기고, 가장 중요한 정보만 담았기 때문에 용량이 무척 작습니다.이번 워크샵을 준비하면서 엑셀파일과 CSV파일의 용량을 비교해보니,동일 데이터 기준으로 60배 가까이 차이가 나더군요. 60기가 데이터라면, 일반 PC에서는 열 수 조차 없는 크기의 데이터이지만,1기가 파일이면, 성능이 괜찮은(?) 일반 노트북에서도 열 수 있는 데이터가 됩니다.그래서 통계 프로그램에서는 CSV 파일을 대부분 활용..
2017.05.18 -
R 및 R-Studio 설치 따라하기 (영상 수업)
깜신 김종엽입니다. ^^ 뜻하지 않게 통계 강의를 시작하게 되었네요.요즘 건양대학교병원 교수님들을 대상으로 오프라인 통계 워크샵을 진행하고 있습니다.해당 영상은 리허설 삼아 작업한 내용이고요.첫 워크샵에 많은 교수님께서 호응해주셔서 아마 후속 워크샵을 계속 준비해야 할 것 같습니다. (웃어야 할지, 울어야 할지...) 함께 공유하면 도움이 될 것 같아, 간만에 블로그질을 시작합니다.후속 강의 주제로 희망하시는 내용이 있으면 댓글로 달아주세요.커리큘럼 구성할 때 참고하도록 하겠습니다.
2017.05.17 -
통계 왕초보를 위한 워크샵 1탄 (R스튜디오를 활용한 Power analysis)
워크샵 진행을 위한 연습용 데이터 파일입니다. 1차 워크샵에서 교육할 코드입니다. ############ csv 파일을 로딩하는 코드 ##########################KY
2017.05.16 -
R을 이용해서 정규성 검정을 해보자! -깜신의 통계 이야기 2탄-
임상 시험을 통계적으로 분석할 때 가장 중요한 건, 어떤 통계기법을 사용할 거냐는 문제일 겁니다. 집단 사이의 비교에서도 가장 익숙한 student's t test에서부터 Mann-Whitney U test, Welch's t test 등등 다양한 통계기법이 있기 때문에 통계 초심자는 처음부터 주눅이 들기 마련이거든요. 그래서 실은 "이런 상황에서는 어떤 통계기법이 적당할까요? 우리 함께 찾아보아요." 형식의 글을 준비하고 있었습니다. 그런데 그 전에 정규성 검정과 등분산 검정 요령에 대해서는 먼저 설명해 드려야겠더군요. 집단의 관찰치값이 정규성 분포를 하느냐, 집단들이 서로 동일한 분산을 갖고 있느냐에 따라 통계기법 선택이 달라지기 때문입니다. 오늘은 그중 R을 이용해서 정규성을 검정하는 방법을 알아보..
2013.08.05