의학통계(10)
-
R스튜디오 연습을 위한 예제 데이터 파일 읽어들이기 - 깜신의 통계 왕초보 탈출 7탄
깜신 김종엽입니다. 통계 공부를 처음 시작하면, 배운 내용을 요리조리 돌려보고 싶은데막상 손 안에는 아무 데이터도 없죠.이건 통계 공부를 시작하는 모든 분이 동일하게 경험하는 과정입니다.그래서 R-studio 개발자들은 패키지를 개발하면서실습용 데이터를 패키지 안에 몇 개 담아서 배포하기 시작했습니다.패키지를 사용하기 전에 실습용 데이터로 충분히 연습해보라는 배려죠. 대표적인 실습용 데이터로는 Iris, Car, Titanic 등이 있습니다만,제가 오늘 소개해드릴 실습용 데이터는 'acs' 입니다. 이 데이터셋은 문건웅 교수님께서 '의학논문 작성을 위한 R통계와 그래프'라는 책을 쓰시면서함께 개발한 moonBook 패키지에 포함되어 있는데요. 다른 데이터셋과는 달리, 관상동맥질환 환자들의 데이터여서의학통..
2017.06.06 -
두 그룹 사이의 평균 비교 개념 설명 -깜신의 통계 왕초보 탈출 6탄
깜신 김종엽입니다. 이번 시간에는 통계의 가장 기본!두 그룹간의 결과값이 서로 차이가 있는지 없는지 알아 보려고 합니다. 일반적인 임상시험에서는 늘 실험군과 대조군을 비교하죠.사실 어떤 연구를 하더라도 기본적으로 두 그룹의 나이는 비교하죠.나이는 특히나 임상 연구에 있어서는 대표적인 혼란변수이기 때문입니다.혼란변수라는 건 연구자가 비교하고자 하는 결과값(이를테면, 콜레스테롤 수치값은)에 영향을 미칠 수 있는 요인이라는 의미입니다. 실험군과 대조군 사이에 콜레스테롤 수치가 차이를 보이더라도, 두 그룹 사이에서 나이 또한 차이를 보인다면콜레스테롤의 차이가 실험군과 대조군 사이의 조건(투약 종류)에 따른 차이인지 나이 차이에 따른 건지 알 수가 없는 거죠. 그래서 임상논문들을 보면, 늘 첫 번째 테이블은 실험..
2017.06.05 -
Power analysis(검정력 분석) 따라하기 -깜신의 통계 왕초보 탈출 5탄
깜신 김종엽입니다.이번 시간에는 R스튜디오에서 Power analysis(검정력 분석)을 직접 따라하며 배워보도록 합니다. 긴장하거나, 걱정하실 필요 전혀 없습니다.'CSV파일 읽어들이기' 수업에서 이야기했던 것처럼오히려 그 수업보다 오늘 수업이 더 쉬우실 거에요. 만약, 포털이나 구글검색 등을 통해 이 강의로 바로 들어오신 연구자라면,당황하지 마시고, 앞 강의부터 순서대로 따라오세요~ ^^
2017.05.22 -
엑셀파일을 CSV파일로 변환하기-깜신의 통계 왕초보 탈출 2탄
깜신 김종엽입니다. 2편에서는 엑셀파일을 CSV파일로 변환하는 방법에 대해 알아보려고 합니다.회계 장부가 필요하다면 엑셀파일이 편하지만,통계를 위해서는 CSV파일이 갑입니다. CSV 파일은 Comma separated values의 약자입니다.1,2,3 이런게 CSV 파일에 담기는 내용의 형식이죠.불필요한 옷을 다 벗기고, 가장 중요한 정보만 담았기 때문에 용량이 무척 작습니다.이번 워크샵을 준비하면서 엑셀파일과 CSV파일의 용량을 비교해보니,동일 데이터 기준으로 60배 가까이 차이가 나더군요. 60기가 데이터라면, 일반 PC에서는 열 수 조차 없는 크기의 데이터이지만,1기가 파일이면, 성능이 괜찮은(?) 일반 노트북에서도 열 수 있는 데이터가 됩니다.그래서 통계 프로그램에서는 CSV 파일을 대부분 활용..
2017.05.18