통계왕초보(16)
-
R스튜디오 연습을 위한 예제 데이터 파일 읽어들이기 - 깜신의 통계 왕초보 탈출 7탄
깜신 김종엽입니다. 통계 공부를 처음 시작하면, 배운 내용을 요리조리 돌려보고 싶은데막상 손 안에는 아무 데이터도 없죠.이건 통계 공부를 시작하는 모든 분이 동일하게 경험하는 과정입니다.그래서 R-studio 개발자들은 패키지를 개발하면서실습용 데이터를 패키지 안에 몇 개 담아서 배포하기 시작했습니다.패키지를 사용하기 전에 실습용 데이터로 충분히 연습해보라는 배려죠. 대표적인 실습용 데이터로는 Iris, Car, Titanic 등이 있습니다만,제가 오늘 소개해드릴 실습용 데이터는 'acs' 입니다. 이 데이터셋은 문건웅 교수님께서 '의학논문 작성을 위한 R통계와 그래프'라는 책을 쓰시면서함께 개발한 moonBook 패키지에 포함되어 있는데요. 다른 데이터셋과는 달리, 관상동맥질환 환자들의 데이터여서의학통..
2017.06.06 -
두 그룹 사이의 평균 비교 개념 설명 -깜신의 통계 왕초보 탈출 6탄
깜신 김종엽입니다. 이번 시간에는 통계의 가장 기본!두 그룹간의 결과값이 서로 차이가 있는지 없는지 알아 보려고 합니다. 일반적인 임상시험에서는 늘 실험군과 대조군을 비교하죠.사실 어떤 연구를 하더라도 기본적으로 두 그룹의 나이는 비교하죠.나이는 특히나 임상 연구에 있어서는 대표적인 혼란변수이기 때문입니다.혼란변수라는 건 연구자가 비교하고자 하는 결과값(이를테면, 콜레스테롤 수치값은)에 영향을 미칠 수 있는 요인이라는 의미입니다. 실험군과 대조군 사이에 콜레스테롤 수치가 차이를 보이더라도, 두 그룹 사이에서 나이 또한 차이를 보인다면콜레스테롤의 차이가 실험군과 대조군 사이의 조건(투약 종류)에 따른 차이인지 나이 차이에 따른 건지 알 수가 없는 거죠. 그래서 임상논문들을 보면, 늘 첫 번째 테이블은 실험..
2017.06.05 -
Power analysis(검정력 분석) 따라하기 -깜신의 통계 왕초보 탈출 5탄
깜신 김종엽입니다.이번 시간에는 R스튜디오에서 Power analysis(검정력 분석)을 직접 따라하며 배워보도록 합니다. 긴장하거나, 걱정하실 필요 전혀 없습니다.'CSV파일 읽어들이기' 수업에서 이야기했던 것처럼오히려 그 수업보다 오늘 수업이 더 쉬우실 거에요. 만약, 포털이나 구글검색 등을 통해 이 강의로 바로 들어오신 연구자라면,당황하지 마시고, 앞 강의부터 순서대로 따라오세요~ ^^
2017.05.22 -
CSV파일 R스튜디오로 읽어오기-깜신의 통계 왕초보 탈출 3탄
깜신 김종엽입니다. 이번 시간은 깜신의 통계 왕초보 탈출 3탄! 바로, CSV파일 R스튜디오로 읽어오기입니다. 사실, 윈도우 환경과 같은 그래픽 유저 인터페이스에 익숙하신 분들은,커맨드라인 인터페이스(DOS시절 처럼 커서만 깜빡이는 화면)가 무척 당황스러우실 겁니다.하지만, 적어도 주눅들지는 마세요. 날고 긴다는 석.박사 들도 이런 환경을 처음 접하면 쫄기는 마찬가지입니다. 그래서 다들 파일 읽기 하나가 이렇게 어려우면... 그 다음은 ?!하고, 포기하시죠. 하지만, 이 단계가 가장 어렵고, 오히려 그 다음부터는 조금 쉬워집니다.윈도우 환경에 익숙해지면서 파일 경로를 찾는 과정을 잊어서 그렇지,파일 경로만 다시 찾을 수 있으면, 별반 다를 게 없거든요. 그래서 CSV파일을 읽어들이는 과정만 장장 12분에..
2017.05.20