본문 바로가기

깜신의 통계 이야기

R스튜디오 연습을 위한 예제 데이터 파일 읽어들이기 - 깜신의 통계 왕초보 탈출 7탄



깜신 김종엽입니다.


통계 공부를 처음 시작하면, 배운 내용을 요리조리 돌려보고 싶은데

막상 손 안에는 아무 데이터도 없죠.

이건 통계 공부를 시작하는 모든 분이 동일하게 경험하는 과정입니다.

그래서 R-studio 개발자들은 패키지를 개발하면서

실습용 데이터를 패키지 안에 몇 개 담아서 배포하기 시작했습니다.

패키지를 사용하기 전에 실습용 데이터로 충분히 연습해보라는 배려죠.


대표적인 실습용 데이터로는 Iris, Car, Titanic 등이 있습니다만,

제가 오늘 소개해드릴 실습용 데이터는  'acs' 입니다.


이 데이터셋은 문건웅 교수님께서 '의학논문 작성을 위한 R통계와 그래프'라는 책을 쓰시면서

함께 개발한 moonBook 패키지에 포함되어 있는데요.


다른 데이터셋과는 달리, 관상동맥질환 환자들의 데이터여서

의학통계를 주로 다루시는 연구자에게는 더할 나위 없이 익숙한 구조하는 점입니다.


변수를 살펴보면, 나이,성별부터, 진단명과, 키, 몸무게, 콜레스테롤 수치까지 포함되어 있죠.

문제는 패키지에 담아서 배포해준다해도, 찾아서 읽어들이지 못하면 무용지물입니다.


그래서 이번 동영상 강의에서는 패키지 안에 들어 있는 데이터셋을 

읽어들일 수 있도록 따라하기 방식으로 안내해드리려고 합니다.


늘 포스가 함께하길 빕니다.




*해당 패키지의 사용과 강의 자료로써의 활용에 대해서는 문건웅 교수님과 한나래아카데미 출판사에서 사전 동의를 구했음을 밝힙니다.