엑셀파일 CSV로 변환해서 R로 불러오기



유튜브 영상에 이어 이번에는 강의록을 만들고 있습니다.
통계를 독학 하시는 여러분께 도움이 되었으면 하는 바람입니다.

김종엽


엑셀파일에 데이터를 모두 담아놓았다면, 통계분석을 위해 모아놓은 데이터를 R로 불어오는 과정이 필요하겠죠. 이 과정이 바로 R에 도전하는 많은 연구자가 진입을 포기하는 그 유명한 단계입니다. 다들 이렇게 이야기하던군요. “R은 어찌나 어려운지, 파일 조차 열어볼 수가 없더라고요.” 맞습니다. R에서 데이터를 불러오는 과정은 지금까지 여러분이 사용하던 여러 프로그램과 사뭇 달라 익숙하지 않습니다. 익숙하지 않으면 어렵고요. 위로의 말씀을 드리자면, 절대 여러분 혼자만 여러운 건 아니라는 사실 입니다. 실제로 유튜브에 올려놓은 제 강의 동영상 중에서 가장 많은 조회수를 기록한 강의가 ‘엑셀파일, R로 불러오기’입니다. 그러니 당황하거나 움츠러들지 마시고, 이 챕터를 찬찬히 읽어보시기 바랍니다. 차근차근 따라하시면 절대 어렵지 않습니다. 제가 하면 1분도 안 걸리는 과정인데, 겨우 ’1분’ 거리가 어려우면 얼마나 어렵겠습니까.


엑셀파일 CSV로 변환해서 저장하기

엑셀파일은 R에서 바로 불러올 수 없습니다. 그래서 먼저 엑셀파일을 R에서 이해할 수 있는 파일 형태로 변환해주어야 합니다. R사용자들이 가장 많이 사용하는 파일형태는 CSV와 TXT가 있습니다. CSV는 comma seperated value의 약자로 이름처럼 콤마(,)로 구분해서 적어놓은 값들이 담긴 파일을 말합니다. 확장자가 .csv로 끝나고요. TXT파일은 그래도 익숙하시죠?! 메모장에서 열리고, 윈도우에서 간단한 메모 등을 적어놓을 때 사용하셨을테니까요. 저는 가지고 계신 엑셀파일을 R로 분석하실 때는 CSV파일로 변환하시라고 권해드립니다. 그래서 이 챕터에서는 엑셀파일을 CSV파일로 변환하는 방법만 소개해드릴 겁니다. 대신 TXT 파일을 접하실 경우도 있을거라 생각되어 TXT파일을 R로 불러오는 방법은 챕터 뒷쪽에서 알려드리겠습니다.

먼저, 엑셀파일을 CSV파일로 변환해보도록 하죠. 이번 챕터에서 예제로 사용하는 파일은 sampleData.xlsx입니다. 엑셀에서 해당파일을 열어보시면 아래 그림처럼 보일 겁니다. 먼저 좌측 상단의 ‘파일’ 메뉴를 클릭하도록 하세요.



그럼 아래와 같은 창으로 모습이 바뀔 겁니다. 이번에는 ‘다른 이름으로 저장하기’ 버튼을 클릭하세요.