CSV란?
쉼표로 구분해 데이터를 담는 텍스트 형식의 기초와 업무에 도움 되는 포인트를 정리합니다.
CSV의 기본
CSV(Comma-Separated Values)는 쉼표로 구분된 텍스트 형식 데이터 파일입니다. 한 줄이 한 레코드이고, 각 열은 쉼표로 구분되며, 보통 첫 줄이 헤더(열 이름)로 쓰입니다.
CSV 예시
id,name,email 1,홍길동,hong@example.com 2,김영희,kim@example.com
이처럼 표 형태 데이터를 그대로 텍스트로 표현할 수 있어, 엑셀·DB·웹 앱 간 데이터 전달에 많이 쓰입니다.
CSV의 장점
- 호환성: OS·앱에 관계없이 열기 쉽고, 시스템 간 연동의 표준 형식 중 하나입니다.
- 가벼움: 바이너리보다 용량이 작아 메일 첨부나 배치 처리에 적합합니다.
- 가독성: 텍스트 에디터로 열 수 있어 확인·간단 수정이 쉽습니다.
구분자에 대해
이름처럼 쉼표(,)가 쓰이지만, 지역·앱에 따라 세미콜론(;)이나 탭을 쓰는 경우도 있습니다. CSV 체커에서는 구분자 자동 감지와 수동 지정이 가능합니다.
문자 코드(인코딩)
CSV는 텍스트 파일이므로 문자 코드 설정이 중요합니다. 한국어에서는 주로 다음이 쓰입니다.
- UTF-8: 국제적으로도 표준. BOM을 붙이면 엑셀에서도 잘 열립니다.
- EUC-KR / CP949: 한국 업무 시스템에서 자주 쓰입니다. 엑셀 저장 시 이 형식이 되는 경우가 많습니다.
문자 코드가 맞지 않으면 깨짐이 납니다. 자세한 내용은 글자 깨짐·인코딩 문제를 참고하세요.
CSV와 엑셀의 차이
엑셀(.xlsx)은 셀·서식·수식·여러 시트 등을 가진 바이너리 형식입니다. CSV는 “순수 텍스트 표 데이터”에만 집중하며, 서식은 없고 1파일=1시트 정도로 보면 됩니다. 데이터 전달·가져오기에는 CSV가 많이 쓰이며, CSV와 엑셀의 차이에서 비교해 두었습니다.
CSV에서 주의할 점
- 중복 ID: 같은 ID가 여러 행에 있으면 DB 등록·매칭에서 오류가 납니다. 중복 데이터 찾기를 참고하세요.
- 보이지 않는 문자: 복사·다른 시스템에서 가져온 데이터에 보이지 않는 제어 문자가 섞일 수 있습니다. CSV 오류 가이드에서 대처법을 설명합니다.
- 열 개수 불일치: 행마다 열 개수가 다르면 가져오기 시 오류가 나기 쉽습니다. 형식·기본 검사로 미리 확인할 수 있습니다.