글자 깨짐·인코딩 문제와 대처법

CSV 글자 깨짐의 원인과 UTF-8로 바꿔 해결하는 방법을 설명합니다.

글자 깨짐이란

CSV는 텍스트 파일이므로, 어떤 문자 코드(인코딩)로 저장됐는지가 중요합니다. 파일을 “다른 문자 코드로” 열면 글자가 읽기 어려운 기호나 □로 바뀝니다. 이를 흔히 “글자 깨짐”이라고 합니다.

자주 있는 원인

EUC-KR로 저장된 파일을 UTF-8로 열기(또는 그 반대)

한국어 Windows에서는 엑셀에서 “CSV(쉼표로 분리)”로 저장하면 많은 경우 EUC-KR(CP949)이 됩니다. 반면 웹이나 최신 시스템은 UTF-8을 쓰는 경우가 많습니다. EUC-KR 파일을 UTF-8로 열면 한글이 깨지고, UTF-8 파일을 EUC-KR로 열어도 마찬가지로 깨집니다.

BOM 유무

UTF-8에는 “BOM(Byte Order Mark) 있음”과 “BOM 없음”이 있습니다. 엑셀은 UTF-8 BOM 있는 파일이 아니면 UTF-8 CSV를 제대로 인식하지 못하는 경우가 있습니다. BOM 없는 UTF-8을 엑셀으로 열면 앞부분이 깨지거나 열 구분이 틀어질 수 있으므로, 엑셀에서 열 목적이면 UTF-8 BOM으로 저장하는 것이 안전합니다.

대처 순서

  1. 원본 문자 코드 확인: 파일이 EUC-KR로 저장됐는지, UTF-8인지, 다른 형식인지 확인합니다. 이 사이트의 형식·기본 검사에서는 올린 CSV의 문자 코드를 자동 감지해 표시합니다.
  2. 목적에 맞는 형식으로 변환: 대부분 UTF-8(BOM 있음)으로 변환하면 엑셀과 웹 모두에서 다루기 쉽습니다. 글자 깨짐 복원 도구는 감지한 문자 코드로 다시 읽고, UTF-8 BOM으로 다운로드합니다. 파일은 서버로 보내지 않고 브라우저 안에서만 처리됩니다.
  3. 변환 후 다시 검사: 변환한 뒤 형식·기본 검사단일 검사를 돌려 문자 코드가 UTF-8로 맞는지, 내용에 문제가 없는지 확인할 수 있습니다.

어떤 문자 코드를 쓸지

정리

글자 깨짐은 “저장할 때의 문자 코드”와 “열 때의 문자 코드”가 다를 때 발생합니다. CSV 체커에서는 글자 깨짐 복원으로 원본 문자 코드를 감지하고, UTF-8 BOM으로 변환해 다운로드할 수 있어, 데이터를 밖으로 보내지 않고도 안전하게 해결할 수 있습니다. CSV 오류 가이드에서도 글자 깨짐을 포함한 대표 오류를 정리해 두었습니다.

홈으로 · 글자 깨짐 복원 도구 사용