CSVとExcelの違い
形式の違いと、データの受け渡し・チェックで気をつけたいポイントをまとめます。
形式の違い
CSV(Comma-Separated Values)は、カンマなどで区切られたプレーンテキストのデータ形式です。1行が1レコード、列は区切り文字で分かれており、書式(色・フォント・数式)や複数シートは持たず、データそのものだけが格納されます。
Excel(.xlsx)は、Microsoft Excel用のバイナリ形式です。セルごとの書式・数式・グラフ・複数シート・画像などを含むことができ、人間が表計算ソフトで編集・閲覧する用途に最適化されています。
いつCSVを使うか
- システム間のデータ受け渡し:DBのインポート/エクスポート、バッチ処理の入力ファイル、APIとの連携などでは、CSVが指定されることが多いです。
- 汎用性:テキストなので、OSやアプリに依存せず開けます。Excelが入っていない環境でも編集・チェックが可能です。
- 軽量・シンプル:同じデータ量なら、.xlsxよりCSVの方がファイルサイズが小さく、処理も単純です。
「Excelで編集した表を、別システムに取り込む」という流れでは、Excelで「CSV(カンマ区切り)」や「CSV UTF-8」で保存し、そのCSVを当ツールでチェックしてから渡すと、文字化けや列ずれを防げます。
ExcelでCSVを保存・開くときの注意
保存時
Excelの「名前を付けて保存」で「CSV(カンマ区切り)(*.csv)」を選ぶと、多くの環境ではShift_JISで保存されます。UTF-8で渡したい場合は「CSV UTF-8(コンマ区切り)(*.csv)」を選ぶと、UTF-8 BOM付きで保存され、他システムや当ツールでそのまま扱いやすくなります。詳しくは文字化け・エンコーディングのトラブルを参照してください。
開く時
UTF-8(BOMなし)のCSVをExcelでそのまま開くと、先頭が文字化けしたり列がずれたりすることがあります。当ツールの文字化け復元でUTF-8 BOMに変換してからExcelで開くと、正しく表示されやすいです。
先頭のゼロが消える
Excelは「数値」と判断したセルでは、先頭のゼロ(例:0123)を省略して表示します。CSVに書き出したときも 123 になることがあるため、会員番号やコードで先頭ゼロが必要な場合は、Excel側で列を「文字列」にしておくか、CSVで確認・修正する必要があります。CSV単体チェックでは、そのような問題も検出の対象にしています。
CSVにできないこと(Excelならできること)
CSVは「テキストの表データ」だけなので、次のようなものは含めません。
- 数式(計算結果の値だけがCSVには出る)
- セルの色・罫線・フォント
- 複数シート(1ファイル=1シート分のデータのみ)
- グラフ・画像
データの受け渡しや検証が目的ならCSVで十分なことが多く、書式や数式まで必要な場合はExcelのまま扱うか、必要に応じてCSVとExcelを使い分けるとよいです。
まとめ
CSVは「データだけのシンプルなテキスト形式」、Excelは「表計算・書式・複数シートまで含む形式」です。データ連携やチェックにはCSVが向いており、CSVとはやCSVエラーガイドとあわせて、正しい文字コード・区切り・重複の有無を確認してから使うと安全です。