← |
2024年11月 |
→ |
日 |
月 |
火 |
水 |
木 |
金 |
土 |
|
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
|
26 |
27 |
28 |
29 |
30 |
|
RFC 4180 Common Format and MIME Type for Comma-Separated Values (CSV) Files |
・カンマ区切りデータファイルの標準フォーマットとMIMEタイプ
ごくごく普通のRFC・・・だが、実はかなり衝撃的なRFC。
このRFCで定義されているのは、ExcelやLotus1-2-3等、いわゆる表計算やデータベースなどと言われるソフトで、長い間サポートされているCSVフォーマットの標準フォーマット。
と書くと、なんだ普通じゃんと思う人が多いかもしれない。
しかし、このCSVフォーマットは非常に曖昧なフォーマットで、「カンマでデータを区切って、改行でレコードを区切るフォーマット」であれば何でもCSVと名乗れる。
なので、たとえば、データ内に改行が存在した場合の回避策は?となると ・データを""で括ったらその中の改行はデータとしての改行と見なす。 ・\nに置き換える。 ・<br>に置き換える。 : といった感じで、様々な亜流が出てくる。そんなんで、CSVフォーマットの標準化が必要になってきたわけです。
で、このRFC。さぞかし昔に定義されていたんだろうと思いきや、去年(2005年)に定義されているんだなこれが。
私自身、CSVフォーマットという言葉を10年以上、もしかするとそれ以上のはるか昔に初めて聞いてから、これまで標準フォーマットがなかったこと自身驚きです。
というわけで、今後は「RFC4180準拠のCSVでデータの交換」と言えば、要らない仕様策定を考えなくて良くなって、便利かもしれない。
ちなみに、Excel-CSVをRFC4180-CSVとして読み込むことは可能ですが、RFC4180-CSVをExcel-CSVとして読み込めない場合があります。
これは、Excel-CSVでは、データ内の改行は必ずLFコードと決まっているらしく、CR-LFコードを入れると、CRコード部分がエクセルで開いたときに未定義文字として表示されます。
別の言い方すると、Excel-CSVでは、2種類の改行コードが混在したテキストファイルってことです。さすがMicrosoftQuality。 #設計した人の気持ちは分からんでも無いが。微妙。 |
01:28, Friday, Jun 30, 2006 ¦ 固定リンク
¦ 携帯
■コメント
■コメントを書く
※コメントの受け付けは終了しました
|
|