XMLとは
XMLは、"eXtensible Markup Language"、つまり拡張可能なマークアップ言語のことです。拡張可能とは、マークアップを自由に定義できることをさします。XMLで決まっているのはマークアップの方法のみで、何をどういうマーク(タグ)で示すかは使い手次第です。
XMLはテキストデータです。テキストデータとは、文字コードだけで構成されているデータという意味で、文字コードの種類さえわかえればどのような環境でも利用できます。
コンピュータでデータを扱う上で、常に悩みの種となるのは「データの互換性」でした。特にマシンが非力な場合、データは極力小さく、極力効率よく扱えるようにすることが重要です。従って、データはどうしてもOS固有・アプリケーション固有となってしまいがちです。
しかし、マシンが高速になり、記憶媒体も巨大化した現在、あらゆる環境で使用できること・再利用しやすいことを重視したほうが、結果として効率が良くなります。そこで、テキストデータでさまざまなデータを扱えるような枠組みが誕生しました。これがXMLです。
テキストデータでさまざまな情報を表現する方法の一つがマークアップです。
XMLの場合、タグと呼ばれる特別な文字列でマークをつけます。例えば、1070062が郵便番号であることを示すのに「<postalcode>1070062</postalcode>」や「<郵便番号>1070062</郵便番号>」のように書きます。このとき<postalcode>や<郵便番号>を開始タグ、</postalcode></郵便番号>を終了タグと言います。
このように、印(マーク)をつけることで何かを表現する言語をマークアップ原語(markup language)と言います。
XMLで書かれたデータは、XML文書(XML document)と呼ばれます。”文書”というと、マニュアルや文献、書類などを連想しがちですが、XML文書の場合はモット広い意味で使われています。XMLのベースであるSGML(Standard Generalized Markup Language)は、マニュアルや電子出版用の文書を扱うために設計されました。このため、XMLで表現されるデータは文書であれなんであれ、"文書"や"ドキュメント"と呼ぶ習慣となったようです。
HTMLはWWW(World Wide Web)用に作られた言語で、簡単な文書構造及び表示方法が指定できます。シンプルで扱いやすく、インターネット上で広く普及しています。
XMLは、HTMLで培われたノウハウをいかし、かつより汎用的に利用できることを目指して作られました。HTML例
XML例