整形式XML文書
XMLには守らなければならない最低限のルールがあります。XMLとしての体裁が整っている文書を整形式XML文書(well-formed XML document)と言います。
XMLは「タグ」を使ってデータを表現します。この「タグ」は、自由に使うことができますが、開始タグと終了タグが必要です。
@ 開始タグと終了タグで示された部分を「要素(element)」と言う
A 開始タグと終了タグにはさまれた部分を「内容(content)」と言うただし、内容(開始タグと終了タグに挟まれた部分)が何もない場合に限り<name />のように書くことができます。これを空要素と言います。
要素の中に要素を書くことができます。要素の中にある要素を「子要素」、子要素の外側にあるものを「親要素」と言います。要素は、子、孫、ひ孫、・・・・というようにいくつも作っていくことがdきますが。XMLデータ全体は1つの要素を親とする"木"のような形になっている必要があります。
文書全体の親となる要素は「ルート要素(root要素)」と呼ばれます。
XMLは、Internet ExplolerなどXMLに対応したソフトウェアで表示することができます。XMLデータが整形式になっていない場合は、エラーになります。
Internet Explolerはバージョン5.0以降XMLに対応しており、XMLデータを開くと文書がツリーで表示されます。
Internet ExplolerでXML文書を開いた時、整形式になっていないと、エラーになります。
W3CによるXML仕様書では、XMLの文法を定めると共に、XMLを処理するプログラムがどのように動作すべきかも規定されています。例えば、エラーにはerrorとfatal error(致命的なエラー)の2種類があり、errorの場合はそのまま処理を続行しても構わないが、fatal errorの場合は処理を中断しなくてはならない、と規定されています。XMLが整形式(well-formed)であることに関しては「違反している場合はfatal errorとして扱うこと」とあります。従って、XMLを処理するプログラムは、指定されたデータが整形式に反していたならばfatal errorとして処理を中断しなくてはなりません。