Dreamweaver TechniqueJAVA Script サンプル | CSS sample | JAVA Applet sample | Flash Sample
HTML4.0 riference | DynamicHTMLXHTML | XML sample | XSLT sample | RIKO's ASP Trial

XMLでの日本語使用

XMLでは、Unicodeで定義されている文字を使用することができ、デフォルトの文字コードはUTF-8です。それ以外の文字コードを使用したい場合は、"XML宣言"で指定します。

■ XMLでの日本語使用

XMLはUTF-8を使用することを前提としています。しかし、UTF-8は比較的新しい規格で、Windowsのメモ帳(notepad)や古くからあるエディタ、ワープロソフトなどはシフトJISという文字コードを使用しています。

XMLでシフトJISを使う場合は、XML宣言で「encoding="shift_jis"」を指定します。
なお、日本語EUC(UNIX系システムで利用されている文字コード)の場合は、「encoding="euc-jp"」と指定します。

<? xml version="1.0" encoding="shift_jis" ?>
    <氏名>山本圭子</氏名>

コンピュータは、あらゆるデータを0と1で処理していますが、文字についても同様です。具体的には、Aという文字は65、Bという文字は66・・・・・のような番号を振って管理しています。これを文字コードと言います。
英語圏で一般的に使われているのはASCIIコードで、アルファベットと記号が使用できます。日本で使われる文字k、つまり、ひらがなや幹事用の文字コードにはシフトJISや日本語EUCがあります。
世界にはさまざまな文字があります。世界中の主要な文字を一括して扱うことを目指して作られた規格がISO/IEC 10646(いわゆるUnicode)です。ISO/IEC 10646では、文字の種類がリストアップされています。書く文字に対し、どのようなコードをつけるか決めたものがUTF-8及びUTF-16です。通常、XMLのデータファイルにはUTF-8を使用します。

<<<戻る

R HOUSE | RIKO's Trial Page | Shirley's Pettit Case | Shirley's i-box | Shirley's little box