XMLを操作するための仕様

■チェック用語

・XMLパーサ(XML Parser)
      「XMLプロセッサ」ともいいます。
      XML文書の妥当性をチェック(DTDなどのスキーマ言語に沿って
      内容が正しいかを検証など)したり、扱いやすい階層構造に文書を展開
      する処理をおこなうXML処理エンジンのことです。
      XMLパーサは、XMLを読み込んで処理をする場合に必要となり
      ます。

・DOM(Document Object Model)
      「ドム」と読みます。
      XMLバーサにアクセスするためのAPIのひとつです。
      W3Cで制定されました。

      XML文書を「DOMツリー」と呼ばれるツリー構造として扱います。
      メモリ上に「DOMツリー」をおき、これにアクセスしたり、要素を
      追加、削除したりといったことをランダムにおこないます。

・SAX(The Simple API for XML)
      「サックス」と読みます。
      XMLバーサにアクセスするためのAPIのひとつです。
      DOMと異なり、W3Cではなく、草の根の運動(メーリングリストに
      よる議論により考案)によって開発されました。

      SAXはDOMと異なり、文書を先頭から順に読み込んでいき、そこで
      発生したイベントを経由して情報をアプリケーションに通知します。

■補足
「DOM」と「SAX」は、それぞれの長所、短所をもっているので使いわけ
が必要です。

「DOM」は「DOMツリー」をメモリ上にとるので、大きなXML文書に
なれば、それだけメモリもたくさん必要になります。
メモリを少なく使いたい時には、「SAX」を使います。

「SAX」は順次アクセスしますが、「DOM」はランダムアクセスができる
ので、要素をランダムに追加、削除したり、XMLデータの構造を大きく変え
たいときには、「DOM」が向いています。

またアクセスのタイミングとしては、「DOM」は、「DOMツリー」が
つくられてから(データを全部読み込んだ後)になりますが、
「SAX」はデータを読みながら、その都度になります。

■まとめ
「XML」とは、「W3C」よりインターネットの標準として勧告された
「メタ言語」(言語をつくる言語)です。
XMLによって作られた言語を用いて作成された文書やデータのことを
「XML文書」といいます。

XMLのタグを書き分けるための方法を「XML名前空間」といいます。

XMLにおける「スキーマ」は、XML文書のデータ構造のことで、
スキーマを記述するための言語を、「スキーマ言語」といいます。
主なXML用のスキーマ言語には、「DTD」、「XML Schema」
などがあります。

異なるスキーマの間でデータ交換したいときに用いるのが「XSLT」です。

「XMLパーサ」は、XMLを読み込んで処理をする場合に必要となります。
XMLバーサにアクセスするためのAPIには、「DOM」や「SAX」が
あります。

[ Index ] [ Home ]