HTML(エイチティーエムエル)

HTML(エイチティーエムエル、HyperText Markup Language)は、ウェブ上のドキュメントを記述するためのマークアップ言語である。

ウェブの基幹的役割を持つ技術の一つで、HTMLでマークアップされたドキュメントはほかのドキュメントへのハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などの高度な表現力を持つ。

W3Cは、XMLベースの規格であるXHTMLの勧告も行っている。また、2009年10月現在、HTML 5も策定中である。

HTMLの特徴は、ハイパーテキストを利用した、相互間文書参照のフレームワークである。マークアップはプレーンテキストの文書を要素で括って意味付けすることで行い、文書の特定要素にURIを用いた他文書へのリンクを記載しておけば、ユーザエージェントはそれを解釈して指定された他文書を表示させることが可能となる。また、マークアップを施す際に引用や画像の埋め込み、文書のタイトルの指定などを定める要素を記載すれば、ユーザエージェントがそれらを解釈し、形態に見合った表示を行う。HTML はそうしたマークアップの規則を定めている。

マークアップ規則はDTDとして公開され、要素ごとに記載することの出来る属性、内容に含むことの出来る要素などが定められている。2007年4月現在の最新バージョンである XHTML 1.0 では、厳密なもの (Strict)、HTML 3.2からの移行過渡期のためのもの (Transitional)、フレームを用いた文書のためのもの (Frameset) といった3つのDTDが定義されている。

要素は開始タグ、内容、終了タグの3つで構成される。開始タグ・終了タグはそれぞれ |C#V| のように表現される。必要であれば、要素に付加する特性を現す属性を記述してよい。属性は開始タグの中に、要素名に続けて属性名と属性値の組み合わせを記述する。要素名と属性名については大文字小文字を区別しない。属性値については、属性によって大文字と小文字を区別するかどうかが個別に定められる。要素によっては、文脈上一意に特定できる場合は開始タグや終了タグを省略できる。また内容を持たず開始タグのみで構成される空要素も存在する。さらに一部の属性についても属性名の省略が可能となっている。

HTML 3.2 では見た目を左右する要素や属性が追加されたが、HTML は本来文書構造を示すためだけにその存在意義があり、それらの要素は目的に反するものとされた。そのため視覚的・感覚的効果を定義する手段としてスタイルシート(一般にはその中のCSS)が考案された。見た目を左右する要素や属性の一部は、HTML 4以降では非推奨とされており、HTML 4.01 Strictでは定義されていないので使用できない。ただし、非推奨とされず、HTML 4.01 Strictで定義されている要素や属性の一部にも見た目を左右するものがある。装飾的な視覚表現のためにそれらの要素や属性を用いているのであれば、その内容に適する要素を用いた上で、スタイルシートで表現を指定するのが望ましい。

HTML 4.0策定時は、多くの利用者が未対応のブラウザを愛用していたため、スタイルシートによる制作の普及が遅れたものの、2005年の時点でHTML 4.01に対応するブラウザが普及したことで、主要なWebサイトではHTML 4.01に準拠した制作方法に切り替えられている。実際に表現力において、従来のHTML 2.xベースに比べて多彩な表現を可能にしている。
オリジナルのHTML(および多くの関連したプロトコルHTTPなど)はティム・バーナーズ=リーによって、NEXTSTEPの動作するNeXTcubeワークステーション上で開発された。当時のHTMLは仕様ではなく、直面していた問題を解決するためのツール群であった。直面していた問題とは、バーナーズ=リーやその同僚たちがどのように情報や進行中の研究を共有するかということである。彼の成果は後に国際的かつ公開のネットワークの出現として結実し、世界的な注目を集めることになった。

HTMLの初期のバージョンはゆるい文法規則によって定義されており、ウェブ技術になじみのない層に受け入れられる助けとなった。ウェブブラウザウェブページの意図を推測し、レンダリングを実行するのが一般的であった。やがて公式規格においては厳格な言語構文をつくることを志向するようになっていったが、ブラウザにおいては妥当なHTMLからは程遠いページをレンダリングすることがまだ続いている。

HTMLが公式な仕様として定義されたのは1990年代からである。それは従来のマークアップ言語であるSGMLに、インターネットのためのハイパーテキストの機能を取り入れる、というバーナーズ=リーの提案に大きく影響を受けたものだった。

1993年には、IETFからHTML仕様書バージョン 1.0が公開され、SGMLからの拡張として、文法定義のDTDを持つようになった。また1994年にIETFのHTMLワーキンググループが発足した。しかし、2.0以降のIETFの元での開発は他の開発との競合から停滞した。1996年からはW3Cによって、商用ソフトウェアベンダーからの支援も受け、HTMLの仕様が標準化されている。また2000年からは国際標準ともなった(ISO/IEC 15445:2000)。W3Cから公開された最新のHTML仕様はHTML 4.01である。


人気ブログランキングへ

0 件のコメント:

コメントを投稿