HTML liegt derzeit in Version 2.0 als Internet-Draft vor. HTML ist eine Anwendung der Standard Generalized Markup Language
(SGML). Sie stellt eine einfache Sprache dar, die zum Aufbau von plattformunabhängigen
Hypertext-Dokumenten dient.
Dazu werden in den Orginaltext der einzelnen Dokumente sogenannte Tags (Marken) eingefügt. Bis auf wenige Ausnahmen
treten Tags paarweise auf, d.h. ein Starttag und ein Endtag. Das durch das Starttag gesetzte Attribut gilt für den Text
vom Starttag bis zum Endtag. Ein Starttag hat die Form <MARKE>
und ein Endtag die Form <\MARKE>
. Entfernt man in einem
HTML-Dokument alle Tags, so erhält man den ursprünglichen Rohtext (gilt für den Body-Teil).
Die geforderte Struktur eines HTML-Dokuments schreibt eine Zweiteilung in einen Kopf- (Head) und einen Rumpfteil (Body) vor.