Institut für Computersprachen
Programmiersprachen und Übersetzer
| Diplomarbeit | |
| Titel | Attributvisualisierung in HTML 4.0 Dokumenten |
| Autor | Hansen, Christian |
| Erscheinungsjahr | 1999 |
| Inventardatum | 28.10.1999 |
| Abstract | Am 18. Dezember 1997 wurde die Version 4.0 der Sprache HTML (Hyper Text Markup Language) veröffentlicht. Diese Sprache dient zur Verfassung von Seiten, die im World Wide Web dargestellt werden können. Ein geeigneter user agent, auch Browser genannt, interpretiert den HTML-Text und stellt die darin enthaltenen Informationen im definierten Stil dar. Inhalt und Informationen der Seite sind dabei von der konkreten Darstellung und dem Stil getrennt. Die Sturkturinformation in HTML-Dokumenten ist im sogenannten Markup - deutlich vom Text getrennten Informationselementen - enthalten. Die Struktur von HTML Dokumenten ist in einer Document Type Definition (DTD) festgehalten, die die erlaubten Elemente und die Reihenfolge der Elemente definiert. Eine häufige Aufgabe für Web-Designer ist es, nicht selbst erstellte Seiten zu analysieren und zu warten. Ein essentieller Teil dabei ist die Untersuchung der Attribute des Markup. Durch die Verwendung von nicht Standard-konformen Editoren und Konvertierungsprogrammen, sowie Unterschieden in den Browsern wird die Analyse erschwert. Sinnvoll ist es daher, die Attribute des Markup im Inhalt des Dokuments an einer geeigneten Stelle sichtbar zu machen und daher gezielt die Wirkung der Attribute feststellen zu können. In dieser Arbeit wird daher ein Verfahren präsentiert, das HTML-Dokumente automatisch analysieren und so umwandeln kann, dass die Attribute sichtbar sind. Zu diesem Zweck werden die Programme Lex, Yacc und Ox verwendet, die die lexikalische und syntaktische Anaylse ermöglichen. Ein Perl-Programm analysiert die DTD und erzeugt daraus automatisch eine Spezifikation für Lex und eine Grammatik für Yacc und Ox. Dadurch ist die Erstellung der Grammatik weitgehend unabhängig von Änderungen am HTML-Standard. Diese Arbeit präsentiert die Grundlagen von HTML und lexikalischer und syntaktischer Analyse und erläutert die DTD und die erzeugten Spezifikationen und Grammatiken. Abschließend werden Beispiele von bearbeiteten HTML-Dokumenten präsentiert. |
| Status | Verfügbar |