Hypertextsorten : Definition, Struktur, Klassifikation

Rehm, Georg

Hypertextsorten : Definition, Struktur, Klassifikation

dc.contributor.author	Rehm, Georg
dc.date.accessioned	2023-03-28T12:45:29Z
dc.date.available	2006-01-26T09:34:07Z
dc.date.available	2023-03-28T12:45:29Z
dc.date.issued	2005
dc.description.abstract	Suchmaschinen im WWW indexieren und durchsuchen Dokumente in großer Geschwindigkeit. Trotz der quantitativ beeindruckenden Ergebnisse lässt dieQualität der Treffer jedoch oft zu wünschen übrig. Die vorliegende Arbeitzielt darauf ab, die theoretischen und praktischen Grundlagen für strukturelle Verbesserungen der Funktionsweise von Suchmaschinen zu liefern. Der Schlüssel hierfür liegt in der maschinellen Identifikation von Hypertextsorten. Dieser Begriff bezeichnet den generellen Typ eines WWW-basierten Hypertextes im Sinne eines funktional-thematisch markierten Kommunikats. Hypertextsorten sind -- ebenso wie traditionelle Textsorten -- auf verschiedenen Ebenen von Konventionen gekennzeichnet, die rekurrent in zugehörigen Text- bzw. Hypertextexemplaren beobachtet werden können. Eine Komponente zur maschinellen Erkennung von Hypertextsorten könnte unter anderem im Rahmen einer Suchmaschine Verwendung finden. Ihren Anwendern stünde hierdurch eine weitere Ebene des Zugriffs auf Dokumente zur Verfügung, so dass nach Dokumenten recherchiert werden kann, die die angegebenen Stichwörter enthalten und darüber hinaus den vom Benutzer spezifizierten Hypertextsorten zugehörig sind, z.B. persönliche Homepage, Produktkatalog oder Kochrezept (Kap. 1). Die Arbeit behandelt zunächst die für die Charakterisierung des Begriffs Hypertextsorte benötigten Grundlagen (Teil I), die sich auf die Textlinguistik (Kap. 2) und die linguistischen Spezifika des Konzepts Hypertext stützen (Kap. 3). Anschließend werden die Kerneigenschaften von Hypertextsorten dargestellt (Kap. 4). Teil II erläutert den Rahmenansatz und die Methodologie. In Kap. 5 wird ein Hypertextsortenmodell entwickelt, das sowohl für textlinguistische Analysen als auch für texttechnologische Anwendungen ausgelegt ist und zwischen den drei konzeptionellen Ebenen Hypertextsorte, Hypertextknotensorte und Hypertextsortenmodul differenziert. Kap. 6 stellt die Untersuchungsdomäne der universitären Webangebote vor, für die ein Korpus von etwa vier Millionen HTML-Dokumenten angefertigt wurde, die sich in einer Korpusdatenbank befinden und sowohl manuell -- über eine Web-Oberfläche -- als auch automatisch analysiert werden können (Kap. 7). Teil III umfasst fünf empirische Analysen als exemplarische Anwendungen des Hypertextsortenmodells. Die ersten drei Analysen betreffen die quantitative Auswertung persönlicher Homepages (Kap. 8) und Untersuchungen von Exemplaren der Hypertextsorten private Homepage eines Studierenden (Kap. 9) sowie persönliche Homepage eines Wissenschaftlers (Kap. 10). In Kap. 11 wird die Hypertextknotensorte Einstiegsseite eines universitären Webauftritts anhand von 35 Einstiegsseiten analysiert; es schließt sich eine Untersuchung der 692 Dokumente an, die mittels Hyperlinks referenziert werden. In der fünften Analyse werden 750 zufällig ausgewählte Dokumente ausgewertet (Kap. 12). Mit den beiden abschließenden Untersuchungen wird das Ziel der Sammlung und Identifizierung von Hypertextknotensorten und Hypertextsorten verfolgt. Die Analysen weisen eine Vielzahl von Konventionen nach und belegen die Existenz zahlreicher Hypertextsorten, die nicht nur dem universitären Bereich zuzurechnen sind. Teil IV geht auf die technologischeUmsetzung ein. Kap. 13 präsentiert die Hypertextsortenontologie, die auf der Web Ontology Language basiert und von einem Domänenmodell sowie einerOntologie wissenschaftlicher Themen und Fachgebiete flankiert wird. In diese Ontologie werden die Ergebnisse der empirischen Analysen integriert, wobei auch die Frage der Typologisierung aufgegriffen wird. Die maschinelleIdentifizierung von Hypertextsorten als Grundlage sprachtechnologischerAnwendungen ist Gegenstand von Kap. 14. Ausgehend von einer kritischenBetrachtung der vorliegenden Arbeiten zur automatischen Identifizierung vonWeb-Genres wird eine Architektur mit Komponenten entwickelt, die für diemaschinelle Erkennung von Hypertextsorten benötigt werden, um die im WWWexistenten realen Gegebenheiten der Kommunikation erfassen zu können. DieHypertextsortenontologie fungiert hierbei als Wissensbasis, die dieZusammenhänge zwischen Hypertextsorten, Hypertextknotensorten undHypertextsortenmodulen beinhaltet. Es wird die prototypische Implementierung eines Textparsers für arbiträre HTML-Dokumente vorgestellt, der innerhalb dieser Architektur einen zentralen Stellenwert einnimmt, um die Komponenten der Textoberfläche auf Hypertextsortenmodule abzubilden.	de_DE
dc.identifier.uri	http://nbn-resolving.de/urn:nbn:de:hebis:26-opus-26887
dc.identifier.uri	https://jlupub.ub.uni-giessen.de//handle/jlupub/15972
dc.identifier.uri	http://dx.doi.org/10.22029/jlupub-15354
dc.language.iso	de_DE	de_DE
dc.rights	In Copyright	*
dc.rights.uri	http://rightsstatements.org/page/InC/1.0/	*
dc.subject	Computerlinguistik	de_DE
dc.subject	Linguistik	de_DE
dc.subject	Hypertext	de_DE
dc.subject	Semantic Web	de_DE
dc.subject	Computational Linguistics	en
dc.subject	Hypertext	en
dc.subject	Web Genre	en
dc.subject	Semantic Web	en
dc.subject.ddc	ddc:400	de_DE
dc.title	Hypertextsorten : Definition, Struktur, Klassifikation	de_DE
dc.title.alternative	Hypertext Types : definition, structure, classification	en
dc.type	doctoralThesis	de_DE
dcterms.dateAccepted	2006-01-23
local.affiliation	FB 05 - Sprache, Literatur, Kultur	de_DE
local.opus.fachgebiet	Germanistik	de_DE
local.opus.id	2688
local.opus.institute	Institut für Germanistik - Fachgebiet Angewandte Sprachwissenschaft und Computerlinguistik	de_DE
thesis.level	thesis.doctoral	de_DE

Files

Original bundle

Now showing 1 - 1 of 1

Name:: RehmGeorg-2006-01-23.pdf
Size:: 23.52 MB
Format:: Adobe Portable Document Format

Download

Collections

Dissertationen/Habilitationen