Web Mining und Natural Language Processing als methodisches Komplement in der Wirtschaftsgeographie

dc.contributor.advisorHennemann, Stefan
dc.contributor.advisorDiller, Christian
dc.contributor.authorKriesch, Lukas Julian
dc.date.accessioned2023-05-31T09:17:57Z
dc.date.available2023-05-31T09:17:57Z
dc.date.issued2023
dc.description.abstractFür wirtschaftsgeographische Forschung spielen räumlich und inhaltlich granular aufgelöste Daten eine zentrale Rolle, um Treiber und Barrieren sozioökonomischer Entwicklungen von Regionen besser verstehen zu können. Vor dem Hintergrund der zunehmenden Digitalisierung hat sich das Internet zu einer enorm umfassenden Datenquelle für unterschiedlichste For-schungsdisziplinen entwickelt. Insbesondere die Fähigkeit moderner Algorithmik auch un-strukturierte Textdaten semantisch auswerten zu können, ermöglicht es, enorm umfassende und gleichzeitig sehr detaillierte Informationen aus Webdaten gewinnen zu können. In der Wirtschaftsgeographie hat eine Exploration dieser Verfahren bisher kaum stattgefunden, sodass es das übergeordnete Ziel dieser Disseration ist unstrukturierte Textdaten aus dem Internet für wirtschaftsgeographische Forschung nutzbar zu machen. Aufgrund des methodenexplorierenden Charakters der Arbeit führt diese zunächst in die Forschungsfelder Web Mining und Natural Language Processing ein, bevor die Methodiken anhand von Fallstudien konkret auf wirtschaftsgeographische Forschungsfragen projiziert werden. Die Fallstudien skizzieren verschiedene Zugänge zu Webdaten, demonstrieren unterschiedliche Verfahren zur quantitativen Textanalyse, behandeln Texte unterschiedlicher Sprachen und umfassen sowohl Quer- als auch Längsschnittanalysen. Dabei liegt der Fokus auf der Entwicklung und Adaptierung von Modellen, die speziell im Kontext raumbezogener Forschung eingesetzt werden können. Im Rahmen der ersten Fallstudie wurde das offene Webrepositorium Com-monCrawl genutzt, um eine flächendeckende, koordinatenscharfe Datenbank von Unterneh-mensdomains mittels Web Mining zu erstellen. Die geographische Analyse und der Vergleich mit amtlichen Statistiken zeigt, dass die extrahierten Daten in der Lage sind, die tatsächliche Unternehmenslandschaft in Deutschland zu repräsentieren. Fallstudie 2 nutzt diese Daten, um Unternehmen anhand ihrer Webseitentexte nach Technologienutzung zu klassifizieren. In der dritten Fallstudie wurde einschlägige wirtschaftsgeographische Literatur herangezogen, um abstrakte Themen in den Publikationen aufzudecken. Ferner konnten Entwicklungstrends und Zusammenhänge der Themen mittels Verfahren des Natural Language Processings quantifiziert werden. Abschließend diskutiert die Arbeit weitere Potentiale und Herausforderungen der explorierten Methodiken. Die Diskussion beinhaltet ferner eine Gegenüberstellung der untersuchten Methodiken mit tradierten Verfahren der empirischen Sozialforschung. Aus dieser Erörterung heraus wurde ebenfalls beleuchtet, wie sich Web Mining und Natural Language Processing insbesondere in wirtschaftsgeographische Forschungsdesigns integrieren lassen und welche Perspektiven eine Methodenintegration ermöglicht.de_DE
dc.identifier.urihttps://jlupub.ub.uni-giessen.de//handle/jlupub/16306
dc.identifier.urihttp://dx.doi.org/10.22029/jlupub-15686
dc.language.isodede_DE
dc.rightsAttribution-NonCommercial 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/*
dc.subjectnatural language processingde_DE
dc.subjectweb miningde_DE
dc.subjectWirtschaftsgeographiede_DE
dc.subject.ddcddc:550de_DE
dc.titleWeb Mining und Natural Language Processing als methodisches Komplement in der Wirtschaftsgeographiede_DE
dc.title.alternativeWeb mining and natural language processing in economic geographyde_DE
dc.typedoctoralThesisde_DE
dcterms.dateAccepted2023-05-15
local.affiliationFB 07 - Mathematik und Informatik, Physik, Geographiede_DE
thesis.levelthesis.doctoralde_DE

Dateien

Originalbündel
Gerade angezeigt 1 - 1 von 1
Lade...
Vorschaubild
Name:
KrieschLukas-2023-05-15.pdf
Größe:
13.01 MB
Format:
Adobe Portable Document Format
Beschreibung:
Lizenzbündel
Gerade angezeigt 1 - 1 von 1
Vorschaubild nicht verfügbar
Name:
license.txt
Größe:
7.58 KB
Format:
Item-specific license agreed upon to submission
Beschreibung: