TrendRadar - domänenspezifisches Sprachmodell für Logistik/Mobilität

Lade...
Vorschaubild

Betreuer/Gutachter

Weitere Beteiligte

Herausgeber

Zeitschriftentitel

ISSN der Zeitschrift

Bandtitel

Verlag

Zusammenfassung

Der Datensatz beinhaltet ein bereinigtes, vortrainiertes, deutsches Sprachmodell (word2vec), welches aus über 40.000 deutschsprachiger Nachrichtenartikel von 467 Webseiten aus dem Bereich Logistik und Mobilität gespeist wurde. Der Datensatz entstand im Rahmen des Forschungsprojekts "TrendRadar - Erforschung der Grundlagen für einen ML-gestützten automatisierten TrendRadar", welches von dem Fraunhofer IML und der AG Wirtschaftsgeographie der JLU bearbeitet wurde. Der Erhebungszeitraum der zugrundeliegenden Nachrichtenartikel war vom 09.12.2020 - 31.05.2021. Zum Einlesen des Datensatzes wird die Gensim-Bibliothek in Python3 empfohlen (https://radimrehurek.com/gensim/models/word2vec.html).

Verknüpfung zu Publikationen oder weiteren Datensätzen

Beschreibung

Anmerkungen

Erstpublikation in

Erstpublikation in

Sammelband

Sammlungen

URI der Erstpublikation

Forschungsdaten

Schriftenreihe

Zitierform