TrendRadar - domänenspezifisches Sprachmodell für Logistik/Mobilität
Dateien zu dieser Ressource
Datum
2021-07-19Autor
Kriesch, Lukas
Van der Au, Niklas
Hennemann, Stefan
Weitere Beteiligte
Fraunhofer-Institut für Materialfluss und Logistik IML
Zitierlink
http://dx.doi.org/10.22029/jlupub-69Zusammenfassung
Der Datensatz beinhaltet ein bereinigtes, vortrainiertes, deutsches Sprachmodell (word2vec), welches aus über 40.000 deutschsprachiger Nachrichtenartikel von 467 Webseiten aus dem Bereich Logistik und Mobilität gespeist wurde. Der Datensatz entstand im Rahmen des Forschungsprojekts "TrendRadar - Erforschung der Grundlagen für einen ML-gestützten ... automatisierten TrendRadar", welches von dem Fraunhofer IML und der AG Wirtschaftsgeographie der JLU bearbeitet wurde. Der Erhebungszeitraum der zugrundeliegenden Nachrichtenartikel war vom 09.12.2020 - 31.05.2021. Zum Einlesen des Datensatzes wird die Gensim-Bibliothek in Python3 empfohlen (https://radimrehurek.com/gensim/models/word2vec.html).