TrendRadar - domänenspezifisches Sprachmodell für Logistik/Mobilität

dc.contributor.authorKriesch, Lukas
dc.contributor.authorVan der Au, Niklas
dc.contributor.authorHennemann, Stefan
dc.contributor.otherFraunhofer-Institut für Materialfluss und Logistik IMLde_DE
dc.date.accessioned2021-07-20T04:50:46Z
dc.date.available2021-07-20T04:50:46Z
dc.date.issued2021-07-19
dc.description.abstractDer Datensatz beinhaltet ein bereinigtes, vortrainiertes, deutsches Sprachmodell (word2vec), welches aus über 40.000 deutschsprachiger Nachrichtenartikel von 467 Webseiten aus dem Bereich Logistik und Mobilität gespeist wurde. Der Datensatz entstand im Rahmen des Forschungsprojekts "TrendRadar - Erforschung der Grundlagen für einen ML-gestützten automatisierten TrendRadar", welches von dem Fraunhofer IML und der AG Wirtschaftsgeographie der JLU bearbeitet wurde. Der Erhebungszeitraum der zugrundeliegenden Nachrichtenartikel war vom 09.12.2020 - 31.05.2021. Zum Einlesen des Datensatzes wird die Gensim-Bibliothek in Python3 empfohlen (https://radimrehurek.com/gensim/models/word2vec.html).de_DE
dc.description.sponsorshipHA Hessen Agentur GmbHde_DE
dc.identifier.urihttps://jlupub.ub.uni-giessen.de//handle/jlupub/124
dc.identifier.urihttp://dx.doi.org/10.22029/jlupub-69
dc.language.isodede_DE
dc.rightsAttribution-NonCommercial 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/*
dc.subjectLogistikde_DE
dc.subjectMobilitätde_DE
dc.subjectword2vecde_DE
dc.subjectSprachmodellde_DE
dc.subjectword-embeddingde_DE
dc.subjectnlpde_DE
dc.subjectNatural Language Processingde_DE
dc.subjectWeb Miningde_DE
dc.subject.ddcddc:004de_DE
dc.subject.ddcddc:400de_DE
dc.subject.ddcddc:430de_DE
dc.subject.ddcddc:550de_DE
dc.titleTrendRadar - domänenspezifisches Sprachmodell für Logistik/Mobilitätde_DE
dc.typeModelde_DE
local.affiliationFB 07 - Mathematik und Informatik, Physik, Geographiede_DE
local.project859/20-16de_DE

Dateien

Originalbündel
Gerade angezeigt 1 - 1 von 1
Vorschaubild nicht verfügbar
Name:
tr.model
Größe:
57.52 MB
Format:
Unknown data format
Beschreibung:
Lizenzbündel
Gerade angezeigt 1 - 1 von 1
Vorschaubild nicht verfügbar
Name:
license.txt
Größe:
7.58 KB
Format:
Item-specific license agreed upon to submission
Beschreibung:

Sammlungen