semtracks Corpora
Die semtracks forschergruppe hat eine Reihe von Korpora selber erstellt oder Dritte bei der Erstellung von Korpora unterstützt. Diese Korpora werden der wissenschaftlichen Öffentlichkeit zur Verfügung gestellt, wobei die dafür notwendige Infrastruktur von der /semtracks gmbh/ finanziert wird.
Momentan ist der Zugriff auf folgende Korpora möglich:
CosMov (Corpora for Social Movement Research)
Das Projekt “Corpora for Social Movement Research” möchte für all jene ein korpuslinguistisch aufbereitetes Textarchiv zur Verfügung stellen, die sich mit der Erforschung sozialer Bewegungen beschäftigen.
GerMov-Korpus
Das GerMov-Korpus umfasst 340.894 laufende Wortformen und gliedert sich in ein Subkorpus, das ausschließlich Tonbandprotokolle der 68er-Bewegung enthält, und ein Subkorpus mit Flugblättern.
KLG – Korpus linke Gewalt
Das KLG enthält ausschließlich Texte sog. militanter linker Gruppierungen. Es versammelt Texte, die im Kontext der Rechtfertigung und der Organisation von sich als revolutionär verstehender Gewalt entstanden sind.
Text+Berg-Korpus
Im Projekt “Text+Berg digital” werden in einem ersten Schritt zwei Publikationsreihen des Schweizer Alpen-Clubs (SAC), die kontinuierlich seit 1864 erschienen sind, digital erfasst und korpuslinguistisch aufbereitet. Die beiden Reihen, das “Jahrbuch des S.A.C.” (1864–1923) und die “Alpen” (1925–heute), sind eine wertvolle Sammlung von Berichten, Aufsätzen und Reflexionen über den Alpinismus. Durch die zeitliche Kontinuität, in der die Reihen erschienen sind, stellen sie eine einzigartige Textbasis dar, um historische, kulturwissenschaftliche aber gerade auch sprachwissenschaftliche Fragestellungen zu beantworten.
uaWaC: Ukrainian Web as Corpus (in Vorbereitung)
Das momentan 27 Mio. laufende Wortformen und 10517 Texte umfassende Korpus enthält ukrainischsprachige Dokumente aus dem Web und wurde mit BootCaT und dem Web as Corpus Toolkit kompiliert. Für weitere Informationen wenden Sie sich bitte an [email protected].
Dokumentation
Anleitung zum Korpussystem CQPweb