Begriffslexikon
Eine Sammlung in der Korpusforschung gebräuchlicher Fachbegriffe
der Prozess der Versehung von Korpusdaten mit (interpretativen) linguistischen Informationen
die Anzahl der Vorkommen eines sprachlichen Merkmals in einem Korpus
eine Auflistung eines Wortes/Ausdrucks in einem Korpus, normalerweise in einem bestimmten Kontext
Schlagwort/Eintrag in einem Lexikon; im Allgemeinen wird davon ausgegangen, dass ein Lemma alle Formen eines Wortparadigmas umfasst, mit weiteren Unterscheidungen nach PoS (Part-of-Speech)
das zentrale Wort oder der zentrale Suchbegriff in einer Kollokation oder Konkordanz
ein Korpus, das sich aus Quelltexten und deren Übersetzungskorpus zusammensetzt
ein Prozess, der die Sätze in einem Korpus in ihre Bestandteile analysiert, auch Treebanking oder Bracketing genannt
Wortklasse oder morpho-syntaktische Kategorie
ein alternativer Begriff für Annotation wie PoS-Tagging und semantisches Tagging
ein tatsächliches Vorkommen einer bestimmten Wortform, im Gegensatz zu ihrem Typ (type)
eine Wortform, im Gegensatz zu ihren einzelnen Vorkommen (Token) in einem Text
Quellen
Begriffslexikon adaptiert von:
Weisser, Martin (2016). Practical Corpus Linguistics: An Introduction to Corpus-Based Language Analysis. Hoboken: John Wiley & Sons.