CQP

Ziel ist es, dass Sie das CheatSheet verstehen und CQP eigenständig nutzen können. Sie können das provisorische CQP-Tutorial „A practical guide“ nutzen, das Übungsaufgaben und Lösungsvorschläge enthält, das Online-Tutorium ist davon aber unabhängig. Bei Fragen schreiben Sie mir eine Mail.

Die einzelnen Clips einer Folge sind ca. 2–5min lang. Ohne Vorkenntnisse sollten Sie alle Clips in der vorgegebenen Reihenfolge durchgehen (insbesondere bei den Folgen 1 & 3–11). Folgen 12, 13 und 14 stellen einzelne Korpora und ihre Besonderheiten vor und werden nicht aufeinander aufbauen.

INHALTSVERZEICHNIS

Folge 0: Was machen wir hier?
Folge 1: Einführung
Folge 2: Verbindung zum Login-Server
Folge 3: Einstieg in CQP
Folge 4: Reguläre Ausdrücke
Folge 5: Mehrwortmuster
Folge 6: Das CQP-Prinzip
Folge 7: Zählen
Folge 8: Sortieren, Randomisieren, Stichproben
Folge 9: Metainformationen (Strukturattribute)
Folge 10: Einstellungen setzen
Folge 11: Export, Aufräumen, Download
Folge 12: Arbeiten mit historischen Korpora
Folge 13: Arbeiten mit Korpora anderer Sprachen
Folge 14: Arbeiten mit Spezialkorpora

Folge 0: Was soll das Korpustutorium insgesamt leisten?

Übersicht (Sorry, leider bescheidener Ton)

Folge 1: Einführung

Playlist, ca. 18 Minuten

§1.1: Was ist ein Korpus?
§1.2: Abfragesysteme
§1.3: CQP-Datenmodell
§1.4: CQP für alle: cqp@fu

Folge 2: Verbindung zum Login-Server

Playlist

Clips bauen nicht aufeinander auf, aber alle Nutzer/innen müssen das Skript ausführen, das in §2.4 besprochen wird. (Die Clips dieser Folge haben leider eine mindere Tonqualität.)

§2.1: PuTTY (Windows)
§2.2: Terminal (Mac/Linux)
§2.3: Tablets (Allgemeines & Demo)
§2.4: CQP-Einstellungen setzen
§2.x: Fehlermeldungen beim Verbindungsaufbau (X-Files)

(Anmerkung: wenn Ihr ZEDAT-Konto bereits länger als 10 Jahre existiert, kann es sein, dass Sie CQP nicht ohne weitere Einstellungen nutzen können. Bitten Sie die ZEDAT, für Ihren Userspace auf dem Login-Server standardmäßig die BASH-Shell einzustellen.)

Folge 3: Einstieg in CQP

(Die Clips dieser Folge haben leider eine mindere Tonqualität.)

Playlist, ca. 25min

§3.1: Im CQP-Raum
§3.2: Erste Abfragen & Konkordanzansicht
§3.3: Abfragenverwaltung
§3.4: Very Basic Unix
§3.x: Tipparbeit sparen (X-Files)

Folge 4: Reguläre Ausdrücke

Playlist, ca. 30min

§4.1: Wortformen I (Optionale Buchstaben) – ?
§4.2: Wortformen II (Mehr optionale Buchstaben)
§4.3: Klassen & Sequenzen gruppieren – [] & ()
§4.4: Wildcards – .
§4.5: Operatoren kombinieren
§4.6: Logisches ODER – Pipe |
§4.7: Wiederholungsoperatoren I ( + und * )
§4.8: Wiederholungsoperatoren II (+ und * in Aktion)
§4.9: Groß- & Kleinschreibung ( %c )
§4.x: Fehlermeldungen in CQP (X-Files)

Folge 5: Mehrwortmuster

Playlist, ca. 18min

§5.1: Mehr als ein Wort finden I
§5.2: Mehr als ein Wort finden II
§5.3: Variable Strings
§5.4: Variable Strings begrenzen – {min,max}
§5.x: Token, Satzzeichen & Operatoren (X-Files)

Folge 6: Das CQP-Prinzip: Annotationen

Playlist, ca. 25min

§6.1: Wortklassen
§6.2: Lemmas
§6.3: Das CQP-Prinzip revisited
§6.4: Übungsbeispiel: Phrasen
§6.5: Übungsbeispiel: Split Infinitives
§6.6: Übungsbeispiel: Progressive
§6.7: Infos finden

Folge 7: Zählen in CQP

Playlist, ca. 13min

§7.1: Zählen: 1-Gramme
§7.2: Zählen: N-Gramme
§7.4: Übungsbeispiel: X-and-X-Koordination
§7.x: Zählen hilft! (X-Files)

Folge 8: Sortieren, Randomisieren, Stichproben

Playlist, ca. 9min

§8.1: Sortieren
§8.2: Randomisieren
§8.3: Stichproben ziehen

Folge 9: Metainformationen nutzen

Playlist, ca. 13min

§9.1: Nach Strukturattributen auszählen (group-Befehl)
§9.2: Nach Strukturattributen eingrenzen
§9.3: Strukturattribute & Besonderheiten
§9.4: Satzgrenzen & Satztags (within s)

Folge 10: Einstellungen ändern

Playlist, ca. 8min

§10.1: Kontext vergrößern (set Context)
§10.2: Metainformationen anzeigen (set PrintStructures)
§10.3: Positionsattribute anzeigen (show +pos)

Folge 11: Exportieren, Aufräumen, Download

Playlist, 7min

§11.1: Konkordanzen exportieren
§11.2: Konkordanzen aufräumen
§11.3: Frequenzlisten aufräumen
§11.4: Dateien runterladen

Folge 12: Arbeiten mit historischen Korpora

§12.1: Corpus of Late Modern English Texts (CLMET)
§12.2: Penn-Korpora (PPCME2, PPCEME, PPCEEC, PPCMBE)
§12.3: Dictionary of Old English (DOE)

Folge 13: Arbeiten mit Korpora anderer Sprachen

§13.1: LCC-Korpora (DE, EN, ES, FR, IT…)
§13.2: German-Manchester Corpus (GERMANC)
§13.3: Deutsches Textarchiv (DTA)

Folge 14: Arbeiten mit Spezialkorpora

§14.1: ICE-Korpora
§14.2: SWITCHBOARD
Folge 15: Fallstudie I
Folge 16: Fallstudie II