Syntax mit PC-PATR

Grammatik 0

Daten:
  1. Mary laughed
  2. John jumped
  3. Susan cried
  4. Tom ran
Schritt 1.
Schreiben Sie eine Phrasenstruktur-Grammatik (PSG) für diese Daten. Sie besteht nur aus einer Regel!
Schritt 2.
Umsetzung in PC-PATR-Form.

Der Text einer PATR-Grammatik ist vergleichbar mit dem "Quellkode" eines Computer-Programmes. Der PATR-Formalismus ist quasi eine Programmiersprache für eine maschinelle synaktische Analyse. Für diese Sprache gelten strenge syntaktische Regeln, die beachtet werden müssen, damit das Programm korrekt arbeiten kann. Eine Grammatik besteht zunächst aus einer Menge von Phrasenstruktur-Regeln (PS-Regeln).

Eine Grammatik-Regel in PC-PATR besteht aus folgenden Teilen (in der angegebenen Reihenfolge):

  1. dem Schlüsselwort Rule
  2. einem optionalen Regelnamen, der in geschweifte Klammern eingeschlossen wird ({})
  3. einer Phrasenstruktur-Regel aus folgenden Elementen:
    1. dem zu expandierenden nicht-terminalen Symbol als Kopf
    2. einem Pfeil (->) oder Gleichheitszeichen (=)
    3. dem Rumpf, der entweder leer ist oder  aus einem oder mehreren terminalen oder nicht-terminalen Symbolen besteht, die ggf. als alternative oder optionale Konstituenten markiert sind
  4. einem optionalen Punkt (.)
Rule {Derivation}
  Stamm -> Wurzel Suffix .

Das Layout ist unwichtig. Man könnte alles auch hintereinander schreiben, z.B.:

Rule    {Derivation} Stamm -> Wurzel Suffix .

Schritt 3.
Menüpunkt Editor > Start EditorStarten Sie das Programm WinPatr, am einfachsten über die Verknüpfung WinPATR Symbol auf dem Desktop. Starten Sie von dort über den Menüpunkt Editor > Start Editor den Programm-Editor MED.

Schritt 4.
Sichern alsSchreiben Sie die Grammatik im PATR-Formalismus und speichern Sie die Datei unter dem Namen psg0.grm in ihrem Homeverzeichnis (d.h. auf Z:) (Menüpunkt Datei > Speichern als). Bestätigen Sie die Frage, ob der Dateiname übernommen werden soll, mit ja.

Lexikon zur Grammatik 0

Damit mit unserer Grammatik Sätze analysiert werden können, brauchen wir ein Lexikon, das die in den Daten vorkommenden Wortformen und deren Eigenschaften enthält. Das Lexikon besteht aus einer Folge von Lexikoneinträgen, die in der einfachsten Form folgende Gestalt haben:

\w     Wortform
\c     Kategorie

z.B.

\w     Mary
\c     NP
Schritt 5.
Erstellen Sie für die obigen Daten das Lexikon in dieser Form und speichern Sie die Datei unter dem Namen psg0.lex

Austesten der Grammatik

Nachdem Grammatik und Lexikon erstellt worden sind, müssen wir testen, ob die Grammatik auch die Daten, von denen wir ausgegangen sind, korrekt analysieren kann.

Schritt 6.
Sie zum Programm WinPatr zurück und laden Sie die Grammatik psg0.grm über File > Load Grammar.
Schritt 7.
Laden Sie über File > Load Lexicon die Lexikondatei psg0.lex.

Jetzt sind wir soweit, dass wir Sätze analysieren lassen können. Natürlich können nur Sätze analysiert werden, die den Regeln unsere Grammatik entsprechen und die Wortformen aus dem Lexikon enthalten.

Schritt 8.
Geben Sie einen Satz aus den Ausgangsdaten in das Textfeld Sentence ein, z.B. Mary laughed. Sie müssen dafür die gleiche Orthographie verwenden wie im Lexikon und dürfen keine Interpunktionszeichen verwenden.
Schritt 9.
Lassen Sie den Satz analysieren, indem Sie auf den Schalter Parse klicken.

Wenn alles richtig gelaufen ist, müsste dann in dem Textfeld Parse Output folgende Ausgabe erscheinen:

1:
       S
   ____|____
  NP      VP 
Mary   laughed 

S:
[ cat:   S ]
1 parse found

Lösung für Grammatik 0:

;Grammatik psg0.grm
Rule    {Einfacher Satz}
        S -> NP VP:

;Lexikon psg0.lex
\w        Mary
\c        NP

\w        John
\c        NP

\w        Susan
\c        NP

\w        Tom
\c        NP

\w        laughed
\c        VP

\w        jumped
\c        VP

\w        cried
\c        VP

\w        ran
\c        VP