Wissensrepräsentation

Ein Bereich der Künstlichen Intelligenz, welcher auch für die Computerlinguistik von großem Interesse ist, ist das Gebiet der Wissensrepräsentation.

Wie wir im Zusammenhang mit Eliza feststellen werden, kann ein maschinelles System zur Analyse (oder zur Erzeugung) natürlicher Sprache eigentlich nur dann einigermaßen korrekt funktionieren, wenn es in der Lage ist, auch das bei der Verwendung und dem Verstehen von Sprache benutzte allgemeine Wissen oder Weltwissen einzusetzen. Dazu zwei Beispiele aus dem Bereich der Bindung von Pronomina:

  1. Kurt beißt ihn.

Obwohl wir nicht wissen, auf welche Person sich das ihn bezieht, wissen wir aber doch ganz klar, auf welche es sich nicht bezieht, nämlich auf Kurt – der Eigenname Kurt und das Pronomen ihn weisen nicht dieselbe Referenz auf. Im Rahmen verschiedener Grammatikformalismen werden diese Bindungsphänomene in einer syntaktischen Komponente erledigt, was letzendlich auf Aussagen hinausläuft wie z.B. 'das Antezendens eines Pronomens taucht nicht in derselben lokalen syntaktischen Domäne auf wie das Pronomen selber'. Zum Vergleich das nächste Beispiel:

  1. Lisa sprang in die Dusche, weil sie schmutzig war.

Die Referenz des Pronomens sie im Nebensatz ist nicht eindeutig und kann sich potentiell sowohl auf Lisa als auch auf die Dusche beziehen – dennoch wird eine spontane Zuordnung klar Lisa als Antezedens favorisieren. Dabei allerdings spielt der Einsatz von Allgemeinwissen eine gewichtige Rolle. Ähnlich gelagert ist die Situation bei einem Standardbeispiel der Syntax, nämlich der Frage 'wohin gehört die PP'? In den Sätzen

  1. Er beobachtete das Mädchen mit dem Fernglas
  2. Er beobachtete das Pferd mit dem Fernglas

Während der erste Satz potentiell ambig ist, wird beim zweiten sofort eine bestimmte Lesart favorisiert, doch auch hier ist es wieder das Weltwissen um die Tatsache, dass Pferde selten Ferngläser nutzen/umhängen haben, welches den Satz desambiguiert.

Die Wissenrepräsentation nun kann als Bereich der KI gesehen werden, in welchem formale Systeme und Darstellungsformen gesucht werden, die große Mengen solch allgemeinen Wissens strukturieren, repräsentieren und ggf. in eine von Maschinen interpretierbare Form bringen, um so den Zugriff auf dieses Wissen und überhaupt die Initiierung des Zugriffs auf das Wissen z.B. in einem konkreten (maschinellen) Sprachverstehens­prozeß zu gewährleisten. Dieser Punkt ist nicht unerheblich. Was bei der menschlichen Kognition mehr oder weniger automatisch abläuft, also das Aktivieren von gespeicherter Information aufgrund von neuer Information, muß für einen Computer in einigermaßen komplexen Verfahren nachgestellt werden. Dass es zwischen den Bereichen Wissensrepräsentation und Semantik enge Bezüge gibt, sollte klar sein. Im Rahmen der LV werden wir uns exemplarisch für diesen Bereich mit einer bestimmten Art von Wissensorganisation auseinandersetzen, nämlich einem Semantischen Netz.