Prof. Dr. K. Heinz Wagner

Linguistik-Werkbank (Titel)

Eine computergestützte, interaktive, multimediale Lern- und Arbeitsumgebung

Das Fachgebiet der Linguistik hat in vielen Teilbereichen einen hohen Formalisierungsgrad erreicht, was für viele Studierende eine schwer zu überwindende Barriere bedeutet.

Das Ziel des Projektes Linguistikwerkbank ist die Entwicklung einer computergestützten, interaktiven, multimedialen Lern- und Arbeitsumgebung, die dabei helfen soll, diese Barriere zu meistern. Die Linguistikwerkbank ist zunächst für das Grundstudium im Studiengang Linguistik gedacht, vorrangig für die Grundlagenveranstaltungen: Grundlagen, Methoden und Theorien der Sprachwissenschaft, dann Grammatik mit den Teilgebieten Phonologie und Phonetik, Morphologie, Syntax sowie Semantik/Lexikologie. Dazu gehört insbesondere auch der Bereich Werkzeuge der Sprachwissenschaft.

Struktur des Grundstudiums

Die Werkbank ist jedoch so angelegt, daß sie zumindest in Teilen später auch für die linguistischen Teilgebiete der anderen Sprachstudiengänge (Anglistik, Germanistik, Romanistik) übertragen werden kann.
Das allgemeine Organisationsprinzip der Werkbank basiert auf dem Hypertext- bzw. Hypermediakonzept. Sie besitzt eine offene Architektur insofern Informationsquellen und Programme verschiedener Herkunft miteinander verknüpft werden können. Sie ist erweiterbar insofern weitere Informationsquellen auch vom Lerner hinzugefügt werden können, eingeschlossen die vielfältigen Angebote aus dem Internet. Sie ist didaktisch variabel und unterstützt eine Vielzahl von Lern- und Arbeitsformen, von konventioneller Wissensaneignung über exploratives Lernen bis zu Formen strikt gelenkten programmierten Unterrichts. Enthalten sind auch Komponenten, die als "intelligente Lernsysteme" angelegt sind.

Dabei geht es um die Einübung, Vertiefung und Ergänzung des in den Grundkursen vermittelten Stoffes u.a. durch interaktive Übungsprogramme, didaktisch aufbereitete und assoziativ verknüpfte Originaltexte (on-line reader), Visualisierung schwieriger abstrakter Begriffe (z.B. der Grammatiktheorie) und komplexer Abläufe (z.B. animierte Algorithmen), Simulation von Sprachverarbeitungsprozessen, etc. Wesentlicher Bestandteil der Arbeitsumgebung soll dabei eine on-line Terminologiedatenbank sein, auf die aus beliebigen Texten ein unmittelbarer Zugriff besteht.

Die Bezeichnung Werkbank ist eine Übernahme des englischen Wortes workbench, das im übertragenen Sinne in der Informatik besonders im Bereich der Softwareentwicklung für eine Arbeitsumgebung verwendet wird, die verschiedene "Werkzeuge" (engl. tools) in einer einheitlichen Benutzeroberfläche integriert. In der computerlinguistischen Forschung sind eine Reihe solcher "Werkbänke" für die Unterstützung der Entwicklung von formalen Grammatiken für sprachverarbeitende Systeme geschaffen worden.

Für eine Linguistikwerkbank im intendierten weiten Sinne, die alle Komponenten des linguistischen Grundstudiums vereinigt, gibt es unseres Wissens keine Vorbilder. Auch wenn keine dem Gesamtkonzept entsprechende Vorlage existiert, gibt es doch eine ganze Reihe von Bereichen, die für die Entwicklung der Linguistikwerkbank unmittelbar oder mittelbar von Bedeutung sind. Die wichtigsten davon sind in Abb. 1 in ihrem Bezug zum geplanten Vorhaben dargestellt.

Grundlagen der Werkbank

Dazu zählt zunächst allgemein der Gesamtbereich des computergestützten Lehrens und Lernens (Computer Assisted Instruction, CAI; Computer Assisted Learning, CAL; Computer Based Learning, CBL; Computer Based Training, CBT; etc.).

Das allgemeine Organisationsprinzip der Linguistik-Werkbank ist Hypertext, aufgefaßt als ein "innovatives Medium zur Kommunikation von Wissen". Konventionelle Texte sind im wesentlichen sequentiell angeordnet. Das gilt auch dort, wo eine mehrstufige hierarchische Untergliederung verwendet wird. Das bedeutet, daß in solchen Texten auch die "Kommunikation von Wissen" weitgehend linear und sequentiell erfolgt. Das menschliche Denken arbeitet jedoch weitgehend assoziativ - "Wissen ist beim Menschen in komplexen Netzwerkstrukturen repräsentiert". Hypertexte sind Informationsstrukturen, die diesem assoziativen Denken und dieser Repräsentationsform entgegenkommmen. Dabei ist es sinnvoll, zwischen Hypertext und Hypermedia in systematischer Weise zu unterscheiden:

Hypertext bezieht sich vorrangig auf den strukturellen Aspekt: Mit Hypertext ist eine Kategorie von (vorrangig elektronischen) Dokumenten gemeint, deren bestimmenden Merkmale mit sog. nicht-linearen Netzwerkstrukturen und assoziativen Verweisketten - innerhalb und zwischen Dokumenten - am besten charakterisiert werden. Dabei wird eine verallgemeinerte Vorstellung des Begriffs "Dokumente” verwendet, nämlich allgemein Medien zur Repräsentation, Kommunikation und Rezeption von Wissen. Für die Charakterisierung von Hypertexten ist besonders wichtig, daß die zum Einsatz kommenden Verweisketten nur in elektronischen Dokumenten adäquat realisierbar sind.

Hypermedia verweist auf den multi-medialen Aspekt: Der Begriff Hypermedia bezieht sich mehr auf die Darstellungsform der in einem Hyperdokument enthaltenen Information. Schließt diese verschiedene Medien ein (Multimedia), dann sprechen wir von Hypermedia. Dazu gehören u.a. Ton (Geräusche, Sprache, Musik), komplexe Vektorgrafiken, Stand- und Bewegtbilder, Videosequenzen, Animationen und Simulationen. Diese können entweder alleine oder in mehrfacher Kombination in auftreten.

Der Terminus HYPERTEXT wurde bereits 1965 von Ted Nelson geprägt, der 1981 eine ehrgeizige, weltumspannende Hypertext-Datenbank namens "Xanadu" konzipierte.

Die umfassende Idee von Nelson wurde weitestgehend durch das 1989 von Tim Berners-Lee vorgeschlagene World-Wide-Web-Projekt auf dem Internet realisiert. Das World-Wide Web wird für die Entwicklung der Linguistikwerkbank von großer Wichtigkeit sein, einerseits als unerschöpfliche Informationsquelle für die Entwicklungsarbeit selbst, andererseits für die Werkbanknutzer als vielfältige Erweiterungsmöglichkeit.

Architektur

Die Linguistikwerkbank soll längerfristig zumindest partiell als sog. Intelligentes Lehr- Lernsystem (intelligent computer aided instruction, ICAI; intelligent tutorial System, ITS) angelegt sein.. "Intelligent" bedeutet in diesem Zusammenhang nicht mehr, als daß das System selbst über das Wissen verfügt, das es vermitteln soll. Praktisch bedeutet dies, daß das System in der Lage ist, aufgrund des in seiner Wissensbasis gespeicherten "Wissens" Problemstellungen zu generieren und angebotene Lösungen zu evaluieren. Man spricht daher auch von Wissensbasierten Lehr- Lernsystemen.

Wissensbasierte Lehr- Lernsysteme haben inzwischen auch Eingang in das Gebiet des computerunterstützten Fremdsprachenunterricht gefunden (intelligent computer assisted language learning, ICALL), wobei ITS-Methoden mit computerlinguistischen Verfahren verbunden werden. Auch dieser Entwicklungsstrang wird für die Projektarbeit von großer Bedeutung sein.

Auf die Bedeutung linguistischer Werkzeuge wurde bereits hingewiesen. Sie werden zwar meist primär zu Forschungszwecken entwickelt, eignen sich doch in vielen Fällen auch für Ausbildungszwecke. Insbesondere sollen Software-Werkzeuge zum Einsatz kommen, welche die Entwicklung und Überprüfung von Grammatiken zu Sprachausschnitten auf der Grundlage verschiedener Grammatikformalismen unterstützen, vor allem Unifikations- und Constraint-basierte Systeme wie Lexikalisch-Funktionale Grammatik [LFG], Funktionale Unifikationsgrammatik [FUG], Generalisierte Phrasen-Struktur-Grammatik [GPSG] und Head Driven Phrase Structure Grammar [HPSG], aber auch Modelle im Rahmen der Rektions und Bindungstheorie von Noam Chomsky (prinzipienbasiertes Parsing).

Weitere Aspekte sind:

Voraussetzung ist dafür auch die Verfügbarkeit eines wartbaren und maschinenverarbeitbaren Wörterbuches. Als Repräsentationsformalismus für die Wortinhalte ist dabei an das System der Conceptual Structures von John F. Sowa gedacht. Es müssen ebenfalls Werkzeuge zur Erstellung und Wartung eines solchen Wörterbuches zur Verfügung gestellt

Beispiel Phonetik-Phonologie

Erstellt von: Karl Heinz Wagner khwagner@uni-bremen.de, zuletzt geändert am 30.6.2001