Die Volltextsuche mit MediaWiki

Autor on 14. Oktober 2012 in Wiki-Lösungen mit 0 Kommentare

Technisch gesehen setzt Wikipedia auf MediaWiki auf. Insoweit ist es naheliegend, wenn man die Leistungsfähigkeit der Wikipedia-Suche auch bei MediaWiki erwartet. Dieses ist nicht der Fall. In der Standard-Lösung bietet MediaWiki nur eine einfache Suche mit geringen Möglichkeiten. Die MediaWiki-Suche wird zwar schrittweise verbessert, für viele professionelle Anwendungen ist dies aber noch nicht ausreichend.
Die gute Nachricht ist, dass mit den entsprechenden Erweiterungen bzw. Extensions die Leistungsfähigkeit von MediaWIki massiv gesteigert kann. Bei entsprechender Systemanpassung sind folgende Leistungsstufen realisierbar:

  1. Einfache Suche nach Begriffen
  2. Suche nach Begriffen mit Verknüpfungen und Kriterien
  3. Suche auch in angehängten Dokumenten wie MS-Office und PDF
  4. Semantische Suche

1. Einfache Suche nach Begriffen

Die Standard-Implementierung von MediaWiki unterstützt die Suche nach Worten. Alle Wiki-Seiten werden auf das exakte Wort, unabhängig von Groß- und Kleinbuchstaben durchsucht. Die Seitentitel werden hierbei nicht berücksichtigt. Auch eine Wildcard-Funktion steht zur Verfügung. Die Suche nach „*“Markt“*“ zeigt alle Seiten mit dem Begriff Markt wie auch Gesundheitsmarkt oder Marktzahlen und Marktsegment.
Werden mehrere Begriffe eingegeben, so wird dieses als „oder“ interpretiert. Die Suche nach -Social Media- bringt als Suchergebnis alle Seiten mit dem Begriff -Social- und alle Seiten mit dem Begriff -Media-. Angezeigt werden alle Ergebnisseiten mit den jeweiligen Textpassagen nach Relevanz.
Über den Button Einstellungen und Suchoptionen läßt der Suchbereich für alle Namensräume oder für spezifische Namensräume vorgeben.
Eine praktische Zusatzfunktion ist die Möglichkeit der Integration der MediaWiki-Suche in die Browser-Suchfunktion. Dieses geschieht auf Basis des OpenSearch-Standards. Dies ist interessant, wenn das Wiki z.B. als Glossar oder Vertriebssupport-Tool genutzt wird.

2. Suche nach Begriffen mit Verknüpfungen

Attraktiver wird die Suchfunktion, wenn auch Verknüpfungen wie „und“  möglich werden. Dann werden bei der Suche nach „Social Media“ tatsächlich alle Social Media-Seiten angezeigt. Zu den weiteren Suchfunktionen gehört die Möglichkeit nach Kriterien wie Namensräumen, Autoren oder Schlagworten zu sortieren.  Zur Umsetzung dieser Anwendung empfehlen sich alternativ die Systemerweiterung MWSearch/Lucene-Search oder SphinxSearch. Die erstere Lösung ist die Lösung, die auch bei Wikipedia eingesetzt wird. Technisch gesehen ist die Lösung etwas komplexer, da eine Java-Server-Umgebung erforderlich ist. Die zweite Lösung ist einfacher, aber weniger verbreitet. Beide Lösungen machen Sinn, wenn das Wiki auf einem eigenen Server betrieben wird.

3. Suche auch in angehängten Dokumenten wie MS-Office und PDF

In der Unternehmenswelt wird das Wissensmanagement sehr schnell gekoppelt mit der Diskussion über die Auswertemöglichkeit von MS-Office- und PDF-Dokumenten. In Frage kommen die Systemerweiterungen EzMwLucene, Woogle4MediaWiki und BlueSpice(free/fully featured). Alle 3 Suchmaschinen-Anwendungen sind Lucene-basiert und benötigen Java. BlueSpice ist eine vollständige, offene Unternehmenslösung. Aus Anwendungssicht macht es Sinn in einem Unternehmen, eine der 3 Lösungen einzusetzen.

4. Semantische Suche

Das Semantische MediaWiki SMW und die Unternehmensvariante SMW+ gehen einen Schritt weiter. Dazu werden additive Informationen über die Seiten sowie ihren Relationen in Form von Metadaten erfasst. Für die semantische Suche wird dann eine Abfragesprache benötigt. Der große Vorteil liegt in der besseren Einbindung von nicht Wiki-Textinformationen und der weiteren Verknüpfung von Informationen. Zur Zeit sind diese Lösungen in der Handhabung noch recht komplex. Ihre Bedeutung wird aufgrund des Nutzens steigen.

Für die weitere Vertiefung und Auseinandersetzung mit dem Thema MediaWiki und Suche empfehle ich dem MediaWiki-Search-Extension-Link. Hier wird als weitere Alternative für den Google-Fan die Integration der Google-Suchmaschine angeboten.

Tags:

Abonnieren

Wenn Ihnen der Artikel gefallen hat, das nutzen Sie den RSS-Feed oder den monatlichen Newsletter

Subscribe via RSS Feed

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Top