Blog

In unserem Blog berichten wir über aktuelle Projekte, Techniken und Ereignisse rund um NetThinks, TYPO3 und Suchmaschinen. Wir freuen uns selbstverständlich über Beiträge und Kommentare.

Apache Solr in TYPO3 integrieren – mehr Speeeeeeed für die TYPO3-Suche

12. Dezember 2010  |   Autor :   |   Allgemein, Tools & Techniken, TYPO3, TYPO3-Extensions   |   1 Kommentar»

TYPO3 bringt von Haus aus die Suchmaschine „Indexed Search“ mit, die jedoch besonders bei größeren Seiten Performanceprobleme offenbart. Mit Solr steht ein sehr performanter und funktional reicher Suchserver bereit, der mit den Problemen der Indexed Search aufräumt.

Solr erweitert die Such-Bibliothek Lucene, vor kurzem in Version 2.9 erschienen, um Features wie Facetting zur Erleichterung der Navigation in Suchergebnissen, RESTful XML, ein JSON-API sowie ein Web-Interface.

Solr ist ein „Open Source Enterprise Search Server“ basierend auf der Lucene Java-Bibliothek. Funktionen von Solr beinhalten XML/HTTP und JSON APIs, Hit-Highlighting, facettierte Suche, Caching, Replikation, eine Web-Administrations-Oberfläche und vieles mehr.

  • facettierte Suche (siehe Infobox rechts)
  • „Meinten Sie …“ Fehlerkorrektur
  • Ranking von Suchergebnissen
  • Platzierung von redaktionellen Inhalten in Suchergebnissen (Paid Content)
  • Synonymsuche
  • Stopwörter

Facettierte Suche

Mit Faceted Searching und den Suchergebnissen können Sie sich auf einfache Weise anzeigen lassen, wie die gefundenen Artikel in anderen Kategorien oder „Facetten“ angeordnet sind. Diese Darstellung zeigt also die Beziehung (Relation) des gesuchten Begriffs im Kontext zu den Suchergebnissen. Beispiel: die Suche nach „Jaguar“ würde die Kategorie „Tier“ als auch „Fahrzeug“ präsentieren. Durch die Eingrenzung auf einen bestimmte Kategorie findet man so schneller zum gewünschten Ergebnis.

Das W3C definiert, was mit dem sogenannten „Semantischen Web“ erreicht werden soll: Die Anwendung soll seine Anwender in gewissem Maß „verstehen“. Sie soll zum Beispiel den Hintergrund einer Suchanfrage richtig interpretieren. Bei mehrdeutigen Suchanfragen wie „Jaguar“ soll sie entweder nachfragen oder aufgrund anderer User-Eingaben oder Kontext-Informationen die Interpretation automatisch vornehmen

Für TYPO3 steht die Extension „Solr“ bereit, die die Integration der mächtigen Suche in TYPO3 ermöglicht und zugleich die in TYPO3 integrierte Suche „Indexed Search“ ersetzt. Die von der Frankfurter TYPO3-Agentur d.k.d entwickelte Extension ist als Open Source-Version kostenlos aus dem TER verwendbar, aber auch eine weiterentwickelte „gesponsorte“ Version ist verfügbar, die allerdings mehrere Tausend Euro kostet und so für Projekte mit  kleinerem Budget wohl eher selten zum Einsatz kommen wird.

Mehr zum Thema findet man in dem ausführlichen Artikel auf T3N: Enterprise Search Server trifft Enterprise Content Management: Apache Solr für TYPO3

1 Kommentar

  • Olivier Dobberkau

    13. Dezember 2010 um 11:47

    Vielen Dank für den Blogpost! Wir möchte betonen, dass die Erweiterung, die wir in Early Access Programm entwickeln, am Ende auch Frei zur Verfügung stehen wird.

    Interessierten stellen wir gerne ein umfassendes White-paper zur Information.

    Und last but not least: Mitglieder der TYPO3 Association Mitglieder erhalten einen Discount auf die EAP Summe.