Lösungsansätze für Volltextsuche

Hallo zusammen,

bei diesem Thema würde mich interessieren wie bei euren Systemen die Volltextsuche gelöst/integriert ist. Nutzt ihr Funktionen der Datenbank, ist ein Suchindex im Core eingebaut, oder über Extensions nachrüstbar, oder setzt ihr auf einen externen Suchserver wie Solr oder Elastic Search?

Viele Grüße

Jens

Hi Jens,

hier eine Übersicht zu Plone und “One-more-Thing” aufgeteilt in zwei Posts (neue Nutzer – die mit Jubiläums Status – dürfen maximal zwei Links posten)…

Teil 1 – Plone

Default Suche Out-of-the-Box
Plone besitzt out of the Box eine sofortige Indexierung des Inhalts durch die Objektdatenbank beim Erstellen. Es muss nicht auf einen Indexlauf gewartet werden. Auch hochgeladene Dateien können indexiert durchsucht werden (PDF, sowie Office Dokumente)

Live-Search
Weiterhin kann man für das Standard Suchfeld “LiveSearch aktivieren”. Diese zeigt Besuchern bereits während der Eingabe in das Suchfeld die ersten Ergebnisse an. Obwohl diese Funktion für kleinere bis mittelgroße Websites sehr nützlich ist, kann sie bei Hunderttausenden oder Millionen von Besuchern pro Tag ein Leistungsrisiko darstellen. -> Siehe auch dazu Algolia [1] als externen Dienst weiter unten

Wenn die Website sehr stark besucht wird, macht es Sinn diese Funktion abzuschalten oder erst bei Eingabe von mehr als drei Zeichen zu aktivieren sowie die Auswirkungen auf die Serverlast zu messen.

Advanced Search | Eigene Inhaltstypen
Mit anderen Optionen kannst Du festlegen, welche Inhaltstypen in den Suchergebnissen angezeigt werden sollen und wo und wann die Beschreibungen abgeschnitten werden soll.

Weitere Inhaltstypen werden eingebunden, wenn Du diese installierst oder per Konfiguration im Browser neu erstellst (Indexe können auch manuell administriert und ggf. neu aufgebaut werden).

Multi-Site Search | Externe Tools
Für Websites in Unternehmensgröße, große Organisationen oder Multisite Search über mehrere Instanzen hinweg gibt es fertige Add-Ons, die sich in Suchlösungen wie Solr oder ElasticSearch integrieren lassen.

Facetted Search
Es gibt fertige AddOns u.A. für ausgefeilte Facetted Search Anwendungen. https://training.plone.org/5/mastering-plone/custom_search.html Dort wird die technik hinter dem Gefilterten Suchsystem der Europaischen Umwelt Behörde http://search.apps.eea.europa.eu/ gezeigt.

Lieben Gruß

Armin


Teil 2 folgt

Teil 2 – Optionaler Tipp zu Algolia


Kommerzielle Anbieter / kostenfreie Nutzung für FOSS Dokumentation

[1] Algolia

Mein persönlicher Tipp für kommerzielle Such Anwendungen bei den sich optimale Darstellungen der Suchergebnisse rechnen. Eine auch verwendbare Google Suche Integration kommt da nicht ansatzweise ran (Ist bei intensiver Nutzung auch nicht kostenlos!)

Kostenfreie Nutzung Algolia für OpenSource Dokumentation
Wir nutzen bei Plone die Algolia DocSearch Engine als OpenSource Projekt kostenlos, um die statisch publizierten Plone Dokumentationen unter https://docs.plone.org/ durchsuchbar zu machen. Für alle öffentlichen technischen Dokumentationen (z.B. OpenSource Projekte) ist das Tool kostenlos verwendbar: https://docsearch.algolia.com

Dokumentation
Um Suchen und die Optimierung/Wichtung von Indexen zu verstehen und auch für OpenSource Projekte zu optimieren lohnt es sich die ausgefeilte allgemeine Dokumentation von Algolia anzusehen. Besonders die didaktisch optimierte Darstellung der Suchergebnisse incl. Bilddaten und Variation nach Domain ist extrem cool. Hier macht sich eine gute objektorientierte Informationsarchitektur bemerkbar, wenn die sprechenden Pfade im Ergebnis als Kontext angezeigt werden können.

LG Armin

Noch eine kleine Ergänzung. Neben der internen Suche, kann man auch Solr/Elastic Search über add-on’s verwenden. Das ist vor allem bei großen Installation der Weg, da man dort eine bessere Sortierung erreichen kann. Für alles was nur ein paar tausend Dokumente hat, reichen die Boardmittel in der Regal aus.

Hi, MrTango. Ich hatte den Plone Post wegen der Links zweigeteilt. Hast Du den ersten nicht gelesen? Dort steht Solr & Elasticsearch schon drin. Schau mal drüber ob das Deinen Segen hat :wink: LG Armin

@acsr inhaltlich alles gut, aber die eigentlich gefragten Infos gingen auf Grund deines Informationsumfangs etwas unter (ich hab Solr & co glatt überlesen \o/ ). Ich glaube Jens interessieert sich da eher für das was, unter der Motorhaube steckt als Live-Suche und Plone-Konfiguration.