Pimcore User Group | Berlin - Reality Check Pimcore Enterprise Platform: Managing Business Assets at Scale
Pimcore und Open Source, das gehört einfach zusammen. Doch nicht für jedes Projekt ist Open Source die passende Lösung. Interne (Compliance-)Auflagen, spezielle Anforderungen an den Service (Long Term Support) oder ein höherer Bedarf an vorinstallierten Funktionen, es gibt eine Vielzahl an Gründen, die auch den Einsatz proprietärer Software erfordern.
Bei der zweiten Pimcore User Group | Berlin, am 21.06.2023, widmeten sich mehr als 50 Teilnehmer deshalb voll und ganz dem Thema “Pimcore Enterprise”, den Unterschieden zur Community Edition und welche zusätzlichen Möglichkeiten sie bietet, Assets zu verwalten.
Pimcore Enterprise Edition - Vorteile und Unterschiede zur Community Edition
Stefan Gruber ist Chief Sales Officer bei Pimcore und berät Unternehmen bereits seit mehr als 15 Jahren zu Marketing-Kampagnen und Digitalisierungsprojekten. Er kennt die Ansprüche an Customer Experience Plattformen und natürlich die Vorteile von Pimcore so gut wie kein anderer.
In seinem Vortrag erklärte er die exklusiven Features der Pimcore Enterprise Edition und gab uns Einblicke in die Roadmap von Pimcore und die zukünftig geplanten Features. Für die Teilnehmenden Pimcore-NutzerInnen und die, die es noch werden wollen ein Highlight, denn bisher wurden diese Infos nur mit Pimcore-Partnern geteilt.
Product & Asset Experience Portals
Die Portal-Engine ist laut Stefan das beliebteste Feature von Pimcore Enterprise und bietet Unternehmen komplett neue Möglichkeiten, ihre digitalen Assets zu verwalten. Dabei handelt es sich um ein eigenes Frontend, mit dem Unternehmen ihre Daten, wie Bilder, Videos oder auch Produktinformationen anreichern und teilen können. Über das Rechte- und Rollenmanagement der Portale kann genau definiert werden, welche Daten, welchen Nutzern und Partnern zur Verfügung gestellt werden.
Vergleichbare Experience Portale sind zwar auch auf Basis der Community Edition möglich, müssen aber eigens entwickelt und gewartet werden. Die Portal-Engine spart somit erheblich Zeit bei der Konfiguration und Wartung des eigenen Experience Portals.
Stefans Top-3 Features der Portal-Engine in Pimcore Enterprise
- Elasticsearch Integration um Assets durchsuchbar zu machen
- Download Cart um ausgewählte Assets im Bulk herunterzuladen
- Konfigurierbare Reports
Vielen Dank Stefan, für deinen Vortrag und dass du dir Zeit für die Fragen der Community genommen hast!
Reality Check: Vector-based search at Enterprise Scale with ChatGPT and Pimcore
Christoph Lühr ist CTO bei Basilicom und Pimconaut der ersten Stunde. Für die Pimcore User Group hat sich angesehen, wie man ChatGPT dafür nutzen kann, Inhalte in Pimcore mithilfe einer vektorbasierten Suche noch besser auffindbar zu machen. In seiner Präsentation und Demo macht er den Basilicom Reality Check, ob das Modell bereits praktisch umsetzbar ist und ob es in Zukunft eine Alternative zu Tools wie Elasticsearch darstellen kann.
Für seinen Reality Check hat sich Christoph ein “Produkt” ausgesucht, das allen vertraut ist: Filme. Anhand der IMDb (International Movie Database) zeigte er uns erst die klassische Keyword basierte Volltextsuche, die bei einer Suche nach “Sherlock” an erster Stelle die beliebte Serie vorschlägt.
Doch was passiert, wenn man den Titel des Films oder der Serie nicht kennt? Dazu nutzte Christoph die Suche “Detektiv, London”. Die Ergebnisse? Unzufriedenstellend! Denn während den meisten Nutzern aus dem Kontext klar wäre, welcher Titel hier gesucht wird, muss sich die Volltextsuche darauf verlassen, dass die gesuchten Keywords, oder festgelegte Synonyme, in den Daten enthalten sind.
“Volltextsuche funktioniert super, wenn du das Stichwort kennst, aber wenn du das Konzept suchst, kann man's vergessen!” - Christoph Lühr
Kontext suchen, mithilfe von Vektor-Datenbanken
Um die Lücke der Volltextsuche zu füllen, hat Christoph also eine eigene Suche erstellt, mit Hilfe einer Vektor-Datenbank. Was ist ein Vektor? Ein Vektor ist eine Dimension, also eine Beziehung zu einer Eigenschaft.
Einfach gesagt, es wird die Entfernung zu einer bestimmten Eigenschaft gemessen. Ein Beispiel für Vektoren sind Koordinaten. In diesem Fall ist Potsdam näher an der Eigenschaft Berlin als Stuttgart.
Ein relevanter Vektor für einen Film ist zum Beispiel die Nähe zu einem Genre. “Sherlock Holmes” liegt beispielsweise sehr nahe an der “Eigenschaft” Krimi, “Rome & Julia” wiederum weit entfernt.
Um nach Kontext suchen zu können, sind allerdings deutlich mehr als zwei Vektoren nötig. Tatsächlich benötigt man laut Christoph eher hunderte oder sogar tausende Dimensionen, um eine effektive vektorbasierte Suche zu finden.
Eine solche Anzahl an Vektoren kann nicht effizient manuell erstellt werden - dafür benötigt man Machine Learning, zum Beispiel Large Language Models (LLM) wie ChatGPT, wenn es um Texte geht. Denn diese Modelle verfügen bereits über Vektoren.
Genauer gesagt, hat Christoph die “Embeddings”-API von ChatGPT genutzt, um die Texte zu analysieren. Embedding ist dabei einfach ein anderes Wort für Vektor.
Die KI erkennt dann in den über die API geteilten Texten Konzepte und generiert daraus Vektoren. Diese werden dann in einer Datenbank gespeichert, um sie später für die Suche zu nutzen. Zum Beispiel kann sie aus zwei Namen ableiten, dass es sich bei den Protagonisten um zwei Männer handelt.
Für den Reality Check hat Christoph also Filmbeschreibungen aus der IMDb in Pimcore hochgeladen und analysieren lassen. Die KI berechnet dann bei jeder Suche automatisch die Entfernung der Vektoren. Je näher das Ergebnis, desto höher erscheint es letztendlich in der Suche. Das Ergebnis schlägt die Volltextsuche des Originals deutlich.
Bei der Suche “zwei Männer untersuchen Kriminalfälle in London, historisch” erscheint Sherlock Holmes direkt in den Top-3.
Ein weiterer Vorteil: da die Suche auf LLMs basiert, ist sie auch sprachlich unabhängig wie Christoph nach der Präsentation in einer Demo zeigt. Auch wenn ein Text zum Beispiel nur in Deutsch oder Englisch verfügbar ist, kann in jeder Sprache gesucht werden, mit der die KI trainiert wurde.
Unser Fazit
Basilicom Reality Check? Check! Die vektorbasierte Suche liefert sehr gute Ergebnisse, wenn Nutzer nach einem Konzept und nicht nach einem exakten Begriff suchen. In vielen Fällen macht die Volltextsuche natürlich weiter Sinn, unter anderem weil sie im Betrieb kosteneffizienter ist und die Keyword-Suche ein Teil unseres angelernten Suchverhaltens ist.
Eine vektorbasierte Suche kann aber eine sehr gute Ergänzung oder Alternative sein und die User Experience erheblich verbessern. Da Vektor-Datenbanken mithilfe von KI automatisch erstellt und aktualisiert werden können, benötigen sie vergleichsweise wenig Zeit für das Setup und die Pflege. Voraussetzung dafür sind aber ausreichend Informationen, wie Produkttexte, um Vektoren zu generieren.
Wenn Sie wissen möchten, ob eine vektor-basierte Suche bei Ihnen Sinn macht und wie sie diese implementieren können, beraten wir Sie gerne.