Im ersten Teil meiner Beiträge über Recommender Systems / Recommendation Systeme bin ich auf Personalisierungstechnicken und ihre Funktionen eingegangen. In diesem Teil möchte ich euch erklären, welche Filtertechnicken bei Recommender Systemen verwendet werden.

Die gängigsten Filtertechniken, mit denen Recommendations generiert werden, sind Content-Based Filtering, auch Item-to-Item Correlation genannt, und Collaborative Filtering, welches auch als User-toUser Correlation bekannt ist. Da beide Verfahren Vor- und Nachteile mit sich bringen, kommen oft hybride Systeme zum Einsatz.

Content-Based Filtering

Das CDF Verfahren funktioniert nach dem Prinzip, das die Eigenschaften von Objekten (Produkte oder Dienstleistungen, die bspw. in einem Onlineshop angeboten werden) in einem Data-Warehouse miteinander vergleicht und über verschiedene mathematische Verfahren die Ähnlichkeit dieser Objekte ermittelt. Ein Beispiel hierfür sei ein roter Hut und eine rote Tasche. Die Ähnlichkeit dieser zwei Produkte ist die Farbe rot.

Recommendation Systeme, die Empfehlungen nach dem Prinzip des CBF generieren, greifen auf verschiedene Lösungsansätze zur Identifizierung und Bewertung von Eigenschaften eines Produktes oder einer Dienstleistung zurück. Die Ähnlichkeit dieser Eigenschaften kann durch verschiedene Verfahren bestimmt werden, welche sich in exact-match und best-match Verfahren unterteilen lassen. Das exact-match Verfahren generiert Recommendations, die vollständig dem Präferenzprofil entsprechen. Das best-match Verfahren sortiert Recommendations nach Relevanz, weshalb die generierten Ergebnisse sich nicht vollständig mit dem Präferenzprofil gleichen müssen.

Vorteile des Content-Based Filtering

  • Es ist keine „kritische Masse“ an Usern notwendig.
  • Anwendbar bei anonymen Usern (not loged-in User).

 

Nachteile des Content-Based Filtering

  • Produkteigenschaften sind teilweise schwer automatisch bewertbar (bspw. Musik-, Bild- oder Videodateien).
  • Einseitiger Kreis an Empfehlungen möglich, wenn ein Benutzer nur ein Produkt bewertet und es werden dann Recommendations nur für ähnliche Produkte generiert solange der Benutzer nur diese eine Bewertung abgegeben hat.
  • Kein „Cross-Selling“ möglich solange der Benutzer keine Bewertung in einem bestimmten Bereich abgegeben hat.
  • Mindestmenge an Bewertungen notwendig für das Generieren von aussagekräftigen Recommendations

 

Beispiel für Content-Based Filtering

Das System sucht unter Verwendung der CBF Technik nach ähnlichen oder ergänzenden Produkten, wie bspw. Zubehör, zu dem Ziel-Produkt (Produkt, für das der User Interesse zeigt oder das bereits im Warenkorb liegt). Wenn die Menge der ähnlichen bzw. ergänzenden Produkte identifiziert ist, filtert das System noch die Präferenzen eines Benutzers heraus, falls diese bekannt sind und generiert dann unter Berücksichtigung eines gewichteten Mittelwertes die Recommendations. Ein Beispiel für Content-Based Filtering bietet Amazon unter der Rubrik „Kürzlich angesehen“ an, wie die folgende Abbildung zeigt:

Beispiel für Content-Based Filtering

Beispiel für Content-Based Filtering

Collaborative Filtering

Bei dieser Filtertechnik werden nicht die Eigenschaften von Objekten (Produkte oder Dienstleistungen) miteinander verglichen, sondern Benutzer und ihre individuellen Vorlieben. Das System vergleicht ein Benutzerprofil mit allen Profilen aus der Datenbank auf Ähnlichkeit und empfiehlt Objekte, die Benutzer mit gleichen Vorlieben positiv bewertet haben.
Hierbei werden die Empfehlungen vom System automatisch generiert, denn das System basiert auf einer künstlichen Intelligenz und lernt über eine längere Zeitspanne vom Benutzerverhalten. Empfehlungen, die nach dem Prinzip des CF generiert wurden, sind persistent, da das Lernen des Benutzerverhaltens auf der Webseite meist nur über eine längere Zeitspanne erfolgen kann.
Es gibt unterschiedliche Algorithmen, die für die Methode des CF entwickelt wurden wie folgende Abbildung zeigt:

Klassifikation von Collaborative Filtering

Klassifikation von Collaborative Filtering

 

Manual Collaborative Filtering

Unter Manual CF versteht man die manuelle Eingabe von Informationen durch den Benutzer, indem er direkt Objekte anderen Benutzern empfiehlt. Active CF (Push-Variante) bedeutet, dass der Benutzer durch eine manuelle Tätigkeit selbst Empfehlungen an andere Benutzer verschickt. Unter Passive CF (Pull-Variante) versteht man, dass der Benutzer durch manuelle Bemühungen Empfehlungen bekommen kann (bspw. die Buchung von Channels auf Musik- oder Videoportalen).
Es ist ein Nachteil von Manual CF, dass die Benutzer miteinander vernetzt sein müssen, d.h. sie müssen sich kennen.

Automated Collaborative Filtering

Automated CF bedeutet, dass das System die Vorlieben eines Benutzers analysiert und automatisch entsprechende Recommendations generiert. Ein Unterschied zu Manual CF ist, dass die Benutzer sich untereinander nicht kennen müssen. Die zwei Methoden des Automated CF unterscheiden sich in ihrer Verfahrensweise mit unterschiedlichen mathematisch-statistischen Algorithmen:

Model-Based CF (Modellbasiertes Verfahren):
Es wird ein probabilistisches Modell errechnet, mit dem man Bewertungen für nicht bewertete Objekte prognostiziert. Als Basis dienen die Bewertungen in den Benutzerprofilen für die Wahrscheinlichkeitsberechnung, in der die Parameter für das Model- Based CF „offline“ geschätzt werden. Dieses Modellbasierte Verfahren funktioniert nach den Techniken des Clustering und der Bayesschen Netze.

Memory-Based CF (Speicherbasiertes Verfahren):
Hierbei dient die Berechnung eines arithmetischen Mittelwertes über alle verfügbaren Bewertungen als Grundlage für das Memory-Based CF. Da die Berechnung eines arithmetischen Mittelwertes für ein Objekt verwendet wird, erhalten alle aktiven Benutzer übereinstimmende Werte für dieses Objekt. Deshalb spricht man hierbei über ein nicht- individualisiertes Verfahren.
Beim Memory-Based CF gibt es distanzbasierte Ansätze, die das Ähnlichkeitsmaß über Distanzmaße berechnen, und den korrelationsbasierten Ansatz von Pearson, der die Ähnlichkeit zwischen einem beliebigen Benutzer und dem Empfänger der Recommendation direkt darstellt.

 

Vorteile des Collaborative Filtering

  • Medien, die schwer automatisch zu klassifizieren sind können aufgrund der Erfassung von Binärdateien personalisiert werden.
  • Das Recommendation System erfasst auch subjektive Merkmaleeines Objektes.
  • „Cross-Selling“ Elemente vorhanden.
  • Niedriger administrativer Aufwand während des laufenden Betriebs.
  • Leichte Implementierung sobald erste Bewertungen vorhandensind.
  • Individualisierte Recommendations.
  • Erweiterte Einsatzmöglichkeit bspw. in Social Networks umMenschen mit ähnlichen Interessen zusammenzuführen.

Nachteile des Collaborative Filtering

  • Ohne vorhandene Bewertungen von Objekten können auch keine Recommendations generiert werden.
  • Bei neuen Benutzern müssen Daten über diesen Benutzer vorhanden sein, um Recommendations erstellen zu können.
  • Es können bei neuartigen oder Nischen Produkten keine Recommendations generiert werden, da über diese keine Bewertungen vorhanden sind.
  • Nur wenige Benutzer bewerten Objekte.
  • Geringe Nachvollziehbarkeit beim Benutzer.
  • Behandlung von „Ausreißern“ – bspw. wenn ein männlicherBenutzer ein Geschenk für eine Frau kauft, kann dies sein Profil verfälschen.

 

Beispiel für Collaborative Filtering

Das Recommendation System von Amazon generiert mittels dem Prinzip des CF die Empfehlungen „Kunden, die diesen Artikel gekauft haben, kauften auch“, die jedem Benutzer von Amazon bekannt sind. Kommt ein User auf die Webseite und interessiert sich für ein bestimmtes Produkt, werden Recommendations generiert, die andere Benutzer in Bezug mit dem betrachteten Produkt gekauft haben:

Recommendations nach dem Prinzip des CF

Recommendations nach dem Prinzip des CF

 

Hybride Systeme

CBF und CF Systeme bringen trotz ihres Potenzials auch spezifische Schwächen mit sich, die man durch Kombination unterschiedlicher Algorithmen für Recommendations versucht zu umgehen.
Eines der bekanntesten hybriden Systeme ist das Item-Based Collaborative Filtering, auch Feature-Based Collaborative Filtering genannt, welches CBF-Merkmale in ein CF-System einbaut.

Es gibt noch zahlreiche andere hybride Systeme, auf die in diesem Artikel nicht weiter eingegangen wird.

Jede Personalisierungstechnik benötigt Input, um Recommendations zu generieren. Meist wird dieser Input vom Benutzer in Form seiner persönlichen Informationen bereitgestellt. Diese Informationen können durch manuelle Eingaben, bspw. beim Anlegen eines Benutzerprofils, in eine Datenbank gespeichert werden oder durch die Analyse des Surfverhaltens mit verschiedenen Tracking-Tools.

By Published On: Februar 20th, 2013Categories: Allgemein, E-Commerce, Google, Online Marketing

Google Partner Cutvert. Das Bild zeigt das Google Partner-Logo, das eine Partnerschaft mit Google symbolisiert.