Loading...

Wir freuen uns auf Ihre Nachricht

Die von Ihnen gesendete Nachricht wird selbstverständlich streng vertraulich behandelt. Wir melden uns dann so rasch wie möglich auf Ihr Anliegen.

Ihr Download steht bereit

Geben Sie uns bitte ein paar Infos zu Ihrer Person bekannt. Die Präsentation wird im Anschluss an die von Ihnen angegebene E-Mail-Adresse gesendet.

Random Forest

TOWA Mitarbeiter Simon Mathis

Written By
Simon Mathis


| 8 Minuten

Was ist eigentlich ein Random Forest? Und warum können Bäume helfen, Kunden zu verstehen?

Ein Random Forest Modell kann genutzt werden, um Entscheidungen von Benutzern vorherzusagen. Es besteht, vereinfacht gesagt, aus einer Ansammlung von verschiedenen Entscheidungsbäumen (Decision Trees), deren einzelne Entscheidungen nach der Auswertung mit Hilfe von Majority Voting zu einer ganzheitlichen Entscheidung zusammengeführt werden.

Entscheidungsbaum – Baustein des Waldes

Um einen Random Forest zu verstehen muss man zuerst den elementaren Baustein verstehen, den Entscheidungsbaum. Um den Entscheidungsbaum greifbarer zu machen werde ich anhand eines für unsere Agentur alltäglichen Beispiels das Konzept erklären:

Wird ein Website Besucher einen Artikel kaufen oder nicht?

Das zugrundeliegende Szenario bei einem Besuch auf einem E-Commerce Shop könnte folgendermaßen aussehen:

Ein User besucht die Webseite, vielleicht zum ersten Mal, vielleicht hat er schonmal etwas gekauft. Er bleibt auf der Webseite, schaut sich Produkte an, und schließt die Seite nach einer bestimmten Zeit. Die Frage ist: Wie stellen wir jetzt diese möglichen Verhalten in einem Entscheidungsbaum dar, um das Verhalten des Users besser vorherzusagen? Anhand seiner Journey auf der Webseite können wir dieses Verhalten in einem Entscheidungsbaum abbilden, der zeigt, unter welchen Bedingungen Benutzer kaufen. Vereinfacht kann ein solcher Baum so aussehen:

Wie können mir Random Forests jetzt helfen meinen Umsatz zu steigern?

Ein einzelner Entscheidungsbaum ist aber sehr fehleranfällig, da er dazu neigt, sich zu sehr an die vorliegenden Daten anzupassen (Overfitting). Um dieses Problem in den Griff zu bekommen kann eine Kombination von mehreren (u.U. bis zu hunderten) von Entscheidungsbäumen – Random Forest genannt – verwendet werden. Hierzu wird der Durchschnittswert aller Bäume als Ergebnis des Random Forest verwendet, der mehr Aussagekraft hat als ein einzelner Entscheidungsbaum.

Das Besondere an diesen Entscheidungsbäumen ist, dass die einzelnen Variablen in unterschiedlichen Konstellationen immer wieder zu anderen Entscheidungen führen können. Hierzu werden auch die Grenzwerte der Entscheidungsknoten, die den User die Pfade entlang leiten, in jedem Baum verschoben. Es gibt in diesem Falle zwei Variablen, die sich in der Anzahl der Entscheidungen potenzieren. Nimmt man eine weitere Variable hinzu, kommt man aufgrund der möglichen Grenzwerte und ihrer Ausprägungen schnell zu einem ganzen Wald an z.T. sehr verästelten Entscheidungsbäumen.

Es werden hier also alle möglichen Kombinationen von Entscheidungen abgebildet, um daraus eine größere Zahl an Entscheidungsbäumen zu generieren. Die Kombinationen der einzelnen Parameter bestimmt hier den Ausgang und die Aussage der Entscheidungsbäume.

Alle Entscheidungsbäume beschreiben eine Entscheidung, in diesem Fall ob der User kauft der oder nicht, und alle Ergebnisse kumuliert können somit eine genauere Aussage treffen, die gleichzeitig das Problem des Overfittings minimiert.

Zusätzlich zur Vorhersage einer Kaufentscheidung sind Random Forests nützlich, um weitere E-Commerce Fragen zu beantworten, wie zum Beispiel:

  • Wird der User ein zweites Produkt zum Warenkorb hinzufügen? oder
  • Wird der Benutzer Produkte vom Warenkorb entfernen?

Der Vorteil an Random Forests ist es, dass ihre Anwendung schon ab einer relativ geringen Anzahl an Beobachtungen möglich ist. So gilt die “Rule of Thumb”, dass schon bei 100 Beobachtungen verwendbare Ergebnisse erzielt werden können. Bei der Anzahl der Webseitenbesucher gelingt es meist relativ schnell eine Stichprobe zu sammeln die groß genug ist.

Die richtigen Antworten auf diese Fragen zu finden kann dabei helfen Online Shops zu optimieren und auf bestimmte Änderungen im Verhalten der Benutzer differenziert zu reagieren. Falls z.B. ein User kurz davor steht, den Kauf abzubrechen können so gezielte Gegenmaßnahmen zu seinen wichtigsten Parametern ergriffen werden, indem beispielsweise Coupon Codes oder spezielle Angebote ausgespielt werden, um den Benutzer zur Kaufentscheidung zurückzuführen.

TOWA Mitarbeiter Simon Mathis

Simon Mathis

Director Data

Big Data Spezialist und verantwortlich für die Führung der TOWA-Data-Unit.
E-Mail senden