„All that matters on the chessboard is good moves.“ Dieses Zitat stammt von Bobby Fischer, dem Sieger des “Match des Jahrhunderts“, in dem er 1972 seinen sowjetischen Kontrahenten Boris Spasski bezwang und zum elften Weltmeister im Schach wurde. Was aber macht Züge zu „good moves“ bzw. zum Gegenteil? Und was hat das mit Kundenbindung zu tun?
All that matters on the chessboard is good moves.
Dieser Post möchte das für Dich klären. Ohne lästige Mathematik lernst Du eine spezielle Methode der künstlichen Intelligenz kennen, reinforcement learning.
Diese Methode löst nicht nur das Schachproblem, sondern hilft Unternehmen dabei, Kundenerlebnisse zu optimieren, um hierdurch die Kundenbindung und schließlich den Customer Lifetime Value zu maximieren.
Was macht nun Züge zu “good moves”? Ist es beispielsweise schlecht, eine Figur zu verlieren? In der unmittelbaren Folge sicherlich. Sinnvoll eingesetzt, kann hierdurch jedoch ein späterer Vorteil erlangt werden, der den anfänglichen Verlust kompensiert, etwa indem hierdurch günstige gegnerische Strukturen zerstört werden.
Es gibt also Situationen, in denen Entscheidungen nicht allein nach ihrem unmittelbaren Nutzen bewertet werden sollten, sondern in einen längerfristigen Kontext gestellt werden müssen. Es gilt hierbei eine Kette von Entscheidungen in ihrer Gesamtheit bestmöglich zu treffen und nicht nur eine Aneinanderreihung isolierter Einzelentscheidungen.
Wie erreicht man so etwas formell, anders gefragt, was ist die Ratio hinter Algorithmen, die uns erlauben würden, eine Kette von Entscheidungen optimal zu treffen? Die Antwort ist denkbar einfach: War das Ergebnis einer Entscheidung gut, muss man nicht nur diese Entscheidung aufwerten, sondern auch zuvor getroffene. Gewinnt man also eine Partie Schach, ist das nicht allein das Ergebnis des Matt-Setzens. Wurde zuvor z.B. auch ein Bauer geopfert, so hat auch diese Entscheidung vermutlich zum Erfolg beigetragen.
Befindet man sich in einer späteren Partie in derselben oder einer vergleichbaren Situation, sollte demnach dieses Bauernopfer abermals erwogen werden. Sehr erfahrene Spieler haben sich oft in denselben oder miteinander vergleichbaren Situationen befunden und kennen die Züge, die langfristig sinnvoll sind und sie dem Sieg ein Stück näher bringen können.
Was hat das nun mit Kundenbindung zu tun? Auch hier gibt es das sprichwörtliche Bauernopfer. Nehmen wir an, ein Kunde stünde kurz vor der Verlängerung seines Mobilfunkvertrages. Nehmen wir außerdem an, er hätte sein monatliches Datenvolumen fast aufgebraucht, womit ihm eine Drosselung der Übertragungsrate drohte. Entsprechend der Strategie des Mobilfunkanbieters erhält er eine SMS-Nachricht mit einem überteuerten Angebot für ein zusätzliches Datenpaket.
Der Kunde mag das Angebot vielleicht akzeptieren, zumal er dringend etwas recherchieren muss, empfindet es dabei jedoch als dreist. Bei der bald darauf anstehenden Vertragsverlängerung entschließt er sich darum zur Kündigung. Dem Anbieter entgehen wichtige künftige Umsätze.
Was ist hier schief gelaufen? Kann es sein, dass ein Bauernopfer, also ein rabattiertes Datenpaket sinnvoller gewesen wäre? In der Tat.
Formell wäre der Anbieter besser wie folgt vorgegangen. In einem Test kann er einem Teil seiner Kunden einen Rabatt gewähren, um anschließend kurzfristige Verluste mit langfristigen Gewinnen zu verrechnen. Dabei wird der Anbieter feststellen, dass der Kunde aus obigem Beispiel und Kunden aus dem selben Kundensegment (vergleichbare Kunden) ein wenig mehr Großzügigkeit zu schätzen wissen, ihren Vertrag häufiger verlängern und somit nachhaltige Umsätze garantieren.
Die Maßnahme eines frühzeitigen, rabattierten Angebots ist also auch als ein Instrument der Kundenbindung bzw. Kündigungsverhinderung (churn prevention) zu verstehen. Das Problem von churn (Kündigung) entsteht nämlich normalerweise nicht erst bei Vertrags-Ende, sondern ist oftmals die Folge einer Sequenz früherer Fehlentscheidungen.
Eine typische Kundenbeziehung ist in Abbildung 1 dargestellt. Dabei darf nicht vergessen werden, dass sich einzelne Kontaktpunkte (Touchpoints) in immer mehr Kanälen (Social, Push, E-Mail, SMS/MMS etc.) zu einem Gesamterlebnis fügen. Unternehmen stehen also vor der Herausforderung, Touch-Points in einer Vielzahl von Kanälen zu orchestrieren, um die Customer Loyalty (die Loyalität ihrer Kunden) zu erhöhen. In diesem Zusammenhang spricht man auch vom Problem der Next-best-action (NBA).
Das Wort “Next” deutet hierbei auf die sequentielle Natur des Entscheidungsproblems hin. So häufig dieser Ausdruck verwendet wird, so selten wird er nach unserer Erfahrung richtig verstanden und umgesetzt. Der Grund hierfür mag sein, dass reinforcement learning, ein modernes Werkzeug künstlicher Intelligenz zum Lösen sequenzieller Entscheidungsprobleme anfänglich nur schwer zugänglich und daher abschreckend ist.
Die Orchestrierung aller Maßnahmen in teils jahrelangen Kundenbeziehungen in vielen Kanälen innerhalb eines hochdynamischen Marktes, stellt Unternehmen vor massive Herausforderungen. Aufgrund fehlenden oder wider besseren Wissens optimieren Unternehmen Entscheidungen bislang isoliert und oftmals regelbasiert. Mithilfe von reinforcement learning lassen sich Entscheidungen in ihrer Gesamtheit optimieren und dynamisch adaptieren.
Als Zielgruppe für eine entsprechende Lösung sind neben Mobilfunkanbietern vor allem Unternehmen aus Branchen mit ebenfalls langfristigen Kundenbeziehungen zu nennen, wie Banken, Versicherungen oder Energieversorger.
Im vorigen Abschnitt war die Rede von vergleichbaren Situationen auf dem Schachbrett bzw. vergleichbarem Kundenverhalten. Einen Begriff von Vergleichbarkeit zu haben ist in beiden Zusammenhängen von enormem Vorteil. Der Grund ist, dass es bei der Vielzahl möglicher Spielverläufe und der Vielfältigkeit von Kundenverhalten, selbst bei einem riesigen Erfahrungsschatz, immer wieder Situationen gibt, die anders als die bis dahin gesehenen sind. Wer dann Vergleiche zu vorher Gesehenem ziehen kann, gleichsam bisherige Erfahrungen zu generalisieren vermag, wird trotz der neuen Situation eine fundierte Entscheidung treffen können.
Formell bedeutet dies, unveränderliche Merkmale von Situationen zu identifizieren, die dieselbe optimale Entscheidung erfordern. In diesem Zusammenhang wird auch von Mustererkennung gesprochen. Beim Schach mag es sein, dass die genaue Position eines Läufers, der weder selbst bedroht ist noch eine andere Figur bedroht, für den nächsten besten Zug vernachlässigbar ist. Im Beispiel des Kunden mag es sein, dass die Wirksamkeit beispielsweise einer bestimmten Upsell-Kampagne nicht vom Alter des Kunden, dafür aber davon abhängt, ob der letzte Rechnungsbetrag vergleichsweise hoch war. Die Rechnungshöhe wäre also eines dieser gesuchten unveränderlichen Merkmale.
Deep learning, eine weitere Methode der künstlichen Intelligenz, hat die herausragende Eigenschaft, selbstständig diejenigen Merkmale in Daten zu identifizieren, die eine bestmögliche Generalisierung erlauben. Hierdurch konnten in manchen Anwendungsfeldern, etwa der Diagnose von Leukämien[1], Leistungen erzielt werden, die den menschlichen Fähigkeiten ebenbürtig sind. Diese Algorithmen konnten dabei oft Merkmale aufspüren und ausnutzen, die dem Menschen verborgen waren.
Neben komplexen strategischen Aufgaben ist der Mensch vermutlich jedoch noch auf lange Sicht künstlicher Intelligenz bei folgender Aufgabe überlegen: Dem Wissenstransfer. Der Mensch ist herausragend gut darin, in einem Kontext erworbenes Wissen in einen anderen Kontext zu übertragen. Software hat bei dieser Aufgabe bislang eine harte Zeit[2].
Und trotzdem können Algorithmen in klar umrissenen Problemstellungen äußerst nützlich sein. Deep learning findet z.B. Anwendung beim Design von Medikamenten, dem Erkennen von Sprache, oder der Restauration von Bildern. Die Kombination mit reinforcement learning lässt Anwender die Vorteile beider Welten auskosten. Entsprechende Algorithmen ermöglichen es mittels Generalisierung nachhaltige Entscheidungen selbst in unbekannten Situationen zu treffen.
Deep learning ist jedoch nicht immer die beste Möglichkeit zu generalisieren. In der Tat wurde in den vergangenen Jahren nach unserer Erfahrung viel Geld in Projekten versenkt, die mit weniger komplexen Algorithmen besser umgesetzt worden wären. Methoden des deep learning benötigen allesamt große Datenmengen um Wert zu schaffen.
Nicht jeder Anwendungsfall entspricht dieser Maßgabe. Darum sollte nicht auf einen einzigen Algorithmus, sondern stets auf eine Reihe komplementärer Algorithmen gesetzt werden, die je nach Datenlage das Ruder übernehmen können.
Das nachfolgende Video zeigt, wie eine Roboterhand, die mittels deep learning und reinforcement learning den Zauberwürfel (Rubik’s cube) löst.
Neben nachhaltigem Handeln und der Fähigkeit zu generalisieren, braucht es noch eine dritte Eigenschaft um ein guter Schachspieler zu werden bzw. Kundenerlebnisse substanziell zu verbessern: die Fähigkeit, sich rasch an veränderte Bedingungen anzupassen. Spielt man etwa gegen einen unbekannten Gegner, kann die in vorangegangenen Spielen mühsam erlernte Strategie plötzlich weniger wirksam sein.
Im Fall eines Mobilfunkanbieters kann es z.B. vorkommen, dass ein neuer Konkurrent den Markt betritt, oder bestehende Konkurrenz eine neue Strategie initiiert. Beides beeinflusst potentiell das Verhalten der Stammkunden. Die Welt ändert sich und sie scheint es immer schneller zu tun. Auch kommt es vor, dass spezielle Marketingkampagnen Kunden anziehen, die ein zu Bestandskunden wenig vergleichbares Verhalten zeigen. Das Kauferlebnis ist dann vielversprechend, die anschließende Kundenbeziehung aber unbefriedigend.
Allein auf eine vorhandene Strategie zu setzen und das bis dahin Erlernte einfach ausnutzen zu wollen, wäre in diesem Fall fahrlässig. Vielmehr gilt es, durch vorsichtiges Experimentieren, die Strategie entsprechend der Veränderungen weiter zu entwickeln.
Formell heißt das, nicht immer diejenige Maßnahme zu tätigen, die nach aktuellem Kenntnisstand optimal ist, sondern gelegentlich eine vermeintlich suboptimale Entscheidung zu versuchen, da nur so ermittelt werden kann, ob diese zwischenzeitlich doch das gesuchte Optimum herbeiführt.
Entscheidungen, die für das Customer Retention Management gestern noch suboptimal waren, können heute optimal sein und umgekehrt. Herausfinden kann man das nur durch entsprechende, zeitnahe Tests.
Gute Lösungen meistern die subtile Balance zwischen Ausnutzen vorhandenen Wissens und Erforschen neuer Begebenheiten. Solche Software ist de facto selbstlernend, erkennt Trends frühzeitig und verhindert Einbußen beim Umsatz. Vergleiche hierzu auch Abbildung 2.
Viele Unternehmen setzen nach wie vor auf sogenannte scores. Ein churn score etwa ist proportional zur Wahrscheinlichkeit, dass ein Kunde innerhalb einer gewissen Dauer seinen Vertrag kündigen wird.
Die zugrunde liegende Wahrscheinlichkeit entstammt dabei statistischen Modellen des Kündigungsverhaltens. Diese Modelle mögen oft klug aufgesetzt sein, trotzdem findet hier ein problematischer Bruch statt: Die Fachseite muss entscheiden, welche Maßnahmen zur Bindung von Kunden in Abhängigkeit der Höhe des churn score getroffen werden soll.
Ein hoher score etwa sagt indes nicht, welches die beste Gegenmaßnahme ist, Kündigungen zu verhindern. Wird ein Bonus zu hoch angesetzt, verschenkt das Unternehmen Geld, ist er zu niedrig, verliert es den Kunden. Die Software GoodMoves schließt diese wichtige Lücke, indem sie für jeden Kunden unter Berücksichtigung der Business-Logik direkt optimale Maßnahmen vorschlägt.
Zusammenfassend kann festgehalten werden, dass Schachspiel und Kundenbindung auf hohem Niveau dreierlei Fähigkeiten erfordern.
Alle drei Fähigkeiten sollten in solider Software in einer einzigen künstlichen Intelligenz ihren Höhepunkt erreichen.
Die besten derzeit erhältlichen Software-Lösungen erlauben es, Entscheidungen über die NBA weitestgehend zu automatisieren. Dennoch bedarf es des Menschen beim Erdenken dieser Maßnahmen, die Software wählt dann lediglich eine davon der Situation entsprechend aus.
Es ist zu erwarten, dass Software künftig vermehrt kreative Aufgaben übernehmen kann. Erste Beispiele in Musik und bildender Kunst belegen dies eindrucksvoll.
[1] “An Artificial Neural Network Providing Highly Reliable Decision Support in a Routine Setting for Classification of B-Cell Neoplasms Based on Flow Cytometric Raw Data”
Wolfgang Kern, MD , Franz Elsner, PhD , Max Zhao , Nanditha Mallesh , Richard Schabath, PhD , Claudia Haferlach, MD , Peter Krawitz, MD , Hannes Lüling, PhD , Torsten Haferlach, MD
[2] “Knowledge Transfer between Artificial Neural Networks for Different Multicolor Flow Cytometry Protocols Improves Classification Performance for Rare B-Cell Neoplasm Subtypes”
Nanditha Mallesh , Max Zhao , Franz Elsner, PhD , Hannes Lüling, PhD , Richard Schabath, PhD , Claudia Haferlach, MD , Torsten Haferlach, MD , Peter Krawitz, MD , Wolfgang Kern, MD
Als Data Scientist bin ich seit vielen Jahren für DAX-Unternehmen und Startups tätig.
Mit meinem Unternehmen, der res mechanica GmbH mit Sitz in München haben wir 2020 GoodMoves aus der Taufe gehoben. Ein Software-Service für NBA (Next Best Action).
Die dahinterstehende Technologie erreichte die höchste jemals vergebene Punktzahl beim renommierten Stipendium “EXIST” des Bundesministeriums für Wirtschaft und Energie.
Hast Du Fragen oder Anmerkungen? Dann freue ich mich über Deine Kontaktaufnahme.
Content
Tool-Box
100% kostenfrei | 10 Min. per Q&A
Innerhalb von max. 10 Minuten mittels Q&A erhältst Du eine Standortbestimmung, wo Du im Feld Marketing-Kunden-Daten ansetzen kannst.