Kapitel 17
IN DIESEM KAPITEL
Im diesem und den folgenden Kapiteln werden die »Intelligenten« Funktionen der SAP Analytics Cloud dargestellt. Mit Künstlicher Intelligenz hat das allerdings nur bedingt zu tun. Häufig ist es eher Statistik, wobei die Grenzen fließend sind. Maschinelles Lernen war in den letzten Jahren ein Hype-Thema. Allerdings hat sich das ein wenig beruhigt. Schnelle Erfolge sind selten und man braucht ein wenig Glück, auf gute Daten zu stoßen. Statistische Funktionen wurden in der Vergangenheit im Controlling viel zu wenig eingesetzt.
Die SAP Analytics Cloud bietet mittlerweile einiges an Unterstützung. Ziel der Entwickler war und ist es, den Benutzer so zu unterstützen, dass die technische Expertise in den Hintergrund gestellt werden soll. Wichtig dabei ist es, die Themen mit den Werkzeugen zur konventionellen Analyse und Planung zu verbinden.
Die »intelligenten Funktionen« können in zwei Teilbereiche unterteilt werden:
Smart Predict umfasst die klassischen Predictive Analytics Features. Smart Predict unterstützt drei Verfahren: Klassifikation, Regression und Zeitreihen-Forecast. Damit lassen sich die wesentlichen Fragestellungen in diesem Bereich beantworten. Welche Kunden/Mitarbeiter kündigen? Wie viel Umsatz werden wir im nächsten Quartal machen? Welche Wirkung hat der Rabatt auf den Umsatz?
Im maschinellen Lernen unterscheidet man zwischen überwachtem, nicht überwachtem Lernen sowie bestärkendem Lernen (Reinforcement Learning). Smart Predict fokussiert auf das unterstützte Lernen. Beim unterstützten Lernen sind Einfluss- und Zielvariablen bekannt.
Grundlage jeder Planung ist üblicherweise eine Vorschaurechnung: So ist der Ausgangspunkt der strategischen Planung häufig eine Gap-Analyse, die auf einer Fortschreibung der aktuellen Strategie unter Berücksichtigung der Prognose von Umweltfaktoren basiert. Gleiches gilt für das Budget des nächsten Jahres, das in der Regel auf der Jahresendprognose des aktuellen Jahres und auf Erwartungswerten für das zu planende Jahr beruht. Obwohl sich die verschiedenen Ausprägungen deutlich unterscheiden, ist das Ziel eindeutig: Man möchte einen möglichst unverzerrten Blick in die Zukunft haben.
Um die Forecast-Genauigkeit zu erhöhen, werden häufig statistische Methoden eingesetzt. Aus vergangenen Perioden wird die Entwicklung unter Berücksichtigung von Trends und Saisonfiguren fortgeschrieben. Anspruchsvolle Lösungen wie beispielsweise ARIMA können zum Einsatz kommen, wenn die Datengrundlage es erlaubt.
Grundsätzlich sollten Zeitreihen über einige Perioden bereitstehen und keine disruptiven Ereignisse (zum Beispiel Covid, Finanzkrise) aufgetreten sein. Zwar gibt es Möglichkeiten, auch Letztere zu justieren. Das ist aber aufwendig.
Die zeitliche Entwicklung hat aber in der Regel nur eine begrenzte Erklärungskraft. Gerade beim Absatz gibt es vielfältige Einflussfaktoren. Alternativ oder auch additiv könnte eine Korrelationsanalyse auf mögliche Ähnlichkeiten zum Beispiel zwischen Produkten hinweisen. Auf mögliche Herausforderungen sei hier aber aufmerksam gemacht: Zu einer hohen Anzahl möglicher Einflussfaktoren kommt möglicherweise noch ein unbekannter Zeitversatz. Zudem erkennt man durch die Korrelationsanalyse noch keine Kausalität. Somit weiß man beispielsweise nicht unbedingt, welches Produkt (bei zeitgleichem Auftreten) Follower und welches Leader ist.
Auch moderne Verfahren täuschen allerdings nicht darüber hinweg, dass es sich bei einer statistischen Prognose um eine Vergangenheitsbetrachtung handelt. So gibt es auch disruptive Veränderungen, die praktisch nicht aus Vergangenheitsinformationen abgeleitet werden können. Auch bei gegebener Skepsis bezüglich manueller Einschätzungen der zukünftigen Entwicklung reicht es meistens nicht aus, ausschließlich statistische Verfahren einzusetzen. Eine strukturierte manuelle Einschätzung muss in den Vorgang integriert werden. Insofern sind automatisch erzeugte Ergebnisse stets zu hinterfragen. Der Entscheider sollte die Möglichkeit haben, einzugreifen beziehungsweise automatisch erzeugte Daten zu überschreiben. Es ist wichtig, das Kontextwissen des jeweiligen Anwenders zu integrieren. So hat der Fachexperte unter Umständen Kenntnisse über konkret anstehende Kundenaufträge und weitere diskontinuierliche Entwicklungen.
Eine Fortschreibung aus Vergangenheitsdaten wird über die Zeitreihenprognose aus Smart Predict unterstützt. Üblicherweise Einflüsse aus verschiedenen Komponenten:
Smart Predict unterstützt genau diesen Ansatz. Seit geraumer Zeit werden auch weitere Einflussgrößen neben der Zeitreihenbetrachtung unterstützt.
Bei internen Einflussfaktoren kann die Vorschau hingegen unproblematisch sein: Hier treffen Sie vielleicht sogar selber die Entscheidung. Wenn beispielsweise die durchschnittliche Rabatthöhe einen signifikanten Einfluss auf den Absatz hat, dann können Sie über die Festlegung von Maximalrabatten im Vertrieb die Position aktiv steuern.
ERFI
aus Kapitel 15 und 16 (Abbildung 17.1). Daten sind dabei nicht notwendig, die laden Sie gleich neu.
Abbildung 17.1: Kopieren eines Würfels
Zeitreihe
(Abbildung 17.2). Schließen Sie die Daten mit in den Kopiervorgang ein.
Für eine gute Prognose brauchen Sie viele Vergangenheitsdaten. Wenn Sie zwölf Monate vorausschauen wollen, sollten ganz grob fünf Jahre Daten vorliegen.
Öffnen Sie das Modell Zeitreihe
und passen Sie den Zeitrahmen auf 2019
bis 2025
an (Abbildung 17.3).
In den Kapiteln 15 und 16 hatten wir nur Bewegungsdaten für ein Produkt und eine Region. Das ist etwas wenig für eine aussagekräftige Prognose des Gesamtabsatzes. Auch reicht der Horizont der Ist-Daten nicht weit genug, um aussagekräftige Prognosen zu erstellen. Daher müssen Sie frische Daten laden.
Abbildung 17.2: Kopieren eines Modells
Abbildung 17.3: Erweiterung der Datumsdimension
Datenverwaltung
und erstellen Sie einen neuen Datenimport (Abbildung 17.4).
Abbildung 17.4: Neuer Datenimport
SacFuerDummiesZeitreihendaten.xlsx
(Abbildung 17.5). Details zum Import lesen Sie in Kapitel 5.
Abbildung 17.5: Laden der Ist-Daten
Haben Sie wieder etwas Geduld.
In der Überprüfungssicht sollten keine Fehler auftauchen.
Erstellen Sie nun eine Story, ebenfalls mit der Bezeichnung Zeitreihe
, um sich einen Eindruck über die Daten zu verschaffen.
Lassen Sie sich dabei von dem klassischen Entwurfserlebnis
inspirieren. Dies ist notwendig, da eine Ad-hoc-Prognose noch nicht im neuen optimierten Erlebnis unterstützt wird.
Zeitreihe
aus. Wählen Sie die Parameter wie in Abbildung 17.6 dargestellt.
In dem Balken unterhalb der Grafik können Sie das Intervall einstellen. Sie sehen aber schon jetzt ein paar Eigenschaften der Zahlen (Abbildung 17.7): Im Januar, Februar und März jedes Jahres bricht der Absatz ein. Im April gibt es dann einen Boom und im Juni sowie im September und Oktober gibt es dann eine kleine Delle. Also eine klare Saisonalität, dafür braucht man vielleicht ein gutes Auge, aber noch keine Statistik.
Abbildung 17.6: Parametrisierung der Zeitreihe
Abbildung 17.7: Ein Zeitreihendiagramm
Erstellen Sie nun eine Ad-hoc-Prognose.
Dazu legen Sie erst mal ein Tabellen-Widget an. Übernehmen Sie das Datum in die Zeilen und die Version und die Produkte in die Spalten. Wählen Sie bei der Dimension Date
die Hierarchieeinstellung Im Widget nur Blätter anzeigen
. Als Konto übernehmen Sie Menge
und als Kennzahl Wert
.
Die Tabelle sollte wie in Abbildung 17.8 aussehen.
Abbildung 17.8: Tabelle über die Ist-Werte
Erzeugen Sie nun eine Prognoseversion, indem Sie in der Tabelle auf einen beliebigen Wert der Version Actual
klicken und die Ist-Version in eine (private) Prognoseversion kopieren (Abbildung 17.9).
In der Tabelle wird nun die Prognose dargestellt.
Abbildung 17.9: Kopieren in eine private Version
Prognose
und Alle Produkte
und wählen Sie aus den Werkzeugen Prognose
aus (Abbildung 17.10).
Abbildung 17.10: Starten einer Ad-hoc-Prognose
Wählen Sie die Perioden 2023.04
bis 2023.12
aus (Abbildung 17.11).
Sie werden sehen, dass maximal bis Januar 2024 prognostiziert werden kann. Das ist eine von den Entwicklern getroffene Einschränkung. Dies lässt sich aber auch nachvollziehen: Das Verhältnis Ist- zu Prognosewerten wurde 5 zu 1 gesetzt. Es sind 51 Ist-Werte vorhanden, ergo können 10 Werte prognostiziert werden.
Abbildung 17.11: Festlegen der Prognoseparameter
Klicken Sie auf Vorschau
.
Sie gelangen in die Vorschau. Das Ergebnis in Abbildung 17.12 sieht doch schon ziemlich gut aus.
Das gelbe Band um die Prognosewerte stellt den sogenannten Konfidenzbereich dar. Hierbei wird ein Konfidenzniveau von 95 % angenommen. Das bedeutet, mit einer Wahrscheinlichkeit von 95% liegt der mögliche spätere Ist-Wert im Intervall, mit 2,5 % Wahrscheinlichkeit ist er größer und mit 2,5 % kleiner als das Intervall.
Abbildung 17.12: Prognosevorschau
Reißen Sie in der Tabelle die Produkte auf Business
und Dynamic
auf und erstellen Sie eine Berechnung über den prozentualen Unterschied (Abbildung 17.13, siehe auch Kapitel 6).
Sie erkennen leicht, dass das Verhältnis Business zu Dynamic bei den prognostizierten Perioden gleich ist.
Abbildung 17.13: Analyse der Prognose-Ebene
Wie im vorherigen Abschnitt gezeigt, kann man eine Prognose sehr einfach erstellen. Aber üblicherweise erstellen Sie ja nicht nur eine einzige Prognose, sondern für Regionen und Produkte unterschiedliche Prognosen, und zwar häufig eine ganze Menge davon. Die manuelle Konfiguration, wie Sie es gerade gesehen haben, kann recht aufwendig werden. Für die Massenerstellung gibt es ein eigenes Werkzeug: Prognoseszenarien.
Zeitreihenprognosen
(Abbildung 17.14).
Zeitreihe
(Abbildung 17.15).Zeitreihe
als Datenquelle aus (Abbildung 17.16).Wählen Sie nun die Parameter aus, wie in Abbildung 17.17 dargestellt.
Es wird eine Zeitdimension benötigt. Da wir nur eine haben, ist die Entscheidung einfach.
Konto
wählen Sie Menge
. Diese Größe enthält das Absatzvolumen. Kennzahl
enthält Wert
.Die Anzahl der Prognosezeiträume
stellen Sie auf 9
ein.
Hintergrund ist, dass wir Daten bis März 2023 haben. Damit wird eine Jahresendprognose erstellt.
Abbildung 17.14: Neuanlage eines Prognoseszenarios
Abbildung 17.15: Neues Modell
Abbildung 17.16: Konfiguration
Nun die spannende Frage, wie viele einzelne Forecasts sollen denn eigentlich erzeugt werden? Dies können Sie über die Auswahl Entity
steuern (übrigens kein gelungener Name, da in mehrdimensionalen Systemen Entities meistens für die Unternehmen eines Konzerns verwendet werden). In unserem Fall lassen wir erst mal alles frei.
Abbildung 17.17: Vollständige Parametrisierung
Das reicht eigentlich schon für Ihren ersten automatischen Forecast.
Trainieren Sie nun das Szenario.
Sie erhalten je nach Umfang der Analyse das Ergebnis (Abbildung 17.18).
Der mittlere, absolute prozentuale Fehler (englisch Mean Absolute Percentage Error) MAPE ist eine wichtige Qualitätsgröße. Sie teilen die Abweichung durch den jeweiligen Ist-Wert. Negative Abweichungen zählen genauso wie positive Abweichungen, daher der absolute Fehler. Hierauf bilden Sie den ungewichteten Durchschnitt.
Abbildung 17.18: Ergebnis der Prognose
Warum aber »Erwartet«? Die Trainingsdaten werden in mehrere Trainings- und Validierungsbereiche aufgespalten (immer im Verhältnis 75 zu 25). Das trainierte Modell wird auf die Validierung angewendet und der MAPE berechnet. Zur Erläuterung gibt es eine sehr gute Einführung:
https://blogs.sap.com/2021/04/21/understand-accuracy-measure-of-time-series-forecasting-models/
Vielleicht kennen Sie aus einer Statistikvorlesung auch noch das Bestimmtheitsmaß R2. Dieser Faktor gibt an, wie gut eine Gerade die Gesamtabweichung vom Mittelwert erklärt. Dieser Wert wird aber in der Regel auf der Basis der Trainingsdaten ermittelt, man bezeichnet das als In Sample. Über eine Generalisierbarkeit, also die Anwendung auf neue Daten, sagt dies aber nichts aus. Bei der Linearitätsannahme der Einflussfaktoren auf die Zielvariable, wie es der linearen Regression eigen ist, kann man damit leben. Für komplexere Verfahren, wie es auch die Zeitreihenanalyse ist, ist diese Messgröße nicht geeignet.
Der Algorithmus in Smart Predict nutzt additive Verfahren. Damit können die unterschiedlichen Einflüsse separiert werden. Abbildung 17.19 zeigt grafisch diese Separierung.
Abbildung 17.19: Aufspaltung der Wirkungen
Interessant ist dabei die Stärke der Einflüsse (Abbildung 17.20). Sie sehen, dass in unserem Beispiel der Trend dominierend ist, aber auch eine deutliche Saisonalität zu erkennen ist.
Abbildung 17.20: Stärke der Einflüsse
Nun sind Sie sicherlich auch auf die Details gespannt, denn eine Gesamtprognose reicht nicht aus, um beispielsweise eine Produktionsplanung zu versorgen. Hier sind schon Details auf Produktebene notwendig.
Über das Plus in der Icon-Leiste können Sie sich ein neues Modell im Prognoseszenario anlegen (Abbildung 17.21).
Leider müssen Sie noch mal alle Parameter angeben. Aber das übt.
Abbildung 17.21: Erstellung eines neuen Modells
Abbildung 17.22: Vollständige Parametrisierung
Eine wichtige Frage ist, auf welcher Hierarchieebene der Forecast ausgeführt werden sollte. Es kann beispielsweise sein, dass Sie auf Produkt- und Verkaufsstellenebene gar nicht genug Verkäufe haben und es Perioden ohne Verkäufe gibt (sogenannte sporadische Verkäufer oder Langsamdreher). Aufgrund der wenigen Werte ist dann zu erwarten, dass die Prognosequalität sehr gering ist. Meistens ist es sinnvoll, nur auf höherer Ebene einen Forecast aufzubauen.
Klicken Sie auf Train & Forecast
.
Jetzt brauchen Sie ein wenig Geduld. Ein bis zwei Minuten kann die Kalkulation schon dauern.
Excel ist schneller, werden Sie sagen. Aber das stimmt nur bedingt. Das System prüft im Hintergrund verschiedene Parameter, damit Sie gleich das bestmögliche Ergebnis erhalten (Abbildung 17.23).
Abbildung 17.23: Top- und Flop-Ergebnisse
Schauen Sie sich die Entität Van – Schweden
an (Abbildung 17.24). Der Algorithmus hat quasi kapituliert und prognostiziert keine Schwankungen, ein Verhalten, dass SARIMA, das der Prognose zugrunde liegende Verfahren, gelegentlich zeigt. Der Konfidenzkorridor ist so groß gehalten, dass die Sinnhaftigkeit dieser Prognose infrage gestellt werden kann. Auf Detailebene versagt der Algorithmus allerdings häufig. Bei den Ist-Werten sind oft starke Schwankungen vorzufinden. Auf der obersten Ebene sind die Ergebnisse zwar gut, aber etwas genauer sollte es schon sein. Hier scheint ein Kompromiss sinnvoll. Nehmen Sie doch die Knotenebene, entweder auf Regionen, Kunden oder auch in der Kombination.
Abbildung 17.24: Ergebnis der Prognose
Business, Dynamic
und Nordeuropa, Südeuropa
aus (Abbildung 17.25).
Abbildung 17.25: Erweiterte Parametrisierung
Und siehe da, das Modell rechnet gar nicht so schlecht (Abbildung 17.26).
Abbildung 17.26: Top- und Flop-Ergebnisse
Sie sehen, auf den richtigen Abstraktionsgrad kommt es an. Wie kommt man darauf? Da hilft leider nur Ausprobieren.
Wie kommt man dann allerdings nun auf die gewünschten Details? Schließlich braucht man für die Produktionsplanung die einzelnen Produkte. Man könnte die Allokationsfunktion nutzen. Wir führen das hier aber nicht weiter aus. Probieren Sie es aus!
Sie sollten auch ausprobieren, wie Einflussfaktoren wirken können. Hierzu stellen Sie zunächst einmal Hypothesen über mögliche Wirkungszusammenhänge auf. So könnte die Rabattpolitik einen Einfluss auf das Kaufverhalten haben. Aber auch die Marketingaktivitäten oder externe Größen wie Wirtschaftswachstum können den Absatz beeinflussen.
Rabatt pro Stück
(Abbildung 17.27). Fügen Sie dieses Konto hinzu.
Abbildung 17.27: Zuordnung von Einflussfaktoren
Vergessen Sie nicht, das Häkchen (Abbildung 17.27) zu setzen. Wenn Sie es nicht tun, wird Ihre Eingabe nicht gespeichert.
Lassen Sie nun das Modell trainieren und prognostizieren.
Das Ergebnis hat sich leicht verbessert (Abbildung 17.28). Eine solche Verbesserung ist realitätsnah: Man kämpft in Projekten bildlich ausgedrückt um jedes Promille Verbesserung der Prognosegenauigkeit.
Schauen Sie sich im Detail den Spitzenreiter Business in Südeuropa an (Abbildung 17.29). Man erkennt gut die Saisonalität. Schwankungen werden schon gut abgebildet. Wenn die Prognosefunktion auf die Ist-Perioden angewendet wird, sieht man eine hohe Abdeckung.
Abbildung 17.28: Ergebnis der Prognose auf Knotenebene
Abbildung 17.29: Forecast-Übersicht
Klicken Sie auf den Reiter Erklärung
.
Sie sehen die Wirkungen der jeweiligen Komponente (Abbildung 17.30). Es sind additive Komponenten, sodass Sie die Zahlen für eine Periode einfach aufaddieren:
Für den Wert April 2023:
Dies ergibt den Prognosewert: 993,13
Abbildung 17.30: Erklärungen
Man kann hier auch schön die Einflussstärke erkennen. Interessant ist die Linie Einflussfaktoren ab April. Falls keine Werte für den Prognosezeitraum vorliegen, wird als Ersatz für die fehlenden Rabatte einfach der März-Wert genommen und linear fortgeschrieben.
Allerdings können Sie die Rabatte auch planen. Und das sollten Sie auch machen.
Zeitreihe
um einen Reiter für die Eingabe.Erstellen Sie eine Tabelle wie in Abbildung 17.31 und tragen Sie beliebige Werte für den Rabatt in die Monate April bis Dezember 2023 ein.
Sie können hierzu auch die Ist-Werte von 2022 kopieren (Abbildung 17.31).
Die Prognosewerte sollen allerdings auch gespeichert werden.
Smart Predict
an (Abbildung 17.32), indem Sie die Ist-Werte kopieren.
Abbildung 17.31: Konfiguration
Abbildung 17.32: Erstellung der Prognose
Abbildung 17.33: Speichern der Story
Über das Fabriksymbol können Sie die Ergebnisse speichern. Wählen Sie nun die neue Version Smart Predict
zum Speichern der Prognosewerte aus. In den erweiterten Einstellungen können Sie noch angeben, ob die Prognosewerte für die Ist-Zahlen übernommen werden sollen.
Beachten Sie allerdings, dass dann ein voraussichtlicher Jahresend-Ist-Wert nicht korrekt ist, wenn Sie beispielsweise eine Prognose von April bis Dezember durchführen. Im Januar bis März befinden sich nämlich nicht die Ist-Daten im Szenario, sondern auf die Vergangenheit projizierte Prognosedaten.
Sie können allerdings auch das Prognose-Layout des Tabellen-Widgets nutzen.
Abbildung 17.34: Sichern der Prognose
Gehen Sie zurück in die Story Zeitreihe
.
Das Bild sollte wie in Abbildung 17.35 aussehen.
Abbildung 17.35: Das Ergebnis von Smart Predict
Abbildung 17.36: Automatische Verteilung von Predict
Hier würde sich, wie beschrieben, eine Allokation empfehlen, beispielsweise auf der Basis der Ist-Verhältnisse.
Wir wollen zum Abschluss noch einmal auf die korrekte Summierung der Werte auf Jahresebene zurückkommen. Um Ist- und Prognosewerte richtig aufzuaddieren, gibt es beim Tabellen-Widget die Option Prognose-Layout
.
Prognose-Layout
(Abbildung 17.37).
Abbildung 17.37: Auswahl des Prognose-Layouts
Abbildung 17.38: Einstellungen des Prognose-Layouts
2023
. Ihr Bericht sollte wie in Abbildung 17.39 aussehen.
Abbildung 17.39: Darstellung des Prognose-Layouts
Wie Sie sehen, werden die Jahreswerte korrekt aufsummiert.