Название: Smart Data statt Big Data
Автор: Schmidt Jutta
Издательство: John Wiley & Sons Limited
Жанр: Зарубежная образовательная литература
isbn: 9783527692248
isbn:
Nun klicken Sie auf die Schaltfläche LÖSEN. Excel sollte eigentlich sofort eine Lösung finden. Und diese Lösung, die Abbildung 1.27 zeigt, lautet 5. Es kann sein, dass Ihr Excel über andere Artikel zu diesem Ergebnis kommt, als es Abbildung 1.27 zeigt, aber Sie müssen auf jeden Fall mindestens fünf Teile kaufen, um auf die gewünschten 2.400 Kalorien zu kommen.
Abb. 1.27 Die optimierte Artikelauswahl
1.14 OpenSolver: Ich wünschte, wir würden ihn nicht benötigen. Dem ist aber nicht so
Dieses Buch sollte ursprünglich nur mit dem in Excel eingebauten Solver auskommen. Es hat sich aber gezeigt, dass aus mysteriösen und nicht kommunizierten Gründen in bestimmten Excel-Versionen Funktionen aus Solver entfernt worden sind.
Dies bedeutet, dass das gesamte Buch problemlos funktioniert, wenn Solver in Excel 2007 oder Excel 2011 für Mac verwendet wird, während sich Solver in Excel 2010 und Excel 2013 ab und an darüber beschwert, dass ein lineares Optimierungsmodell zu groß sei (ich sage Ihnen in diesem Buch jedes Mal Bescheid, wenn ein Modell zu komplex werden könnte).
Glücklicherweise gibt es ein kostenloses Werkzeug mit dem Namen OpenSolver, das bei Excel für Windows diese Defizite beseitigt. Sie können Ihre Modelle beim Einsatz von OpenSolver auch weiterhin in der normalen Solver-Oberfläche zusammenbauen, und OpenSolver stellt eine Schaltfläche zur Verfügung, die Sie anklicken, um einen Simplex-LP-Algorithmus zu nutzen, der bemerkenswert schnell ist.
Um OpenSolver einzurichten, gehen Sie zu OpenSolver.org und laden sich die ZIP-Datei herunter. Entpacken Sie diese Datei in einen Ordner, und jedes Mal, wenn Sie ein dickes Modell lösen müssen, arbeiten Sie zunächst ganz normal in einem Excel-Arbeitsblatt. Dann führen Sie auf der Datei OpenSolver.xlsm einen Doppelklick aus, was in Excel auf der Registerkarte DATEN zu einem OPENSOLVER-Abschnitt führt. Klicken Sie auf die Schaltfläche SOLVE, um ein vorhandenes Modell zu lösen. Wie Abbildung 1.28 zeigt, wende ich OpenSolver in Excel 2010 auf das Modell aus dem letzten Abschnitt an, und es werden fünf Stück Pizza gekauft. Dieser Solver ist mir richtig sympathisch.
Abb. 1.28 OpenSolver kauft wie ein Verrückter Pizza.
1.15 Zusammenfassung
Schön, Sie haben erfahren, wie Sie sich schnell in Bereichen bewegen und sie auswählen können, wie Sie sich absolute Verweise zunutze machen, wie besondere Einfügeoptionen verwendet werden, wie Sie SVERWEIS und andere geeignete Formeln einsetzen, wie Daten sortiert und gefiltert werden, wie sich Pivot-Tabellen und Diagramme anlegen lassen, wie Array-Formeln ausgeführt werden und wie und wann Sie mehr als nur Excels Solver benötigen.
Es hängt ganz von Ihnen ab, ob das Folgende eine gute oder eine schlechte Nachricht ist. Ich kenne Unternehmensberater sehr bekannter Organisationen, die mehr als gutes Geld damit verdienen, dass sie etwas machen, das ich als »Zwei-Schritte-Beratung« bezeichne:
1. Sprechen Sie mit dem Kunden über Unwichtiges (Sport, Urlaub, Grillen … wobei es nichts Unwichtiges an gut durchgebratenem Fleisch gibt).
2. Fassen Sie die Daten in Excel zusammen.
Sie müssen die Abseitsregel nicht verstehen (zumindest ich tue das nicht), aber wenn Sie dieses Kapitel verinnerlichen, bereitet der zweite Punkt schon einmal keine Schwierigkeiten mehr.
Aber Sie sind nicht hier, um Unternehmensberater zu werden. Sie haben vor, sich intensiv mit Data Science zu beschäftigen, und das beginnt im nächsten Kapitel, in dem es mit ein wenig unbegleitetem Maschinenlernen losgeht.
Kapitel 2
Clusteranalyse Teil I: Die Kundenbasis mit k-Means aufteilen
Ich bin auf dem Markt des E-Mail-Marketings für eine Website mit dem Namen MailChim.com tätig. Wir helfen Kunden dabei, an ihr Publikum Newsletter per E-Mail zu versenden, und jedes Mal stirbt ein kleiner Teil von mir, wenn ich höre, wie jemand den Ausdruck »E-Mail-Werbebombe« verwendet.
Warum? Weil E-Mail-Adressen keine Blackboxen mehr sind, in die Sie »Sprengsätze« wie Blendgranaten schmeißen. Nein, beim E-Mail-Marketing erhält ein Unternehmen (wie bei anderen Formen eines Online-Engagements wie Tweets, Facebook-Postings und Pinterest-Kampagnen) auf individueller Ebene über Click-Tracking, Online-Verkäufe, Social Sharing und so weiter Rückmeldungen über die Kundeninteressen. Bei diesen Daten handelt es sich nicht um Blendwerk. Sie charakterisieren Ihre Kunden. Nur für nicht Eingeweihte stellen diese Daten böhmische Dörfer dar.
Wie können Sie sich Daten von Kunden (oder einem Publikum, Abonnenten, Mitbürgern und so weiter) beschaffen, die mit geschäftlichen Transaktionen zu tun haben, und diese Daten verwenden, um die Menschen dahinter zu verstehen? Wenn Sie mit vielen zu tun haben, ist es fast unmöglich, jeden einzelnen Kunden separat zu verstehen. Dies gilt ganz besonders dann, wenn jeder dieser Kunden seinen eigenen Weg geht, um mit Ihnen in Kontakt zu kommen. Selbst wenn Sie es schaffen würden, jeden auf einer persönlichen Ebene zu verstehen, wäre es kaum möglich, damit etwas anzufangen.
Sie müssen Ihre Kundenbasis nehmen und einen gesunden Mittelweg finden zwischen dem »Bombardieren« Ihrer Kunden, als ob es sich dabei um eine gesichtslose Masse handelt, und dem Eingehen auf alle individuellen Besonderheiten, um für jeden Empfänger ein individuell personalisiertes Marketing bereitzustellen. Ein Weg, um diese Gratwanderung erfolgreich hinter sich zu bringen, ist die Clusterbildung (die auch in deutschsprachigen Texten oft als Clustering bezeichnet wird), um eine Marktsegmentierung Ihrer Kunden zu erstellen. Dann sind Sie in der Lage, Teile Ihrer Basis gezielt anzusprechen.
Die praktische Umsetzung des Sammelns von Daten und deren Aufteilung in Gruppen mit ähnlichen Inhalten wird Clusteranalyse genannt. Sie können dadurch, dass Sie diese Gruppen untersuchen, um herauszufinden, inwieweit sie sich ähneln und worin sie sich unterscheiden, eine Menge über den bis dahin gestaltlosen Datenstapel, den Sie besitzen, in Erfahrung bringen. Diese Einsichten können Ihnen dann dabei helfen, Entscheidungen auf einer Ebene zu fällen, die mehr Einzelheiten berücksichtigt als früher.
Clusterbildung dieser Art wird auch explorative Datengewinnung oder exploratives Data-Mining genannt, weil diese Form der Clusterbildung dabei hilft, in großen Datenbanken Beziehungen herauszubekommen, die mit dem bloßen Auge kaum zu erkennen sind. Und es ist wichtig, Beziehungen in Ihrer Population zu entdecken, die sich nicht auf einen Geschäftsbereich beschränken. Dies gilt unabhängig davon, ob es sich dabei um die Filmindustrie handelt, die Empfehlungen haben will, die sich an den Gepflogenheiten der Kunden orientieren, die in einem am Geschmack ausgerichteten Cluster »leben«, weil man herausfinden will, ob es in einem ländlichen Raum an Krimis interessierte Ballungsgebiete gibt, oder ob es darum geht, Investitionen, bei denen finanzielle Rückflüsse von Bedeutung sind, zu gruppieren, um für einen Cluster zu sorgen, der aus einem breit gefächerten Portfolio besteht.
Конец ознакомительного фрагмента.
Текст предоставлен ООО «ЛитРес».