Название: Data Intelligence
Автор: Manfred Kulmitzer
Издательство: Readbox publishing GmbH
Жанр: Отраслевые издания
isbn: 9783347101456
isbn:
• aufbereitete (beispielsweise anonymisierte oder speziell formatierte Daten)
• berechnete Daten von internen Stellen (beispielsweise Transformationen oder Zwischenergebnisse aus ETL-Strecke und Rechenkernen)
• berechnete Daten von externen Stellen (also Daten, die von externen Parteien berechnet, aggregiert oder gefiltert und somit bereits aufbereitet zur Verfügung gestellt werden) und umfasst auch extern erstellte Auswertungen und Analysen
Das Datensegment Kennzahlen umfasst alle im Rahmen einer dispositiven Sicht erzeugten Kennzahlen. Diese sollen für ein Unternehmen einheitlich definiert und bereichsübergreifend verwendet werden.
Das Datensegment Dispositive Basisdaten umfasst all jene Daten, welche für die Auswertungen und Analysen aus einer dispositiven Sicht benötigt werden:
• eine redundante Kopie der Rohdaten aus der operativen Datenwelt (meist aus Gründen der Performance und zur Entkopplung der IT-Systeme) und diese Kopie beinhaltet zumindest die Basisdaten, die Geschäftsdaten und externe, operative Rohdaten
• externe, dispositive Rohdaten (beispielsweise statistische Kennzahlen oder standortbezogene Daten)
• dispositive Struktur- und Dimensionsdaten (beispielsweise alternative Konzernstrukturen)
Das Datensegment KI Daten umfasst alle erforderlichen Trainings-, Input- und Ergebnisdaten für die KI-Modelle sowie die KI-Modelle selbst, welche im Rahmen der Geschäftstätigkeit entwickelt und bereitgestellt werden.
Das Datensegment Stammdaten umfasst die mitunter wichtigsten Daten eines Unternehmens, welche meistens über mehrere Geschäftsprozesse hinweg genutzt werden. Dazu gehören beispielsweise:
• Kundendaten, Personal & Organisation, Finanzmarktdaten
• interne Stammdaten (zum Beispiel Immobilien-Daten, Büroflächen, Telefonbuch, Zimmer-Nummern, IT-Hardware Inventar, IT System Inventar)
• externe Stammdaten (beispielsweise Geo-Daten, postalische Adressen, Bank- und Börsenfeiertage, UID für Unternehmen)
Das Datensegment Referenzdaten umfasst die Inventare von Schlüsseln und anderen Referenzwerten, welche über mehrere Geschäftsprozesse genutzt werden, für das gesamte Unternehmen einheitlich definiert sind und auf die üblicherweise referenziert werden. Dazu gehören beispielsweise:
• Eineindeutige (das heißt dieses Datum kommt nur ein einziges Mal vor), nicht sprechende (man kann vom Namen des Schlüssels keinen Rückschluss auf den Inhalt machen; beispielsweise sollte eine Kontonummer nicht gleichzeitig auch der Schlüssel sein)
• fachliche Schlüssel für Stamm- und Referenzdaten, welche intern erzeugt und verwaltet werden
• interne Referenzdaten, die durch das Unternehmen selbst definiert und erzeugt werden (beispielsweise interne Ratings, Risikostufen, Segmentierungen)
• externe Referenzdaten, wie extern erzeugte Schlüssel und Referenzdaten, welche von extern bezogen werden und generell oder branchenspezifisch gebräuchlich sind (beispielsweise Ländercodes, Währungscodes, NOGA-Code, externe Ratings)
Das Datensegment Produktdaten umfasst alle Definitionen von Produkten und Dienstleistung mit den dazugehörigen Geschäftslogiken (beispielsweise: ist die regulative Relevanz pro Produkt für ein „Jugendkonto“ für Personen unter 20 Jahren gegeben?).
Das Datensegment Vertriebsdaten umfasst „scharfe“ Vertriebsdaten (beispielsweise ein Kunde) und zugehörige Dateninstanzen mit interner Anreicherung oder Veredelung.
Das Datensegment Bestand umfasst „scharfe“ Bestandsdaten (beispielsweise aus Konto und Depots von Kunden) und zugehörige Dateninstanzen mit interner Anreicherung oder Veredelung.
Das Datensegment Transaktionen umfasst alle „scharfen“ Transaktionsdaten (beispielsweise einen Kundenauftrag oder Aktienkauf), und zugehörige Dateninstanzen mit interner Anreicherung oder Veredelung.
Die Erweiterungen und Verfeinerungen der Datensegmente können je nach Bedürfnis beliebig so weiter fortgeführt werden, bis man alle erforderlichen Datensegmente auf der gewünschten Detaillierungsebene identifiziert und beschrieben hat. Das hier beschriebene Vorgehen und der richtige Einsatz vom «Haus der Daten & Dokumente» unterstützen die elegante und zielgerichtete Entwicklung einer Datenstrategie - und zwar jeweils basierend auf den grundlegenden Daten und Dokumenten eines Unternehmens.
Somit schließt sich der Kreis mit dem Beginn der Geschichte zu Beginn dieses Abschnitts und gleichzeitig habe ich den Mehrwert vom Grundbegriffe-Ansatz ein weiteres Mal aufzeigen können.
3.5 Ein Datenmodell bringt den Überblick
Allgemein betrachtet dient ein Modell zur Darstellung von Dingen, Gegenständen und Objekten der realen Welt und den Zusammenhängen - also Beziehungen - zwischen diesen Objekten. Im Rahmen der semantischen Datenmodellierung dient ein Datenmodell dazu, den in einem gegebenen Kontext relevanten Ausschnitt der realen Welt - beispielsweise die benötigten Funktionen bei der Entwicklung einer Software - zu bestimmen und als Modell darzustellen.
Somit sollen die bereichsübergreifende Abstimmung, Steuerung und Weiterentwicklung von elektronischen Daten vereinfacht werden. Die Dokumentation von Daten ist ebenfalls eine Grundvoraussetzung für die Entwicklung einer Datenstrategie, wie ich später noch aufzeigen werde.
Fachliche Datenmodelle haben in der Regel eine wesentlich längere Lebensdauer als Funktionen und Prozesse und somit Software - grundsätzlich gilt hier der einfache Leitsatz: Daten sind stabil, IT-Funktionen sind es nicht.
«Das primäre Ziel der Datenmodellierung ist ein ganzheitlicher, systematischer und nachhaltiger Ansatz zur einheitlichen Dokumentation der relevanten elektronischen Daten.»
Alle fachlichen Datenmodelle bestehen aus Datenobjekten als Abbildung von Objekten der realen Welt und schafft ein vollständiges Abbild aller relevanten Daten. Dabei geht es in erster Linie darum, die reale Welt unabhängig von der IT fachlich zu beschreiben und eine bestmögliche Grundlage für die Standardisierung der Daten zu bieten.
Das fachliche, ganzheitliche Unternehmensdatenmodell aka UDM ist ein konzeptionelles, semantisches Datenmodell, welches mit Datenobjekten als Abstraktion die wesentlichen Daten des gesamten Unternehmens in einer vereinfachten und systematischen Form darstellt und so für ganzheitliche Transparenz sorgt.
Das UDM schafft für das Unternehmen eine einheitliche, methodische und inhaltliche Basis zur Steuerung und Bewirtschaftung von elektronischen Daten und deckt die vollständige inhaltliche Dimension der Steuerung und Bewirtschaftung von Daten über die Datensegmente im HDD und über alle Phasen des Datenlebenszyklus ab:
Wesentliche Anwendungsfälle für das UDM
Durch fachliche Metadaten und deren Abbildung im UDM werden die logischen Zusammenhänge von Daten (Was wird betrachtet?), Verantwortlichkeiten (Wer betrachtet die Daten?) und Business Capabilities (Welche Fähigkeiten werden gebraucht?) transparent und konsistent.
Die СКАЧАТЬ