Aufgabenstellung

 

Wie muß ein Data Warehouse entworfen werden um Firmenziele zu unterstützen?

Die Aufgabenstellung des Praktikums repräsentiert den gesamten Lebenszyklus eines Data Warehouse in einer Organisation: von der Anforderungsanalyse, konzeptionelles Datenmodell, ETL Prozess (Extraktion, Transformation und Laden der Daten) bis hin zur Kennzahlenauswertung.

Jede Gruppe erhält Geschäftsziele (Business Questions)  und Daten von einem Unternehmen. Diese Firmen gehören dem Sektoren Retail. Die Geschäftsziele und Daten müssen in allen Aufgabenstellungen durchgehend verwendet werden. Die einzelnen Aufgabenstellungen bauen aufeinander auf.

Aufgabe 1: Datenmodell

Die Gruppen erhalten von den BetreuerInnen Geschäftsziele (Business Questions)  und Daten (auf der Teradata Warehouse 7.0 Demo). Daraus ist ein Datenmodell zu entwickeln, welches die Analyse der Geschäftsziele unterstützt (Star-Schema). Weiters ist ein ER-Modell zu entwickeln (Reverseengineering), das die Tabellen der DB repräsentiert. Jede Gruppe entwirft ein ein Star-Schema und ein ER-Modell. Es ist zu empfehlen mit dem ER-Modell zu beginnen.

Input: Geschäftsziele und  Daten

Output: 2 Datenmodelle als Star-Schema und  ER-Modell

Tool: Für das ER-Modell ist kein bestimmtes Tool vorgesehen. Für das Star-Schema  werden Visio Templates zur Verfügung gestellt: ADAPT .

Abgabetermin: neuer Termin: Woche 22. Dezember -  Woche 12. Jänner  bzw. in Ausnahmefällen auch immer später möglich, grundsätzlich aber immer früher möglich

Abgabeform: Persönlich bei den BereuerInnen.

Betreuung:  Dr. Beate List und  DI Nevena Stolba

 

Aufgabe 2: Extraktion, Transformation Laden und Auswertungen

Diese Aufgabenstellung unterteilt sich ich zwei Teile. Es sind einerseits Auswertungen für das ER-Modell und andererseits für das Star-Schema zu schreiben. 

a) ER-Modell: Die Daten befinden sich bereits in der Retail-DB und sind dort normalisiert gespreichert. Die Business Questions aus Aufgabe1 sind mit diesen Daten mittels  SQL-Abfragen zu beantworten.

b) Star-Schema: Die Daten sind noch nicht als Star-Schema in der DB gespeichert. Bevor noch Daten in die DB geladen werden können, müssen Tabellen für die Dimensionen und den Fakt angelegt werden. Danach sind die Daten aus der Retail-DB zu extrahieren, transformieren und in das Data Warehouse zu laden (insert / select statements), wobei das Star Schema aus Aufgabe 1 repräsentiert sein muß. Zuletzt sind die Business Questions aus Aufgabe1 mit diesen Daten mittels  SQL-Abfragen zu beantworten.

Input: Daten und Datenmodell

Output: Geladene Daten im Data Warehouse sowie Auswertungen

Tool: Teradata Warehouse 7.0, SQL Assistant. Zum Laden ist kein Fastload oder Multiload zu verwenden sondern nur insert / select statements.

Abgabetermin: neuer Termin: Woche 26. Jänner bzw. in Ausnahmefällen auch immer später möglich

Abgabeform: Persönlich bei den BereuerInnen.

 

Aufgabe 3: Auswertung und Erweiterung der Firmenziele

Die Daten sind jetzt im DWH und werden ausgewertet. Davor werden aber noch erweiterte Firmenziele bekanntgegeben. Wenn diese Ziele nicht durch das DWH analysiert  werden können, muß das Datenmodell erweitert werden und Daten vielleicht sogar wieder aus den Quelldaten extrahiert, transformiert und geladen werden.

Input: Erweiterte Firmenziele, Geladene Daten im Data Warehouse

Output: Ausgewertete Daten

Tool: SQL Assistant

Abgabetermin: neuer Termin: Woche 16. Februar bzw. in Ausnahmefällen auch immer später möglich

Abgabeform: Persönlich bei den BereuerInnen.