DataTree


DataTree – Framework für robuste Datenflüsse


DataTree ist ein Framework zur graphbasierten Modellierung abhängiger Datenflüsse. Komplexe Zusammenhänge in Datenquellen werden übersichtlich als Graph abgebildet.

Vorteile: - Automatische Bestimmung der optimalen Lade-Reihenfolge - Maximale Parallelisierung der Abläufe - Überschneidende Ladeläufe (z.B. täglich die letzten 3 Tage) - Automatisches Duplikate-Handling für besonders robuste Ladeprozesse

Funktionen & Vorteile


Graphbasierte Modellierung

Abhängigkeiten und Ladeprozesse werden als übersichtlicher Graph dargestellt.

Parallele Abläufe

DataTree erkennt unabhängige Prozesse und führt sie parallel aus.

Überschneidende Ladeläufe

Mehrfache Ladevorgänge (z.B. rollierende Zeitfenster) werden automatisch unterstützt.

Automatisches Duplikate-Handling

Doppelte Datensätze werden automatisch erkannt und gefiltert.

Praxisbeispiel: E-Commerce Dashboard


Für ein E-Commerce Power BI Dashboard werden Werbekosten aus verschiedenen Systemen geladen. Werbekosten, die nur auf Tagesbasis vorliegen, werden nach Umsatzschlüsseln auf Produkte umgelegt. Umsatzdaten werden aus dem Shopsystem gezogen.

DataTree sorgt dafür, dass vor der Umlage der Werbekosten sichergestellt ist, dass sowohl Werbekosten als auch Umsätze vollständig geladen wurden. Die Abhängigkeiten werden automatisch modelliert und die Ladeprozesse fehlertolerant gesteuert.