By using our website, you agree to the use of our cookies.
By using our website, you agree to the use of our cookies.

Programm Details

Donnerstag, 17.10.2019   |   12:00 - 12:45 Uhr   |    Do 1.2

Eine Data Science-Architektur für die Analyse und Visualisierung von Rechenzentrumsdaten der Bundesagentur für Arbeit


Eldar Sultanow
Capgemini Deutschland GmbH
Enterprise Architect

Matthias Seßler
Bundesagentur für Arbeit
Lead Architekt für Datenbanktechnologie

Frank Pelzel
Bundesagentur für Arbeit
Teamlead Advanced Analytics

Die Bundesagentur für Arbeit (kurz BA) verfügt über drei Rechenzentren mit jeweils mehreren Dutzend Clustern mit insgesamt mehr als 10.000 Servern. Eine der größten Herausforderungen ist die Gewinnung eines Überblicks über den Gesamtzustand der Infrastruktur, der die Auslastungslage und -historie, sowie Anomalien, Peaks, ungenutzte Ressourcen oder gegenseitige Beeinflussungen von IT-Systemen der BA beinhaltet. Die IT-Systeme der BA sind missionskritisch, so zum Beispiel für die Auszahlung von Arbeitslosengeld an leistungsberechtigte Bürger verantwortlich. In unserem Vortrag stellen wir eine Architektur vor, die die Infrastrukturdaten derart sammelt, auswertet und visualisiert, dass die für den Betrieb der BA-Systeme zuständigen Mitarbeiter die Auslastungslagen, Engpässe und Anomalien ganzheitlich überblicken und entsprechend reagieren können.

Zielpublikum: Architekten, Entwickler, Data Scientists, Manager, Entscheider
Voraussetzungen: Grundkenntnisse Enterprise Architecture, Data Science, Referenzarchitekturen
Schwierigkeitsgrad: Advanced

Extended Abstract:

Die Bundesagentur für Arbeit (kurz BA) verfügt über drei Rechenzentren mit jeweils mehreren Dutzend Clustern mit insgesamt mehr als 10.000 Servern. Eine der größten Herausforderungen ist die Gewinnung eines Überblicks über den Gesamtzustand der Infrastruktur, der die Auslastungslage und -historie, sowie Anomalien, Peaks, ungenutzte Ressourcen oder gegenseitige Beeinflussungen von IT-Systemen der BA beinhaltet. Die IT-Systeme der BA sind missionskritisch, so zum Beispiel für die Auszahlung von Arbeitslosengeld an leistungsberechtigte Bürger verantwortlich. In unserem Vortrag stellen wir eine Architektur vor, die die Infrastrukturdaten derart sammelt, auswertet und visualisiert, dass die für den Betrieb der BA-Systeme zuständigen Mitarbeiter die Auslastungslagen, Engpässe und Anomalien ganzheitlich überblicken und entsprechend reagieren können.

Diese Data Science-Architektur ist mehrschichtig – sie besitzt drei Hauptschichten, einen Ingest-Layer für das Sammeln der Daten, einen auf maschinellen Lernverfahren basierenden Analytics-Layer und einen Visualisierungs-Layer. Innerhalb dieser Schichten sind technologieagnostische Bausteine, wie zum Beispiel ein Modell für Zeitreihenanalyse oder eine Komponente für die dreidimensionale Darstellung des Zustands der Rechenzentren, verortet. Diese Bausteine definieren Verfahren (inklusive Algorithmen), welche durch unterschiedliche Lösungen (Frameworks) – sei es via Python oder Java – umgesetzt sind. In unserem Vortrag zeigen wir nicht nur die Architektur mitsamt ihren Schichten und Bausteinen, sondern auch eine komplette Referenzimplementierung, die die genannten Herausforderungen der BA löst. In diesem „Hands-On“-Teil des Vortrags gehen wir auf technische Details näher ein, zeigen die umgesetzte 3D-Visualisierung, das dafür erforderliche Zusammenspiel der Komponenten sowohl anhand der Architekturmodelle, als auch konkret an den wichtigsten Stellen im Code.