Seminar 32 253: "Self-Management and Reliability" 

Artur Andrzejak (ZIB)

HU Berlin, Sommersemester 2007


Inhalte:

Wir behandeln Themen aus dem Bereich des Selbstmanagements von Computersystemen mit Betonung der Aspekte der Zuverlässigkeit. Typische Beispiele sind Anomalienerkennung, Software Rejuvenation oder Kapazitätsvorhersage. Dabei werden u.a. Methoden des Machine Learnings / KI eingeführt, die für Analyse und Kontrolle der Systeme einsetzbar sind. Gleichzeitig schauen wir uns auch Lösungen in realen Systemen an, z.B. dem Google File System (GFS).

Achtung:

Nützliches: Tipps für Vorträge

Referenten und Termine:

Referent Vortrag Termin Präsentation Ausarbeitung
Martin Herzog
1 A

 P1

A1

Eric Redlin
2 A

 P2

A2

Irina Kacarska
3 A

 P3

A3


4

 P4

A4


5

 P5

A5


6

 P6

A6


7

 P7

A7

Mathias Müller
8 B

 P8

bester Vortrag

Christoph Sawade
9 B

 P9

bester Vortrag

Glenn Schütze 10 B

 P10

A10

Daniel Stoye
11 B

 P11

A11


12

 P12

A12


13

 P13

A13



Motivation: Reale Systeme

1. Probleme in großen Systemen

2. Finden von Fehlerursachen in großen Systemen

Erkennen von Anomalien

3. Grundlagen der Anomalieerkennung

4. Anwendungen der Anomalieerkennung


Software Aging (Softwarealterung)

5. Grundlagen der Softwarealterung

6. Softwarealterung und Verjungung (rejuvenation)

7. Adaptive Softwareverjungung


Datenanalyse und Vorhersagen


8. Datenanalyse in großen Systemen (Google)

9. Vorhersagetechniken für das Management der Computersysteme

10. Vorhersagen von kritischen Ereignissen

11. Vorhersagetechniken für Debugging (off-topic, aber interessant)


Change Point Detection

12. Grundlagen der Change Point Detection

13. Bayesian Methoden in Change Point Detection