Informatikmaterialien 
von Tino Hempel

Startseite | Informatik | Physik | Mathematik | Sonstiges |


Richard-Wossidlo-Gymnasium Ribnitz-Damgarten
Fachbereich Informatik


Normalisierung von Datenbanken


Begriffe der Normalisierung

Die Erzeugung der Relationen einer konkreten Datenbank ist entweder:

  1. über die Schrittfolge: konzeptioneller Entwurf (ERM) →  logischer Enwturf (Relationenmodell) oder
  2. über die Normalisierung einer Relation, die alle für die Datenbank relevanten Attribute enthält, möglich.

Normalisierung ist somit eine weitere Möglichkeit, relationale Datenbanken zu erhalten. Ein exakter Modellentwurf (ERM/RM) macht eine Normalisierung eigentlich überflüssig, kann aber eingesetzt werden, um Anomalien zu beseitigen oder Redundanzen zu minimieren.

Im Folgenden werden der Normalisierungsprozess an einem Beispiel illustriert. Die Ausgangsrelation beschreibt dabei, welche Schüler einer Schule im aktuellen Schuljahr Lernangebote nutzen.

1. Normalform

Eine Relation befindet sich in der ersten Normalform, wenn alle Attribute nur einfache Attributwerte aufweisen (Bezeichnung: atomar).

Relation Lernangebotesübersicht:

SchülerNr Name Vorname Klasse Klassenlehrer LernangebotsNr Beschreibung Zeit in h
1 Jürgens Ina 11a Lempel 2 Tanz 12
2 Schmidt Tom 12a Breier 3 Chor 22
3 Jäger Franz 11a Lempel 1, 2, 3 Elektronik, Tanz, Chor 15, 12, 2
4 Olsen Ina 11b Sommer 2 Tanz 5
5 Jürgens Paula 12a Breier 1 Elektronik 23

Zur Bildung der ersten Normalform müssen die nicht atomaren Attribute umgewandelt werden. Dies kann durch Einfügen zusätzlicher Zeilen, Spalten oder neuer Relationen erfolgen.

Relation Lernangebotesübersicht in der ersten Normalform:

SchülerNr Name Vorname Klasse Klassenlehrer LernangebotsNr Beschreibung Zeit in h
1 Jürgens Ina 11a Lempel 2 Tanz 12
2 Schmidt Tom 12a Breier 3 Chor 22
3 Jäger Franz 11a Lempel 1 Elektronik 15
3 Jäger Franz 11a Lempel 2 Tanz 12
3 Jäger Franz 11a Lempel 3 Chor 2
4 Olsen Ina 11b Sommer 2 Tanz 5
5 Jürgens Paula 12a Breier 1 Elektronik 23

Die Redundanz nimmt zu. Der bisherige Primärschlüssel verliert seine Eindeutigkeit, es muss ein Neuer gefunden werden. 
Festlegung: SchülerNr und LernangebotsNr ist der neue Primärschlüssel.

2. Normalform

Eine Relation befindet sich in der zweiten Normalform, wenn 

  1. sie in der ersten Normalform ist und
  2. jedes Nicht-Schlüssel-Attribut vom Primärschlüssel voll funktional abhängig ist.

Regel zum Prüfen der zweiten Bedingung:  Wenn Attribute von einem Teil des Schlüssels eindeutig identifiziert werden, dann liegt keine 2. Normalform vor!

Schrittfolge zur Herstellung der zweiten Normalform: 

  1. Primärschlüssel der gegebenen Relation festlegen, falls dieser nur aus einem Attribut besteht, so liegt bereits 2. NF vor.
  2. Untersuchung, ob aus Teilschlüsselattributen bereits weitere Attribute folgen. Falls nicht liegt bereits die 2. NF vor. Falls Abhängigkeiten gefunden werden, dann
  3. Neue Relation bilden, die das Teilschlüsselattribut und alle von diesem abhängigen Nichtschlüsselattribute anthalten. Das Teilschlüsselattribut wird in der neuen Relation der Primärschlüssel.
  4. Löschen der ausgelagerten Nichtschlüsselattribute in der Ausgangsrelation.
  5. Vorgang ab 2. wiederholen, bis alle Nichtschlüsselattribute vom gesamten Schlüssel funktional abhängig sind.

Beispiel:

Aus dem Teilschlüssel LernangebotsNr lässt sich bereits eindeutig auf Beschreibung schließen. Aus SchülerNr lässt sich eindeutig auf Name, Vorname, Klasse und Klassenlehrer schließen. Somit sind zwei neue Relationsschemen Lernangebot und Schüler zu erzeugen und das verbleibende Schema Lernangebotsübersicht so zu überarbeiten, dass die Attribute Beschreibung, Name, Vorname, Klasse und Klassenlehrer gelöscht werden.

Relation Lernangebot Relation Schüler Relation Lernangebotsübersicht
LernangebotsNr Beschreibung
2 Tanz
3 Chor
1 Elektronik
SchülerNr Name Vorname Klasse Klassenlehrer
1 Jürgens Ina 11a Lempel
2 Schmidt Tom
12a Breier
3 Jäger Franz 11a Lempel
4 Olsen Ina 11b Sommer
5 Jürgens Paula 12a Breier
SchülerNr LernangebotsNr Zeit in h
1 2 12
2 3 22
3 1 15
3 2 12
3 3 2
4 2 5
5 1 23

3. Normalform

Eine Relation befindet sich in der dritten Normalform, wenn 

  1. sie in der zweiten Normalform ist und
  2. jedes Nichtschlüsselattribute nicht transitiv vom Primärschlüssel abhängig ist, d.h. aus keinem Nichtschlüsselattribut folgt ein anderes Nichtschlüsselattribut. 

Regel zum Prüfen der zweiten Bedingung: Wenn aus einem Nichtschlüsselattribut ein anderes Nichtschlüsselattribut folgt, dann liegt keine 3. Normalform vor! 

Schrittfolge zur Herstellung der dritten Normalform:

  1. Untersuchung, ob aus Nichtschlüsselattributen andere Nichtschlüsselattribute folgen. Falls nicht liegt bereits die 3. NF vor. Falls Abhängigkeiten gefunden werden, dann
  2. Neue Relation bilden, die das Nichtschlüsselattribut (wird nun Primärschlüssel der neuen Relation) und die von ihm abhängigen Attribute enthält.
  3. Löschen der ausgelagerten Nichtschlüsselattribute mit Ausnahme des Attributes, das in der neuen Relation Primärschlüssel ist.
  4. Vorgang ab 2. wiederholen, bis keine Abhängigkeiten mehr bestehen

Schreibweise zur Erkennung von transitiven Abhängigkeiten:

Beispiel:

Aus der SchülerNr. folgt Name, Vorname, Klasse und der Klassenlehrer. Aber aus der Klasse folgt bereits der Klassenlehrer! Also werden die Attribute Klasse und Klassenlehrer in eine neue Relation gebracht.

Relation Lernangebot Relation Schüler Relation Lernangebotsübersicht Relation Klasse
LernangebotsNr Beschreibung
2 Tanz
3 Chor
1 Elektronik
SchülerNr Name Vorname Klasse
1 Jürgens Ina 11a
2 Schmidt Tom
12a
3 Jäger Franz 11a
4 Olsen Ina 11b
5 Jürgens Paula 12a
SchülerNr LernangebotsNr Zeit in h
1 2 12
2 3 22
3 1 15
3 2 12
3 3 2
4 2 5
5 1 23
Klasse Klassenlehrer
11a Lempel
12a Breier
11b Sommer


zur Startseite
© Tino Hempel 1997 - 2014 Im Web vertreten seit 1994.
Eine Internet-Seite aus dem Angebot von Tino Hempel.