Advertisement

Externes Suchen und Sortieren

  • Ralf Hartmut Güting
  • Stefan Dieker
Chapter
  • 194 Downloads
Part of the Leitfäden der Informatik book series (XLINF)

Zusammenfassung

Wir haben bisher stillschweigend angenommen, daß beliebig komplexe Datenstrukturen bzw. alle von einem Algorithmus benötigten Daten komplett im Hauptspeicher gehalten werden können. Für manche Anwendungen trifft diese Annahme nicht zu, vor allem aus zwei Gründen:
  1. 1.

    Daten sollen persistent sein, das heißt, die Laufzeit des Programms überdauern. Dazu sind sie z.B. auf “externem” Plattenspeicher zu halten.

     
  2. 2.

    Die zu verarbeitende Datenmenge ist schlicht zu groß, um gleichzeitig vollständig in den Hauptspeicher zu passen.

     

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literaturhinweise

  1. B-Bäume stammen von Bayer und McCreight [1972]; eine ältere File-Organisationsmethode, die bereits gewisse Ähnlichkeiten aufweist, ist die ISAM-Technik (index sequential access method) [Ghosh und Senko 1969]. Erwartungswerte für die Speicherplatzausnutzung eines B-Baumes wurden von Nakamura und Mizzogushi [1978] berechnet (vgl. auch Yao [1985]). Es ergibt sich unabhängig von der Ordnung des B-Baumes eine Speicherplatzausnutzung von In 2 ≈ 69%, wenn n zufällig gewählte Schlüssel in einen anfangs leeren B-Baum eingefügt werden. Die Speicherplatzausnutzung kann erhöht werden, wie in Aufgabe 8.1 angedeutet; derart “verdichtete” Bäume wurden von Culik [1981] untersucht. Wie am Ende des Abschnitts 8.1 erwähnt, bilden Datenbanksysteme das Haupteinsatzfeld für B-Bäume. Dafür wurden verschiedene Varianten entwickelt, etwa mit dem Ziel, effizienten sequentiellen Zugriff zu erreichen und Schlüssel, die Zeichenketten sind, zu komprimieren [Wedekind 1974, Bayer und Unterauer 1977, Küspert 1983, Wagner 1973]. Derartige Techniken werden in [Lockemann und Schmidt 1987] diskutiert; ein Überblicksartikel zu B-Bäumen und ihren Varianten ist [Comer 1979].Google Scholar
  2. Die wesentliche Quelle auch für externes Sortieren ist das Buch von Knuth [1998]; dort wird eine Fülle weiterer Varianten und Strategien diskutiert und analysiert, z.B. auch das Kaskaden-Mischsortieren (Aufgabe 8.7) und eine ähnliche Technik, das Mehrphasen-Mischsortieren (polyphase merging), eine Modifikation des Vielweg-Mischens, die mit k+1 anstelle von 2k Files auskommt (siehe auch [Shell 1971]). Als Alternative zum Mischen kann man übrigens auch Quicksort als externes Sortierverfahren einsetzen [Six und Wegner 1981]. Neuere Untersuchungen zum externen Sortieren versuchen, die Möglichkeiten modemer Rechnertechnik, z.B. sehr große interne Speicher [Salzberg 1989] oder Parallelität [Salzberg 1990], [Barve, Grove und Vitter 1997] auszunutzen.Google Scholar
  3. Ein ausgezeichneter, aktueller Überblicksartikel zu externen Algorithmen und Datenstrukturen ist [Vitter 2001].Google Scholar

Copyright information

© B. G. Teubner Verlag / GWV Fachverlage GmbH, Wiesbaden 2004

Authors and Affiliations

  • Ralf Hartmut Güting
    • 1
  • Stefan Dieker
    • 1
  1. 1.HagenDeutschland

Personalised recommendations