Zusammenfassung
Als ein weiteres, in Analogie zur (hier unbelebten) Natur gestaltetes Verfahren zur Lösung kombinatorischer Optimierungsprobleme soll im folgenden das sogenannte Simulated Annealing175 betrachtet werden. Ebenso wie die genetischen Algorithmen zählt auch das Simulated Annealing zu den relativ rechenintensiven Verfahren, deren Einsatz erst mit der Verfügbarkeit leistungsfähiger Hardware möglich wurde.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Literatur
Die Übersetzungen von ‘Annealing’ reichen von ‘Abk¨¹hlen’ ¨¹ber ‘Ausgl¨¹hen’ bis ‘Aushärten’. Verwendet wird der englische Begriff aber immer im Sinne der Einnahme eines physikalischen Zustandes niedrigerer Gesamtenergie.
Obwohl erst 1985 veröffentlicht, wurden die Ergebnisse von Cerny vor Erscheinen der Veröffentlichung von Kirkpatrick eingereicht.
F¨¹r einf¨¹hrende Darstellungen, die ¨¹ber die hier gegebene Übersicht hinausgehen, sei verwiesen auf [RtrrENBAR 89], [JOHNSON 891, [SHAHOOKAR 91]. Formalere Darstellungen finden sich bei [LAARHOVEN 88].
Wie bereits angesprochen, besteht kein Unterschied zwischen der Semantik des Begriffs ‘Konfiguration’ und der des Begriffs ’Lösung’. Beide bezeichnen Elemente des Lösungsraums S, der in der SA-Literatur nat¨¹rlich als ‘Konfigurationsraum’ bezeichnet wird.
Die bei der Realisierung einer bestimmten Konfiguration C anfallenden Kosten werden im Rahmen der physikalischen Analogie als Gesamtenergie der Konfiguration aufgefaßt und im folgenden mit E abgek¨¹rzt.
Metropolis zeigte, daß die Boltzmann-Verteilung der Energie eines Systems durch einen stochastischen Zufallsprozeß von einem energetischen Zustand zu einem jeweils benachbarten Zustand simuliert werden kann, wenn f¨¹r Zustands¨¹bergänge, die eine Erhöhung der Energie bedeuten, genau diese Annahmewahrscheinlichkeit gilt [METROPOLIS 53]. Der rechte Term der Gleichung 49 wird daher im folgenden auch als Metropolis-Funktion bezeichnet.
Man muß sich zusätzlich noch eine gewisse Gleitreibung vorstellen, die die Kugel beim Rollen auf der Gebirgsoberfläche etwas abbremst und ihr so wieder Energie entzieht.
Streng genommen kann sie sich nat¨¹rlich auch nicht auf den Gitternetzlinien befinden, sondern muß von einem Kreuzungspunkt des Gitternetzes zum nächsten Kreuzungspunkt springen.
Zur Theorie der Markov-Kctten vgl. z.B. piETZ 83]
Da wir die Bezeichnung P Sir die Übergangswahrscheinlichkeiten reservieren, wird die Eintrittswahr
F¨¹r eine stochastische Matrix muß gelten [LAARHOVEN 88, S.13], daß die Zeilensumme f¨¹r alle Zeilen der Matrix eins beträgt. Die Erf¨¹llung dieser Bedingung ist notwendig, um die Zeilen der Matrix als Übergangswahrscheinlichkeiten interpretieren zu können.
Von einer uniformen Wahrscheinlichkeitsverteilung spricht man dann, wenn jedem von n möglichen Ereignissen genau die Eintrittswahrscheinlichkeit 1/n zukommt
Dies geschieht nicht zuletzt, um die unten diskutierten eigenen Erweiterungen des SA um ‘kooperative Transitionen’ noch unter den Begriff des Simulated Annealing fassen zu d¨¹rfen. ’Probabilistic Hillclimbing’ erscheint als wenig aussagekräftige Altemative.
Eine ausfiihrliche Diskussion der Konvergenzbedingungen und eine formale Beweisf¨¹hrung finden sich bei [LAARHOVEN 88, S.17–38].
Konvergenzbeweise, die auf hinreichenden aber nicht notwendigen Bedingungssystemen aufbauen, finden sich bei [GIDAS 85], [LuNDY 86], [ANILY 87] und [MITRA 86].
Reduzierbar wäre eine Markov-Kette dann, wenn sie Zustände umfaßt, die nicht erreicht werden können. F¨¹r Nichtreduzierbarkeit muß folglich gelten, daß fir je zwei Zustände i und j eine Sequenz von Transitionen exisitiert, die i in j ¨¹berf¨¹hrt, und fir jeden Schritt dieser Sequenz die Generierungswahrscheinlichkeit der entsprechenden Transition größer als null ist.
Die Nichtreduzierbarkeit gewährleistet bereits, daß es mindestens einen Pfad gibt, ¨¹ber den i von j erreichbar ist. Die Frage lautet nun, ob auch mindestens einer dieser Pfade vollständig unterhalb einer vorgegebenen Höhe L verläuft, d.h. f¨¹r alle Konfigurationen 1 des Pfades muß E(C1) 5 L gelten.
Um die Tiefe eines Nebenminimums zu bestimmen, muß also derjenige Pfad von Transitionen aus dem Nebenminimum in das globale Minimum konstruiert werden, der das geringste energetische Maximum zu ¨¹berqueren hat. Die Differenz zwischen diesem Maximalwert und der Energie des Nebenminimum bestimmt dessen Tiefe. Bildlich gesprochen kann man auch solange ‘Wasser’ in das Nebenminimum gießen, bis es irgendwann hoch genug steht, um in das globale Minimum zu fließen. Der Wasserpegel ¨¹ber dem Nebenminimum bezeichnet dann dessen Tiefe.
Dieser Vektor q wird auch als linker Eigenvektor der Matrix P(7) bezeichnet.
Diese läßt sich leicht berechnen, indem man die durch die stationäre Verteilung q vorgegebenen Aufenthaltswahrscheinlichkeiten fir jeden der (hier zwölf) Zustände i mit den Kosten E(Ci) der entsprechenden Konfiguration multipliziert, also E,Q,,,,,b =
Die Energie der Konfiguration C4 kann nun nicht mehr als die länge der entsprechenden Tour interpretiert werden.
Einhundert Transitionen reichen aus, um bei jeder Temperatur die stationäre Verteilung relativ gut zu approximieren.
In diesem Temperaturbereich vollzieht sich, wie man der Grafik entnehmen kann, nämlich der entscheidende R¨¹ckgang der Aufenthaltswahrscheinlichkeit fitr das Nebenoptimum C4
Formal bedeutet dies die Forderung der sog. Ergodizität der Markov-Kette. Die Anfangsverteilung ist also zumindest dann, wenn man den im Konvergenzbeweis geforderten Abk¨¹hlungsplan einhält, nach einer bestimmten Zahl von Transitionen gänzlich irrelevant f¨¹r die weitere Entwicklung der MarkovKette. Der Effekt der Anfangsverteilung hat sich sozusagen ‘verwaschen’.
Von einem parameterfreien Verfahren spricht man dann, wenn außer der Problemstellung selbst keine weiteren Angaben nötig sind, um das Verfahren ablaufen zu lassen. Als Beispiel eines parameterfreien Verfahrens wäre z.B. der 2-opt-Algorithmus zu nennen.
Ohne Beschränkung der Allgemeinheit sei hier von einer Gleichverteilung ausgegangen.
Die unkonventionelle Bezeichnung des Erwartungswertes mit’Env’ wird durch das bereits f¨¹r die Energie vergebene Symbol E erzwungen.
In diesem Falle ist es ratsam, K extrem groß, a nahe bei eins und TI extrem hoch zu wählen.
Da es sich bei SA um einen stochastischen Algorithmus handelt, muß eine Stichprobe von hinreichendem Umfang ermittelt werden, um die erwartete Energie zu schätzen.
Zu den wichtigsten Problemstellungen, fir die auch kommerzielle SA-Software verf¨¹gbar ist, zählt sicherlich das VLSI-Layout [SHAH00KAR 91], [DAREMA 87]. Connolly demonstrierte k¨¹rzlich die Einsetzbarkeit von SA zur approximativen Lösung jeglicher ganzzahliger 0/1-Programme [CONNOLLY 92]. Laursen berichtet ¨¹ber sehr positive Ergebnisse bei der Lösung quadratischer Zuordnungsprobleme [LAURSEN 93]. Auch fir Job-Shop-Scheduling-Probleme wurden z.T. bessere Ergebnisse erzielt als mit spezialisierten Heuristiken [LAARHOVEN 92], [Lo 92].
Zu ähnlichen Überlegungen kommt man auch nach einer Untersuchung der Autokorrelationslänge ? fir die 3-change-Topologie. Während fik den Zweikantentausch,% # 2 zu beobachten war, beträgt sie hier A z n, ist also deutlich k¨¹rzer [STADLER 92]. 3
In der Literatur finden sich häufig recht widerspr¨¹chliche Angaben zur Möglichkeit, mittels SA bessere Resultate als mit anderen Heuristiken zu erzielen. Während z.B. Rossier IRossIER 86] auch fir große Problemstellungen sehr gute Ergebnisse erzielt, kommt Golden zu folgendem Schluß: “For comparable amounts of CPU time, repeated application of the 2-opt procedure yields better accuracy than simulated annealing does on traveling salesman problems.” [GOLDEN 86b, S. 277]
Im Mittel wurden 4.61 Iterationen zu je 1225 Transitionsversuchen benötigt, also insgesamt 5647 Transitionsversuche.
Obwohl dieses Verfahren eine bessere Vergleichbarkeit gewährleistet, ist es nat¨¹rlich als Abbruchkriterium f¨¹r einen ‘stochastischen 2-opt’ nicht praktikabel, da man die benötigte Transitionszahl des deterministischen Gegenst¨¹cks nicht kennt. Ein sinnvolles Vorgehen best¨¹nde darin, die gleiche Zahl erfolgloser Transitionsversuche zugrunde zu legen, wie beim 2-opt: F¨¹r das TSP51 m¨¹ssen die letzten 1225 Transitionsversuche (entsprechend einem Durchlauf des 2-opt-one) erfolglos verlaufen sein, um das Verfahren zu beenden.
Die Wahrscheinlichkeit dafiir, daß ein gegebenes Kantenpaar, f¨¹r welches die Ersetzung durch ein anderes sinnvoll wäre, bei einem Transitionsversuch nicht ‘gefunden’ wird, beträgt (1–1/1225). Durch Potenzieren dieses Ausdrucks mit 5647, der Gesamtzahl der Transitionsversuche, erhalten wir eine Wahrscheinlichkeit von immerhin 1% daf¨¹r, daß das entsprechende Kantenpaar von keinem der Transitions-versuche als austauschw¨¹rdig erkannt wird. Besser sieht das Bild bei einem Vergleich des SA mit dem mehrfach (auf verschiedene Ausgangslösungen) angewandten 2-opt oder einer Kombination aus 2-opt und 3-opt aus, wie sich
Folgende Parametrisierungen wurden gewählt: (K=10000: T1=5; a=0.95), (K=50000: T1=5; a=0.992), (K=110000: T1=5; cr).998)
Der Wert von 50000 Transitionen bezieht sich auf eine Target-Sampling-Rate von 100 je Generation und eine Generationenzahl von 500. Es darf nicht vernachlässigt werden, daß der zu betreibende Aufwand f¨¹r die Durchf¨¹hrung dieser 50000 Transitionen bei GA deutlich höher liegt als bei SA und 2-opt: Bei GA m¨¹ssen in jeder Generation die besten Individuen selektiert und dann je nach Ranking-Verfahren die ihrem Fitncßwert entsprechende Zahl von Nachkommen generieren. Das notwendige Kopieren der Individuen verursacht zusätzlichen Rechenaufwand.
Rights and permissions
Copyright information
© 1995 Springer Fachmedien Wiesbaden
About this chapter
Cite this chapter
Wendt, O. (1995). Simulated Annealing (SA). In: Tourenplanung durch Einsatz naturanaloger Verfahren. Gabler Edition Wissenschaft. Deutscher Universitätsverlag, Wiesbaden. https://doi.org/10.1007/978-3-663-09046-5_5
Download citation
DOI: https://doi.org/10.1007/978-3-663-09046-5_5
Publisher Name: Deutscher Universitätsverlag, Wiesbaden
Print ISBN: 978-3-8244-6181-3
Online ISBN: 978-3-663-09046-5
eBook Packages: Springer Book Archive