Simulated Annealing (SA)

Wendt, Oliver

doi:10.1007/978-3-663-09046-5_5

Oliver Wendt

Part of the book series: Gabler Edition Wissenschaft ((GEWLV))

193 Accesses

Zusammenfassung

Als ein weiteres, in Analogie zur (hier unbelebten) Natur gestaltetes Verfahren zur Lösung kombinatorischer Optimierungsprobleme soll im folgenden das sogenannte Simulated Annealing¹⁷⁵ betrachtet werden. Ebenso wie die genetischen Algorithmen zählt auch das Simulated Annealing zu den relativ rechenintensiven Verfahren, deren Einsatz erst mit der Verfügbarkeit leistungsfähiger Hardware möglich wurde.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Log in via an institution

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 49.99; Price excludes VAT (USA)

Softcover Book: USD 49.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Literatur

Die Übersetzungen von ‘Annealing’ reichen von ‘Abk¨¹hlen’ ¨¹ber ‘Ausgl¨¹hen’ bis ‘Aushärten’. Verwendet wird der englische Begriff aber immer im Sinne der Einnahme eines physikalischen Zustandes niedrigerer Gesamtenergie.
Google Scholar
Obwohl erst 1985 veröffentlicht, wurden die Ergebnisse von Cerny vor Erscheinen der Veröffentlichung von Kirkpatrick eingereicht.
Google Scholar
F¨¹r einf¨¹hrende Darstellungen, die ¨¹ber die hier gegebene Übersicht hinausgehen, sei verwiesen auf [RtrrENBAR 89], [JOHNSON 891, [SHAHOOKAR 91]. Formalere Darstellungen finden sich bei [LAARHOVEN 88].
Google Scholar
Wie bereits angesprochen, besteht kein Unterschied zwischen der Semantik des Begriffs ‘Konfiguration’ und der des Begriffs ’Lösung’. Beide bezeichnen Elemente des Lösungsraums S, der in der SA-Literatur nat¨¹rlich als ‘Konfigurationsraum’ bezeichnet wird.
Google Scholar
Die bei der Realisierung einer bestimmten Konfiguration C anfallenden Kosten werden im Rahmen der physikalischen Analogie als Gesamtenergie der Konfiguration aufgefaßt und im folgenden mit E abgek¨¹rzt.
Google Scholar
Metropolis zeigte, daß die Boltzmann-Verteilung der Energie eines Systems durch einen stochastischen Zufallsprozeß von einem energetischen Zustand zu einem jeweils benachbarten Zustand simuliert werden kann, wenn f¨¹r Zustands¨¹bergänge, die eine Erhöhung der Energie bedeuten, genau diese Annahmewahrscheinlichkeit gilt [METROPOLIS 53]. Der rechte Term der Gleichung 49 wird daher im folgenden auch als Metropolis-Funktion bezeichnet.
Google Scholar
Man muß sich zusätzlich noch eine gewisse Gleitreibung vorstellen, die die Kugel beim Rollen auf der Gebirgsoberfläche etwas abbremst und ihr so wieder Energie entzieht.
Google Scholar
Streng genommen kann sie sich nat¨¹rlich auch nicht auf den Gitternetzlinien befinden, sondern muß von einem Kreuzungspunkt des Gitternetzes zum nächsten Kreuzungspunkt springen.
Google Scholar
Zur Theorie der Markov-Kctten vgl. z.B. piETZ 83]
Google Scholar
Da wir die Bezeichnung P Sir die Übergangswahrscheinlichkeiten reservieren, wird die Eintrittswahr
Google Scholar
F¨¹r eine stochastische Matrix muß gelten [LAARHOVEN 88, S.13], daß die Zeilensumme f¨¹r alle Zeilen der Matrix eins beträgt. Die Erf¨¹llung dieser Bedingung ist notwendig, um die Zeilen der Matrix als Übergangswahrscheinlichkeiten interpretieren zu können.
Google Scholar
Von einer uniformen Wahrscheinlichkeitsverteilung spricht man dann, wenn jedem von n möglichen Ereignissen genau die Eintrittswahrscheinlichkeit 1/n zukommt
Google Scholar
Dies geschieht nicht zuletzt, um die unten diskutierten eigenen Erweiterungen des SA um ‘kooperative Transitionen’ noch unter den Begriff des Simulated Annealing fassen zu d¨¹rfen. ’Probabilistic Hillclimbing’ erscheint als wenig aussagekräftige Altemative.
Google Scholar
Eine ausfiihrliche Diskussion der Konvergenzbedingungen und eine formale Beweisf¨¹hrung finden sich bei [LAARHOVEN 88, S.17–38].
Google Scholar
Konvergenzbeweise, die auf hinreichenden aber nicht notwendigen Bedingungssystemen aufbauen, finden sich bei [GIDAS 85], [LuNDY 86], [ANILY 87] und [MITRA 86].
Google Scholar
Reduzierbar wäre eine Markov-Kette dann, wenn sie Zustände umfaßt, die nicht erreicht werden können. F¨¹r Nichtreduzierbarkeit muß folglich gelten, daß fir je zwei Zustände i und j eine Sequenz von Transitionen exisitiert, die i in j ¨¹berf¨¹hrt, und fir jeden Schritt dieser Sequenz die Generierungswahrscheinlichkeit der entsprechenden Transition größer als null ist.
Google Scholar
Die Nichtreduzierbarkeit gewährleistet bereits, daß es mindestens einen Pfad gibt, ¨¹ber den i von j erreichbar ist. Die Frage lautet nun, ob auch mindestens einer dieser Pfade vollständig unterhalb einer vorgegebenen Höhe L verläuft, d.h. f¨¹r alle Konfigurationen 1 des Pfades muß E(C1) 5 L gelten.
Google Scholar
Um die Tiefe eines Nebenminimums zu bestimmen, muß also derjenige Pfad von Transitionen aus dem Nebenminimum in das globale Minimum konstruiert werden, der das geringste energetische Maximum zu ¨¹berqueren hat. Die Differenz zwischen diesem Maximalwert und der Energie des Nebenminimum bestimmt dessen Tiefe. Bildlich gesprochen kann man auch solange ‘Wasser’ in das Nebenminimum gießen, bis es irgendwann hoch genug steht, um in das globale Minimum zu fließen. Der Wasserpegel ¨¹ber dem Nebenminimum bezeichnet dann dessen Tiefe.
Google Scholar
Dieser Vektor q wird auch als linker Eigenvektor der Matrix P(7) bezeichnet.
Google Scholar
Diese läßt sich leicht berechnen, indem man die durch die stationäre Verteilung q vorgegebenen Aufenthaltswahrscheinlichkeiten fir jeden der (hier zwölf) Zustände i mit den Kosten E(Ci) der entsprechenden Konfiguration multipliziert, also E,Q,,,,,b =
Google Scholar
Die Energie der Konfiguration C4 kann nun nicht mehr als die länge der entsprechenden Tour interpretiert werden.
Google Scholar
Einhundert Transitionen reichen aus, um bei jeder Temperatur die stationäre Verteilung relativ gut zu approximieren.
Google Scholar
In diesem Temperaturbereich vollzieht sich, wie man der Grafik entnehmen kann, nämlich der entscheidende R¨¹ckgang der Aufenthaltswahrscheinlichkeit fitr das Nebenoptimum C4
Google Scholar
Formal bedeutet dies die Forderung der sog. Ergodizität der Markov-Kette. Die Anfangsverteilung ist also zumindest dann, wenn man den im Konvergenzbeweis geforderten Abk¨¹hlungsplan einhält, nach einer bestimmten Zahl von Transitionen gänzlich irrelevant f¨¹r die weitere Entwicklung der MarkovKette. Der Effekt der Anfangsverteilung hat sich sozusagen ‘verwaschen’.
Google Scholar
Von einem parameterfreien Verfahren spricht man dann, wenn außer der Problemstellung selbst keine weiteren Angaben nötig sind, um das Verfahren ablaufen zu lassen. Als Beispiel eines parameterfreien Verfahrens wäre z.B. der 2-opt-Algorithmus zu nennen.
Google Scholar
Ohne Beschränkung der Allgemeinheit sei hier von einer Gleichverteilung ausgegangen.
Google Scholar
Die unkonventionelle Bezeichnung des Erwartungswertes mit’Env’ wird durch das bereits f¨¹r die Energie vergebene Symbol E erzwungen.
Google Scholar
In diesem Falle ist es ratsam, K extrem groß, a nahe bei eins und TI extrem hoch zu wählen.
Google Scholar
Da es sich bei SA um einen stochastischen Algorithmus handelt, muß eine Stichprobe von hinreichendem Umfang ermittelt werden, um die erwartete Energie zu schätzen.
Google Scholar
Zu den wichtigsten Problemstellungen, fir die auch kommerzielle SA-Software verf¨¹gbar ist, zählt sicherlich das VLSI-Layout [SHAH00KAR 91], [DAREMA 87]. Connolly demonstrierte k¨¹rzlich die Einsetzbarkeit von SA zur approximativen Lösung jeglicher ganzzahliger 0/1-Programme [CONNOLLY 92]. Laursen berichtet ¨¹ber sehr positive Ergebnisse bei der Lösung quadratischer Zuordnungsprobleme [LAURSEN 93]. Auch fir Job-Shop-Scheduling-Probleme wurden z.T. bessere Ergebnisse erzielt als mit spezialisierten Heuristiken [LAARHOVEN 92], [Lo 92].
Google Scholar
Zu ähnlichen Überlegungen kommt man auch nach einer Untersuchung der Autokorrelationslänge ? fir die 3-change-Topologie. Während fik den Zweikantentausch,% # 2 zu beobachten war, beträgt sie hier A z n, ist also deutlich k¨¹rzer [STADLER 92]. 3
Google Scholar
In der Literatur finden sich häufig recht widerspr¨¹chliche Angaben zur Möglichkeit, mittels SA bessere Resultate als mit anderen Heuristiken zu erzielen. Während z.B. Rossier IRossIER 86] auch fir große Problemstellungen sehr gute Ergebnisse erzielt, kommt Golden zu folgendem Schluß: “For comparable amounts of CPU time, repeated application of the 2-opt procedure yields better accuracy than simulated annealing does on traveling salesman problems.” [GOLDEN 86b, S. 277]
Google Scholar
Im Mittel wurden 4.61 Iterationen zu je 1225 Transitionsversuchen benötigt, also insgesamt 5647 Transitionsversuche.
Google Scholar
Obwohl dieses Verfahren eine bessere Vergleichbarkeit gewährleistet, ist es nat¨¹rlich als Abbruchkriterium f¨¹r einen ‘stochastischen 2-opt’ nicht praktikabel, da man die benötigte Transitionszahl des deterministischen Gegenst¨¹cks nicht kennt. Ein sinnvolles Vorgehen best¨¹nde darin, die gleiche Zahl erfolgloser Transitionsversuche zugrunde zu legen, wie beim 2-opt: F¨¹r das TSP51 m¨¹ssen die letzten 1225 Transitionsversuche (entsprechend einem Durchlauf des 2-opt-one) erfolglos verlaufen sein, um das Verfahren zu beenden.
Google Scholar
Die Wahrscheinlichkeit dafiir, daß ein gegebenes Kantenpaar, f¨¹r welches die Ersetzung durch ein anderes sinnvoll wäre, bei einem Transitionsversuch nicht ‘gefunden’ wird, beträgt (1–1/1225). Durch Potenzieren dieses Ausdrucks mit 5647, der Gesamtzahl der Transitionsversuche, erhalten wir eine Wahrscheinlichkeit von immerhin 1% daf¨¹r, daß das entsprechende Kantenpaar von keinem der Transitions-versuche als austauschw¨¹rdig erkannt wird. Besser sieht das Bild bei einem Vergleich des SA mit dem mehrfach (auf verschiedene Ausgangslösungen) angewandten 2-opt oder einer Kombination aus 2-opt und 3-opt aus, wie sich
Google Scholar
Folgende Parametrisierungen wurden gewählt: (K=10000: T1=5; a=0.95), (K=50000: T1=5; a=0.992), (K=110000: T1=5; cr).998)
Google Scholar
Der Wert von 50000 Transitionen bezieht sich auf eine Target-Sampling-Rate von 100 je Generation und eine Generationenzahl von 500. Es darf nicht vernachlässigt werden, daß der zu betreibende Aufwand f¨¹r die Durchf¨¹hrung dieser 50000 Transitionen bei GA deutlich höher liegt als bei SA und 2-opt: Bei GA m¨¹ssen in jeder Generation die besten Individuen selektiert und dann je nach Ranking-Verfahren die ihrem Fitncßwert entsprechende Zahl von Nachkommen generieren. Das notwendige Kopieren der Individuen verursacht zusätzlichen Rechenaufwand.
Google Scholar

Download references

Authors

Oliver Wendt
View author publications
You can also search for this author in PubMed Google Scholar

Rights and permissions

Reprints and permissions

Copyright information

About this chapter

Cite this chapter

Wendt, O. (1995). Simulated Annealing (SA). In: Tourenplanung durch Einsatz naturanaloger Verfahren. Gabler Edition Wissenschaft. Deutscher Universitätsverlag, Wiesbaden. https://doi.org/10.1007/978-3-663-09046-5_5

Download citation

DOI: https://doi.org/10.1007/978-3-663-09046-5_5
Publisher Name: Deutscher Universitätsverlag, Wiesbaden
Print ISBN: 978-3-8244-6181-3
Online ISBN: 978-3-663-09046-5
eBook Packages: Springer Book Archive

Publish with us

Policies and ethics