In diesem Kapitel werden Bedingungen hergeleitet, die es erlauben, für konvexe Optimierungsprobleme zu entscheiden, ob ein gegebener Punkt optimal ist oder nicht. Diese Frage ist bei Funktionen von mehreren Unbekannten – und bei gegebenen Nebenbedingungen an die Unbekannten – in der Tat nicht leicht zu beantworten. Die Resultate dieses Kapitels sind Ausgangspunkt für viele numerische Verfahren zur Bestimmung einer Optimallösung und sind für das Verständnis dieser Verfahren wichtig, so dass sich ihr Studium lohnt. Ihre Bedeutung ist grundlegend, während die praktische Bedeutung einzelner Optimierungsverfahren relativ ist: die Vorzüge vieler Verfahren hängen häufig von der benutzten Computerarchitektur und davon ab, wie gut sie die besondere Struktur des jeweiligen Problems berücksichtigen.
8.1 Konvexe Ungleichungssysteme
Eine differenzierbare konvexe Funktion besitzt
genau dann als Minimalpunkt, wenn
gilt. (Wir überlassen den Nachweis dieser Aussage als einfache Übung.) Ziel der folgenden Betrachtungen ist es, diese Bedingung auf konvexe Optimierungsprobleme zu verallgemeinern, bei denen endlich viele Nebenbedingungen in der Form von Gleichungen oder Ungleichungen zu berücksichtigen sind.
Wir beginnen mit einem Resultat über die Lösbarkeit von Systemen von konvexen strikten Ungleichungen:
Satz 8.1.1











Beweis
- „
“
Diese Richtung ist offensichtlich richtig, weil (8.1.3) und
implizieren, dass für jedes
mindestens ein i mit
existiert.
- „
“
Die Menge
ist konvex, da alle
konvex sind. Weiter ist
,
und
wegen der Unlösbarkeit von (8.1.2). Nach Satz 7.2.2 kann
von A getrennt werden, d. h. es gibt ein
,
, so dass
für alle
. Nun ist mit
auch
für alle
. Aus
folgt
für alle
, also
. Weiter kann man zu jedem
ein
finden, das beliebig nahe bei F(x) liegt. Nach Definition ist
und daher
. Insgesamt gilt also
und
für alle
.






Damit (8.1.4) ein konvexes Optimierungsproblem wird, treffen wir die
Voraussetzung 8.1.6
Man überzeugt sich leicht, dass die Menge unter dieser Voraussetzung konvex ist. Darüber hinaus ist sie auch abgeschlossen, falls C eine abgeschlossene konvexe Menge und die Einschränkungen aller
,
, 2, ..., p, auf C reellwertige stetige Funktionen sind.
Ein wichtiges Resultat zur Charakterisierung von Optimalpunkten von konvexen Programmen der Form (8.1.4) ist der folgende Satz:
Satz 8.1.7




Bemerkungen
Voraussetzung 2) stellt eine Regularitätsforderung dar; sie wird weiter unten noch näher erläutert und analysiert. Ferner wird nur die Endlichkeit des Optimalwerts von (8.1.4) verlangt, keine Differenzierbarkeit und auch nicht die Existenz einer Optimallösung. So erfüllt z. B. für
das Problem
, das keine Optimallösung besitzt, alle Voraussetzungen des Satzes mit
. Satz 8.1.7 ist also auch auf solche Probleme anwendbar. Beachte, dass es kein
gibt, sodass (8.1.8) mit rechter Seite
anstelle von
erfüllt ist. Denn für
ist
und nach Definition von
existiert zu
ein
mit
. Der Vektor y aus Satz 8.1.7 maximiert also die „rechte Seite
“ unter allen
mit
für
. Tritt dieses Maximierungsproblem wie in Punkt (3) in Satz 8.3.4 auf, so wird es auch als Lagrange-Duales bezeichnet.
Wir zeigen zunächst, dass die Bedingung 2)b) zu der Forderung äquivalent ist, dass es einen Punkt gibt, mit
für alle nichtaffinen Funktionen
mit
.




















Beweis von Satz 8.1.7
Wir setzen zunächst voraus, dass es ein gibt mit
, d. h. wir fordern zunächst
auch für die affinen Funktionen
mit
.






- 1.Ohne die Regularitätsvoraussetzung 2) des Satzes zu benutzen, zeigen wir zunächst, dass es einen Vektor
,
, gibt mit den Eigenschaften
(8.1.10) - 2.
Unter Verwendung von Voraussetzung 2) zeigen wir dann
. Dann erfüllt der Vektor
die Behauptung des Satzes.


























































Definition 8.1.12

Diese Bedingung schließt gewisse Entartungen der nichtaffinen Nebenbedingungen aus. Wir erläutern sie an zwei einfachen Beispielen im ,
, die zeigen, dass die Aussage des Satzes falsch sein kann, wenn die Slater-Bedingung verletzt ist:
Beispiel 8.1.13











Beispiel 8.1.14
















8.2 Die KKT-Bedingungen





















































Die Bedingungen (8.2.4) werden KKT-Bedingungen für das Optimierungsproblem (8.2.2) genannt: Sie gehen auf Karush, Kuhn und Tucker zurück.
Für Probleme (8.2.2), die die Slater-Bedingung erfüllen, werden wir im nächsten Abschnitt sehen (s. Satz 8.3.4), dass die Lösung des KKT-Systems (8.2.4) mit der Lösung des Optimierungsproblems (8.2.2) äquivalent ist.
8.3 Die Lagrangefunktion
Eines der wichtigsten Werkzeuge der Optimierung ist die Lagrangefunktion, die dazu dient, ein gewisses „Gleichgewicht“ zwischen der Zielfunktion und den Nebenbedingungen zu beschreiben. Bevor wir die Lagrangefunktion formal einführen, soll sie anhand eines kleinen Beispiels motiviert werden.
- Beispiel:
- Wir betrachten ein konvexes Optimierungsproblem im
mit nur einer Ungleichungsrestriktion
Man führt dann zu jedem Parameter(8.3.1),
, Hilfsprobleme ein, die von y abhängen:
Der Parameter y beschreibt das Gewicht, das man der Erfüllung der Nebenbedingung(8.3.2)beimisst. Wir nehmen an, dass (8.3.2) für jedes feste
eine Optimallösung
besitzt. Für
wird vermutlich der Optimalpunkt
die Nebenbedingung
im Allgemeinen verletzen, es sei denn, die Nebenbedingung
war „überflüssig“. Wenn man aber y sehr groß wählt, wird das Hauptgewicht des Problems (8.3.2) bei der Minimierung von
liegen; in der Regel wird dann
gelten und
wird für (8.3.1) nicht optimal sein. Lässt man nun, beginnend bei
, den Wert von y langsam wachsen und verfolgt die zugehörigen Lösungen
, so wird es einen Zwischenwert oder „Gleichgewichtspunkt“
geben, für den
gilt. Dann löst
auch (8.3.1).

Definition 8.3.3
- 1.Sei D die Menge
. Dann heißt die Funktion
, die durch
definiert ist, die Lagrangefunktion von (8.1.4). - 2.Ein Punkt
heißt Sattelpunkt von L auf
, falls
Diese Definitionen erlauben es, den folgenden Satz zu zeigen, der im wesentlichen äquivalent zu Satz 8.1.7 und als Satz von Karush, Kuhn und Tucker für konvexe Optimierungsprobleme (8.1.4) bekannt ist:
Beweis
- 1.Sei
ein Sattelpunkt von L auf
. Dann ist für alle
Aus der Definition von D folgt dannfür
und
für
, denn die linke Seite ist beschränkt und die
, bzw.
können für
bzw. für
beliebig gewählt werden. Also ist
.
Fallsfür ein
, so muss
und
sein. Wir setzen dann
für dieses i und
für alle anderen Komponenten von y. Daraus folgt dann
, im Widerspruch zur Definition des Sattelpunktes. Also ist
für alle
, ..., m. Für beliebiges
ist
wegenund
für
und
für
.
Also ist
eine Optimallösung von (8.1.4).
- 2.
- 3.

Satz 8.3.4 gibt eine sehr allgemeine Fassung des Satzes von Karush-Kuhn-Tucker an, die für beliebige konvexe Mengen C und beliebige konvexe Funktionen f und ,
, gilt, die sogar nichtdifferenzierbar sein können.







8.4 Dualität bei konisch konvexen Programmen
In Anlehnung an das Buch [128] schildern wir hier noch eine weitere elegante Möglichkeit, für konvexe Probleme ein duales Problem zu formulieren. Sie beruht auf der Beobachtung, dass sich ein konvexes Problem stets in einer konischen Standardform schreiben lässt, in der Kegel und ihre dualen Kegel
bezüglich eines Skalarprodukts
eine wesentliche Rolle spielen.






















Der weiter unten bewiesene Dualitätssatz 8.4.4 wird die Bezeichnung von (P) und (D) als duale Programme rechtfertigen.







Im Folgenden sei deshalb linear und wieder
, d. h.
. Wir setzen jetzt voraus, dass
eine abgeschlossene konvexe Menge ist. Dies ist sicher der Fall, wenn C eine abgeschlossene konvexe Menge ist und die Einschränkungen der Funktionen
,
, 2, ..., m, auf C reellwertig stetig und konvex sind.









Es gilt nun folgender Dualitätssatz
Satz 8.4.4
- 1.Für jede zulässige Lösung x von (P) und s von (D) ist
- 2.Falls (P) einen endlichen Optimalwert
besitzt,
und (P) die Slater-Bedingungerfüllt, dann besitzt (D) eine Optimallösung
und es gilt
Für jede Optimallösungvon (P) gilt dann
Beweis













































Da (P) wegen das duale Programm zu (D) ist, folgt sofort aus dem letzten Satz:
8.5 Dualität bei semidefiniten Programmen
Weitere Beispiele konischer Programme, in denen die Dualitätsbeziehungen zwischen (8.4.2) und (8.4.3) in natürlicher Weise auftreten, liefern die sogenannten semidefiniten Programme: In einer Reihe von Anwendungen treten – wie wir in Kap. 16 sehen werden – Optimierungsprobleme auf, bei denen eine unbekannte symmetrische Matrix X so zu bestimmen ist, dass X positiv semidefinit ist und gegebene lineare Gleichungen erfüllt.























Bezüglich des Skalarprodukts (8.5.7) ist nach einem Satz von Féjer der Kegel selbstdual,
. Er spielt damit in
die gleiche Rolle wie der positive Orthant
im
versehen mit dem Standard-Skalarprodukt
.
Satz 8.5.2
(Féjer) Eine symmetrische Matrix Z ist positiv semidefinit genau dann, wenn für alle positiv semidefiniten Matrizen X gilt. Mit anderen Worten:
.
Beweis












Es ist leicht zu sehen, dass der Kegel ein nichtleeres Inneres besitzt, nämlich den offenen Kegel
der positiv definiten Matrizen.






































Satz 8.5.9





Wenn die Matrix X eine Diagonalmatrix ist, d. h. wenn die linearen Gleichungen nur für Diagonalmatrizen X erfüllbar sind, dann kann man (SDP) als eine komplizierte Art auffassen, um ein lineares Programm zu formulieren. Der Dualitätssatz stimmt dann mit dem der linearen Programmierung überein (man überlege kurz, dass das wirklich so ist!); allerdings gilt die hier hergeleitete Dualität nur unter der Voraussetzung der Slater-Bedingung. Wir werden später noch auf dieses Paar dualer Programme zurückkommen.
8.6 Übungsaufgaben
- 1.Gegeben sei die MengeGesucht ist der Punkt
, der zum Punkt
den kürzesten Euklidischen Abstand hat.
- a)
Lösen Sie die Aufgabe graphisch.
- b)
Lösen Sie die Aufgabe durch Auswertung der KKT-Bedingungen.
- a)
- 2.Sei
eine abgeschlossene, konvexe Teilmenge des
. Man zeige die folgenden Eigenschaften der Orthogonalprojektion
von x auf K:
- a)Zu jedem
gibt es genau ein
mit der Eigenschaft
definiert die Orthogonalprojektion von x auf
,
.
- b)Bedingung
ist äquivalent zu
Hinweis: Man betrachte.
- c)Es istHinweis: Man setze
und
geeignet in b) ein und nutze die Cauchy-Schwarzsche Ungleichung aus.
- d)
Die (Abstands-)Funktion
ist konvex.
- e)
Es gilt
für alle
.
- f)Falls
in einem Punkt
differenzierbar ist, so gilt
Hinweis: Man untersuche die Richtungsableitung in Richtungund nutze Teil e), um die Norm von
abzuschätzen.
- a)
- 3.Sei
mit konvexen Funktionen
(
) und festen
(
). Sei
undwie in Abschn. 8.4. Man zeige:
- a)
.
- b)
Die Menge
ist genau dann abgeschlossen, wenn
beschränkt ist.
- c)Sei
und
. Dann ist
genau dann, wenn für alle i mit
und alle j mit
gilt
- d)
Mit
ist auch die Funktion
mit
konvex.
- a)
- 4.
Sei
(d. h. symmetrisch und positiv semidefinit). Man zeige, dass es eine symmetrische Matrix
gibt (die symmetrische Wurzel von Z) mit
. (Man nutze die Normalform
mit einer unitären Matrix U und einer Diagonalmatrix
.)
- 5.Seien konvexe Funktionen
für
gegeben. Für
definieren wir die Funktionen
durch
. Man zeige, dass auch die
konvex sind. Man schreibe das Problem
mit Hilfe der Funktionenals konisches konvexes Programm.
- 6.Sei
,
,
,
. Man betrachte das primal-duale Paar von Problemen der Form (8.4.2), (8.4.3)
und- a)
Man zeige
.
- b)
Man zeige, dass (P) die Slaterbedingung verletzt.
- c)
Man zeige, dass beide Probleme trotzdem eine endliche Optimallösung besitzen und die Optimalwerte sich zu Null addieren. (Vgl. Satz 8.4.4)
- d)
Man gebe ein Paar konischer konvexer Programme an, für das das primale Problem und das duale Problem beide die Slaterbedingung verletzen aber beide trotzdem endliche Optimallösungen besitzen, deren Optimalwerte sich zu Null addieren.
- a)