Qui si risolve LOGO
a

Menu

M

Chiudi

Esercizi su punti stazionari con determinante hessiano nullo

Massimi e minimi liberi e vincolati, Metodi matematici per la meccanica classica

Home » Esercizi su punti stazionari con determinante hessiano nullo

Nella ricerca dei punti di massimo e minimo per una funzione derivabile, è molto utile il teorema di Fermat: tali punti di estremo vanno ricercati tra i punti stazionari della funzione, ossia i punti in cui la sua derivata o il suo gradiente si annullano. Non tutti i punti stazionari sono però di massimo o di minimo; inoltre, il teorema non dà alcuna informazione su come distinguere i punti di massimo da quelli di minimo. Anche ai fini delle applicazioni pratiche come la ricerca dei punti di stabilità di un sistema meccanico, risulta di importanza fondamentale classificare quali punti stazionari siano di massimo, di minimo, oppure né di massimo né di minimo. Il segno della derivata seconda della funzione nel punto considerato è un primo modo di procedere. Per funzioni in più variabili, ciò corrisponde a studiare la segnatura della matrice hessiana della funzione, cioè determinarne il segno degli autovalori. Purtroppo tale metodo non è sempre conclusivo, in quanto in presenza di autovalori nulli (cioè se il determinante hessiano è nullo) può capitare di non trarre abbastanza informazioni per stabilire con certezza la natura del punto stazionario considerato.

In questa raccolta di 16 esercizi presentiamo dei casi in cui tale situazione si verifica, mostrando varie tecniche per portare a termine lo studio della natura dei punti stazionari. Gli esercizi sono completamente risolti e ampiamente illustrati, per fornire al lettore spiegazioni chiare e dettagliate. Gli esercizi vanno oltre il semplice studio dei punti stazionari, presentando lo studio completo degli estremi locali e globali delle funzioni in più variabili coinvolte.
Le tecniche qui presentate sono estremamente utili anche agli studenti dei corsi di Meccanica Razionale, in quanto spesso lo studio della stabilità di sistemi meccanici si riconduce a studiare la natura di punti critici in cui appunto il determinante hessiano si annulla. Infatti alcuni dei seguenti esercizi sono proprio tratti da casistiche simili.
L’articolo è quindi uno strumento dedicato a chi desidera approfondire a 360° la propria competenza nello studio delle funzioni in più variabili, fornendo una panoramica completa sull’argomento.

Oltre all’esaustiva lista reperibile in fondo all’articolo, segnaliamo anche le seguenti pagine contenenti materiale affine:

Buona lettura!

 

Sommario

Leggi...

Questa dispensa è una raccolta di esercizi svolti sullo studio dei punti di massimo e minimo assoluti e relativi per funzioni di più variabili, con particolare attenzione al caso in cui la matrice hessiana sia semidefinita ma non definita, che in due variabili è equivalente al fatto che essa abbia determinante nullo. Dopo un breve sunto della teoria, negli esercizi vengono mostrati vari metodi per affrontare tale studio. Segnaliamo che alcuni problemi e parte delle relative soluzioni sono tratti da [6].

 
 

Autori e revisori


 
 

Notazioni

Leggi...

\mathbb{N} Insieme dei numeri naturali;
\mathbb{Z} Insieme dei numeri interi relativi;
\mathbb{R} Insieme dei numeri reali;
\mathbb{R}^n Insieme delle n-uple di numeri reali;
\mathbf{0} Vettore nullo in \mathbb{R}^n;
e_i i-esimo vettore coordinato in \mathbb{R}^n: (0,\dots,0,1,0,\dots,0);
f_{x_i}(\bar{x}), \frac{\partial f}{\partial x_i}(\bar{x}) Derivata parziale di f \colon \mathbb{R}^n \to \mathbb{R} nel punto \bar{x} rispetto alla direzione e_i;
\nabla f(\bar{x}), D f(\bar{x}) Gradiente di f \colon \mathbb{R}^n \to \mathbb{R} nel punto \bar{x};
f_{x_i x_j}(\bar{x}), \dfrac{\partial^2 f}{\partial x_i \partial x_j}(\bar{x}) Derivata seconda di f \colon \mathbb{R}^n \to \mathbb{R} nel punto \bar{x} rispetto alle coordinate x_i e x_j;
\nabla^2 f(\bar{x}), D^2 f(\bar{x}) Matrice hessiana di f \colon \mathbb{R}^n \to \mathbb{R} nel punto \bar{x};
\mathcal{C}^{k}(A) Spazio delle funzioni derivabili k volte in A con derivate continue;
\mathcal{C}^{\infty}(A) Spazio delle funzioni derivabili infinite volte in A con derivate continue;
\mathbb{R}^{m \times n} Spazio vettoriale delle matrici a coefficienti reali aventi m righe e n colonne;
I Matrice identità di dimensione deducibile dal contesto;
\det M Determinante della matrice M \in \mathbb{R}^{n \times n};
\operatorname{Tr} M Traccia della matrice M \in \mathbb{R}^{n \times n}, ossia somma degli elementi sulla diagonale principale di M;
\sup_A f, \inf_A f Estremi inferiore e superiore di f sull’insieme A;
\max_A f, \min_A f Massimo e minimo di f sull’insieme A;
\partial A Frontiera dell’insieme A \subseteq \mathbb{R}^n.


 
 

Introduzione

Leggi...

Lo studio degli estremi relativi e assoluti di una funzione reale assume notevole importanza dal punto di vista pratico, soprattutto in applicazioni di tipo fisico ed economico. In molti problemi, un obiettivo fondamentale consiste infatti nel determinare per quali scelte dei parametri alcune funzioni (che possono modellizzare ad esempio il costo di un progetto o la durata di un componente) assumono valore massimo o minimo. Nei corsi di Analisi Matematica 1, lo studente è diventato familiare con tali problemi di ottimizzazione, nel caso in cui la funzione in esame dipendesse da una sola variabile reale.

Non è difficile fornire esempi (e anzi in natura tali esempi abbondano) di casi in cui le funzioni che si vuole studiare dipendono da più variabili reali. Ad esempio, il costo di trasporto di un determinato bene su un mezzo come un camion dipende sia dalla lunghezza del tratto percorso, ma anche dal carico a cui il mezzo è sottoposto. Oppure, la durata di un componente dipende dal tempo di utilizzo dello stesso, ma anche dallo stress che è costretto a sopportare.

È dunque naturale studiare tecniche per lo studio di problemi di massimo e di minimo anche per funzioni che dipendano da più variabili reali. Tale scopo è uno dei principali dei corsi di Analisi Matematica 2. Come il lettore può immaginare, le derivate costituiscono anche in questo ambito lo strumento principale per affrontare tale studio.

Nel caso di funzioni di una variabile reale, un metodo per determinare estremi locali di una funzione f \colon \mathbb{R} \to \mathbb{R} derivabile 2 volte con continuità consiste nell’usare il teorema di Fermat, che afferma che, se f è derivabile in un punto x_0 di estremo locale, allora f'(x_0)=0. Dunque, per determinare i punti di estremo locale di f, si determinano le soluzioni dell’equazione

(1) \begin{equation*} f'(x) = 0, \end{equation*}

ossia i cosiddetti punti stazionari di f. Una volta ottenuto un punto stazionario x_0, una conseguenza del teorema di Taylor è la seguente:

\[\quad\]

  1. se f''(x_0)>0, allora x_0 è un punto di minimo locale per f;
  2.  

  3. se f''(x_0)<0, allora x_0 è un punto di massimo locale per f;
  4.  

  5. se f''(x_0)=0, allora occorre determinare la natura di x_0 in altro modo.

Il criterio esposto non afferma quindi nulla nel caso in cui la derivata seconda di f si annulli: occorre stabilire la natura di x_0 con altri metodi, ad esempio studiando il segno della derivata prima f' in un intorno di x_0, oppure con considerazioni particolari su f (come il suo segno, stime, etc…).

Nel caso di una funzione f \colon \mathbb{R}^n \to \mathbb{R} di più variabili, il processo che solitamente si segue è simile: dal teorema di Fermat 1.9 i punti di estremo locale di f vanno ricercati tra i suoi punti stazionari.

Una volta determinati tali punti stazionari, si può utilizzare il criterio fornito dal teorema 1.10, basato sul “segno delle derivate seconde” di f, analogo di quello per funzioni di una variabile. Purtroppo può accadere, come per il punto 3, che tale criterio non permetta di stabilire la natura del punto stazionario in esame. Ciò avviene quando l’analogo delle derivata seconda in più variabili, detta matrice hessiana di f, è semidefinita ma non definita; ciò, nel caso di funzioni di due variabili, è equivalente al fatto che il determinante della matrice hessiana, detto determinante hessiano di f, si annulli.

In tali casi, occorre stabilire la natura del punto stazionario usando altri metodi. Lo scopo principale di questa dispensa è appunto di analizzare queste situazioni, e fornire al lettore una panoramica varia di strategie per affrontare lo studio della natura dei punti stazionari in cui la matrice hessiana sia semidefinita. Questi metodi si basano principalmente su tre tecniche generali:

\[\quad\]

  • studio del segno di f (o di una sua variante) in un intorno del punto stazionario \bar{x};
  •  

  • studio del segno delle derivate prime di f in un intorno di \bar{x};
  •  

  • considerazioni e stime particolari su f.

Negli esercizi spiegheremo nel dettaglio queste tecniche e ne forniremo varie applicazioni allo studio dei punti di estremo locale e assoluto per funzioni di più variabili reali. Il lavoro è così organizzato.

\[\quad\]

  1. Nella sezione 1 ricordiamo brevemente le definizioni e i teoremi principali che utilizzeremo nella risoluzione degli esercizi.
  2.  

  3. Nella sezione 2 riportiamo le tracce degli esercizi che svolgeremo.
  4.  

  5. Nella sezione 3 proponiamo delle soluzioni per gli esercizi. Spesso vengono fornite più soluzioni alternative dei problemi, al fine di permettere al lettore di acquisire varie tecniche e affinare la sua capacità di valutare quale pregio abbia ciascuna di esse.

Osserviamo che gli esercizi, pur essendo principalmente improntati allo studio di punti stazionari con hessiano nullo, presentano inoltre lo studio di punti a hessiano non nullo e la ricerca degli estremi assoluti di f. Abbiamo preferito inserire gli esercizi in questo contesto più generale, anche per fornire al lettore una panoramica più ampia dell’argomento dell’ottimizzazione per funzioni a più variabili.

Osserviamo infine che, per semplicità, ci restringiamo principalmente al caso di funzioni di 2 variabili, ma si può facilmente intuire come ragionamenti del tutto simili si applichino anche al caso di funzioni di 3 o più variabili.


 
 

Richiami di teoria

Leggi...

In questa sezione riportiamo le definizioni e i risultati fondamentali sulle funzioni in più variabili che utilizzeremo nel seguito. Non riportiamo le dimostrazioni dei teoremi enunciati, ma rimandiamo il lettore a [2, capitolo 3] e [3, capitolo 3] per una trattazione completa dell’argomento.

Indicheremo il generico punto di \mathbb{R}^n con \bar{x} e le sue coordinate con \bar{x}=(x_1,\dots,x_n). Poiché spesso lavoreremo in \mathbb{R}^2, indicheremo in tali casi le coordinate dei punti di \mathbb{R}^2 con (x,y).

Definizione 1.1 (derivate parziali). Sia A \subseteq \mathbb{R}^n aperto, sia \bar{x} \coloneqq (x_1,\dots,x_n) \in A, sia f \colon A \to \mathbb{R} e sia i \in \{1,\dots,n\}. Si definisce derivata parziale di f rispetto a x_i in \bar{x} il limite (se esiste)

(2) \begin{equation*} \begin{split} f_{x_i}(\bar{x}) \coloneqq & \lim_{h \to 0} \frac{f(\bar{x}+he_i) - f(\bar{x})}{h} \\ = & \lim_{h \to 0} \frac{f(x_1,x_2,\dots,x_{i-1},x_i + h,x_{i+1},\dots,x_n) - f(x_1,x_2,\dots,x_{i-1},x_i,x_{i+1},\dots,x_n)}{h}. \end{split} \end{equation*}

Se f_{x_i}(\bar{x}) esiste ed è finita, f si dice derivabile parzialmente rispetto a x_i in \bar{x}.

\[\quad\]

Le derivate parziali di f vengono anche denotate rispettivamente con il simbolo

(3) \begin{equation*} \frac{\partial f}{\partial x_i}(\bar{x}). \end{equation*}

Nel caso di \mathbb{R}^2, indicheremo le derivate parziali in (x_0,y_0) \in A con

(4) \begin{equation*} f_x(x_0,y_0),\quad f_y(x_0,y_0), \qquad \text{oppure con} \qquad \frac{\partial f}{\partial x}(x_0,y_0), \quad \frac{\partial f}{\partial y}(x_0,y_0). \end{equation*}

Definizione 1.2 (gradiente, punti stazionari). Sia A \subseteq \mathbb{R}^n aperto, sia f \colon A \to \mathbb{R} e sia \bar{x} \coloneqq (x_1,\dots,x_n) \in A. Se le n derivate parziali di f in \bar{x} esistono e sono finite, f si dice derivabile in \bar{x} e si definisce gradiente di f in \bar{x} il vettore di \mathbb{R}^n delle derivate parziali in \bar{x}, ovvero

(5) \begin{equation*} \nabla f(\bar{x}) \coloneqq \left(f_{x_1}(\bar{x}),\dots, f_{x_n}(\bar{x})  \right ). \end{equation*}

Se tutte le derivate parziali di f in \bar{x} sono nulle, ossia se \nabla f(\bar{x}) = \mathbf{0}, allora \bar{x} è detto un punto stazionario di f.

\[\quad\]

Per il gradiente vengono tipicamente usati anche i simboli

(6) \begin{equation*} Df(\bar{x}), \qquad \operatorname{grad}f(\bar{x}). \end{equation*}

Se una funzione di più variabili è derivabile in un aperto, ha senso parlare di derivate parziali seconde.

Definizione 1.3 (derivate seconde). Sia A \subseteq \mathbb{R}^n aperto, sia f \colon A \to \mathbb{R} e sia \bar{x} \in A. Se f è derivabile parzialmente rispetto a x_i in A, si definisce derivata parziale seconda di f rispetto a x_i e x_j in \bar{x} la derivata parziale della funzione f_{x_i} \colon A \to \mathbb{R} rispetto a x_j in \bar{x}, ovvero

(7) \begin{equation*} f_{x_i x_j}(\bar{x}) \coloneqq (f_{x_i})_{x_j}(\bar{x}) = \lim_{h \to 0} \frac{f_{x_i}(\bar{x} + h e_j) - f_{x_i}(\bar{x})}{h}. \end{equation*}

Le derivate seconde parziali f_{x_i x_i} di f si dicono pure, mentre le derivate seconde parziali f_{x_i x_j} di f, con i \neq j, si dicono miste.

\[\quad\]

Un’altra notazione molto utilizzata per le derivate seconde di f rispettivamente pure e miste è

(8) \begin{equation*} \frac{\partial^2 f}{\partial x_i^2}(\bar{x}), \qquad \frac{\partial^2 f}{\partial x_i \partial x_j}(\bar{x}). \end{equation*}

In maniera analoga si definiscono le derivate di f di ordine 3 o superiore.

Definizione 1.4 (matrice hessiana). Sia A \subseteq \mathbb{R}^n aperto, sia f \colon A \to \mathbb{R} e sia \bar{x}\in A. Se le derivate seconde f_{x_i x_j}(\bar{x}) esistono e sono finite per ogni i,j \in \{1, \dots,n\}, la matrice n \times n

(9) \begin{equation*} \nabla^2 f(\bar{x}) \coloneqq \begin{pmatrix}     f_{x_1 x_1}(\overline{x})	&	f_{x_1 x_2}(\overline{x})		&	\cdots 					& 	f_{x_1 x_n}(\overline{x})\\[6pt]     f_{x_2 x_1}(\overline{x})	&	f_{x_2 x_2}(\overline{x})		&	\cdots 					& 	f_{x_2 x_n}(\overline{x})\\[6pt]     \vdots						&	\vdots							&	\ddots					&	\vdots \\[6pt]     f_{x_n x_1}(\overline{x})	&	f_{x_n x_2}(\overline{x})		&	\cdots 					& 	f_{x_n x_n}(\overline{x})     \end{pmatrix} \end{equation*}

delle derivate seconde di f in \bar{x} si dice matrice hessiana di f in \bar{x}

\[\quad\]

La matrice hessiana di f in \bar{x} viene anche indicata con i simboli

(10) \begin{equation*} D^2 f(\bar{x}), \qquad \operatorname{Hess} f(\bar{x}). \end{equation*}

Nel caso di una funzione f \colon \mathbb{R}^2 \to \mathbb{R}, la matrice hessiana di f è una matrice 2 \times 2 della forma

(11) \begin{equation*} \nabla^2 f(x_0,y_0) = \begin{pmatrix} f_{xx}(x_0,y_0) 	&	f_{xy}(x_0,y_0) \\[6pt] f_{yx}(x_0,y_0) 	&	f_{yy}(x_0,y_0) \end{pmatrix}. \end{equation*}

Definizione 1.5 (funzione di classe \mathcal{C}^k). Sia A \subseteq \mathbb{R}^n aperto e sia f \colon A \to \mathbb{R}.

\[\quad\]

  1. f si dice di classe \mathcal{C}^1(A) se tutte le derivate parziali di f esistono in ogni punto di A e sono funzioni continue.
  2.  

  3. f si dice di classe \mathcal{C}^k(A) se le derivate parziali di ordine k-1 di f sono a loro volta derivabili in ogni punto di A e le loro derivate sono funzioni continue.
  4.  

  5. f si dice di classe \mathcal{C}^\infty(A) se f è di classe \mathcal{C}^k(A) per ogni k \in \mathbb{N}.

\[\quad\]

Il seguente teorema afferma che, sotto opportune ipotesi di regolarità, la matrice Hessiana è sempre simmetrica. Per una dimostrazione, il lettore può consultare [2, teorema 3.11] oppure [3, sezione 28]

Teorema 1.6 (Schwartz). Sia A \subseteq \mathbb{R}^n aperto, sia f \colon A \to \mathbb{R} una funzione di classe \mathcal{C}^2(A) e sia \bar{x} \in A. Allora per ogni i,j=1,\dots,n si ha

(12) \begin{equation*} f_{x_i x_j}(\bar{x}) = f_{x_j x_i} (\bar{x}). \end{equation*}

\[\quad\]

In altre parole, se f è di classe \mathcal{C}^2, allora la matrice Hessiana \nabla^2 f è simmetrica.

Come nel caso delle funzioni di una variabile reale, le derivate permettono di studiare gli estremi locali e assoluti. Ricordiamo quindi la definizione di tali nozioni.

Definizione 1.7 (punti di estremo locale e assoluto). Sia A \subseteq \mathbb{R}^n, sia f \colon A \to \mathbb{R} una funzione e sia \bar{x} \in A.

\[\quad\]

  • \bar{x} si dice punto di massimo assoluto se

    (13) \begin{equation*} f(\bar{x}) \geq f(x) \qquad \forall x \in A. \end{equation*}

    In tal caso, il valore f(\bar{x}) viene detto massimo di f in A e viene indicato col simbolo \max_A f.

  •  

  • \bar{x} si dice punto di minimo assoluto se

    (14) \begin{equation*} f(\bar{x}) \leq f(x) \qquad \forall x \in A. \end{equation*}

    In tal caso, il valore f(\bar{x}) viene detto minimo di f in A e viene indicato col simbolo \min_A f.

  •  

  • \bar{x} si dice punto di massimo locale o relativo se esiste un intorno U di \bar{x} tale che

    (15) \begin{equation*} f(\bar{x}) \geq f(x) \qquad \forall x \in U. \end{equation*}

  •  

  • \bar{x} si dice punto di minimo locale o relativo se esiste un intorno U di \bar{x} tale che

    (16) \begin{equation*} f(\bar{x}) \leq f(x) \qquad \forall x \in U. \end{equation*}

\[\quad\]

Risulta utile il seguente teorema di Weierstrass, che fornisce l’esistenza di massimi e minimi assoluti per funzioni continue su sottoinsiemi compatti1 di \mathbb{R}^n. Rimandiamo a [2, teorema 1.20] e [3, sezione 22] per la dimostrazione.

Teorema 1.8 (Weierstrass). Sia C \subseteq \mathbb{R}^n un insieme compatto e sia f \colon C \to \mathbb{R} una funzione continua. Allora esistono \bar{x}_m, \bar{x}_M \in C punti rispettivamente di minimo e massimo assoluto per f.

\[\quad\]

Anche per funzioni di più variabili vale l’analogo del teorema di Fermat valido per funzioni di una variabile [4, teorema 1]: un punto di estremo locale in cui la funzione è derivabile è anche un punto stazionario, ovvero in cui tutte le derivate della funzione si annullano. Il lettore può consultare [2, teorema 3.12] oppure [3, sezione 37] per la dimostrazione.

Teorema 1.9 (Fermat). Sia A \subseteq \mathbb{R}^n aperto, sia f \colon A \to \mathbb{R} una funzione e sia \bar{x} \in A. Se \bar{x} è un punto di estremo locale e f è derivabile in \bar{x}, allora \nabla f(\bar{x}) = \bar{0}, ovvero \bar{x} è un punto stazionario di f.

\[\quad\]

Tale teorema afferma dunque che, per una funzione ovunque derivabile, i punti di estremo locale e assoluto vanno cercati tra i suoi punti stazionari. Esso suggerisce pertanto un metodo per determinare i punti di estremo locale di una funzione f \colon A \to \mathbb{R} con A \subseteq \mathbb{R}^n aperto:

\[\quad\]

  1. Si verifica che la funzione è ovunque derivabile;
  2.  

  3. Si determinano i punti stazionari di f, cioè si risolve il sistema

    (17) \begin{equation*} \nabla f(x_1,\dots,x_n) = (0,\dots,0). \end{equation*}

  4.  

  5. Si cerca di stabilire se i punti stazionari trovati siano o meno punti di estremo locale per f.

L’ultimo punto del metodo sopra esposto è essenziale, in quanto la condizione di essere stazionario è necessaria ma non sufficiente affinché il punto sia di estremo locale. Il prossimo criterio permette, in alcuni casi, di determinare la natura del punto stazionario. In altri casi, esso fornisce soltanto delle informazioni parziali, e la classificazione va quindi affrontata con argomenti di tipo diverso, come vedremo nel corso degli esercizi. Per una dimostrazione del teorema, si consulti [2, proposizione 3.13] oppure [3, sezione 37].

Teorema 1.10 (classificazione dei punti stazionari). Sia A \subseteq \mathbb{R}^n aperto, sia f \colon A \to \mathbb{R} una funzione di classe \mathcal{C}^2(A) e sia \bar{x} \in A un punto stazionario di f. Allora valgono le seguenti implicazioni:

\[\quad\]

  1. se \nabla^2 f(\bar{x}) è definita positiva, allora \bar{x} è un punto di minimo locale per f;
  2.  

  3. se \nabla^2 f(\bar{x}) è definita negativa, allora \bar{x} è un punto di massimo locale per f;
  4.  

  5. se \nabla^2 f(\bar{x}) è indefinita, allora \bar{x} è un punto di sella per f;

Nel caso in cui la matrice hessiana \nabla^2 f(\bar{x}) sia semidefinita, ossia possieda degli autovalori nulli, il criterio di sopra non permette di classificare univocamente \bar{x}, ma solo di escludere alcuni casi. Infatti:

\[\quad\]

  1. se \nabla^2 f(\bar{x}) è semidefinita positiva e non nulla, allora \bar{x} è un punto di minimo locale o un punto di sella per f;
  2.  

  3. se \nabla^2 f(\bar{x}) è semidefinita negativa e non nulla, allora \bar{x} è un punto di massimo locale o un punto di sella per f.

\[\quad\]

Ricordiamo al lettore che una matrice simmetrica reale M \in \mathbb{R}^{n \times n} (quale è la matrice hessiana di una funzione di classe \mathcal{C}^2, come stabilito dal teorema 1.6) è sempre diagonalizzabile per il teorema spettrale [1, teorema 15.8]. Dunque vale la seguente definizione/caratterizzazione.

\[\quad\]

  • M si dice definita positiva se v^T M v >0 per ogni v \in \mathbb{R}^n \setminus \{\mathbf{0}\}. Ciò avviene se e solo se gli autovalori di M sono tutti positivi.
  •  

  • M si dice definita negativa se v^T M v <0 per ogni v \in \mathbb{R}^n \setminus \{\mathbf{0}\}. Ciò avviene se e solo se gli autovalori di M sono tutti negativi.
  •  

  • M si dice indefinita se v^T M v non assume sempre lo stesso segno al variare di v \in \mathbb{R}^n \setminus \{\mathbf{0}\}. Ciò avviene se e solo se M possiede autovalori di segno discorde.
  •  

  • M si dice semidefinita positiva se v^T M v \geq 0 per ogni v \in \mathbb{R}^n. Ciò avviene se e solo se gli autovalori di M sono tutti non-negativi.
  •  

  • M si dice semidefinita negativa se v^T M v \leq 0 per ogni v \in \mathbb{R}^n. Ciò avviene se e solo se gli autovalori di M sono tutti non-positivi.

Pertanto, per utilizzare il criterio fornito dal teorema 1.10, occorre determinare i segni degli autovalori di \nabla^2 f calcolata nei punti stazionari. A tal fine, risultano utili i seguenti criteri. Il primo è detto criterio di Cartesio e si basa sul determinare i segni delle radici del polinomio caratteristico p(\lambda) di M considerando le variazioni di segno dei coefficienti di p(\lambda).

Teorema 1.11 (criterio di Cartesio, [1, teorema 16.4]). Sia M \in \mathbb{R}^{n \times n} una matrice simmetrica e sia p(\lambda)=a_n \lambda^n + \dots + a_d \lambda^d il suo polinomio caratteristico, dove d \in \{0,\dots,n\} e a_d \neq 0. Allora:

\[\quad\]

  1. la molteplicità dell’autovalore nullo per M è pari a d, ossia alla molteplicità algebrica di 0 come radice di p(\lambda);
  2.  

  3. il numero di autovalori positivi di M, contati con la relativa molteplicità, è pari al numero delle variazioni di segno nella successione

    (18) \begin{equation*} a_n, a_{n-1}, \dots, a_d \end{equation*}

    dei coefficienti non nulli di p.

\[\quad\]

Il secondo criterio per studiare i segni degli autovalori di una matrice quadrata M \in \mathbb{R}^{n \times n} considera i determinanti delle sottomatrici ottenute dalle prime k righe e k colonne di M, ed è detto criterio di Sylvester.

Teorema 1.12 (criterio di Sylvester, [7]). Sia M \in \mathbb{R}^{n \times n} una matrice simmetrica reale e sia, per ogni k \in \{1,\dots,n\}, M_k \in \mathbb{R}^{k \times k} la matrice ottenuta dalle prime k righe e k colonne di M. Allora le seguenti condizioni sono equivalenti:

\[\quad\]

  1. M è definita positiva;
  2.  

  3. \det M_k >0 per ogni k \in \{1,\dots,n\}.

Analogamente, M è definita negativa se e solo se \det M_k < 0 per gli indici k \in \{1,\dots,n\} dispari, mentre \det M_k > 0 per gli indici k \in \{1,\dots,n\} pari.

\[\quad\]

Nel caso in cui M sia una matrice simmetrica 2\times 2, si può studiare la segnatura2 di M nel seguente modo, che utilizzeremo nel corso della dispensa.

Proposizione 1.13 (autovalori di una matrice 2 \times 2). Sia M \in \mathbb{R}^{2 \times 2} una matrice simmetrica reale e siano \det M e \operatorname{Tr} M rispettivamente il determinante di M e la traccia di M. Valgono le seguenti equivalenze.

\[\quad\]

  1. M è definita positiva se e solo se \det M>0 e \operatorname{Tr}M >0.
  2.  

  3. M è definita negativa se e solo se \det M>0 e \operatorname{Tr}M <0.
  4.  

  5. M è indefinita se e solo se \det M<0.
  6.  

  7. M è semidefinita positiva se e solo se \det M \geq 0 e \operatorname{Tr}M \geq 0.
  8.  

  9. M è semidefinita negativa se e solo se \det M \geq 0 e \operatorname{Tr}M \leq 0.

\[\quad\]

Dimostrazione. Sia

(19) \begin{equation*} M = \begin{pmatrix} a_{11} 	& a_{12} \\ a_{12} 	& a_{22} \end{pmatrix} \in \mathbb{R}^{2 \times 2} \end{equation*}

una matrice simmetrica reale. Osserviamo che

(20) \begin{equation*} p(\lambda) = \det(M- \lambda I) = \det \begin{pmatrix} a_{11} - \lambda 	& a_{12} \\ a_{12} 	& a_{22} - \lambda \end{pmatrix} = \lambda^2 - (\operatorname{Tr} M) \lambda + \det M. \end{equation*}

D’altra parte, poiché M è diagonalizzabile per il teorema spettrale [1, teorema 15.8], sappiamo che p(\lambda) = \det (M - \lambda I) è decomponibile nel prodotto di polinomi di grado 1

(21) \begin{equation*} p(\lambda) = (\lambda - \lambda_1)(\lambda - \lambda_2) = \lambda^2 - (\lambda_1 + \lambda_2) \lambda + \lambda_1 \lambda_2 \end{equation*}

con \lambda_1, \lambda_2 autovalori di M. Confrontando (20) e (21) otteniamo che

(22) \begin{equation*} \lambda_1 + \lambda_2 = \operatorname{Tr}M, \qquad \lambda_1 \lambda_2 = \det M. \end{equation*}

Da queste equazioni si ottiene facilmente la conclusione:

\[\quad\]

  • M è definita positiva se e solo se \lambda_1 e \lambda_2 hanno entrambi segno positivo, ossia se e solo se si ha \det M = \lambda_1 \lambda_2 > 0 e \operatorname{Tr}M = \lambda_1 + \lambda_2 >0;
  •  

  • M è definita negativa se e solo se \lambda_1 e \lambda_2 hanno entrambi segno negativo, ossia se e solo se si ha \det M = \lambda_1 \lambda_2 > 0 e \operatorname{Tr}M = \lambda_1 + \lambda_2 <0;
  •  

  • M è indefinita se e solo se \lambda_1 e \lambda_2 hanno segno discorde e sono non nulli, ossia se e solo se \det M = \lambda_1 \lambda_2 < 0;
  •  

  • M è semidefinita positiva se e solo se \lambda_1 e \lambda_2 sono entrambi non-negativi, ossia se e solo se si ha \det M = \lambda_1 \lambda_2 \geq 0 e \operatorname{Tr}M = \lambda_1 + \lambda_2 \geq 0;
  •  

  • M è semidefinita negativa se e solo se \lambda_1 e \lambda_2 sono entrambi non-positivi, ossia se e solo se si ha \det M = \lambda_1 \lambda_2 \geq 0 e \operatorname{Tr}M = \lambda_1 + \lambda_2 \leq 0.

Osservazione 1.14. In generale, se M \in \mathbb{R}^{n \times n} è una matrice simmetrica e il suo polinomio caratteristico è p(\lambda) = \lambda^n + b_{n-1} \lambda^{n-1} + \dots + b_0, allora con le stesse considerazioni si ottiene che

(23) \begin{equation*} b_{n-1} = (-1)^{n-1} \operatorname{Tr} M, \qquad b_0 = (-1)^n \det M. \end{equation*}

Dato che il coefficiente b_{n-1} di un polinomio di grado n è pari alla somma delle radici moltiplicata per (-1)^{n-1}, mentre b_0 è pari al prodotto delle radici per (-1)^n, si ha

(24) \begin{equation*} \operatorname{Tr} M = \lambda_1 + \dots + \lambda_n, \qquad \det M = \lambda_1 \cdots \lambda_n, \end{equation*}

dove \lambda_1, \dots, \lambda_n sono gli autovalori di M ripetuti in base alla loro molteplicità.    


  1. Per il teorema di Heine-Borel [3, sezione 22] essi sono tutti e soli i sottoinsiemi chiusi e limitati di \mathbb{R}^n.
  2.  

    1. ossia i segni degli autovalori di M.

 
 

Testi degli esercizi

Esercizio 1  (\bigstar\bigstar\bigstar\largewhitestar\largewhitestar). Determinare estremi assoluti e locali della funzione f \colon \mathbb{R}^2 \to \mathbb{R} definita da

(25) \begin{equation*} f(x,y) = (x^2-y-1)(1-x^2-y^2) \qquad \forall (x,y) \in \mathbb{R}^2. \end{equation*}

Svolgimento.

Osserviamo che la funzione è pari rispetto alla variabile x, quindi è sufficiente considerarne il comportamento nel semipiano

(26) \begin{equation*} H \coloneqq \{(x,y) \in \mathbb{R}^2 \colon x \geq 0\} \end{equation*}

e poi estendere per simmetria i risultati ottenuti.

Notiamo subito che

(27) \begin{equation*} \sup_{\mathbb{R}^2} f = + \infty, \qquad \inf_{\mathbb{R}^2} f = - \infty. \end{equation*}

Infatti, restringendo f alla retta di equazione x=0, si ha

(28) \begin{equation*} \lim_{y \to - \infty} f(0,y) = \lim_{y \to - \infty} (-y-1)(1-y^2) = - \infty, \qquad \lim_{y \to + \infty} f(0,y) = \lim_{y \to + \infty} (-y-1)(1-y^2) = + \infty. \end{equation*}

Per determinare gli estremi locali di f, osserviamo che essa è di classe \mathcal{C}^{\infty}(\mathbb{R}^2) poiché somma e prodotto di polinomi. Dunque, per il teorema 1.9, gli estremi locali di f vanno ricercati tra i suoi punti stazionari. Il seguito dell’esercizio è quindi dedicato a determinare e studiare tali punti stazionari.

Svolgendo i prodotti si ha

(29) \begin{equation*} \begin{split} f(x,y) = & x^2 - x^4 - x^2y^2 - y + x^2y + y^3 - 1 + x^2 + y^2 \\ = & 2x^2 -  x^4 - x^2y^2 - y + x^2y + y^3 - 1 + y^2 \qquad \forall (x,y) \in \mathbb{R}^2. \end{split} \end{equation*}

Calcoliamo ora le derivate parziali di f:

(30) \begin{equation*} \begin{gathered} \frac{\partial f}{\partial x}(x,y) = 4x - 4x^3 -2xy^2 + 2xy = 2x(2 - 2x^2 -y^2 +y) \qquad \forall (x,y) \in \mathbb{R}^2, \\ \frac{\partial f}{\partial y}(x,y) = -2x^2y - 1 +x^2 +3y^2 +2y \qquad \forall (x,y) \in \mathbb{R}^2, \end{gathered} \end{equation*}

Da ciò segue che

(31) \begin{equation*} \begin{split} \nabla f(x,y) = (0,0) \iff & \begin{cases} 2x(2 - 2x^2 -y^2 +y) = 0\\ -2x^2y - 1 +x^2 +3y^2 +2y = 0 \end{cases} \\ \iff & \begin{cases} x = 0\\ 3y^2 +2y -1= 0 \end{cases} \vee \begin{cases} 2x^2 = 2  -y^2 +y\\ -4x^2y +2x^2 +6y^2 +4y -2 = 0 \end{cases} \\ \iff & \begin{cases} x = 0\\ (3y-1)(y+1) =0 \end{cases} \vee \begin{cases} 2x^2 = 2  -y^2 +y\\ 2x^2(1-2y) +6y^2 +4y -2 = 0 \end{cases} \end{split} \end{equation*}

\[\quad\]

  1. Le soluzioni del primo sistema sono

    (32) \begin{equation*} (x,y) \in  \left \{ \left ( 0, \frac{1}{3} \right ), \left (0,-1\right ) \right \}. \end{equation*}

  2.  

  3. Per il secondo sistema, sostituendo la prima equazione nella seconda si ottengono i sistemi equivalenti

    (33) \begin{equation*} \begin{split} \begin{cases} 2x^2 = 2  -y^2 +y\\ (2  -y^2 +y)(1-2y) +6y^2 +4y -2 = 0 \end{cases} \iff & \begin{cases} 2x^2 = 2  -y^2 +y\\ 2y^3 +3y^2 + y = 0 \end{cases} \\ \iff & \begin{cases} 2x^2 = 2  -y^2 +y = 0\\[5pt] y \left ( y+\frac{1}{2} \right ) (y+1) = 0. \end{cases} \end{split} \end{equation*}

    Poiché le soluzioni della seconda equazione sono y=0, y=-\dfrac{1}{2}, y=-1, sostituendo nella prima equazione si ottengono tutte le soluzioni del sistema in H:

    (34) \begin{equation*} (x,y) \in  \left \{ (1,0), \left ( \sqrt{\frac{5}{8}} ,-\frac{1}{2}\right ), (0,-1) \right \} \end{equation*}

Unendo le soluzioni dei due sistemi, si ottiene l’insieme dei punti stazionari di f in H:

(35) \begin{equation*} \left\{ \left ( 0, \frac{1}{3} \right ), (0,-1), (1,0), \left ( \sqrt{\frac{5}{8}} ,-\frac{1}{2}\right) \right\}. \end{equation*}

Per determinarne la natura, proviamo a utilizzare il teorema 1.10 e calcoliamo le derivate seconde di f.

(36) \begin{equation*} \begin{gathered} f_{xx}(x,y) = 4 - 12x^2 -2y^2 +2y \qquad \forall (x,y) \in \mathbb{R}^2, \\ f_{xy}(x,y) = f_{yx}(x,y) = -4xy +2x \qquad \forall (x,y) \in \mathbb{R}^2, \\ f_{yy}(x,y) = -2x^2 + 6y +2 \qquad \forall (x,y) \in \mathbb{R}^2. \end{gathered} \end{equation*}

Ricordando la parità di f rispetto a x, studiamo ognuno dei suoi punti stazionari.

\bullet \left (0,\dfrac{1}{3}\right ). La matrice hessiana di f in \left (0,\frac{1}{3}\right ) è pari a

(37) \begin{equation*} \nabla^2 f\left (0,\frac{1}{3}\right ) = \begin{pmatrix} 4 - \dfrac{2}{9} + \dfrac{2}{3}		&	0 \\[9pt] 0									&	4 \end{pmatrix}, \end{equation*}

che è definita positiva in quanto è diagonale e i suoi autovalori sono gli elementi sulla diagonale principale, che sono entrambi positivi. Da ciò e dal teorema 1.10 segue che \left (0,\dfrac{1}{3}\right ) è un punto di minimo locale.

\bullet \left (0,-1\right ). Vale

(38) \begin{equation*} \nabla^2 f\left (0,-1\right ) = \begin{pmatrix} 0			&	0 \\[5pt] 0			&	-4 \end{pmatrix}, \end{equation*}

che risulta semidefinita negativa poiché è diagonale e possiede un autovalore nullo e uno negativo. Dunque per il teorema 1.10 (0,-1) è un punto di massimo locale o di sella per f. Per stabilirlo, studiamo il segno di f. Dall’espressione di f e dalla figura 1 si vede che f(0,-1)=0 e che in ogni intorno di (0,-1) f assume segni sia positivi che negativi, infatti:

\[\quad\]

  • f(0,y)<0 per y<-1;
  •  

  • f(x,y)>0 per -\sqrt{1-x^2} <y<x^2-1 e 0<x<1.

Quindi (0,-1) è di sella per f.

\[\quad\]

\[\quad\]

Figura 1: segni assunti dalla funzione f. In rosso le aree in cui f assume segno positivo, in blu le aree dove f assume segno negativo. Poiché nell’intorno di ognuno dei punti (\pm 1,0) e (0,-1) f assume segni opposti, essi sono di sella per f.

\[\quad\]

\[\quad\]

\bullet (1,0)

(39) \begin{equation*} \nabla^2 f(1,0) = \begin{pmatrix} -8			&	2 \\[5pt] 2			&	0 \end{pmatrix} \quad \Longrightarrow \quad \det \nabla^2 f(1,0) = -4, \end{equation*}

quindi \nabla^2 f(1,0) è indefinita per la proposizione 1.13, poiché possiede autovalori non nulli di segno opposto. Da ciò e dal teorema 1.10 segue che (1,0) è un punto di sella per f. Questo poteva essere dedotto anche dallo studio del segno di f mostrato in figura 1. Per la parità di f rispetto alla variabile x, anche (-1,0) è un punto di sella per f.

\bullet \left (\sqrt{\dfrac{5}{8}} ,-\dfrac{1}{2}\right). Abbiamo

(40) \begin{equation*} \nabla^2 f\left (\sqrt{\frac{5}{8}} ,-\frac{1}{2}\right) = \begin{pmatrix} -5					&	\sqrt{10} \\[5pt] \sqrt{10}			&	-\dfrac{9}{4} \end{pmatrix} \quad \Longrightarrow \quad \det \nabla^2 f\left (\sqrt{\frac{5}{8}} ,-\frac{1}{2}\right) = \frac{45}{4} - 10 = \frac{5}{4} >0, \end{equation*}

da cui segue che gli autovalori di \nabla^2 f\left (\sqrt{\dfrac{5}{8}} ,-\dfrac{1}{2}\right) hanno lo stesso segno, quindi f è definita positiva oppure negativa. Poiché \operatorname{Tr} \nabla^2 f\left (\sqrt{\dfrac{5}{8}} ,-\dfrac{1}{2}\right) < 0, la proposizione 1.13 implica che gli autovalori di \nabla^2 f\left (\sqrt{\dfrac{5}{8}} ,-\dfrac{1}{2}\right) sono entrambi negativi, e quindi essa è definita negativa. Pertanto \left (\pm \sqrt{\dfrac{5}{8}} ,-\dfrac{1}{2}\right) è, per il teorema 1.10, un punto di massimo locale per f. Di nuovo per la parità di f rispetto a x, anche \left (-\sqrt{\dfrac{5}{8}} ,-\dfrac{1}{2}\right) è di massimo locale.


 

Esercizio 2  (\bigstar\bigstar\bigstar\largewhitestar\largewhitestar). Determinare estremi assoluti e locali della funzione f \colon \mathbb{R}^2 \to \mathbb{R} definita da

(41) \begin{equation*} f(x,y) = x^4 - xy^2 + y^2 \qquad \forall (x,y) \in \mathbb{R}^2. \end{equation*}

Svolgimento.

Osserviamo che f è pari rispetto alla variabile y, quindi è sufficiente studiare il problema nel semipiano

(42) \begin{equation*} H \coloneqq \{(x,y) \in \mathbb{R}^2\colon y \geq 0\} \end{equation*}

Affermiamo subito che vale

(43) \begin{equation*} \sup_{\mathbb{R}^2} f = + \infty, \qquad \inf_{\mathbb{R}^2} f = - \infty. \end{equation*}

Infatti, restringendo f alla di equazione y=0, si ottiene

(44) \begin{equation*} \lim_{x \to \pm \infty} f(x,0) = \lim_{x \to \pm \infty} x^4 = + \infty, \end{equation*}

mentre restringendo f alla parabola di equazione y=x^2 si ha

(45) \begin{equation*} \lim_{x \to + \infty} f(x,x^2) = \lim_{x \to + \infty} \left( x^4 - x^5 + x^4 \right ) = -\infty. \end{equation*}

Poiché f è di classe \mathcal{C}^{\infty}(\mathbb{R}^2), dal teorema 1.9 segue che i punti di estremo locale per f vanno ricercati tra i suoi punti stazionari. Calcoliamo quindi le derivate parziali di f e determiniamo i punti in cui esse si annullano. Vale

(46) \begin{gather*} f_x(x,y) = 4x^3-y^2 \qquad \forall (x,y) \in \mathbb{R}^2, \\ f_y(x,y) = -2xy + 2y \qquad \forall (x,y) \in \mathbb{R}^2. \end{gather*}

Da ciò segue che

(47) \begin{equation*} \begin{split} \nabla f(x,y) = (0,0) \iff & \begin{cases} 4x^3-y^2 = 0\\ -2xy + 2y = 0 \end{cases} \\ \iff & \begin{cases} 4x^3-y^2 = 0\\ 2y(1-x) = 0 \end{cases} \\ \iff & \begin{cases} 4x^3 = y^2\\ y = 0 \end{cases} \vee \begin{cases} 4x^3 = y^2\\ x = 1. \end{cases} \end{split} \end{equation*}

Pertanto i punti stazionari di f in H sono

(48) \begin{equation*} (0,0), \quad (1,2). \end{equation*}

Per determinarne la natura, proviamo a utilizzare il teorema 1.10 e calcoliamo le derivate seconde di f:

(49) \begin{gather*} f_{xx}(x,y) = 12x^2 \qquad \forall (x,y) \in \mathbb{R}^2, \\ f_{xy}(x,y) = f_{yx}(x,y) = -2y \qquad \forall (x,y) \in \mathbb{R}^2, \\ f_{yy}(x,y) = 2-2x \qquad \forall (x,y) \in \mathbb{R}^2, \end{gather*}

\bullet (0,0). La matrice hessiana di f in (0,0) è pari a

(50) \begin{equation*} \nabla^2 f(0,0) = \begin{pmatrix} 0	&	0 \\ 0	&	2 \end{pmatrix}, \end{equation*}

che è semidefinita positiva in quanto è diagonale e possiede un autovalore nullo e uno positivo. Dunque dal teorema 1.10 segue che esso è di minimo locale o di sella per f. Mostriamo alcuni metodi per stabilire quindi in quale dei due casi (0,0) ricada.

  • ✦ Si ha

    (51) \begin{equation*} f(x,y) = x^4 + y^2 (1-x) \geq 0 \qquad \forall (x,y) \colon x\leq 1, \end{equation*}

    e quindi, poiché f(0,0)=0, tale punto è di minimo relativo per f.

  •  

  • ✦ Alternativamente, si può ottenere lo stesso risultato studiando il segno delle derivate parziali prime di f in un intorno di (0,0). Si fissi (x_0,y_0) con x_0 < 1 e y_0 \geq 0; supponiamo che x_0 \geq 0, in quanto l’altro caso è analogo. Si ha

    (52) \begin{equation*} f_x(x,0) = 4x^3 > 0 \qquad \forall x> 0, \end{equation*}

quindi la restrizione di f alla retta y=0 è strettamente crescente nel verso delle x positive, situazione rappresentata nella figura 2, in cui la monotonia di f è rappresentata dalle frecce, che puntano nella direzione in cui essa è crescente.

\[\quad\]

\[\quad\]

Figura 2: monotonia di f se ristretta alle rette di equazione y=0 e x=x_0. Le frecce indicano la direzione in cui f è crescente ottenuta studiando rispettivamente i segni di f_x e f_y. Da ciò segue che (0,0) è un punto di minimo relativo per f.

\[\quad\]

\[\quad\]

Da ciò segue che f(x_0,0) \geq f(0,0).

Inoltre si ha

(53) \begin{equation*} f_y(x_0,y) = 2y(1-x_0) > 0 \qquad \forall y > 0, \end{equation*}

in quanto x_0<1, da cui segue che la restrizione di f alla retta di equazione x=x_0 è strettamente crescente nel verso delle y positive, di nuovo rappresentato con le frecce in figura 2. Quindi abbiamo

(54) \begin{equation*} f(x_0,y_0) > f(x_0,0) > f(0,0). \end{equation*}

Poiché y_0>0 e 0 \leq x_0<1 sono arbitrari, ciò mostra che (0,0) è un punto di minimo relativo per f.

\bullet (1,2). La matrice hessiana di f in (1,2) è pari a

(55) \begin{equation*} \nabla^2 f(1,2) = \begin{pmatrix} 12		&	- 4 \\ - 4	&	0 \end{pmatrix} \quad \Longrightarrow \quad \det \nabla^2 f(1,2) = -16<0, \end{equation*}

quindi essa è indefinita per la proposizione 1.13 e pertanto il punto (1, 2) risulta di sella per f per il teorema 1.10. Per la parità di f rispetto a y, anche il punto (1,-2) è di sella per f.


 

Esercizio 3  (\bigstar\bigstar\bigstar\bigstar\largewhitestar). Determinare estremi assoluti e locali della funzione f \colon \mathbb{R}^2 \to \mathbb{R} definita da

(56) \begin{equation*} f(x,y) = x e^y - y e^x \qquad \forall (x,y) \in \mathbb{R}^2. \end{equation*}

Questa parte è riservata agli abbonati

per continuare a leggere, attiva un abbonamento.

Mensile: 7,99€ / mese • Trimestrale: 19,99€ / 3 mesi • Annuale: 79,99€ / anno

Attiva abbonamento

Già abbonato? Accedi