Funzioni convesse – Teoria

Home » Funzioni convesse – Teoria

Le funzioni convesse sono estremamente importanti nell’Analisi Matematica. Una funzione reale di variabile reale si dice convessa se le direzioni delle rette secanti al grafico sono monotone, e dunque variano “sempre nello stesso senso”. Tale proprietà possiede numerosi risvolti di carattere sia teorico che pratico, utili in numerose applicazioni. Questa dispensa vuole offrire uno studio della convessità e delle sue conseguenze, concentrandosi sui seguenti punti fondamentali:

Come si definisce formalmente la convessità e quali sono le sue interpretazioni geometriche?
Come si caratterizza la convessità e quali sono le sue relazioni con la continuità? mostreremo infatti che le funzioni convesse sono continue all’interno dell’intervallo di definizione;
Come si caratterizza la convessità in relazione alla monotonia delle derivate prime e al segno delle derivate seconde?
Quali tipo di punti di estremo può avere una funzione convessa? Vedremo che, all’interno del suo dominio, essa può avere soltanto punti di minimo;
Cos’è un punto di flesso e quali sono le sue proprietà?
Applicazioni e approfondimenti: metodo di Newton per la determinazione degli zeri di un’equazione e disuguaglianza di Jensen, una generalizzazione della definizione di convessità.

Se desideri approfondire questi argomenti con una lettura dettagliata, semplice e chiara, questa dispensa è quello che cercavi!

Segnaliamo che alla fine della dispensa vi sono numerosi esercizi su questo importante argomento; riportiamo inoltre le seguenti dispense sulla teoria collegata:

Sommario

Leggi...

Questa dispensa è un’introduzione alla teoria di funzioni convesse reali di variabile reale. Partendo dalla definizione, vengono studiate le caratterizzazioni della convessità e il suo legame con continuità e derivabilità. Vengono poi trattati gli estremi di una funzione convessa, il concetto di punto di flesso, il metodo di Newton per funzioni convesse e la disuguaglianza di Jensen. Sono infine riportati alcuni esercizi svolti di carattere teorico e pratico.

Autori e revisori

Leggi...

Autori: Francesco Conti, Luigi De Masi

Revisori: Valerio Brunetti, Daniele Bjørn Malesani, Davide Ranieri, Sara Sottile, Matteo Talluri.

Prerequisiti

Leggi...

Questa dispensa necessita della conoscenza della logica elementare (implicazione, equivalenza), della definizione intuitiva di insieme, le operazioni tra insiemi (unione, intersezione, prodotto cartesiano), e infine la definizione e le proprietà degli insiemi numerici più comuni. Inoltre, è necessaria la conoscenza delle funzioni elementari più comuni [2], come potenze, radici, esponenziali, logaritmi, seno e coseno, e dei concetti di continuità, derivabilità, massimi e minimi di una funzione [3, 5].

Notazioni

Leggi...

$\emptyset$	insieme vuoto;
$\mathbb{N}$	insieme dei numeri naturali;
$\mathbb{Z}$	insieme dei numeri relativi;
$\mathbb{Q}$	insieme dei numeri razionali;
$\mathbb{R}$	insieme dei numeri reali;
$f'_{-}(x_0)$ , $f'_{+}(x_0)$	rispettivamente derivata sinistra e destra di $f$ in un punto $x_0$ ;
$\left.f\right\|_I$	restrizione di una funzione $f$ all’insieme $I$ ;
$\max f$ , $\min f$	rispettivamente massimo e minimo della funzione $f$ ;
$\sup f$ , $\inf f$	rispettivamente estremo superiore ed estremo inferiore della funzione $f$ ;
$A^{\circ}$	interno di un insieme $A$ .

Prime definizioni e proprietà

Leggi...

In questa sezione enunciamo le prime definizioni e alcuni risultati elementari sulle funzioni convesse (e concave), analizzandone le prime proprietà ed il loro comportamento rispetto alle operazioni elementari tra funzioni.

Definizione 1.1 (funzioni convesse e concave). Sia $I\subseteq \mathbb{R}$ un intervallo e sia $f\colon I \to \mathbb{R}$ una funzione. Si dice che $f$ è

$\quad$

convessa se per ogni $x_1, x_2 \in I$ e ogni $\alpha \in [0,1]$ vale che

(1) $\begin{equation*} f(\alpha x_1 + (1-\alpha) x_2) \leq \alpha f(x_1) + (1-\alpha) f(x_2); \end{equation*}$

concava se per ogni $x_1, x_2 \in I$ e ogni $\alpha \in [0,1]$ vale che

(2) $\begin{equation*} f(\alpha x_1 + (1-\alpha) x_2) \geq \alpha f(x_1) + (1-\alpha) f(x_2). \end{equation*}$

Inoltre, se la diseguaglianza (1) (risp. (2)) è verificata in senso stretto per $\alpha \in (0,1)$ , $f$ si dice strettamente convessa (risp. strettamente concava).

Se $J \subseteq I$ è un intervallo, $f$ si dice convessa (risp. concava) su $J$ se la restrizione $f|_J$ di $f$ a $J$ è convessa (risp. concava).

$\quad$

Da un punto di vista geometrico, la nozione di concavità e di convessità è ispirata dalla posizione reciproca tra il grafico della funzione e il segmento congiungente due punti della funzione stessa.

In particolare, in una funzione convessa il segmento congiungente due punti del grafico è sempre superiore al grafico stesso, mentre in una funzione concava il segmento è sempre inferiore. Infatti, il secondo membro della disuguaglianza (1) (risp. (2)) è l’ordinata del punto del segmento congiungente i punti $(x_1,f(x_1))$ e $(x_2,f(x_2))$ avente ascissa pari a $\alpha x_1 + (1-\alpha)x_2$ , mentre il primo membro rappresenta l’ordinata di un punto del grafico avente ascissa pari a $\alpha x_1 + (1-\alpha)x_2$ . Si veda la figura 1a per una funzione convessa e la figura 2 per una funzione concava.

$\quad$

Figura 1

$\quad$

Ancora, nei casi in cui abbia senso parlare di tangente al grafico (ovvero nei casi di funzioni derivabili) la retta tangente al grafico è sempre inferiore al grafico stesso nel caso di funzioni convesse, mentre è superiore al grafico per funzioni concave. Questa proprietà, che non risulta immediata dalla definizione, verrà dimostrata in seguito (teorema 2.9). Si veda figura 1b.

$\quad$

Figura 2: il grafico di una funzione concava e il segmento congiungente i punti $A$ e $B$ del grafico. Il segmento è al di sotto del grafico mentre la tangente sopra.

$\quad$

Funzioni concave e convesse sono strettamente legate tra di loro. In particolare, vale il seguente risultato.

Proposizione 1.2. Sia $I\subseteq \mathbb{R}$ un intervallo e sia $f\colon I \to \mathbb{R}$ una funzione. Allora, $f$ è convessa se e solo se $-f$ è concava.

$\quad$

Dimostrazione. Siano $x_1, x_2 \in I$ e $\alpha \in [0,1]$ . Allora vale che

(3) $\begin{equation*} \begin{split} f(\alpha x_1 + (1-\alpha) x_2) \leq & \alpha f(x_1) + (1-\alpha) f(x_2) \iff\\[3pt] -f(\alpha x_1 + (1-\alpha) x_2) \geq& -\alpha f(x_1) - (1-\alpha) f(x_2) = \alpha(-f(x_1)) + (1 - \alpha)(-f(x_2)). \end{split} \end{equation*}$

In virtù della proposizione 1.2, d’ora in avanti ci concentreremo soltanto sulle funzioni convesse, in quanto tutti i risultati varranno anche per le funzioni concave, a meno di invertire il segno.

Osservazione 1.3. Nella definizione 1.1 di funzione convessa (risp. concava) non sono richieste né derivabilità né continuità della funzione $f$ .

Esempio 1.4. In figura 3 è mostrato il grafico delle funzione valore assoluto $f \colon \mathbb{R} \to \mathbb{R}$ definita da $f(x) \coloneqq | x |$ per ogni $x \in \mathbb{R}$ . Questa funzione non è derivabile in $0$ , ma è convessa; infatti, se $x_1$ , $x_2 \in \mathbb{R}$ e $\alpha \in [0,1]$ si ha:

(4) $\begin{equation*} \begin{split} f(\alpha x_1 + (1-\alpha)x_2) =& | \alpha x_1 + (1-\alpha)x_2| \\ \le& | \alpha x_1 |+| (1-\alpha)x_2|\\ = & \alpha |x_1| + (1-\alpha)|x_2| \\ = & \alpha f(x_1)+(1-\alpha)f(x_2), \end{split} \end{equation*}$

dove nella prima disuguaglinza si è applicata la disuguaglianza triangolare.

$\quad$

Figura 3: il grafico del valore assoluto. Tale funzione è convessa ma non è derivabile in $0$ .

$\quad$

Ci si chiede se una funzione possa essere allo stesso tempo sia concava che convessa. La risposta è affermativa: le funzioni affini sono sia concave che convesse e tali funzioni sono le uniche a possedere questa proprietà, come mostra il seguente risultato.

Proposizione 1.5. Sia $f \colon \mathbb{R} \to \mathbb{R}$ una funzione concava e convessa. Allora $f$ è affine.

$\quad$

Dimostrazione. Dalle definizioni di funzione concava (1) e convessa (2), per ogni $x_1, x_2 \in I$ e per ogni $\alpha \in [0,1]$ si ha che

$\begin{cases} f(\alpha x_1 + (1 - \alpha) x_2) \leq \alpha f(x_1) + (1 - \alpha) f(x_2),\\ f(\alpha x_1 + (1 - \alpha) x_2) \geq \alpha f(x_1) + (1 - \alpha) f(x_2), \end{cases}$

da cui segue che

(5) $\begin{equation*} f(\alpha x_1 + (1-\alpha) x_2) = \alpha f(x_1) + (1-\alpha) f(x_2). \end{equation*}$

Facciamo vedere che questa condizione è equivalente alla definizione di funzione affine, i.e. esistono $m,q \in \mathbb{R}$ tali che $f(x)=mx + q$ per ogni $x \in \mathbb{R}$ .

Sia $f$ una funzione tale che $f(x) = mx + q$ per ogni $x\in \mathbb{R}$ , con $m,q \in \mathbb{R}$ , e siano $x_1, x_2 \in \mathbb{R}$ e $\alpha \in [0, 1]$ . Allora

(6) $\begin{equation*} \begin{split} f\left(\alpha x_1 + (1-\alpha)x_2\right) & = m(\alpha x_1 + (1 - \alpha) x_2) + q \\ & = \alpha m x_1 + (1 - \alpha) m x_2 + \alpha q + (1 - \alpha) q \\ & = \alpha (m x_1 + q) + (1 - \alpha) (mx_2 + q) \\ & = \alpha f(x_1) + (1 - \alpha)f(x_2). \end{split} \end{equation*}$

Viceversa, supponiamo che valga (5) per ogni $x_1,x_2 \in I$ e per ogni $\alpha \in [0,1]$ , e mostriamo che esistono $m,q \in \mathbb{R}$ tali che $f(x) = mx + q$ per ogni $x \in \mathbb{R}$ . Si scelga $[a,b] \subseteq I$ con $a<b$ . È immediato verificare che

(7) $\begin{equation*} x = \frac{b-x}{b-a} a + \frac{x-a}{b-a} b \qquad \forall x \in [a,b]. \end{equation*}$

Si ha $\dfrac{x-a}{b-a} = 1 - \dfrac{b-x}{b-a}$ e dal fatto che $x \in [a,b]$ segue che $\dfrac{b-x}{b-a} \in [0,1]$ . Vale dunque

(8) $\begin{equation*} f(x) = f \left (\frac{b-x}{b-a} a + \frac{x-a}{b-a} b \right ) = \frac{b-x}{b-a} f(a) + \frac{x-a}{b-a} f(b), \end{equation*}$

dove nella seconda uguaglianza abbiamo applicato (5) con $x_1=a$ , $x_2=b$ , $\alpha=\dfrac{b-x}{b-a}$ . Svolgendo i calcoli abbiamo quindi

(9) $\begin{equation*} f(x) = \frac{f(b)-f(a)}{b-a} x + \frac{f(a)b - f(b)a}{b-a} \qquad \forall x \in [a,b], \end{equation*}$

ossia $f$ è affine su $[a,b]$ . Rimane solo da mostrare che (9) è valida per ogni $x_0 \in I$ . Se $x_0 \in I$ , consideriamo $[c,d] \subseteq I$ contenente $x_0$ e $[a,b]$ . Per lo stesso ragionamento di sopra, $f$ è affine su $[c,d]$ e deve coincidere con (9) su $[a,b]$ . Poiché due funzioni affini che coincidono su un intervallo sono uguali, $f$ soddisfa (9) anche in $x_0$ , quindi è affine su $I$ .

Esempio 1.6. In figura 4 è mostrato il grafico di una funzione affine, costituito da una retta, che è una funzione sia concava che convessa.

$\quad$

Figura 4: il grafico del valore assoluto. Tale funzione è convessa ma non è derivabile in $0$ .

$\quad$

L’insieme delle funzioni convesse è chiuso rispetto alla somma, alla moltiplicazione per scalari non negativi e, sotto ipotesi aggiuntive, rispetto alla composizione di funzioni. Più formalmente, vale il seguente risultato.

Proposizione 1.7 (Operazioni tra funzioni convesse). Siano $I,J\subseteq \mathbb{R}$ intervalli e siano $f, g \colon I \to \mathbb{R}$ e $h \colon J \to \mathbb{R}$ funzioni convesse e sia $\lambda \geq 0$ . Allora

$\quad$

$f + g \colon I \to \mathbb{R}$ è una funzione convessa;

$\lambda f \colon I \to \mathbb{R}$ è una funzione convessa;

se $h$ è monotona crescente e $f(I) \subseteq J$ , $h \circ f \colon I \to \mathbb{R}$ è una funzione convessa;

se $f,g$ sono inoltre non negative e con la stessa monotonia, allora $fg \colon I \to \mathbb{R}$ è una funzione convessa.

$\quad$

Dimostrazione.

Presi $x_1, x_2 \in I, \alpha \in [0,1]$ , vale che
(10) $\begin{equation*} \begin{split} (f + g)(\alpha x_1 + (1 - \alpha) x_2 ) & = f(\alpha x_1 + (1 - \alpha) x_2 ) + g(\alpha x_1 + (1 - \alpha) x_2 ) \\ & \leq \alpha f(x_1) + (1 - \alpha) f(x_2) + \alpha g(x_1) + (1 - \alpha) g(x_2) \\ & = \alpha (f(x_1) + g(x_1)) + (1 - \alpha) (f(x_2) + g(x_2)) \\ & = \alpha (f + g)(x_1) + (1 - \alpha) (f + g)(x_2). \end{split} \end{equation*}$

Segue direttamente dalle proprietà delle disequazioni.

Presi $x_1, x_2 \in I, \alpha \in [0,1]$ , vale che
(11) $\begin{equation*} \begin{split} (h \circ f)(\alpha x_1 + (1 - \alpha) x_2) & = h(f(\alpha x_1 + (1 - \alpha) x_2 )) \\ & \leq h(\alpha f(x_1) + (1 - \alpha) f(x_2)) \\ & \leq \alpha h(f(x_1)) + (1 - \alpha) h(f(x_2)) \\ & = \alpha (h \circ f) (x_1) + (1 - \alpha) (h \circ f) (x_2), \end{split} \end{equation*}$

dove la prima disuguaglianza segue dal fatto che $h$ è crescente e $f$ convessa mentre la seconda disuguaglianza segue dalla convessità di $h$ .

Per semplicità di notazione, presi $x_1, x_2 \in I, \alpha \in [0,1]$ , definiamo
$\Delta \coloneqq \alpha(fg)(x_1) + (1-\alpha)(fg)(x_2) - (fg)(\alpha x_1 + (1-\alpha)x_2).$

Dimostrare la tesi è equivalente a dimostrare che $\Delta \geq 0$ . Poiché $f, g$ sono non negative e convesse, si ha che

$(fg)(\alpha x_1 + (1 - \alpha)x_2) \leq \left(\alpha f(x_1) + (1-\alpha)f(x_2)\right)\left(\alpha g(x_1) + (1-\alpha)g(x_2)\right).$

Sostituendo nell’equazione di $\Delta$ otteniamo che

(12) $\begin{equation*} \begin{split} \Delta \geq& \alpha(fg)(x_1) + (1 - \alpha)(fg)(x_2) - \left(\alpha f(x_1) + (1-\alpha)f(x_2)\right)\left(\alpha g(x_1) + (1-\alpha)g(x_2)\right) \\ =& \alpha(fg)(x_1) + (1-\alpha)(fg)(x_2) - \alpha^2(fg)(x_1)+\\ & -(1-\alpha)^2(fg)(x_2) - \alpha(1-\alpha)f(x_1)g(x_2) - \alpha(1-\alpha)f(x_2)g(x_1) \\ =& \alpha(1-\alpha)(fg)(x_1) + (1-\alpha)(1-(1-\alpha))(fg)(x_2) - \alpha(1-\alpha)f(x_1)g(x_2) +\\ & - \alpha(1-\alpha)f(x_2)g(x_1) \\ =& \alpha(1-\alpha)\left(f(x_1) g(x_1) + f(x_2)g(x_2) -f(x_1)g(x_2) - f(x_2)g(x_1)\right) \\ = &\alpha(1-\alpha)\left(f(x_1) - f(x_2)\right)\left(g(x_1) - g(x_2)\right). \end{split} \end{equation*}$

Poiché $\alpha(1-\alpha)\geq 0$ e $f,g$ hanno la stessa monotonia, il segno di $\left(f(x_1) - f(x_2)\right)$ e di $\left(g(x_1) - g(x_2)\right)$ è lo stesso, per cui il prodotto delle due funzioni è positivo e $\Delta \geq 0$ .