Se llama bola abierta de centro x0 y radio r y se escribe al conjunto de puntos tales que su distancia a x0 es menor que r.
A veces se habla también de “entorno de x0” correspondiendo al mismo concepto.
Nota: Las bolas en ℜ son los intervalos.
Sean
Se llama combinación lineal negativa de los puntos a:
Las combinaciones lineales negativas se obtendrán sustituyendo y por valores reales negativos (se pide que no sean nulos los dos a la vez):
Obsérvese que al variar de esta manera obtenemos:
Sean
Se llama combinación lineal positiva de los puntos a:
Las combinaciones lineales positivas se obtendrán sustituyendo y por valores reales positivos (se pide que no sean nulos los dos a la vez):
Obsérvese que al variar de esta manera obtenemos justamente el cono convexo generado por los vectores y
Sea
abierto Fr A
Intuitivamente:
Un conjunto es abierto si y sólo si no contiene ningún punto frontera.
Observemos que , es decir, el conjunto de puntos frontera de sólo contiene dos puntos: y estos puntos NO pertenecen a puesto que se ha considerado el intervalo abierto.
Observemos que , es decir, la frontera es justamente la circunferencia que NO pertenece al conjunto.
Observemos que , es decir, ningún punto es punto frontera y, por tanto, es abierto.
Igualmente, y en general son conjuntos abiertos.
NOTA: Obsérvese que todos los conjuntos que aparecen en el ejemplo 3 son también conjuntos cerrados.
Sea
Se dice que es acotado si dado un punto existe un radio finito tal que queda incluido en una bola centrada en y radio , es decir:
acotado tq
Observemos que en estos últimos cuatro ejemplos no hay manera de incluir el conjunto en una bola por grande que sea el radio.
Sea
cerrado Fr A
Intuitivamente:
Un conjunto es cerrado si y sólo si contiene todos los puntos de su frontera.
=
Observemos que , es decir, el conjunto de puntos frontera de sólo contiene dos puntos: y estos puntos pertenecen a puesto que se ha considerado el intervalo cerrado.
=
Observemos que , es decir, la frontera es la circunferencia que pertenece al conjunto.
=
Observemos que , es decir, ningún punto es punto frontera y debido a que, por convenio, el conjunto vacío está incluido en cualquier conjunto (), se puede considerar como conjunto cerrado.
Igualmente, y en general son conjuntos cerrados.
NOTA: Obsérvese que todos los conjuntos que aparecen el ejemplo 3 son también conjuntos abiertos.
Sea
C ℜn
C convexo ⇔ ∀ x1, x2 + C [0,1]
Intuitivamente:
Decimos que C es un conjunto convexo si cualquier segmento que una dos puntos cualesquiera del conjunto, siempre pertenece , todo él, al conjunto.
Conjuntos convexos:
Conjuntos no convexos:
Es el conjunto de los puntos que satisfacen todas las restricciones de un problema. Es dentro de ese conjunto donde deberán buscarse los óptimos.
El conjunto de soluciones factibles o dominio del problema es:
Óptimo y extremo son términos que designan tanto mínimo como máximo.
S es un cono
Nota: Nótese que si sacáramos el origen del conjunto, éste seguiría siendo cono.
Se denomina cono convexo generado por un conjunto y se escribe conv cone S al cono convexo más pequeño que contiene S.
Considérense los siguientes problemas:
cuando la gráfica de f es
cuando la gráfica de f es
En ambos casos, el problema de optimización se reduce a calcular el punto en el que la derivada se anula:
y se obtiene en el primer caso un mínimo global o absoluto, y en el segundo caso un máximo global o absoluto.
Esto explica la gran importancia del concepto de convexidad en optimización.
Un problema del tipo
donde f es una función convexa y D un dominio convexo
se llama problema convexo o programa convexo.
Paralelamente,
donde f es una función cóncava y D un dominio convexo
se llama problema cóncavo o programa cóncavo o problema convexo para maximizar.
NOTA: Obsérvese que una función convexa no ofrece, en cambio, ninguna ventaja si lo que se quiere conseguir es un máximo; ni una función cóncava, si lo que se quiere conseguir es un mínimo.
Sea ƒ: D⊂ℜn→ℜ y k∈ℜ
La curva de nivel k de la función ƒ está formada por todos los puntos del dominio D cuya imagen es k.
Es decir:
En cambio, la representación de las curvas de nivel se hace sobre el dominio, que es en ℜ2, uniendo todos los puntos que tienen la misma imagen.
La gráfica de la función en ℜ3 es:
Es el conjunto de puntos para los que está definida una función.
(en el gráfico está en línea roja)
El dominio de la función está formado por los números reales estrictamente positivos porque no existe el logaritmo neperiano de números negativos ni el logaritmo neperiano de cero.
La ecuación de una circunferencia de radio r y de centro en es:
Cuando está centrada en el origen se tiene:
Sea
La envolvente convexa de A (conv A) es el conjunto convexo más pequeño que contiene a A.
A convexo A = conv A
Sea y
Se dice que p es un punto frontera de A si y sólo si cualquier bola centrada en p, tiene intersección no vacía tanto con A como con el complementario de A (ℜn \ A)
Es decir,
Sea y
p es un punto frontera de A
Sea A:
- k puesto que hemos hallado una bola cuya intersección con el complementario de A es vacía.
- r puesto que hemos hallado una bola cuya intersección con A es vacía.
- t y s puesto que tanto si hacemos la bola más grande como si la hacemos más pequeña, ésta sigue teniendo una intersección no vacía con A (color lila) y con el complementario de A (color verde).
Nota: Observamos que s no pertenece a A, aunque sí que pertenece, como se ha explicado, a la frontera de A.
Una función es cóncava si y sólo si al unir dos puntos cualesquiera de la gráfica de la función, el segmento que los une queda por debajo (o coincide) con la gráfica.
En el ejemplo a) la función se llama estrictamente cóncava porque el segmento queda siempre estrictamente por debajo de la gráfica.
En el ejemplo b) la función es cóncava pero no estrictamente, porque si se toman dos puntos sobre la zona roja de la gráfica, el segmento coincide con ella.
cóncava
estrictamente cóncava
ƒ cóncava ⇔ Hƒ(x) semidefinida negativa
ƒ estrictamente cóncava ⇐ Hƒ(x) definida negativa
ƒ estrictamente cóncava ⇒ Hƒ(x) semidefinida negativa
1.
Consideramos su matriz hessiana:
Observamos que es definida negativa .
Por tanto, deducimos que es estrictamente cóncava.
Una función es convexa si y sólo si al unir dos puntos cualesquiera de la gráfica de la función, el segmento que los une queda por encima (o coincide) con la gráfica.
En el ejemplo a) la función se llama estrictamente convexa porque el segmento queda siempre estrictamente por encima de la gráfica.
En el ejemplo b) la función es convexa pero no estrictamente, porque si se toman dos puntos sobre la zona roja de la gráfica, el segmento coincide con ella.
convexa
estrictamente convexa
ƒ convexa ⇔ Hƒ(x) semidefinida positiva
ƒ estrictamente convexa ⇐ Hƒ(x) definida positiva
ƒ estrictamente convexa ⇒ Hƒ(x) semidefinida positiva
Consideramos su matriz hessiana:
Observamos que es semidefinida positiva .
Por tanto, deducimos que es convexa.
Consideramos su matriz hessiana:
Observamos que es definida positiva . Por tanto, deducimos que es estrictamente convexa.
Definición: f es creciente en
Gráfica de funciones crecientes:
Las pendientes de las rectas tangentes a la gráfica de una función creciente son siempre positivas.
En otras palabras, la derivada de una función creciente es positiva.
Más aún:
Proposición: f creciente en
Definición: f es decreciente en
Gráfica de funciones decrecientes:
Las pendientes de las rectas tangentes a la gráfica de una función decreciente son siempre negativas.
En otras palabras, la derivada de una función decreciente es negativa.
Más aún:
Proposición: f decreciente en
ƒ diferenciable en ⇔ existe en un único hiperplano tangente que aproxima el valor de la función alrededor de este punto.
Ver caso n = 1
f tiene derivadas parciales continuas en ⇒ f diferenciable en ⇒ f continua en .
Se obtienen las siguientes funciones como derivadas parciales:
y puesto que son continuas en , podemos asegurar que la función f es diferenciable en .
La función exponencial es una función real de variable real definida como
donde a se llama base de la función exponencial.
Frecuentemente, la base de la función exponencial es el número irracional e cuyo valor es e = 2,718282…
Entonces, la representación gráfica de la función es:
Es una función del tipo
Una función lineal es un polinomio de 1º grado con n variables.
Es la función que se pretende minimizar o maximizar en un programa matemático.
La función objetivo es
Sea ƒ: ℜn→ℜ
Se llama gradiente de ƒ y se escribe ∇ƒ al vector formado por las derivadas parciales de ƒ
El vector gradiente calculado en un punto es un vector numérico.
Sea ƒ: ℜn→ℜ
Se llama matriz hessiana de ƒ y se escribe Hƒ a la matriz formada por las derivadas parciales segundas de ƒ
Por ejemplo, para ƒ: ℜ3→ℜ
donde ƒxz indica la derivada respecto de z de la derivada parcial respecto de x
La matriz hessiana de ƒ calculada en un punto es una matriz numérica.
La matriz hessiana de ƒ resulta ser una matriz simétrica (Teorema de Schwarz)
Calculemos las derivadas parciales primeras que forman el gradiente de ƒ
Calculemos la matriz hessiana
Sea a ∈ ℜn, k ∈ ℜ
Un conjunto H tal que H=x= k se llama hiperplano.
Si n=2 y a =(1,3) y k=5
H = (x,y) = 5
H es una recta : x +3y =5
Si n=3 y a =(2, -1, 3) y k=12
H = (x,y,z) = 12
H es un plano: 2x – y + 3z = 12
Si n>3, H es un hiperplano.
Propiedad:
Un hiperplano es un conjunto convexo.
Sea ƒ: D⊂ℜn → ℜ siendo D un conjunto convexo no vacío y ƒ una función convexa.
Entonces,
a) Si es mínimo local de en , también es mínimo global.
b) El conjunto de mínimos locales de en es un conjunto convexo.
Nota: Este teorema se puede “entender” fácilmente razonando sobre la gráfica de una función convexa.
Sea siendo un conjunto convexo no vacío y una función cóncava.
Entonces,
a) Si es máximo local de en , también es máximo global.
b) El conjunto de máximos locales de en es un conjunto convexo.
Sea y sea
Consideramos que D es la intersección entre el dominio de la funcióny el conjunto de soluciones factibles.
es un máximo global o absoluto de en D
( es un máximo global o absoluto deen D si su imagen es mayor o igual que la de cualquier otro punto del dominio)
es un mínimo global o absoluto deen D
es un máximo local o relativo de en D
(es un máximo local o relativo de en D si existe una bola centrada en , un entorno de, donde la imagen desea mayor o igual que la de los otros puntos)
es un mínimo local o relativo de en D
Cuando las desigualdades se satisfacen de forma estricta, se dice que los óptimos son estrictos.
Propiedades:
1. Todo máximo/mínimo global es local.
2. Todo máximo/mínimo global estricto es único.
Genéricamente se denomina extremo relativo a un máximo o mínimo local
ƒ dos veces derivable
es punto de inflexión de ƒ ⇔ la función cambia el sentido de la curvatura en .
Es decir, los puntos de inflexión son aquellos en los que la función pasa de cóncava a convexa o viceversa. En ellos, la tangente a la gráfica, corta la gráfica.
es punto de inflexión ⇒
Sea un problema de optimización sin restricciones.
Se llaman puntos de silla a aquellos puntos que anulan el gradiente de la función objetivo, pero que no son máximos ni mínimos.
Un ejemplo de punto de silla (al que se tiende a reducir el concepto de punto de silla, por abuso de lenguaje) es:
Obsérvese que en se anula el gradiente de y que, en cambio, es máximo respecto de una variable y mínimo respecto de la otra.
Se dice que en un punto se satura una restricción o que dicha restricción está saturada o activa en ese punto, cuando en ese punto se satisface la restricción con igualdad.
El punto (3,1) satisface la restricción , pero no la satura.
En cambio, el punto (3,1) satura la restricción
Un semiespacio es cada una de las partes en que un hiperplano divide un espacio.
Un semiespacio es un conjunto convexo.
Sean A y B dos conjuntos convexos disjuntos (AB= O), entonces se cumple que existe un hiperplano H que los separa (de manera que A pertenece a uno de los semiespacios y B al otro).
Observemos que separar dos conjuntos no es, en general, posible si A y B no son disjuntos (1) o si uno de los dos no es convexo (2).
Toda función continua sobre dominio compacto alcanza máximo y mínimo globales.
Intuitivamente:
Observemos que aún siendo continua no tiene máximos ni mínimos:
No obstante, si la definimos sobre un intervalo cerrado (y acotado) automáticamente alcanza máximo y mínimo globales.
Sea, por ejemplo,
mínimo global máximo global
Observemos también que el intervalo debe ser cerrado, porque si uno de los extremos es abierto, ya no alcanzará el óptimo.
Es decir,
mínimo global
Notemos que ya no es máximo global, puesto que ya no pertenece al dominio de la función, ni hay otro máximo (Podríamos pensar que el nuevo máximo fuese 3,999999, pero es fácil caer en la cuenta de que podríamos añadir un 9 y obtener un máximo mejor: 3,9999999 ).
Nota: