Revista de Administración, Finanzas y Economía (Journal of Management, Finance and Economics) vol. 7, núm. 2 (2013), pp. 83-100.
Optimización de la Utilidad Esperada de un Portafolio a partir del Método de Entropía Cruzada Gibrán Sayeg Sánchez* María Elizabeth Delgado Ramírez** Recibido 27 de Septiembre de 2013. Aceptado 13 de Noviembre de 2013.
Resumen En este trabajo se propone una solución que utiliza un algoritmo heurístico de entropía cruzada para la optimización de portafolios sujetos a restricciones en los pesos de los activos que lo componen. Se verifica el valor óptimo de los parámetros a utilizar en la metodología y posteriormente se comparan las soluciones obtenidas con métodos numéricos, específicamente se utiliza el algoritmo de gradiente generalizado reducido para optimizar la utilidad esperada del inversionista en cada uno de los distintos portafolios propuestos. La metodología de entropía cruzada se utilizó originalmente en el campo de la termodinámica y se ha ido permeando paulatinamente a otras disciplinas. Este articulo muestra cómo puede aplicarse esta metodología en el campo de las finanzas, específicamente en la optimización de portafolios de inversión. Abstract This article uses a heuristic algorithm of cross entropy to propose a solution for the optimization of portfolios with weight constraints in each of its assets. The optimal values of the parameters in the methodology are verified and further a comparison between the obtained solutions and the optimal found by numerical methods is provided, specifically generalized gradient reduced method is used to optimize the expected utility of the investor in each of the provided portfolios. The cross entropy methodology was originally used in thermodynamics and has slowly seeped into other disciplines. This article shows how this methodology may be applied in finance, specifically in optimizing investment portfolios. Clasificación JEL: C61 Palabras clave: entropía cruzada, optimización de portafolios, métodos heurísticos.
* Candidato a doctor en Ciencias Financieras por el Instituto Tecnológico y de Estudios Superiores de Monterrey CCM.
[email protected] ** Candidata a doctor en Ciencias Financieras por el Instituto Tecnológico y de Estudios Superiores de Monterrey CCM.
[email protected]
84 Revista de Administración, Finanzas y Economía 1. Introducción El presente trabajo de investigación busca proporcionar un modelo de optimización para portafolios con restricciones por medio de tres objetivos principales: (i) estudiar las principales propiedades del modelo de entropía cruzada (ii) derivar un procedimiento para la optimización de portafolios con restricciones (iii) evaluar su desempeño en la optimización de tres portafolios propuestos llegando a una solución pseudo-óptima similar a la que se obtiene con otros métodos de optimización ampliamente difundidos; específicamente el algoritmo de gradiente generalizado reducido. En este sentido, la teoría clásica de portafolios de Markowitz es uno de los aportes teóricos más relevantes al campo de las finanzas, donde los portafolios eficientes de media-varianza juegan un rol muy importante. Tales portafolios a menudo implican tomar grandes posiciones cortas en un número de activos y grandes posiciones largas en otros activos. Dado que las ponderaciones negativas en los portafolios (posiciones cortas) son difíciles de implementar en la práctica, muchos inversionistas imponen la restricción de que las ponderaciones de los activos no deben ser negativas cuando construyen portafolios eficientes de media - varianza. (Jagannathan & Ma, 2002) De esta manera, el problema de minimización de la varianza de un portafolio, cuando las ponderaciones de éste se encuentran limitadas a satisfacer un límite inferior de cero y un límite superior de ω está dado por: min ω 0 Sω ω
s.a.
n X ωi = 1 i=1
ωi ≥ 0, i = 1, 2, . . . , n ωi ≤ ω, i = 1, 2, . . . , n Donde ω representa la matriz de las ponderaciones de los activos pertenecientes al portafolio global y S representa la matriz de covarianzas. El problema de optimización de portafolios sin ventas en corto es un problema de optimización cuadrática con desigualdades lineales. Restricciones adicionales pueden ser agregadas al modelo si las regulaciones de inversión restringen las ponderaciones para activos específicos. No obstante, si las restricciones adicionales representan desigualdades la solución óptima no puede derivarse mediante multiplicadores de Lagrange, sino que se debe recurrir a las condiciones de Karush-Kuhn Tucker (Hillier & Lieberman, 2006). Este tipo de procedimientos analíticos alcanzan notoria dificultad conforme el número de restricciones se incrementa, por lo que es posible recurrir a otros métodos de solución de problemas, tales como los métodos heurísticos combinatorios los cuales se describen posteriormente.
Optimización de la Utilidad Esperada de un Portafolio 85
2. Optimización de portafolios con restricciones Sean R1 , R2 , . . . , Rn los retornos de los activos 1, 2, . . . , n. Asumimos que E ((Rj )) < ∞ para toda j = 1, 2, . . . , n. Denotando ω1 , ω2 , . . . , ωn las fracciones del capital inicial invertido en los activos 1, 2, . . . , n se puede obtener la fórmula para el retorno total del portafolio: R (x) = R1 ω1 + R2 ω2 + . . . + Rn ωn Por lo tanto, el conjunto de las posibles asignaciones de activos se puede definir de la siguiente manera: Ω = (ω ∈ R : ω1 + ω2 + . . . + ωn = 1, ωj ≥ 0, j = 1, 2, . . . , n) La mayor dificultad en formular un problema de optimización de portafolios válido es la definición de la estructura de preferencias entre las carteras factibles. Si solo utilizamos el retorno promedio: µ (x) = E (R (x)) Entonces el resultado del problema de optimización se basa en invertir todo en aquellos activos que tengan el máximo retorno esperado. Por esta razón, la optimización de carteras recurre por lo general a dos enfoques. 2.1 Primer enfoque: Medidas de Riesgo En el primer enfoque se asocia al portafolio x alguna medida de riesgo ρ(x). En el modelo clásico de Markowitz, ρ(x) es la varianza del portafolio, ρ (x) = V ar (R (x)) Aunque también son posibles otras medidas, tales como los modelos de media-semivarianza y media-gini. En el modelo clásico de portafolio media-semivarianza el valor del portafolio de mercado se define de la siguiente manera: R (x) = R1 ω1 + R2 ω2 + . . . + Rn ωn El rendimiento esperado del portafolio anterior se considera como un portafolio riesgoso y se define como: E (R (x)) = ω1 E (R1 ) + ω2 E (R2 ) + . . . + ωn E(Rn ) Mientras que la medida de riesgo del modelo de semivarianza corresponde a la siguiente expresión: sv (R (x)) =
n X xi csv (R (x) , Ri ) i=1
86 Revista de Administración, Finanzas y Economía Donde sv es la semivarianza del portafolio R(x) y csv es la cosemivarianza del portafolio, definida por: Z
+∞
R
Z
(Rm − Rf ) (Ri − Rf ) f (Ri , Rm ) dRm dRi
csv (R (x) , Ri ) = −∞
f
Donde Rf es la tasa libre de riesgo, Rm es el retorno del portafolio de mercado y f (Ri , Rm ) una función de densidad. (Nantell & Price, 1979) A diferencia del modelo de media-semivarianza, el modelo de media-gini utiliza como medida de riesgo el coeficiente de Gini, el cual es la diferencia promedio de Gini, definido como la mitad de la diferencia absoluta esperada entre los rendimientos de dos cantidades invertidas aleatoriamente en un portafolio. El coeficiente de Gini también puede ser definido como la covarianza entre los rendimientos y su distribución de probabilidad: Γ = 2cov (r, F (r)) Donde r es el rendimiento, Γ es el coeficiente de Gini y F (r) es la función de distribución acumulada (Shalit & Yitzhaki, 2005). 2.2 Segundo enfoque: Función de utilidad El segundo enfoque se basa en seleccionar una función de utilidad u : R → R y formular el siguiente problema de optimización: max E (u (R (x))) x∈X
Usualmente es requerido que la función u (•) sea cóncava y no decreciente, lo cual representa las preferencias de un individuo averso al riesgo. Por lo tanto, el reto es seleccionar la función de utilidad adecuada que represente correctamente las preferencias y restricciones del inversionista cuya aplicación no dé lugar a soluciones triviales. (Dentcheva & Ruszczynski, 2006) El problema de optimización de un portafolio mediante una función de utilidad esperada se formula a continuación: max µ (x) − λρ(x) x∈X
Donde λ es el parámetro no negativo que representa la tasa media de riesgo deseable. Si λ = 0, el riesgo no tiene valor y el problema se reduce al problema de maximizar la media. Si λ > 0 se busca un arreglo entre la media y el riesgo. (Dentcheva & Ruszczynski, 2006). Para propósito de este artículo se utiliza una función de utilidad esperada donde µ (x) = E (R (x)), λ corresponde al coeficiente de aversión al riesgo Pratt-Arrow (Pérez Navarro, Jimeno Pastor, & Cerdá Tena, 2004) y ρ(x) representa la varianza del portafolio. El problema de maximizar la utilidad esperada anterior puede resolverse fácilmente cumpliendo las condiciones de primer y segundo orden; sin embargo, si se consideran
Optimización de la Utilidad Esperada de un Portafolio 87
restricciones adicionales para los activos riesgosos estas condiciones no son suficientes para garantizar optimalidad, sino que es necesario recurrir a las condiciones de KarushKuhn Tucker, para resolver un problema general restringido. (Hillier & Lieberman, 2006). Las condiciones de Karush-Kuhn Tucker necesarias para maximizar la utilidad esperada con pesos restringidos al intervalo (0, ω) están dadas por: X Si,j ωj − λi + δi = λ0 ≥ 0, i = 1, 2, . . . , n j
λi ≥ 0
y λi = 0 si ωi > 0, i = 1, 2, . . . , n
δi ≥ 0 y δi = 0 si ωi < ω,
i = 1, 2, . . . , n
0
En este caso λ = (λ1 , . . . , λn ) son los multiplicadores de Lagrange para las res0 tricciones de no negatividad, δ = (δ1 , . . . , δn ) son los multiplicadores para la resn P tricción donde wi ≤ ω, i = 1, 2, . . . , n, y λ0 es el multiplicador para wi = 1. i=1
(Jagannathan, R. & Ma, T., 2002). Como se mencionó anteriormente, la solución de las condiciones Karush-Kuhn Tucker puede no resultar intuitiva o sencilla de implementar por lo que se pueden utilizar otros tipos de algoritmos de solución. A continuación se muestran algunos métodos heurísticos utilizados para resolver problemas de optimización tales como el anterior, de forma numérica. 3. Métodos heurísticos combinatorios Considere un problema de maximización cuya función objetivo está dada por f (X), donde X = (x1 , . . . , xn ) es un conjunto finito de variables acotadas; es decir, xi ∈ (a, b) para toda i = 1, . . . , n y con un conjunto de restricciones Cj (X) ≤ 0 tales que para que un conjunto X particular sea factible debe satisfacer todas y cada una de las restricciones; es decir, debe pertenecer a la región factible S = (Xi |Cj (Xi ) ≤ 0), también llamada espacio de búsqueda. Se dice que éste es un problema combinatorio si existe una solución única X * que satisface todas las restricciones y además f X * es un máximo global en la región factible (Blum & Roli, 2003). En ocasiones obtener X * mediante fórmulas cerradas es difícil o computacionalmente imposible, por lo que es necesario recurrir a métodos heurísticos. La literatura define un algoritmo heurístico como “un proceso de generación iterativo que mediante la combinación inteligente de diferentes conceptos para explorar y explotar el espacio de búsqueda, utiliza estrategias de aprendizaje para estructurar la información con el fin de encontrar de manera eficiente soluciones pseudo óptimas”. (Osman & Laporte, 1996) Existen diversos algoritmos heurísticos, a saber, Osman y Kelly (Osman & Kelly, 1996) definen algunos de ellos de la siguiente manera: Búsqueda local: Busca soluciones óptimas en la vecindad de la solución actual, en caso de existir una solución mejor, la solución actual es reemplazada por la vecindad. Este tipo de algoritmos constan de 3 fases:
88 Revista de Administración, Finanzas y Economía 1. Se obtiene una solución inicial X0 y se calcula f (X0 ). 2. Se analiza la vecindad V (X0 , ), de manera que si existe X1 tal que f (X1 ) > f (X0 ) entonces X1 reemplaza a la solución X0 . 3. Se repite el paso 2 hasta que ninguna vecindad genere una función objetivo mayor. Recocido simulado: Consiste en generar secuencias de variables de forma aleatoria para aproximarse a la solución óptima de acuerdo a un valor arbitrario T . Este tipo de algoritmos constan de 5 fases: 1. Se genera una solución inicial aleatoria X0 . 2. Se genera aleatoriamente una solución X1 y se calcula la diferencia ∆ = f (X1 )− f (X0 ). −∆
3. Si ∆ > 0 o bien si e T < θ, donde θ ∼ U (0, 1), entonces X1 toma el lugar de X0 . En caso contrario se mantiene la solución X0 . 4. Se actualiza el valor de T de acuerdo a reglas previamente definidas. 5. Repetir desde el paso 2 hasta que se cumpla un criterio de finalización. Búsqueda Tabú: Sigue la misma lógica que la búsqueda local, sin embargo limita al algoritmo para que soluciones previamente identificadas como sub óptimas no formen parte de la vecindad V (X0 , ). A estas soluciones descartadas se les llama soluciones tabú y son almacenadas en listas temporales que hacen a la búsqueda más eficiente. Este tipo de algoritmos constan de 3 fases: 1. Se obtiene una solución inicial X0 y se inicializa la lista tabú T . 2. Se analiza la vecindad VT (X0 , ) = V (X0 , ) \T de manera que si existe X1 en VT (X0 , ) tal que f (X1 ) > f (X0 ) entonces X1 reemplaza a la solución X0 . 3. Se repite el paso 2 hasta cumplir con un criterio de finalización. Umbral de aceptación: Busca obtener soluciones óptimas a través de una secuencia de umbrales Tk , donde k = 1, . . . , K. Cada uno de estos umbrales es definido de acuerdo a criterios previamente establecidos y puede permitir que soluciones donde f (X1 ) < f (X0 ) sean consideradas como mejores a X0 . Este tipo de algoritmos constan de 3 fases: 1. Generar una solución inicial X0 y obtener f (X0 ). Generar asimismo una serie de umbrales Tk∈(1,...,K) . No existe una metodología específica para generar los umbrales pero la literatura sugiere los siguientes ejemplos (Hu, Kahng, & Albert Tsao, 1995): a) Diferencias entre soluciones f (X) adyacentes.
Optimización de la Utilidad Esperada de un Portafolio 89
b) Crecimiento o decrecimiento del umbral inicial T1 descrita como: ! b c Ti i Ti+1 = − 1 *∆* 1 − a M Donde M es el límite en el umbral ∆ es la granularidad a. b, c son factores de crecimiento. 2. Para cada valor de k, simular un número fijo de X1 y calcular ∆ = f (X1 ) − f (X0 ). Si ∆ > Tk entonces X1 toma el lugar de X0 . En caso contrario, se mantiene el valor de X0 y se procede al siguiente valor de k. 3. Al finalizar las K iteraciones, actualizar la secuencia de umbrales Tk∈(1,...,K) y repetir el paso 2. En caso de cumplirse un criterio de finalización el algoritmo se detiene. Este artículo utiliza la técnica de entropía cruzada, la cual pertenece a la familia del recocido simulado. La próxima sección explica detenidamente en que consiste este algoritmo utilizando el caso de una variable dicotómica para facilitar su comprensión. 4. Entropía cruzada La entropía cruzada es un método propuesto originalmente por Rubinstein para estimar probabilidades de eventos poco frecuentes, no obstante muchos problemas de optimización pueden aproximarse utilizando este algoritmo de manera tal que se realiza una búsqueda aleatoria utilizando probabilidades de ocurrencia para cada una de las variables analizadas (Botev Z. I., Kroese, Rubinstein, & Ecuyer, 2012). La literatura muestra que este tipo de algoritmos se ha utilizado para optimizar problemas de producción donde se debe elegir el conjunto óptimo de factores de producción (Caserta, Quiñonez Rico, & Márquez Uribe, 2008) así como para la solución de problemas de objetivos múltiples que se encuentran en conflicto tales como teoría de colas con inventarios de seguridad. (Bekker , 03/2013) entre otras aplicaciones. El fundamento de la entropía cruzada es la divergencia de Kullback – Leibler, también conocida como distancia de entropía cruzada. Esta divergencia estima la diferencia entre dos distribuciones de probabilidad dadas, de manera que mientras más se asemejen, la divergencia se aproxima a 0 (Rubinstein & Kroese, 2007). Considere dos distribuciones de probabilidad g y h, la divergencia de Kullback – Leibler sobre g se expresa de la siguiente manera: Z∞ Z∞ g (x) D (g, h) = Eg log = g (x) log g (x) dx − g (x) log h (x) dx h (x) −∞
−∞
90 Revista de Administración, Finanzas y Economía Para comprender como la entropía cruzada permite resolver problemas de optimización, puede pensarse en la maximización de una función objetivo f (X), con X = (x1 , . . . , xn ), donde cada xi es una variable dicotómica; es decir xi ∈ (0, 1). Sea X * una solución óptima del problema, de manera que f X * es un máximo global, entonces X * puede verse como una secuencia de 1 y 0 debido al carácter dicotómico de las variables. La aproximación por entropía cruzada se obtiene al considerar que cada una de las variables del problema sigue una distribución de Bernoulli con probabilidades de éxito independientes; es decir, xi ∼ Ber (pi ). El objetivo buscado es que pi → 1 cuando x*i = 1 y que pi → 0 cuando x*i = 0. El algoritmo de solución consiste en 5 pasos (Rubinstein & Kroese, 2007): 1. Se selecciona una probabilidad de éxito P0 = (p1 , . . . , pn ) = 21 , . . . , 12 y una solución incumbente inicial γ0 . 2. Se genera una secuencia finita de X, calculando aleatoriamente cada elemento de acuerdo a xi ∼ Ber (pi ). 3. Para cada secuencia simulada se calcula f (X) y se toman las ρ simulaciones donde f (X) ≥ γ0 . P ρ ρ P x1j
j=1 4. Se actualiza el valor de Pt = ρ
xnj
,...,
j=1
ρ
y se define γt como el
cuantil (1 − %) del conjunto de valores f (X) obtenidos en el paso anterior. 5. Se repite desde el paso 2 hasta cumplir con un criterio de finalización, el cual generalmente consiste en: a) Imposibilidad de encontrar F (X) > γt b) Cumplimiento de la condición γt −γt−1 ≤ δ, donde δ es un valor arbitrario muy pequeño. Observe que a pesar de actualizar la probabilidad de éxito de cada variable en forma independiente, las simulaciones deben realizarse en conjunto, asegurando así que la solución obtenida pertenezca a la región factible o espacio de búsqueda. En la literatura se demuestra que la solución de un problema de optimización mediante la metodología de entropía cruzada converge casi seguramente a la solución óptima, esto implica que si bien la solución puede no ser óptima, se encuentra en su vecindad. (Rubinstein R. , 1999). Para comparar los resultados obtenidos en este artículo se utilizará un método generalmente aceptado en la práctica, en particular, el método de gradiente generalizado reducido, utilizado en el complemento Solver de Microsoft Excel. Dicho método puede definirse de la siguiente manera: Considere una función f (x1 , x2 , . . . , xn ) = f (x) no necesariamente lineal que busca maximizarse. El algoritmo de gradiente generalizado reducido permite, a partir de un vector solución inicial x0 , desplazarse sobre la superficie de f hasta encontrar un máximo local, es decir, cuando ∇f (x) = (0, 0, . . . , 0) = (0). La evolución del vector x se da de forma natural al desplazarse sobre el gradiente ∇f (x), ya que éste
Optimización de la Utilidad Esperada de un Portafolio 91
representa la dirección de máximo crecimiento en f . El algoritmo puede representarse mediante 5 pasos iterativos: 1. Se elige de forma arbitraria un valor no negativo que se utilizará como regla de detención y una solución inicial x0 factible. 2. Se calcula ∇f (x) y se evalúa con la solución inicial x0 para obtener un vector de dirección. 3. Utilizando la solución actual xt y el vector de dirección obtenido en el paso 2, se sustituyen valores en f (s) = (xt + s∇f (x)), donde s representa la longitud de paso sobre la superficie de f . 4. Se define la longitud de paso óptima al maximizar f (s), es decir, resolviendo 0 00 las condiciones f (s) = 0 y f (s) < 0. 5. Se actualiza solución xt+1 = xt + s∇f (x). Si se cumple la regla de el vector
∂f detención ∂x ≤ ∀i = 1, 2, . . . , n entonces la solución x será óptima. En i caso contrario, regresar al paso 2 (Hillier & Lieberman, 2006).
5. Datos utilizados Para la realización de este artículo se utilizaron datos de 27 índices, con periodicidad diaria del 4 de enero de 2002 al 18 de octubre de 2012. Estos índices se agruparon en tres portafolios: Países desarrollados, Países emergentes (FTSE, 2012) y Paraísos fiscales (OECD, 2012) tal como se muestra en la tabla1. Tabla 1. Clasificación de los 31 índices en 3 portafolios
Portafolio 1: Países desarrollados
País Francia Alemania EE.UU. Europa Inglaterra España EE.UU. Japón EE.UU Suecia EE.UU Japón
Índice CAC40 DAX DOW JONES EURO STOXX FTSE 100 IBEX 35 NASDAQ NIKKEI225 NYSE OMX S&P 500 TPX
92 Revista de Administración, Finanzas y Economía
País
Índice
Singapur Trinidad China Jamaica Luxemburgo Malta Panamá Líbano
UOBDAQ TTCOMP HSI JMSMX LUXXX MALTEX BVPSBVPS BLOM
Portafolio 2: Paraísos fiscales
País
Índice
México Argentina Chile Perú Colombia Costa Rica Venezuela
MEXBOL MERVAL IGPA IGBVL IGBC CRSMBCT IBVC
Portafolio 3: Países emergentes
Optimización de la Utilidad Esperada de un Portafolio 93
6. Metodología La optimización de un portafolio de índices con restricciones mediante el método de entropía cruzada requiere ciertos supuestos para poder llevarse a cabo, en particular refiriéndose a las cotas de los activos, la distribución de probabilidad y el criterio de finalización. Para fines de análisis se considerarán los siguientes cuatro supuestos durante el resto del artículo: 1. No se considerarán ventas en corto ni apalancamiento; es decir, ωi ∈ (0, 1) ∀i. 2. El capital de inversión es $1. 3. La distribución de probabilidad utilizada por la entropía cruzada corresponde a una distribución normal N µ, σ 2 . 4. Se utiliza un criterio de finalización con una precisión de 12 decimales. La función que se busca optimizar corresponde a la utilidad esperada, definida como: f (ω1 , . . . , ωn ) =
n n n X 1 XX ωi ωj σij ωi R i − λ 2 i=1 j=1 i=1
Donde ωi representa el porcentaje invertido en el índice i, Ri el rendimiento logarítmico promedio del índice i, λ es el coeficiente de Pratt Arrow que establece la aversión al riesgo del inversionista (Pérez Navarro, Jimeno Pastor, & Cerdá Tena, 2004) y σij es la covarianza entre los índices i y j. No obstante, debe considerarse que al tratarse de un portafolio con restricciones n P deben satisfacerse ωi ∈ (0, 1) para cada índice y ωi ≤ 1 para garantizar que el pori=1
tafolio no contenga ventas en corto ni apalancamiento. Para cumplir estas restricciones se utilizará el método de las M’s, el cual consiste en castigar la función objetivo cuando alguna de las restricciones no se cumple. Utilizando esta técnica, la nueva función objetivo se define como: f (ω1 , . . . , ωn ) = n n n n n X X X 1 XX ωi R i − λ ωi ωj σij − M Iωi 1 − M IPni=1 ωi >1 2 i=1 i=1 j=1 i=1 i=1
Donde I(•) es la función indicadora I =
1 si (•) se cumple 0 en caso contrario
y M es un
número muy grande. Dada esta función objetivo, la metodología de entropía cruzada puede ser llevada a cabo de acuerdo a los cinco pasos siguientes: 1. Se toma inicial para cada porcentaje invertido de acuerdo a unaqdistribución 1 1 ωi ˜N n , α , donde α es una constante cualesquiera, así como una son lución incumbente inicial γ = −M .
94 Revista de Administración, Finanzas y Economía 2. Se generan 10,000 vectores de pesos (ω1 , ω2 , . . . , ωn ) de forma aleatoria de acuerdo a la función inversa de la distribución de probabilidad asignada. 3. Para cada vector de pesos se calcula f (ω1 , . . . , ωn ) y se toman solo aquellos donde f (ω1 , . . . , ωn ) ≥ γ. 4. Tomando exclusivamente los vectores seleccionados se actualiza la distribución p de cada peso ωi como N ω i , α (ω i ) , donde ω i es el promedio de los pesos seleccionados. De igual manera, la solución incumbente se actualiza como el tercer cuartil de las soluciones seleccionadas f (ω1 , . . . , ωn ). Debe considerarse que Rubinstein (Botev Z. , Kroese, Rubinstein, & LÉcuyer, 2013) toma en cuenta un cuartil arbitrario para actualizar la solución incumbente. No obstante, en este artículo se utiliza el tercer cuartil para procurar que no se seleccionen valores atípicos. 5. Se repite desde el paso 2 hasta que se cumpla el criterio de finalización f (ω1 , . . . , ωn ) − γ ≤ 1 × 10−12 . Debe observarse que se propone una varianza de la distribución de porcentajes que depende solo de la media de los pesos ω i y de una constante arbitraria α. Esto permite que cuando ω i → 0 entonces σ 2 → 0, mientras que cuando ω i → 1 entonces σ 2 → α, es decir, la varianza estará siempre dentro del intervalo (0, α). Esta particularidad implica que el valor de α define la granularidad de los posibles valores de ωi estimados durante las iteraciones. Más aún, permite que cuando ωi → 0 la probabilidad de que ωi > 0 disminuya, mientras que cuando ωi → 1 se favorece la diversificación de portafolios. 7. Resultados La metodología descrita depende del valor de α para obtener los pesos del portafolio, por lo que es necesario verificar el parámetro α óptimo a utilizar. Para todos los cálculos siguientes se utilizó un coeficiente de aversión al riesgo λ = 21 el cual fue seleccionado de manera arbitraria. La figura 1 muestra cómo para cualesquiera de los tres portafolios estudiados se obtienen resultados pseudo – óptimos, de forma que mientras más pequeño es α, se obtiene mayor precisión en el cálculo de la utilidad esperada. Puede pensarse en el parámetro α como el tamaño de paso que permite avanzar a los pesos ωi hacia su valor óptimo, por lo que pasos grandes permiten una convergencia rápida pero poco acertada, mientras que pasos pequeños permiten una convergencia certera pero lenta. Del mismo modo, la figura 1 deja ver como un valor α = 0.005 permite obtener un resultado pseudo – óptimo con un error respecto al óptimo global del orden 1 × 10−6 o menor, pero con necesidad de más de 500 iteraciones. Por el contrario, un valor de α entre 0.035 y 0.065 permite obtener resultados muy similares con no más de 80 iteraciones. Se compararon los resultados obtenidos con el resultado óptimo global proporcionado por el algoritmo de gradiente generalizado reducido utilizado en el complemento Solver3 de Microsoft Excel y explicado en la sección 4. 3 Para mayor información referirse al capítulo 12.5 Optimización no restringida de varias variables de Introducción a la investigación de operaciones. 8va edición. Frederick S. Hillier & Gerarld J. Lieberman.
Optimización de la Utilidad Esperada de un Portafolio 95
Figura 1. Número de ciclos, solución pseudo-óptima y diferencia con el óptimo global de la función objetivo para cada uno de los portafolios analizados de acuerdo al parámetro α utilizando en la estimación de la varianza. Se observa la eficiencia entre 0.035 y 0.065
Las gráficas de la figura 1 permiten observar la diferencia entre la solución pseudoóptima proporcionada por la metodología de entropía cruzada y el óptimo encontrado por el método de gradiente generalizado reducido. Cabe destacar que los resultados
96 Revista de Administración, Finanzas y Economía convergen de manera asintótica cuando α → 0. Las figuras siguientes comparan cada uno de los portafolios analizados y muestran la convergencia tanto de la función objetivo como de los pesos óptimos. Figura 2. Convergencia de las soluciones pseudo-óptimas para el portafolio de Países desarrollados para un parámetro α de 0.035
Optimización de la Utilidad Esperada de un Portafolio 97
Figura 3. Convergencia de las soluciones pseudo-óptimas para el portafolio de Paraísos fiscales para un parámetro α de 0.035
98 Revista de Administración, Finanzas y Economía Figura 4. Convergencia de las soluciones pseudo-óptimas para el portafolio de países emergentes para un parámetro α de 0.035
Cabe destacar en las figuras 2, 3 y 4 que el lado izquierdo de cada una de las figuras presenta una oscilación en las diferencias entre pesos óptimos con un grado de volatilidad alto, a medida que avanza el número de iteraciones, esta oscilación tiende a la estabilidad. El lado derecho muestra que los activos con ponderaciones relevantes destacan rápidamente de la muestra, mientras que el resto tiende rápidamente a cero a pesar de iniciar todos en el mismo origen.
Optimización de la Utilidad Esperada de un Portafolio 99
8. Conclusiones Los resultados empíricos demuestran que las soluciones tienden al óptimo global incrementando el grado de error conforme el número de iteraciones decrece. Asimismo, a partir del uso de entropía cruzada puede observarse que no es requerido satisfacer condiciones de primer y segundo orden tal como sucede con otros algoritmos analíticos, tales como las condiciones de Karush-Kuhn Tucker, sino que la iteración de números aleatorios converge a la optimalidad gracias a la distribución de las soluciones generadas. Gracias a este tipo de algoritmos es posible abordar problemas de cierta complejidad analítica de una manera más sencilla y fácil de implementar. No obstante, el algoritmo presentado en este artículo posee la desventaja de requerir un uso intensivo de recursos computaciones disminuyendo así la eficiencia del proceso. Esta situación podría resolverse en investigaciones futuras a través de la paralelización del algoritmo. Referencias 1. Bekker , J. (03/2013). Multi-objective buffer space allocation with the crossentropy method. International Journal of Simulation Modelling, 50-61. 2. Blum, C., & Roli, A. (2003, Septiembre). Metaheuristics in Combinatorial Optimization: Overview and Conceptual Comparison. ACM Computing Surveys, 268-308. 3. Botev, Z. I., Kroese, D. P., Rubinstein, R. Y., & Ecuyer, P. L. (2012). The CrossEntropy Method for Optimization. Handbook of Statistics. 4. Botev, Z., Kroese, D., Rubinstein, R., & LÉcuyer, P. (2013). The Cross-Entropy method for optimization. Handbook of statistics Vol. 31, 35-64. 5. Caserta, M., Quiñonez Rico, E., & Márquez Uribe, A. (2008). A cross entropy algorithm for the knapsack problem with setups. Cumputers & Operation Research , 241-252. 6. Dentcheva, D., & Ruszczynski, A. (2006). Portfolio optimization with stochastic dominance constraints. Journal of banking & finance, 433-451. 7. FTSE. (2012, Septiembre). http://www.ftse.com/Indices/Country_Classification/ Downloads/September_2012_Country_Classification_Update.pdf. Retrieved Enero 2013, from http://www.ftse.com. 8. Hillier, F., & Lieberman, G. (2006). Introducción a la investigación de operaciones. México: McGraw Hill. 9. Hu, T., Kahng, A., & Albert Tsao, C.-W. (1995). Old bachelor acceptance: A new class of non-monotone threshold accepting methods. ORSA Journal on Computing, 417-427.
100 Revista de Administración, Finanzas y Economía 10. Jagannathan, R., & Ma, T. (2002). Risk reduction in large portfolios: Why imposing the wrong constraints helps. The Journal of Finance, 1651-1683. 11. Nantell, T., & Price, B. (1979). An analytical comparison of variance and semivariance. Capital market theories. Journal of financial and quantitative analysis, 221-242. 12. OECD. (2012, Abril 2). http://www.oecd.org/general/searchresults/?q= tax %20haven %20list %20. Retrieved Noviembre 22, 2012, from http://www.oecd.org. 13. Osman, I. H., & Kelly, J. P. (1996). Meta-Heuristics: Theory and Applications. Massachusetts: Kluwer Academic Publishers. 14. Osman, I. H., & Laporte, G. (1996). Metaheuristics: A bibliography. Annals of Operational Research, 513-628. 15. Pérez Navarro, J., Jimeno Pastor, J., & Cerdá Tena, E. (2004). Teoría de Juegos. Madrid: Pearson Educación S.A. 16. Rubinstein, R. (1999). The cross entropy method for combinatorial and continous optimization. Methodology and computing in applied probability, 127-190. 17. Rubinstein, R. Y., & Kroese, D. P. (2007). Fast Cross-Entropy Methods for Combinatorial Optimization, Simulation and Counting. INFORMS, (p. 76). Seattle. 18. Shalit, H., & Yitzhaki, S. (2005). The mean-gini efficient portfolio frontier. The journal of financial research, 59-75.