Story Transcript
UNIVERSIDAD PONTIFICIA COMILLAS ESCUELA TÉCNICA SUPERIOR DE INGENIERÍA (ICAI) INGENIERÍA INDUSTRIAL
PROYECTO FIN DE CARRERA
PREDICCIÓN DE LA PRODUCCIÓN EÓLICA
ANTONIO DE GREGORIO Y VERDEJO MADRID, Junio de 2006
Autorizada la entrega del proyecto al alumno: Antonio de Gregorio y Verdejo
EL DIRECTOR DEL PROYECTO Alicia Mateo González Fdo:
Fecha:
Vº Bº del Coordinador de Proyectos Tomás Gómez San Román Fdo:
Fecha:
Resumen
iii
Resumen El marco regulatorio energético ha sido capaz de incentivar la instalación de potencia eólica hasta situar a España en una situación de liderazgo. Sin embargo, cuando la potencia eólica instalada empieza a ser importante en el mix del parque de generación (16% en 2005) es necesaria una mayor gestión de la misma, ya que a medida que aumenta la potencia eólica instalada se incrementa de manera significativa el impacto en el sistema. Se producen incrementos de los costes de desvío, caídas de producción no controladas, problemas con los sistemas complementarios, etc. El Real Decreto 436 / 2004 de 12 de marzo permite a los parques eólicos elegir entre dos opciones retributivas, acudir al Mercado Eléctrico o vender su energía a una tarifa fija. En el primer caso la energía eólica debe comportarse como cualquier energía convencional, es decir, debe preparar sus ofertas, para lo que deberá programar su producción y venderla en el mercado libre. En este entorno el promotor eólico debe asumir las reglas de funcionamiento del mismo como cualquier otro agente, por lo que también pagará penalización por el desvío generado, definiendo éste como la diferencia entre el programa casado en el mercado y la producción realmente entregada a la red. La empresa Wind to Market (W2M), creada por Gamesa tras el mencionado RD, actúa como representante de agentes productores de energía en el Mercado Eléctrico, ofertando la energía en nombre de los parques. Hoy en día este agente vendedor cuenta con dos modelos de predicción, Casandra y Apolo, para el medio plazo (de 1 a 3 días) y el corto plazo (horas) respectivamente. Estos modelos de predicción son desarrollados por Casandra Energy Services, filial de Gamesa. El objetivo principal de este proyecto, financiado por Gamesa, es investigar modelos nuevos de predicción y estudiar posibles comparaciones con los modelos que esta empresa utiliza actualmente. En el proyecto se va a estudiar, desarrollar e implementar en una herramienta informática, un modelo de predicción de la producción eólica que permita a los parques acudir al Mercado Diario. Para ello, como primer paso se ha realizado una revisión del estado del arte de los modelos de predicción. La gran dificultad de la predicción de la producción eólica reside en que la producción es directamente proporcional al cubo del módulo de la
Resumen
iv
velocidad del viento, con lo que ligeras desviaciones en la velocidad provocan grandes desvíos en la producción. En la revisión del estado del arte se han estudiado distintos modelos que pueden clasificarse en tres grandes grupos. Modelos físicos o de circulación atmosférica, los cuales están basados en las ecuaciones diferenciales en derivadas parciales que describen la dinámica de la atmósfera y que están orientados a la predicción a largo plazo (más de tres días), modelos estadísticos como series temporales y redes neuronales artificiales (en ellas se basa el modelo Apolo) más orientados al corto plazo, y modelos híbridos que mezclan técnicas estadísticas y físicas para realizar predicciones en el medio plazo. En este proyecto se propone utilizar técnicas de predicción híbridas basadas en el método de los análogos y en el CBR (razonamiento basado en casos). Este método es utilizado en la predicción meteorológica de fenómenos atmosféricos, como por ejemplo la precipitación en el Instituto Nacional de Meteorología (INM), pero no se utiliza en Casandra Energy Services para la predicción de la producción. Estos métodos se basan en la hipótesis de que configuraciones meteorológicas similares dan lugar a fenómenos meteorológicos similares. El modelo trata de predecir la producción de un caso problema (una hora futura concreta) del que se conocen unas características meteorológicas (campos predictores). La producción de este caso problema va a ser función de las diferentes producciones de unos casos que pertenecen a una base histórica de datos, la cual contiene casos pasados de los que se conocen sus producciones y sus campos predictores. Para relacionar al caso problema con cada uno de los casos históricos es necesario definir una medida de similitud, en la que se tengan en cuenta los campos predictores (características de cada caso). Según se parezca cada caso histórico con el problema (se parecerán en función de la medida de similitud entre ambos casos), la producción de dicho caso histórico será más o menos relevante a la hora de dar la estimación de la producción del caso problema. La búsqueda de los campos predictores más importantes y de la medida de similitud óptima, el compromiso entre aporte de información y tiempo de ejecución, y la generación y optimización de los parámetros del programa constituyen las partes más importantes en el desarrollo de la aplicación. Para valorar los resultados de la herramienta informática, se realizó la predicción en un período problema lo suficientemente significativo (Abril 2005 – Diciembre 2005). El modelo de análogos sigue perfectamente durante todo el período la tendencia general
Resumen
v
de la curva de la producción real, aunque sufre ante producciones muy elevadas y ceros en la producción, ya que al realizarse ponderación de varias producciones históricas para realizar la predicción es complicado captar producciones extremas y, como es lógico, ceros por averías, mantenimiento, etc. El modelo de análogos se ha comparado con el modelo de predicción Casandra. Casandra es un modelo híbrido (combina tanto técnicas físicas como estadísticas) que se perfila como la mejor opción dentro del catálogo de productos que existen en el mercado español y por extensión a nivel mundial, siendo el método de predicción con un menor desvío de kilowatios por parque, lo que significa que es el modelo que más ahorro genera por desvíos para los parques. De los nueve meses de los que consta el período problema, el modelo de análogos supera a Casandra en tres de ellos, y en otros cuatro se encuentra a menos de un tres por ciento de error. Sólo en Agosto y Septiembre 2005, el modelo de análogos es inferior a Casandra, y esto es debido a la gran cantidad de producciones nulas que se produjeron en esos meses estivales. Una de las posibilidades reales que el modelo de análogos ofrece es la posibilidad de realizar combinaciones de sus predicciones junto a las de Casandra. En este modelo también se ha desarrollado este enfoque llegando a resultados muy favorables, ya que la combinación de ambos modelos siempre mejora a la mejor de las dos predicciones, ya sea Casandra o el modelo de análogos. Tras la realización del proyecto se deduce que los métodos de análogos y de razonamiento basado en casos son perfectamente válidos en el mundo de la predicción de la producción. El proyecto es de gran utilidad para W2M ya que le proporciona otra herramienta de predicción con la que acudir al Mercado Eléctrico, cuyos resultados combinados con los de su otro modelo de predicción mejoran su predicción actual. Este hecho tiene un impacto económico directo y claro en tanto que se disminuye el pago que los parques tienen que afrontar en concepto de desvío. Por último, el modelo de análogos no sólo es válido para acudir al Mercado Diario de Electricidad, sino que también puede ser utilizado para realizar predicciones con campos predictores más recientes (lo cual generalmente implica más fiabilidad para la predicción), lo que permite llevar los resultados del modelo a los diferentes Mercados Intradiarios, donde corregir las ofertas realizadas en el Mercado Diario.
Summary
vi
Summary The Spanish energetic regulation has been able to place Spain as the second country worldwide with more wind power capacity. Nevertheless a problem has begun when this capacity has become more important in the energetic mix (16% in 2005). This is owing to the penalties paid for imbalances, unexpected falls in generation, problems related to complementary services, etc. In order to solve this, the 436 / 2004 Spanish Royal Order of the March 12th, gives an incentive to the wind farms to offer in the pool instead of being paid with a fixed tariff. If the wind farms offer in the pool, they will behave as any other generating resource. Consequently they will prepare their offers, programming their power production and selling it in the pool. Also the wind farms will pay penalties for the imbalances from the schedule. The company Wind to Market (W2M), started up by Gamesa as a result of the Royal Order, acts as a manager of wind farms offering their energy in the pool. Currently, W2M has two prediction models, Casandra and Apolo. These models can predict in the medium term (1 to 3 days) and the short term (hours). Both models are developed by Casandra Energy Services, which is a company also started up by Gamesa. The main goal of this project, which is financed by Gamesa, is researching new prediction models, comparing them with the models of Casandra. This project will develop a model to predict wind power, and perform it in software. This tool will enable the wind farms to go to the pool. In order to do this, it has been made a revision of the state of the art of the prediction models. The main difficulty of predicting wind power is that the power is proportional to the cube of the wind speed. This causes that little deviations in the speed generate large deviations in the power prediction. In the revision of the state of the art, numerical weather prediction models based in differential equations have been studied. These models describe the atmosphere dynamics, aimed at long term prediction (more than three days). Also statistical models as time series and artificial neuronal networks (Apolo is based in them) have been studied. These models are directed to the short term prediction. Finally, hybrid models, that mix statistical and numerical techniques for the medium term prediction, have been analyzed.
Summary
vii
This project suggests the use of hybrid techniques of prediction based in the analogue methods and in the CBR (Case-Based Reasoning). This method is used in weather forecasting, such as the rain fall used by the National Institute of Meteorology, but not used in Casandra Energy Services to predict the wind power. These methods are based in the hypothesis that similar atmospheric structures generate similar atmospheric phenomenon. This model tries to predict the power production of the case in study, in which it is known its meteorological characteristics. This power production will be dependant on the power production of other historical cases, whose power production and meteorological characteristics are known. To relate the case in study with each of the historical cases, it is necessary to define a similarity measurement in which the meteorological characteristics are bear in mind. As far as each historical case is similar to the case in study, its power production will be more relevant in the prediction of the case in study. The most important parts of the development of the model were the choice of the more relevant meteorological characteristics and the best similarity measurement, the agreement between amount of information and the time of execution, and the generation and optimization of the parameters of the software. In order to estimate the software results, the power prediction of a period in study (April 2005 to December 2005) sufficiently significant was made. The analogue model follows perfectly the trend of the real power production. However, it suffers with high power productions and zero productions. This is because it is complicated to pick up an extreme production when doing the weights of all the historical power production of the cases, and when there are zeros due to breakdowns and maintenance. The analogue model was compared to the Casandra’s prediction model. Casandra is a hybrid model (it mixes numerical and statistical techniques) that seems to be the best election between the choices that can be made in the Spanish market and so worldwide. This is the prediction model with the least imbalance per wind farm, and that involves highest profits for these wind farms. In the nine months in study, the analogue model is better than Casandra in three of them, and in four of them it is not further than a three per cent of error. Only in August and September, the analogue model is worse than Casandra, and it is due to the huge quantity of zeros that appeared in the summer months.
Summary
viii
One of the possibilities that the analogue model offers to W2M is the combination of its predictions with Casandra’s ones. The combination of both models always improves the best model in each period, whether Casandra or the analogue model. Overall after the performance of the project, it is inferred that the analogue methods and the CBR are perfectly valid for the wind power prediction. This project is really useful for Gamesa because it provides another prediction tool for offering in the pool. This makes that its outputs mixed with Casandra’s ones improve the current prediction, involving an improvement of the economical profit for the clients. The analogue model is not only valid for the day to day market, but for the real time markets with more accurate meteorological data.
Índice
ix
Índice RESUMEN
III
SUMMARY
VI
ÍNDICE
IX
1 INTRODUCCIÓN Y OBJETIVOS
2
1.1 Introducción
2
1.2 El funcionamiento del Mercado Eléctrico Español
5
1.2.1
Funcionamiento básico del Mercado Eléctrico
5
1.2.2
Los contratos bilaterales
7
1.2.3
Los Mercados Intradiarios
8
1.2.4
Restricciones técnicas
9
1.2.5
Mercados de Servicios Complementarios
10
1.3 Regulación del sector eólico
11
1.3.1
Participación de la energía eólica en los mercados de electricidad
11
1.3.2
Remuneración económica de los parques eólicos
13
1.4 Objetivos
18
2 MODELOS DE PREDICCIÓN DE PRODUCCIÓN
20
2.1 Introducción
20
2.2 Técnicas Numéricas
22
2.3 Técnicas Estadísticas
25
2.3.1
Series Temporales
25
2.3.2
Redes Neuronales Artificiales
29
2.4 Técnicas Híbridas
32
2.4.1
Introducción
32
2.4.2
Método de los Análogos
32
2.4.3
CBR (Case-Based Reasoning)
34
2.5 Modelos de predicción de W2M
37
2.5.1
Casandra
37
2.5.2
Apolo
40
3 DESCRIPCIÓN DEL MODELO
43
3.1 Introducción
43
3.2 Descripción General del Modelo
45
3.2.1
Esquema básico del modelo
45
Índice
x
3.2.2
Bases de datos meteorológicas
46
3.2.3
Los campos predictores
48
3.2.4
La medida de similitud
51
3.2.5
El proceso de selección de análogos
53
3.2.6
El proceso de ajuste y verificación
55
3.3 Implantación del modelo en una herramienta informática
58
3.3.1
Introducción
58
3.3.2
Diagrama de flujo de datos
58
3.4 Conclusiones
67
4 RESULTADOS
69
4.1 Introducción
69
4.2 Proceso de ajuste del parque
71
4.3 El proceso de predicción
75
4.3.1
Optimización de parámetros
75
4.3.2
Resultados del modelo
79
4.3.3
Análogos vs. Casandra
86
4.3.4
Combinación del modelo de Análogos con Casandra
94
4.4 Conclusiones 5 CONCLUSIONES Y DESARROLLOS FUTUROS
101 103
5.1 Conclusiones
103
5.2 Desarrollos Futuros
105
6 BIBLIOGRAFÍA
107
6.1 Documentos
107
6.2 Sitios web
110
ANEXO A: MANUAL DE USUARIO
111
A.1 Requisitos del sistema
111
A.2 Instalación
112
A.3 Configuración
113
A.4 Ejecución
121
1 Introducción y Objetivos
Error! Style not defined. Error! Style not defined.
1
2
Introducción y objetivos 1.1 Introducción Con el fin de promocionar la energía eólica en España, tradicionalmente la
regulación se ha focalizado en asegurar los ingresos de los parques eólicos mediante tarifas fijas, prioridad de conexión a la red, asegurando la compra de toda su energía producida, etc. Gracias a esta política, la energía eólica en España está experimentando un importante desarrollo que permite augurar muy buenas perspectivas de evolución en el futuro más inmediato. Prueba de ello son los últimos tres años donde España ha tenido la mayor tasa de crecimiento del mundo, con un incremento anual de 1600 MW instalados, lo que le ha situado como el segundo país en cuanto a potencia eólica instalada, superada únicamente por Alemania.
Evolución de la potencia eólica instalada en España 12000
10000
MW
8000
6000
4000
2000
0 1990 1991
1992 1993
1994
1995
1996
1997
año
1998
1999
2000
2001
2002
MW 2003
2004
2005
Figura 1.1. La evolución de la potencia eólica instalada en España
En definitiva, el entorno regulatorio ha sido capaz de incentivar la instalación de potencia eólica hasta situar a España en una situación de liderazgo. Sin embargo, si bien hasta ahora el principal objetivo era incentivar la nueva instalación, en una situación como la actual en la que la potencia eólica representa ya un 16% del mix de
Error! Style not defined. Error! Style not defined.
3
generación, el impacto en el sistema de esta generación se incrementa de forma significativa: se aumentan los costes del desvío del sistema, se producen caídas de producción no controladas, pueden aumentar los problemas relacionados con los servicios complementarios, etc. Es decir, se hacen necesarias nuevas iniciativas encaminadas a una gestión eficiente de la energía eólica que permita una integración de la misma en la red. El Real Decreto 436 / 2004 de 12 de marzo es el primer paso en esta nueva dirección y ha supuesto un cambio de paradigma para la industria eólica, incentivando su integración en el sistema eléctrico. El mencionado RD permite a los parques eólicos elegir entre dos opciones de venta de energía: vender la energía en el mercado libre de producción o vender su energía a la distribuidora a una tarifa fija. El primero de los casos supone un paso adelante en el camino de acercamiento de la energía eólica y el resto de tecnologías convencionales. Acudir al mercado significa asumir las reglas de funcionamiento del mismo, esto es, el productor eólico deberá preparar sus ofertas para lo que tendrá que programar su producción, liquidará como cualquier otro agente de mercado, pagará penalización por desvío en caso de desviarse de su programa casado, etc. Esta nueva forma de gestionar la energía eólica ha sido un éxito consecuencia del incentivo económico que percibe el productor frente a la remuneración a tarifa fija. Prueba de ello es que a día de hoy más del 90% de los parques eólicos han optado por vender su energía en el mercado. Como primer paso en el camino de la integración de la energía eólica en la red, Gamesa Energía comenzó en 2003 a trabajar en investigar la posibilidad de realizar modelos de predicción de producción. Para realizar estas tareas de predicción creó una empresa de predicción meteorológica llamada Casandra Energy Services. Como resultado de este proyecto, Casandra ha desarrollado un modelo de predicción meteorológica que a día de hoy comercializa con éxito y que le ha situado en una posición de liderazgo mundial en cuanto a modelos de predicción se refiere. En Mayo de 2004 Gamesa, con el objetivo de garantizar el acceso a mercado de todos los productores eólicos (independientemente de su tamaño), creó la empresa Wind to Market S.A. (W2M), la cual actúa como agente vendedor de dichos productores en el mercado gestionando su energía de forma óptima y garantizando la continuidad de la integración de la energía eólica en la red. A día de hoy W2M gestiona una cartera de 1200 MW eólicos en el mercado.
Error! Style not defined. Error! Style not defined.
4
Tras este período de fuerte crecimiento todavía existen factores que permiten seguir apostando por este tipo de tecnología. En España existe aún un amplio potencial eólico sin explotar, las autoridades siguen preocupadas por desarrollar normativa que favorezca el régimen eólico, el sector industrial es cada vez más maduro y el cumplimiento del protocolo de Kyoto requiere de la instalación de energías renovables que contribuyan a reducir las emisiones de CO2 para el logro de los objetivos asumidos.
Error! Style not defined. Error! Style not defined.
5
1.2 El funcionamiento del Mercado Eléctrico Español 1.2.1 Funcionamiento básico del Mercado Eléctrico El mercado eléctrico, al igual que en otro tipo de mercados, los agentes acuden a comprar o vender el bien que se negocia, en este caso la electricidad. La principal diferencia entre este mercado y cualquier otro es que la electricidad no puede ser almacenada, por lo que en cada instante debe existir un equilibrio entre la generación y la demanda. Esta característica hace que los mercados eléctricos sean especialmente complejos. Sin embargo, como en cualquier tipo de mercado, compradores y vendedores realizan sus ofertas (a modo de subasta) en las que expresan la cantidad de energía y el precio al que están dispuestos a comprar/ vender. Los agentes participantes pueden acudir a varios mercados a negociar la energía. El primero y más importante es el Mercado Diario de producción en el que tradicionalmente se ha negociado alrededor del 90% de la energía. Los agentes pueden enviar sus ofertas en cualquier momento antes de las 10.00h de cada día D para negociar la energía de las veinticuatro horas del día siguiente D+1. Una oferta está compuesta por la cantidad de energía que se vende o compra y el precio mínimo/máximo al que se está dispuesto a vender/comprar. Esta información debe suministrarse a nivel de Unidad de Oferta (UOF). Una UOF suele coincidir con una central o instalación aunque existen excepciones en las que una UOF puede representar a un grupo de instalaciones. Un ejemplo es el caso de las instalaciones de régimen especial las cuales puede integrarse de forma conjunta bajo una única UOF. Las ofertas se envían en formato electrónico al Operador del Mercado (OMEL), el cual es responsable de realizar la gestión económica de los mercados. Una vez cerrado el mercado, OMEL procede a casar el mercado lo que implica los siguientes pasos:
1. Ordenar todas las ofertas de compra y venta recibidas por orden de precio, es decir, las ofertas de venta en sentido creciente de precios y las ofertas de compra en sentido decreciente de precios.
Error! Style not defined. Error! Style not defined.
6
2. Obtener las curvas agregadas de venta y compra. Para cada precio se identifica la cantidad de energía que los compradores están dispuestos a comprar y los vendedores a vender. 3. Encontrar el precio marginal como la intersección entre ambas curvas. Nótese que el punto de intersección de ambas curvas da lugar a “un punto de acuerdo”. Todos los vendedores que ofertaron a precio inferior al de casación es obvio que están dispuestos a vender a un precio mayor al que ofertaron. De igual forma todos los compradores que ofertaron a un precio mayor al marginal también están de acuerdo en comprar a un precio inferior al que dijeron. 4. Identificar las ofertas de venta con precio inferior al de casación y las de compra con precio superior al de casación.
El resultado del mercado debe por tanto identificar el precio del mercado y los programas, esto es, ofertas aceptadas o rechazadas, para cada uno de los participantes. Todos los que resultan casados cobran o pagan el mismo precio (el precio marginal) independientemente del precio de oferta.
Curva de compra
Energía
Curva de venta
Precio de casación
Ventas casadas Compras casadas
Precio
Figura 1.2. Ejemplo de casación para una hora
El mercado eléctrico es un mercado físico. Esto significa que cuando una unidad tiene un programa en el mercado, dicha unidad se compromete a generar o consumir dicha energía y el mercado se compromete a servirle de contraparte, es decir, a consumirle o suministrarle dicha energía. Si una unidad no cumple su compromiso es
Error! Style not defined. Error! Style not defined.
7
penalizada económicamente por el desvío que genera entre su programa casado y su energía realmente producida.
1.2.2 Los contratos bilaterales Además del mercado eléctrico, existe otra modalidad de contratación de energía: los contratos bilaterales. Un contrato bilateral es un acuerdo de compra-venta entre dos partes que fijan el precio y el volumen de la transacción. Esta modalidad de contratación permite reducir riesgos de precios tanto a la parte compradora como a la parte vendedora, ya que el precio del contrato lo deciden libremente. Considérese por ejemplo el caso de una empresa comercializadora de energía eléctrica. Esta empresa debe acudir diariamente al pool con el objetivo de comprar la energía necesaria para satisfacer la demanda de sus clientes. Dado que el precio en el mercado de electricidad puede ser muy volátil, la empresa podría estar interesada en protegerse frente al riesgo de que se dieran precios muy elevados. De forma análoga, una empresa generadora podría estar interesada en realizar una cobertura financiera para estar protegida frente a situaciones de precios bajos. Una forma de lograr estos objetivos es que ambas empresas suscriban un contrato bilateral en el que se acuerda la compra / venta de energía a un precio fijo. Los contratos bilaterales se deben declarar en el mercado ante OMEL antes de las 10.00h del día D-1 si afectan a las conexiones internacionales o antes de las 11.00h del día D-1 si son contratos bilaterales nacionales con el objetivo de que sean considerados efectos técnicos. El horizonte de los bilaterales es el mismo que el del Mercado Diario. La declaración de bilateral únicamente supone informar a los operadores de qué UOF van a generar la energía y cuáles van a consumirla, para que el operador del sistema pueda saber como se van a repartir los flujos de energía por la red. El precio del bilateral no se fija en el mercado, ni el operador del mercado ni el del sistema van a liquidar esa energía, ya que son parte y contraparte las que se liquidarán entre ellas con los términos que hayan establecido.
Error! Style not defined. Error! Style not defined.
8
1.2.3 Los Mercados Intradiarios El Mercado Eléctrico Español cuenta con seis sesiones de Mercado Intradiario. La participación en estas sesiones, a diferencia de las del Mercado Diario, es voluntaria. Todas las sesiones de Mercado Intradiario son posteriores al Mercado Diario y permiten ajustar el programa del mercado anterior con previsiones de generación o consumo más actualizadas. Algunas de las causas por las que los agentes pueden querer variar su previsión de generación o consumo pueden ser las siguientes: avería de una central de producción, averías de la red, una avenida de agua que aumente la producción hidráulica, un cambio de previsión de temperatura respecto a la previsión en mercado diario que afecta al consumo o un cambio en la previsión de producción de parques eólicos. Operativamente, el funcionamiento de un Mercado Intradiario es muy similar al del Mercado Diario. Sin embargo, existen varias diferencias entre el Mercado Diario y los Mercados Intradiarios: •
En el Mercado Intradiario se parte de unos compromisos adquiridos en mercados anteriores. Por tanto, las ofertas que se hacen en el Mercado Intradiario son incrementales respecto al programa anterior.
•
Los Mercados Intradiarios no están permanentemente abiertos para enviar ofertas como el Mercado Diario, sino que existen unos marcos para el envío de ofertas con una hora de inicio y una hora de fin definidas.
•
Cada uno de los seis Intradiarios que se convocan a lo largo del día tienen un horizonte distinto (más corto cuanto mayor sea el número de la sesión del Intradiario).
En la tabla 1.1 se puede ver la distribución de las sesiones del Mercado Intradiario, los distintos horarios de apertura y cierre y los distintos horizontes que cubren.
Error! Style not defined. Error! Style not defined.
9
Sesiones de los 6 Mercados Intradiarios Sesiones
Sesión 1ª
Sesión 2ª
Sesión 3ª
Sesión 4ª
Sesión 5ª
Sesión 6ª
Apertura de
16:00
21:00
01:00
04:00
08:00
12:00
17:45
21:45
01:45
04:45
08:45
12:45
18:30
22:30
02:30
05:30
09:30
13:30
28 horas
24 horas
20 horas
17 horas
13 horas
9 horas
(21-24)
(1-24)
(5-24)
(8-24)
(12-24)
(16-24)
sesión Cierre de sesión Casación Horizonte
de
programación
Tabla 1.1. Los Mercados Intradiarios
1.2.4 Restricciones técnicas En todos los mercados presentados anteriormente la casación realizada sólo considera criterios económicos. Podría suceder que la casación óptima desde el punto de vista económico no sea viable técnicamente (por ejemplo, porque sature una línea de transporte o cause problemas de tensión). El operador del sistema Red Eléctrica Española (REE) es el encargado de velar por la seguridad y estabilidad del sistema. Por este objetivo, REE convoca un mercado específico para ajustar el programa resultado del Mercado Diario para evitar problemas de red. Este mercado se convoca a las 11.00h y se mantiene abierto hasta las 12.30h. En el caso de los Mercados Intradiarios, tras la casación del Intradiario, REE realiza una revisión del estado de la red. En caso de detectar algún problema en la casación, REE retira las casaciones que causen el problema.
Error! Style not defined. Error! Style not defined.
10
1.2.5 Mercados de Servicios Complementarios El operador del sistema debe velar en todo momento por el equilibrio de generación y consumo, por lo que organiza mercados que garantizan la seguridad y estabilidad del sistema. Estos mercados son el mercado de reserva secundaria, terciaria y el mercado de gestión de desvíos. El mercado de reserva secundaria se convoca a las 14.30 h. y en él los agentes ofertan una potencia que están dispuestos a subir/ bajar (si fuera necesario) respecto a su programa para cada hora del día siguiente. La casación de este mercado se realiza de forma similar al resto de mercados, pero teniendo en cuenta que la demanda de reserva la pide REE y es fija. El mercado de gestión de desvíos se convoca entre Intradiarios en función de los desajustes que tenga el sistema en tiempo real, por lo que no tienen ni un horario ni horizontes predeterminados.
Error! Style not defined. Error! Style not defined.
11
1.3 Regulación del sector eólico 1.3.1 Participación de la energía eólica en los mercados de electricidad Una vez presentado de forma general el funcionamiento del mercado, a continuación se presentará cómo funciona la eólica en estos mercados, cuáles son los problemas a los que se enfrenta y cuáles son las ventajas de un productor eólico en el entorno del mercado. Hoy en día, la eólica participa en los mercados Diario e Intradiario de electricidad. Para acudir al resto de mercados, aquellos gestionados por REE, todavía faltan avances tecnológicos en cuanto a los aerogeneradores, telecomunicaciones, etc., en los que se están trabajando y prueba de ello es la creación de un centro de control y un despacho delegado para la eólica en el año 2007.
1.3.1.1 Mercado Diario La participación de un agente eólico en el mercado requiere de la elaboración de ofertas. Esta oferta tiene que constar de una cantidad y de un precio. •
Cantidad: La cantidad a ofertar es el factor crítico de la oferta. Para estimar ese valor, se necesitan modelos de predicción de la producción eólica. Estos modelos tienen que predecir las cantidades que van a ofertar los parques en el mercado para cada hora del día siguiente, 38 horas de antelación para el Mercado Diario, ya que antes de las 10.00h deben enviar la oferta para el día siguiente hora a hora. Por lo tanto, los modelos de predicción de la producción de presentan como herramientas imprescindibles para permitir a los parques acudir al mercado eléctrico. El error de estos modelos es tremendamente importante, ya que los parques serán penalizados por los desvíos que se generen entre su energía casada y la realmente producida.
•
Precio: La eólica oferta a precio cero puesto que el coste marginal es cero y debe asegurarse siempre la venta.
La participación de la eólica en el Mercado Diario ha supuesto varios cambios significativos. En primer lugar ha pasado de ser parte de la demanda a incorporarse a la oferta. Cuando la eólica no participa en el mercado de electricidad vende su producción directamente a la distribuidora la cual acude al mercado a comprar menos
Error! Style not defined. Error! Style not defined.
12
energía, es decir la eólica a tarifa contribuye a una menor demanda en el mercado de producción. Por el contrario, la eólica que participa en mercado se incorpora como cualquier generador que acude a vender y por tanto contribuye a aumentar la oferta. En este caso las distribuidoras deben también aumentar la cantidad que compran en el mercado (ya que no la adquieren directamente de los parques). Otro factor asociado a la incorporación de la eólica al mercado es el aumento de la incertidumbre de mercado. Cuando los agentes acuden al mercado deben hacer sus ofertas sujetos a una nueva fuente de incertidumbre: la cantidad de generación eólica que habrá en el mercado. Asimismo aumenta la diferencia entre el precio medio eólico y el precio medio del sistema. El sector eólico suele percibir un precio inferior al precio del sistema debido a que éste no es sensible a la demanda, es decir, el viento no siempre sopla en horas de punta, llano o valle como lo hace cualquier otra tecnología convencional. Por otro lado la participación masiva de la eólica en el mercado contribuye a disminuir el precio del sistema puesto que incorpora oferta barata al mercado y sustituye a tecnologías más caras.
1.3.1.2 Mercados Intradiarios La eólica puede acudir a estos mercados a modificar su programa basándose en previsiones de su producción más recientes. Sin embargo, acudir a estos mercados supone disponer de nuevas previsiones entre horizontes de 5 a 8 h (por ejemplo el Intradiario 1 se cierra a las 17.45h y la primera hora que se negocia son las 21.00h). En estos horizontes no siempre es posible garantizar una mejora de la previsión. En cambio, en horizontes entre 1 y 5 h los errores de los modelos se reducen drásticamente pero el sector eólico no encuentra mercado donde acudir a comunicarlo. La participación en estos mercados supone a priori una gestión eficiente en los mismos y la prestación de un servicio de veinticuatro horas. La gestión en los Mercados Intradiarios es más compleja que en el Diario puesto que las fuentes de incertidumbre son mayores. Existe una incertidumbre de volumen, ya que es necesario garantizar que las nuevas previsiones mejoran las previsiones del Mercado Diario. También existe una incertidumbre de precio al ser necesario asegurar que el “ahorro por disminuir la penalización del desvío” compensa la venta de esa energía al nuevo
Error! Style not defined. Error! Style not defined.
13
precio resultante del Mercado Intradiario. Y por último hay una incertidumbre de liquidez, ya que los Mercados Intradiarios suelen ser en general pocos líquidos.
1.3.1.3 Restricciones técnicas, reserva secundaria y contratos bilaterales La eólica que ha ofertado a cero en el mercado queda automáticamente situada en última posición en caso de ser necesario un reajuste de programas para retirar producción. Operativamente REE obliga a enviar oferta al mercado de restricciones por lo que, si bien no tiene un efecto directo ni económico ni técnico, sí que complica la operación diaria. En cuanto a la reserva secundaria, la eólica no participa en ella. La participación en este mercado supone una serie de requisitos técnicos y tiempos de respuestas en los que se está trabajando para permitir que en el futuro pueda incorporase a este tipo de mercados. Desde el punto de vista económico, en un sistema con un gran porcentaje de potencia eólica instalada es imprescindible disponer de buenos sistemas de predicción que reduzcan la incertidumbre sobre la generación realmente disponible y reduzcan los costes del sistema. En caso contrario, el operador del sistema ante situaciones de incertidumbre se verá obligado a convocar mayores cantidades de reserva de secundaria para garantizar la seguridad del sistema con el consiguiente aumento de coste para el sistema. La eólica puede firmar contratos bilaterales aunque no es habitual que los contrate puesto que no encuentra incentivo económico en esta opción.
1.3.2 Remuneración económica de los parques eólicos Como se ha comentado anteriormente, el RD 436 ofrece dos opciones de venta a los productores eólicos, acudir al Mercado Eléctrico o vender su energía a una tarifa fija. Según sea la opción elegida, los productores percibirán diferentes ingresos por la
Error! Style not defined. Error! Style not defined.
14
energía entregada a ala red. Una vez escogida una opción hay que permanecer en ese régimen retributivo durante al menos un año. En primer lugar se presentan los ingresos y los costes de la opción de acudir a vender la energía al mercado. Los ingresos de los parques que elijan esta opción se rigen por la siguiente fórmula: IngresosM= Producción + Prima + Incentivo + GarantíadePotencia + EnergíaQ
(1.1)
Donde: •
Producción: Este término representa los ingresos que el parque obtiene por vender su energía directamente en el pool. Dependerá por tanto del precio horario del mercado en el que se vende (Mercado Diario o Intradiario), y la cantidad de energía vendida en el mercado. Si un parque tiene una previsión para un Intradiario menor que la que casó en el Mercado Diario acudirá al Intradiario a “recomprar” la energía. Se supone, por ejemplo, un productor que vende 10 MW en el pool en una hora donde el precio de la energía es 53.7 € / MWh. Sus ingresos por el término descrito serían de 537 €.
•
Prima: La energía eólica está incentivada desde el gobierno para fomentar este tipo de tecnologías de origen renovable. Como mecanismo de apoyo a la energía eólica el RD 436 establece una prima adicional a los productores eólicos que consiste en unos ingresos correspondientes al 40% de la TMR (Tarifa media regulada) por MWh producido. La TMR es un valor fijo anual, 76.6 € / MWh en 2006 y 73.3 € /MWh en 2005. Siguiendo el ejemplo anterior, el productor eólico percibiría por este término en esa hora 306.4 €.
•
Incentivo: El RD 436 nació con el objetivo fundamental de incentivar la participación de la energía eólica en el mercado. Con este objetivo, y con las estimaciones del precio del pool que se manejaban en 2004, el RD 436 estableció un incentivo económico adicional que permitiera a los productores eólicos asumir el riesgo de participación en le mercado. Este incentivo se fijó en un 10% de la TMR por cada MWh producido en la opción de venta al mercado. En le ejemplo, el productor percibiría por el término incentivo 76.6 €.
Error! Style not defined. Error! Style not defined.
•
15
Garantía de Potencia: Uno de los problemas que hoy en día tiene que afrontar el sistema eléctrico español es el de seguir aumentando la potencia eléctrica instalada para poder afrontar el crecimiento de la demanda energética. Por ello el sistema regulatorio paga una cantidad en función de la potencia disponible que tengan las unidades generadoras. Aunque este dato es provisional, hoy en día, se pagan 4.8 € por cada MWh producido por la energía eólica. En le ejemplo, el término garantía de potencia supondría para el productor 48 € por su producción en esa hora.
•
EnergíaQ: Este término está relacionado con cumplir unos determinados criterios de energía reactiva. Según sea el cosφ del parque, se puede llegar a cobrar la producción eólica horaria del parque por hasta el 6% de la TMR, aunque normalmente este dato está en torno al 4.3% de la TMR. En el ejemplo este término supondría 3.3 € en esa hora.
Como se ha comentado cuando un parque acude al mercado debe comportarse como cualquier otro tipo de tecnología. En particular cualquier desvío entre su programa casado y la energía realmente entregada a la red será penalizado económicamente. Si bien estos desvíos pueden no ser relevantes para las energías convencionales que pueden programar con bastante certidumbre su producción, en el caso de un productor eólico los desvíos generados pueden llegar a suponer un porcentaje importante de su facturación. Los costes de los parques que acuden al mercado se rigen por la siguiente fórmula: CostesM = CosteDesvíoHorario·|desvío|+CurvadeCarga
(1.2)
Donde: •
Desvío: Es el resultado del producto del coste del desvío horario por el valor absoluto del desvío de la producción del parque, esto es, la diferencia entre la producción prevista y la realmente producida. A día de hoy, el coste del desvío no se liquida hasta pasados casi dos años puesto que depende de medidas de contadores que el operador del sistema no dispone hasta pasado ese período. Provisionalmente se liquida al 26.95 % del precio medio diario. Esta situación cambiará próximamente con la entrada en vigor del P.O. (Procedimiento de operación) 14.2 de REE, que establece una nueva
Error! Style not defined. Error! Style not defined.
16
metodología del pago del desvío tanto en volumen como en precio con la aplicación de los perímetros de equilibrio. •
Curva de Carga: Como consecuencia de la aleatoriedad de la producción eólica los productores deben afrontar unos ingresos inferiores a los del resto del sistema puesto que no siempre pueden seguir la demanda, esto es, generar más en horas pico y menos en horas valle. Este coste suele originar un coste medio de 2 € / MWh a cada parque eólico.
Por otro lado, y para establecer una comparativa, se procede ahora a estudiar el régimen retributivo de los parques que prefieran vender su energía a una tarifa fija. Los ingresos de los parques que se queden a tarifa se rigen por la siguiente fórmula: IngresosT = Producción + EnergíaQ
(1.3)
Donde: •
Producción: Este término refleja el producto de la producción eólica horaria del parque por el 90% de la TMR. En ejemplo anterior donde el productor generaba 10 MW en una hora, acogiéndose a tarifa fija, percibiría por este término 689.4 €.
•
EnergíaQ: Este término es el mismo que en los ingresos de los parques que acuden al mercado.
Por otro lado, sus costes son nulos, pero a partir de 2007 también se verán obligados a verter una predicción de la energía que van a producir, ya que tendrán que pagar su desvío por el 10% de la TMR. Ese desvío no se pagará de la misma forma que el de los parques que acuden a mercado, ya que será menos severo, al empezar a ser tenido en cuenta a partir de una franja de desvío del 20%. La comparativa entre ambas opciones económicas se releja en la figura 1.3:
Error! Style not defined. Error! Style not defined.
17
Comparación de opciones retributivas año 2005:
MERCADO MERCADO
TARIFA TARIFA
4,8
65,8
65,8
89
36.65
€/MWh
(0) (2.5)
ta l To
os D es ví
rif Ta
To ta l
a ar g C a ur v C
De sv ío s
Po te nc ia de
a+ In ce nt iv o
ar an tía
G
Pr im
Po ol
53,7
a
€/MWh
(3)
Figura 1.3. Comparación de opciones retributivas
La opción de acudir al mercado es una opción menos conservadora que quedarse a tarifa. Vender la energía en los mercados de electricidad tiene unos resultados económicos más favorables que permanecer con una tarifa fija, a partir de un precio base del pool de 30 € / MWh. Como el precio del pool en los dos últimos años ha estado entre 40 y 60 € / MWh, acudir al mercado ha sido la mejor opción económica. Como ya se mencionaba, el 92% de los parques eólicos acuden hoy en día al Mercado Eléctrico en España.
Error! Style not defined. Error! Style not defined.
18
1.4 Objetivos Como se ha comentado, tradicionalmente Gamesa Energía ha optado por desarrollar modelos meteorológicos de predicción, basados en las ecuaciones diferenciales que rigen la dinámica de la atmósfera. Casandra Energy Sevices cuenta hoy en día con dos modelos de predicción, Casandra y Apolo. En el mercado existen otros modelos basados en técnicas y planteamientos diferentes a los utilizados en Casandra. El objetivo principal de este proyecto, financiado por Gamesa, es investigar estos modelos nuevos para Casandra y estudiar posibles comparaciones con los modelos que esta empresa utiliza actualmente. En el proyecto se va a estudiar, desarrollar e implementar en una herramienta informática, un modelo de predicción de la producción eólica. Para ello se realizará una revisión del estado del arte de los modelos de predicción. En este proyecto se propone utilizar técnicas de predicción basadas en el método de los análogos y en el CBR (case-based reasoning). La gran dificultad de la predicción de la producción eólica es que la producción es directamente proporcional al cubo del módulo de la velocidad del viento, con lo que ligeras desviaciones en la velocidad provocan grandes desvíos en la producción. Este método es utilizado en la predicción meteorológica de fenómenos atmosféricos, como por ejemplo la de la precipitación en el Instituto Nacional de Meteorología (INM), pero no se utiliza en Casandra para la predicción de la producción. Los resultados que se obtengan con este método serán simulados en el Mercado Eléctrico, comparando con los resultados que proporcionan otros métodos existentes, lo que permitirá obtener conclusiones acerca de los problemas que soluciona y lo que aporta el método del razonamiento basado en casos a la predicción de la producción eólica.
2 Modelos de predicción de producción
Error! Style not defined. Error! Style not defined.
2
20
Modelos de predicción de producción 2.1 Introducción A comienzos del siglo pasado la predicción meteorológica se comienza a abordar de
forma numérica, mediante sistemas de ecuaciones diferenciales en derivadas parciales en lo que se conoce como modelos de circulación atmosférica o modelos físicos. Estos modelos parten de unas condiciones iniciales conocidas y utilizan un conjunto de rejillas espaciales sobre las que se aplica el modelo. Debido al gran cálculo computacional requerido para la resolución de los problemas de este tipo, durante los años 50 con el desarrollo de los ordenadores, la predicción numérica disfruta de una evolución vertiginosa. Las salidas de la predicción numérica proporcionan el estado futuro de la atmósfera, con el cual se obtienen predicciones regionales y locales. Para el pronóstico de meteoros locales también se utilizan técnicas estadísticas mediante los registros históricos de los fenómenos meteorológicos a predecir. Ambos métodos, que a continuación serán descritos en mayor profundidad, tienen sus limitaciones. La predicción numérica tiene el inconveniente de que debido a su resolución no permite obtener pronósticos locales precisos, mientras que la predicción estadística carece de información suficiente acerca de los fenómenos físicos que suceden, y resulta ineficiente en la predicción, sobretodo de las variables meteorológicas íntimamente ligadas con la humedad y la precipitación [BENISTON (1998), AYUSO (1994)]. La predicción meteorológica tiene un gran interés económico y social, no sólo en el campo de la energía eólica, que es el que atañe a este proyecto, sino también, por ejemplo, en cuanto a la mejora y cuidado de cultivos, previsiones de turismo y hasta para evitar catástrofes naturales. Debido a este interés descrito y la cada vez mayor disponibilidad de datos procedentes de observaciones, en la actualidad se desarrollan modelos cada vez más sofisticados de la predicción local, lo que se conoce en la literatura científica como “downscaling”, que lo que trata conseguir es una disminución de la escala, o lo que es lo mismo un aumento de la resolución [COFIÑO (2003), GUTIÉRREZ (2004)]. Las últimas tendencias en el mundo de la predicción meteorológica son los métodos híbridos de predicción local, en los que se mezclan los modelos numéricos y los
Error! Style not defined. Error! Style not defined.
21
estadísticos, intentando siempre conseguir un compromiso entre el ingenio, el coste económico y el coste computacional del modelo de predicción [BERGMAN (1985), MURPHY (1993)]. Estas tendencias no sólo han sido relevantes hasta la fecha sino que parece que lo seguirán siendo en un futuro próximo, y como muestra, el proyecto integrado ENSEMBLES (Ensemble-based Predictions of Climate Changes and their Impacts) del VI Programa Marco de la Unión Europea (2005-2008). Los modelos de predicción se pueden clasificar según su horizonte y su técnica de predicción (Tabla 2.1):
Modelo
Corto Plazo
Horizonte
Técnica
horas
Estadísticas
Medio Plazo
de 1 a 3 días
Híbridas
Largo Plazo
más de 3 días
Físicas
Descripción
Series temporales y redes neuronales Mezclan técnicas estadísticas y físicas Ecuaciones que rigen la dinámica de la atmósfera
Tabla 2.1. Los modelos de predicción
El tipo de predicción en la que este proyecto se va enfocar es la predicción a medio y corto plazo, debido a que ésos son los márgenes en los que se realizan las ofertas al Mercado Diario y a los Intradiarios respectivamente. La empresa Casandra Energy Services ha desarrollado el modelo Casandra basado en una técnica híbrida para la predicción en el medio plazo y un modelo estadístico denominado Apolo para el corto plazo. A continuación se describirán con más detalle las diferentes técnicas comentadas (numéricas, estadísticas e híbridas).
Error! Style not defined. Error! Style not defined.
22
2.2 Técnicas Numéricas Las técnicas numéricas suelen utilizarse bajo un enfoque de predicción meteorológica de largo plazo. Como se ha comentado están basadas e el planteamiento de un conjunto de ecuaciones diferenciales en derivadas parciales que describen la dinámica de la atmósfera. La atmósfera no es sino una mezcla de gases y agua en sus diferentes estados, calentada por el Sol y sometida a los campos gravitatorios propios de la Tierra, con lo cual está sujeta a las leyes clásicas de la mecánica de fluidos. La atmósfera debe cumplir tanto las ecuaciones de conservación de masa, cantidad de movimiento (ley de Newton) y energía (1ª ley de la Termodinámica), así como la ecuación de estado de los gases. Mediante la formulación diferencial se plantean las ecuaciones que relacionan las derivadas totales de las magnitudes físicas en el tiempo, que se descomponen en términos locales y advectivo. Si se considera un sistema cartesiano de referencia (x, y, z), el campo de velocidades v = (u, v, w) y f = f (x, y, z, t), se obtiene:
df ∂f ∂f dx ∂f dy ∂f dz + + = + dt ∂t ∂x dt ∂y dt ∂z dt donde ∂f dx ∂f dy ∂f dz r r + + = v ⋅ ∇f ∂x dt ∂y dt ∂z dt (2.1)
La derivada total o sustancial en el tiempo de una función viene dada por la derivada local en el tiempo más los cambios debidos a la advección.
Gracias a la formulación diferencial se puede afrontar la descripción de las ecuaciones señaladas. En primer lugar está la atmósfera debe cumplir la ecuación de conservación de masa, según la cual la variación total de la masa en un diferencial de aire es nula. Por lo tanto, y considerando un volumen diferencial:
1 dm =0 m dt
(2.2)
m = (∆x ⋅ ∆y ⋅ ∆z ) ρ
(2.3)
Error! Style not defined. Error! Style not defined.
23
Siendo ρ la densidad del aire. Sustituyendo ahora en la ecuación (2.1) se obtiene la ecuación de conservación de la masa:
r ∂ρ r = −∇ ⋅ ( ρ ⋅ v ) ∂t
(2.4)
A continuación está la ecuación de conservación de la cantidad de movimiento, o lo que es lo mismo la ley de Newton. Las fuerzas que originan la aceleración en una unidad de masa de aire son el gradiente de presión, la gravedad, el rozamiento y la fuerza de Coriolis:
r r r r dv ∇p r =− − ∇φ + Froz − 2Ω × v dt ρ
(2.5)
Siguiendo con la ecuación de conservación de la energía, la atmósfera recibe calor (Q) del Sol, el cual se emplea en variar su densidad y/o su temperatura, esto es, producir un trabajo de expansión o aumentar la energía interna. Recordando que la variación de la energía interna es el producto del calor específico a volumen constante (Cv) y la variación de temperatura por unidad de tiempo, y que la relación entre el calor específico a volumen constante y el calor específico a presión constante es Cv + Cp = R, donde R es la constante universal de los gases ideales, se obtiene:
Q = Cp
dT 1 dp − dt ρ dt
(2.6)
A continuación se plantea la ecuación de estado de los gases ideales:
p = ρ ⋅ R ⋅T
(2.7)
Por último en la atmósfera hay que tener en cuenta la ecuación de conservación de algún elemento dentro de la misma como agua líquida, ozono, vapor de agua, etc. Se escoge, por ejemplo, la ecuación de conservación de vapor de agua. Esta ecuación dice que la proporción en masa de vapor de agua (H) en un diferencial de aire se conserva, excepto si se enfrenta a una evaporación (E) o una condensación (C), que se comportan como fuentes y sumideros de vapor de agua respectivamente.
dH = E −C dt
(2.8)
Error! Style not defined. Error! Style not defined.
24
Con lo visto hasta ahora se tiene un sistema de siete ecuaciones (tres de ellas se resumen en una vectorial) y siete incógnitas (v = (u, v, w), ρ, p y H). Estas ecuaciones son conocidas con el nombre de ecuaciones primitivas:
r ∂ρ r = −∇ ⋅ ( ρ ⋅ v ) ∂t
r r r r dv ∇p r =− − ∇φ + Froz − 2Ω × v dt ρ
Q = Cp
dT 1 dp − dt ρ dt
(2.9)
(2.10)
(2.11)
p = ρ ⋅ R ⋅T
(2.12)
dH = E −C dt
(2.13)
Para mayor detalle en las demostraciones y en las descripciones físicas de las leyes que rigen el movimiento de la atmósfera se recomienda ver, WHITE (1988), HOLTON (1992), y KALNAY (2003). A la hora de la resolución de estas ecuaciones se recurren a aproximaciones que simplifican la resolución y filtrado de soluciones triviales, ya que las ecuaciones primitivas son realmente complejas debido a su no linealidad y a la necesidad de tener en cuenta intercambios energéticos tipo radiación, calor latente, etc. La precisión del modelo reside en el tamaño de la rejilla, aunque hay que alcanzar un compromiso entre precisión y coste computacional ya que cada vez que se reduce el tamaño de la rejilla a la mitad, el coste computacional se dispara con un factor de 24. En el presente las mejoras en el campo de la predicción numérica se están obteniendo gracias al gran desarrollo de la potencia de los ordenadores y al aumento y la mejora de la disponibilidad de datos en lugares donde en el pasado eran muy deficientes. El futuro de la predicción numérica reside en modelos que acoplen de manera más íntima las ecuaciones de la atmósfera y la hidrología, y el desarrollo de la predicción numérica a otros campos como el transporte de contaminantes o la prevención de desastres naturales [COFIÑO (2003)].
Error! Style not defined. Error! Style not defined.
25
2.3 Técnicas Estadísticas 2.3.1 Series Temporales Las técnicas estadísticas que se utilizan para la predicción de variables meteorológicas locales son las series temporales, las cuales se basan en registros históricos de los fenómenos que se quieren predecir. El modelo matemático para una serie temporal es el concepto de proceso estocástico. Se supone que el valor observado de la serie en el instante t es una extracción al azar de una variable aleatoria definida en dicho instante. En consecuencia, una serie de n datos será una muestra de un vector de n variables aleatorias ordenadas en el tiempo (z1, z2,…, zt,…, zn). Se denomina proceso estocástico al conjunto de estas variables {zt}, t = 1,…, n, y la serie observada se considera una realización o trayectoria del proceso. [PEÑA (1987)]. En la figura 2.1 se presenta de forma gráfica el concepto de proceso estocástico así como un conjunto de realizaciones del proceso. En ella puede verse cómo en cada etapa temporal, las observaciones se generan de acuerdo a una función de densidad particular.
fT
s
f2
f1
t = 1
t = 2
t =T
Figura 2.1. Proceso estocástico
Se dice que se conoce la estructura probabilística de un proceso estocástico cuando se conoce la distribución conjunta de las n variables aleatorias {zt}. Esta distribución determina la distribución de cualquier subconjunto de variables y, en particular, las distribuciones marginales para cada una de ellas. La determinación práctica de la distribución conjunta del proceso requiere observar un gran número de realizaciones. Esta estimación se simplifica mucho cuando podamos suponer que la distribución conjunta es normal multivariante, ya que, entonces, quedará determinada por el vector de medias y la matriz de varianzas y covarianzas entre las variables. Se conoce función
Error! Style not defined. Error! Style not defined.
26
de medias del proceso a una función que proporciona las medias de las distribuciones marginales zt para cada instante. Un caso particular importante es que todas las variables tengan la misma media; es decir, la función de medias es constante. Entonces las realizaciones del proceso no mostrarán tendencia creciente o decreciente, y se dirá que le proceso es estable en la media. Si, por el contrario, las medias crecen con le tiempo, las observaciones en distintos momentos mostrarán esa tendencia. La función de varianzas del proceso proporciona las varianzas en cada instante temporal. Se dice que un proceso es estable en la varianza si ésta es constante con el tiempo. La estructura de dependencia lineal entre las variables aleatorias del proceso se representa por las funciones de covarianza y correlación. En general, estas dos funciones dependen de dos parámetros, el instante inicial y el intervalo entre observaciones [BRILLINGER (1975)]. Se dice que un proceso estocástico (serie temporal) es estacionario en sentido débil si existen y son estables la media, la varianza y las covarianzas.
Figura 2.2. Proceso estocástico en sentido débil
La estacionaridad débil no garantiza la estabilidad completa del proceso. Por ejemplo la distribución de las variables zt pude estar cambiando con el tiempo. Sin embargo, si se supone que estas variables tienen conjuntamente una distribución normal n-dimensional, como ésta quede determinada por las medias, las varianzas y las covarianzas, todas las distribuciones marginales serán idénticas. Se dice entonces
Error! Style not defined. Error! Style not defined.
27
que el proceso es estacionario en sentido estricto. En las figuras 2.3 y 2.4 se muestran dos procesos no estacionarios por diferentes razones.
Figura 2.3. Proceso no estacionario (la media varía con el tiempo)
Figura 2.4. Proceso no estacionario (la varianza varía con el tiempo)
En ocasiones los procesos presentan movimientos irregulares. Éstos representan variaciones esporádicas de la serie que no están recogidas en ninguna de las componentes anteriores. Este movimiento irregular tiene un carácter residual, que se descompone en dos partes: aleatoria (representa pequeños efectos accidentales) y errática (representa efectos no siempre previsibles). Generalmente se considera que la
Error! Style not defined. Error! Style not defined.
28
parte residual está únicamente formada por la componente aleatoria que se denota con εn, que representa una serie que recoge los diferentes impactos producidos por el azar que en media se compensan, son independientes y muestran una varianza constante en el tiempo denotada como σ2. Esta componente aleatoria se va a representar por una serie {εn}, que al satisfacer las características anteriores se denomina proceso o serie temporal de ruido blanco. Concluyendo, un proceso de ruido blanco constituye una serie temporal que es completamente impredecible. Una clase muy
importante de procesos estacionarios
son
los procesos
autrorregresivos, que resultan de imponer una dependencia lineal entre las variables del proceso, similar a la de una ecuación de regresión. Un proceso denominado autorregresivo de orden p, notado AR(p):
x n+1 = α 1 x n + α 2 x n −1 + α 3 x n− 2 + ... + α p x n− p +1 + ε n
(2.14)
El conjunto {α1, α2, α3,…. αp} se considera los parámetros del modelo. Estos parámetros se pueden hallar con las ecuaciones de Yule-Walker: p
ρ (k ) = ∑ α i ⋅ ρ (k − i )
(2.15)
i =1
Donde ρ(k) es la función de autocorrelación. También existen variantes de este modelo expuesto como son: •
Modelos de Media Móvil (MM o MA): proporcionan un método simple para alisar los datos históricos. Una media móvil es una media aritmética que toma un valor para cada instante de tiempo. En el cálculo de la media móvil no entran todas las observaciones disponibles, e incorporan efectos de retraso en el término aleatorio.
•
Modelos híbridos entre el autorregresivo y el de Media Móvil (ARMA)
•
Modelos ARIMA: proporcionan la posibilidad de tratar series no estacionarias (las que tienen tendencia a aumentar o disminuir el valor de la serie en promedio) en la media.
•
Modelos SARIMA: incluyen componentes periódicas estacionales.
Error! Style not defined. Error! Style not defined.
29
Surge un problema en todos estos modelos, y es que gran parte de las variables meteorológicas siguen una distribución normal en el largo plazo (horizonte donde han tenido éxito estos modelos), pero no en el medio y corto plazo, horizontes que incumben a la predicción de la producción eólica para acudir al Mercado Eléctrico. Para solucionar este problema se ha recurrido a las redes neuronales artificiales (Artificial Neural Networks) que permiten la predicción para el corto plazo. Para más detalle sobre series temporales se recomienda CHATFIELD (2003).
2.3.2 Redes Neuronales Artificiales Las Redes Neuronales Artificiales (RNA) surgieron de la observación del cerebro y de su comparación con la forma de trabajar de los ordenadores digitales. Las neuronas biológicas son unas seis órdenes de magnitud más lentas que las puertas lógicas del silicio, ofreciendo tiempos de respuesta del orden del milisegundo frente a los vertiginosos tiempos de respuesta del orden del nanosegundo que tienen ciertos dispositivos digitales actuales [MUÑOZ (1996)]. Una red neuronal es un sistema compuesto por un elevado número de unidades básicas, agrupadas en capas y que se encuentran altamente interconectadas. A través de estas interconexiones cada neurona recibe una serie de entradas y emite una salida que viene dada por dos funciones: •
Función de propagación o excitación que depende de la suma de las entradas multiplicadas cada una por sus pesos respectivos. Si el peso es positivo, esa conexión se denomina excitatoria, y si por el contrario es negativo, se denomina como inhibitoria.
•
Función de activación que modifica a la anterior. Puede no existir.
En el siguiente dibujo (Fig. 2.5) se aprecia el esquema general de una red neuronal con su función de propagación:
Error! Style not defined. Error! Style not defined.
30
Figura 2.5. Esquema general del funcionamiento de una red neuronal artificial
Las redes neuronales artificiales parten de un conjunto de datos de entrada lo suficientemente significativo para que la red aprenda automáticamente las propiedades deseadas. El diseño de la red está orientado hacia la selección del modelo de red, el número de entradas a incorporar y el preprocesamiento de la información que formará el conjunto de entrenamiento. El proceso por el cual los parámetros de la red se adecuan a la resolución de cada problema se denomina entrenamiento. Estas redes intentan simular la funcionalidad de las verdaderas redes neuronales biológicas. Esta simulación se lleva a cabo mediante un mecanismo de pesos que pretende el modelado de las conexiones sinápticas biológicas. Una vez que la red neuronal ya está entrenada, el conjunto de pesos se denomina “conocimiento” de esa red neuronal artificial y tiene la propiedad de resolver el problema para el que dicha red ha sido entrenada. Las RNA deben su capacidad de procesamiento de información a su estructura distribuida y paralela (la información queda almacenada en los elementos de proceso de la red de forma no centralizada) y a su capacidad de aprendizaje y por tanto de generalización (en contraposición con la memorización). Estas dos capacidades de procesamiento hacen que las RNA sean capaces de resolver problemas muy complejos (tanto por su tamaño como por su estructura) que hasta el momento no habían quedado resueltos de forma satisfactoria. De todas formas, las RNA no son una nueva metodología de ingeniería para la resolución global de problemas. Son herramientas de tratamiento de información que pueden integrarse fácilmente en arquitecturas modulares, para resolver de forma eficaz aquellas subtareas precisas del problema global que mejor se adaptan a sus capacidades. Entre estas subtareas cabe citar
Error! Style not defined. Error! Style not defined.
31
procedimientos de reconocimiento de patrones, de aproximación funcional y de memorias asociativas. Una de las propiedades de las RNA que suele ser más útiles es su no linealidad, ya que las neuronas son elementos de proceso generalmente no lineales. La interconexión de estos elementos genera estructuras de transformación de datos donde este carácter no lineal queda distribuido a lo largo y ancho de la red. Esta característica permite modelar procesos intrínsecamente no lineales pero complica también los métodos de análisis de las estructuras resultantes, impidiendo la aplicación de técnicas de análisis bien establecidas como son las de los sistemas lineales. Otra de sus características más importantes es su adaptabilidad, ya que por definición son estructuras adaptativas capaces de ajustar sus pesos, y por tanto su función se transferencia, a cambios de entorno. Esta característica las hace especialmente útiles en el tratamiento de procesos no estacionarios, donde pueden diseñarse estrategias de aprendizaje en tiempo real para que el modelo conexionista se vaya adaptando de forma continua a los cambios del proceso en cuestión. También goza de más ventajas como su respuesta evidencial (rechazando patrones de entrada), y su tolerancia frente a fallos (respondiendo de forma no catastrófica aunque la estructura esté dañada). Para mayor información sobre redes neuronales artificiales se recomienda FURUNDZIC (1998) y MUÑOZ (1995).
Error! Style not defined. Error! Style not defined.
32
2.4 Técnicas Híbridas 2.4.1 Introducción Las técnicas híbridas mezclan el conocimiento sobre la dinámica de la atmósfera contenido en los modelos numéricos de circulación atmosférica con las distintas técnicas de predicción que se aplican directamente a observaciones para obtener tendencias de comportamiento y futuras ocurrencias de eventos. Estas técnicas híbridas son conocidas como downscaling estadístico. Esto es, en vez de aumentar la resolución de la rejilla sobre la que se realiza la predicción (técnica utilizada en los modelos atmosféricos), se obtienen predicciones sobre aquellas regiones sobre las que se disponga de observaciones. Las dos principales técnicas híbridas son las técnicas globales lineales y el método de los análogos o CBR. Las técnicas globales lineales utilizan la relación entre los históricos del punto de estudio con las salidas de un modelo numérico. Se puede llegar a entrenar un modelo de regresión para estimar la relación lineal entre los datos históricos y la salida buscada, siendo el patrón uno predicho por un modelo atmosférico. Las limitaciones de este modelo residen en su linealidad, lo cual ha sido recientemente solventado mediante el uso de modelos no lineales. El carácter global de estos modelos reside en que se utiliza un único modelo para analizar todas las situaciones posibles. A continuación se van a describir el método de los análogos y el método de CBR, que aunque se basan en la misma idea general, tienen algunas diferencias notables.
2.4.2 Método de los Análogos El método de los análogos introducido por Lorenz en 1969 (LORENZ, 1969) en el marco de la predicción, es una visión particular de la una técnica más general conocida como técnica de los vecinos más próximos (Nearest Neighbours, NN). Los métodos de los análogos se basan en la hipótesis de que configuraciones meteorológicas similares dan lugar a fenómenos meteorológicos similares. Su aplicación se lleva a cabo mediante la elección de una medida de similitud óptima
Error! Style not defined. Error! Style not defined.
33
entre la situación actual y la más próxima (o grupo de situaciones más parecidas) seleccionadas de entre la base de información meteorológica disponible. El método analógico es particularmente útil para predicciones de tipo probabilista y cuenta con la ventaja sobre las técnicas estadísticas clásicas de análisis multivariante de ser capaz de captar bien las relaciones no lineales de forma muy robusta, así como de estar muy bien adaptado al tratamiento de campos meteorológicos. Una clave a la hora de aplicar el método es la forma matemática en la que se define la similitud entre dos configuraciones meteorológicas. La optimización de esta medida de similitud es un proceso complejo que incluye la selección de variables predictoras más eficaz y la formulación de la medida que extraiga la máxima información posible de esos campos meteorológicos. En principio pueden ser empleados todos los campos que nos otorguen información sobre la situación a predecir, pero hay que buscar un compromiso entre la aplicación operativa del método y la precisión a alcanzar. En la literatura se encuentran distintas formas de realizar la predicción una vez que ya se tienen seleccionados los análogos. Un hecho a tener en cuenta es que no todos los análogos seleccionados se parecen de la misma manera al día objeto de estudio. Es decir, no todas las distancias entre el día objeto y los análogos son iguales con lo que se suelen introducir unos índices de ponderación inversamente proporcionales a la distancia, para dar más importancia a los análogos seleccionados que más se parecen al día problema. El método de los análogos puede ser considerado un método puramente estadístico, pero dependiendo si los datos de entrada al modelo han sido dotados o no de la información que otorga la dinámica de la atmósfera puede convertirse en un modelo híbrido. Se ha demostrado que el método de los análogos se comporta tan bien como otros métodos más complejos de predicción, indicando que este método, también conocido como método del “hombre pobre”, es una alternativa eficiente para resolver diferentes métodos de downscaling (VON STORCH, 1999).
Error! Style not defined. Error! Style not defined.
34
2.4.3 CBR (Case-Based Reasoning) El CBR es una aproximación diferente al método de los análogos. Se empezó a desarrollar en los Estados Unidos a finales de los años 80, y durante los años 90 gozó de un gran desarrollo en Europa. De hecho, en noviembre de 1993 tuvo lugar el “First European Workshop on Case-Based Reasoning” en Alemania (EWCBR, 1993). El objetivo del CBR es la resolución de un nuevo problema encontrando un problema similar pasado reutilizando la información de aquel problema. Si el problema es solucionado de manera exitosa, es guardado para solucionar problemas similares en el futuro. Si por el contrario, no soluciona el problema, el error es identificado y almacenado para evitar que se pueda repetir en el futuro. Este método es utilizado constantemente en la vida diaria para resolver problemas de ámbito cotidiano. En el entorno del razonamiento basado en casos, un caso representa normalmente a una situación problema. Para hacer referencia a una situación previa de la que se dispone de experiencia y la cual va a servir para solucionar problemas futuros, se utilizan los términos caso pasado, caso histórico o caso almacenado. Estos métodos necesitan de procesos eficientes de extracción e indexado de casos históricos. El CBR es un proceso cíclico para solucionar un problema y aprender de la experiencia que dicho proceso proporciona. En la siguiente figura (Fig. 2.6) se representa el ciclo del algoritmo del CBR:
Error! Style not defined. Error! Style not defined.
35
Problema
Nuevo Caso
SELECCIONAR
Nuevo Caso Caso Seleccionado
Nuevo Nuevo Nuevo Casos Caso Caso Caso Previos
Caso Aprendido
REUTILIZAR Conocimiento APRENDIZAJE Caso Comprobado
REVISAR
Solución Confirmada
Caso Solucionado Solución Sugerida
Figura 2.6. Esquema de funcionamiento del CBR
Como se aprecia en el diagrama de flujo del CBR hay cuatro grandes fases en el desarrollo del algoritmo. Estas cuatros fases son seleccionar (retrieve), reutilizar (reuse), revisar (revise) y aprendizaje (retain). El primer paso es seleccionar de entre todos los casos de la base de datos, el caso (o casos) más parecido, en lo que se conoce como “retrieve”. Para ello se extraen características relevantes del caso problema, se buscan dichas características en los casos pasados, calculando la similitud entre ambos, y se selecciona un caso de entre todos los pasados. El siguiente paso es reutilizar el caso pasado seleccionado para dar una solución del caso problema. Para ello se adapta la solución del caso pasado al caso actual. Estas dos primeras fases son muy similares al método de los análogos, descrito en el apartado anterior. En este momento ya se obtiene una posible solución (solución sugerida, en la fig. 2.2), y se procede al paso de la revisión, en el cual se evalúa la solución en un modelo o en el mundo real, y se observa el éxito o el fracaso del proceso. A continuación se produce la gran diferencia con el caso de los análogos. El último paso, conocido como aprendizaje, selecciona qué información guardar y cómo guardarla en la base de casos pasados, para que tanto si la selección y la solución
Error! Style not defined. Error! Style not defined.
36
fueron exitosas como si se produjo un error en el proceso, favorezcan la probabilidad de que en futuras ocasiones el proceso se resuelva de manera exitosa. El método de los análogos no reutiliza la información que le puede otorgar el hecho de seleccionar casos y proponer soluciones. Para más información sobre CBR se recomienda PLAZA (1994) y KOLODNER (1992), y sobre diferencias entre el método de los análogos y el método del razonamiento basado en casos, BURSTEIN (1989).
Error! Style not defined. Error! Style not defined.
37
2.5 Modelos de predicción de W2M 2.5.1 Casandra Casandra Energy Services utiliza hoy en día un modelo de predicción de la producción eólica para poder ofertar en el Mercado Eléctrico que combina tanto técnicas físicas como estadísticas (híbrido) para el medio plazo denominado Casandra. Casandra parte de los datos obtenidos por un modelo meteorológico global llamado GFS (Global Forecast System) que está desarrollado por el Centro Nacional de Predicción Medioambiental estadounidense (National Centres for Environmental Prediction) que proporciona una ingente cantidad de parámetros físicos para las predicciones. El GFS es ejecutado 4 veces al día, a las 00h, 06h, 12h y 18h GMT (en horario de verano España va dos horas por delante, y en el de invierno sólo una), tomando como condiciones iniciales las observaciones tomadas en multitud de estaciones, observatorios y sondeos meteorológicos repartidos por todo el globo. Los mejores resultados del GFS se obtienen para las 00h, ya que para esa hora todos los observatorios están obligados a recoger datos. La malla de simulación de este modelo global es de 1º de longitud por 1º de latitud, lo que en España aproximadamente equivale a rejillas espaciales de dimensiones de 100 por 100 kilómetros. A partir de los datos obtenidos del GFS se aplica el modelo PROMES (Pronóstico a mesoscala). Esta parte de Casandra es un modelo numérico de la atmósfera de ecuaciones primitivas que se circunscribe a un área limitada de la atmósfera. Esa área limitada abarca una porción del globo terrestre, centrada en la Península Ibérica, cuyas condiciones de contorno son aplicadas directamente por el GFS. A este proceso se le conoce como “nesting” (anidamiento). De esta forma el PROMES permite aumentar la resolución del GFS en la Península Ibérica hasta rejillas de tamaño 15 por 15 kilómetros. Los datos tomados por el modelo objeto de este proyecto provendrán de la salida del PROMES. Una vez obtenidas las variables meteorológicas tanto para la celdilla en la que está situado el parque eólico objeto de estudio como para las 8 celdillas que la rodean se procede a aplicar el método de “downscaling” estadístico MOS (Model Output Statistics) a los campos pronosticados por el PROMES, con el fin de corregir el error
Error! Style not defined. Error! Style not defined.
38
sistemático de la predicción de mesoscala y para proporcionar información de procesos que tienen una naturaleza por debajo de la resolución de 15 x 15 kilómetros. Estos procesos están muy ligados a la orografía de cada rejilla como las turbulencias, las circulaciones térmicas, etc. El MOS, mediante regresiones lineales multivariables, corrige el valor de la velocidad del viento obtenida por el PROMES, dando otra corregida más cercana a la real. La estrategia de desarrollo del MOS consiste en la selección de un conjunto de sectores de dirección, conocido como la rosa de los vientos con ángulos de 22,5º (Fig. 2.7), y de intervalos de módulos de velocidades que proporcionen unas ecuaciones que corrijan mejor los resultados del PROMES, haciendo hincapié en aquellos rangos de direcciones y módulos de viento donde el producción eléctrica del parque es más sensible al error.
Figura 2.7. La rosa de los vientos
Una vez que ya se tienen los valores de dirección y módulo de la velocidad del viento, la producción eólica horaria se realiza mediante un modelo de parque. Dicho modelo será único para cada parque y estará basado en información completa sobre la zona y el parque: orografía, rugosidad del terreno, altura sobre el nivel del mar, número de aerogeneradores de cada parque, tipo de máquinas de cada parque, estelas creadas por los aerogeneradores, registros individuales de los aerogeneradores (posición, alarmas, rearmes, velocidades, producciones), etc. La curva de potencia modelo de cada parque será elaborada a partir de toda esta información, siendo imprescindible que dicha información se disponga durante un período suficientemente amplio y que los datos sean completos y fiables, para que el modelo represente el comportamiento real del parque.
Error! Style not defined. Error! Style not defined.
39
Con Casandra ejecutado se obtiene una estimación de la potencia que producirá el parque. En la siguiente imagen (Fig. 2.8) se resume todo el esquema de funcionamiento del modelo:
GFS
PROMES
Base de datos
Modelo de parque
MOS
Estimación de Potencia
Figura 2.8. Esquema de funcionamiento de Casandra
Casandra se perfila como la mejor opción dentro del catálogo de productos que existen en el mercado español y por extensión a nivel mundial. El modelo CASANDRA es un modelo vivo que continuamente está implantando nuevas mejoras que le permitan seguir disminuyendo sus errores. La utilización de tecnologías como la predicción por conjuntos y la utilización de un post proceso estadístico basado en más de un modelo global, así como la utilización de técnicas complejas de redes neuronales son sólo una primera fase en la actualización del modelo Casandra 2.
Error! Style not defined. Error! Style not defined.
40
Los errores de Casandra oscilan entre un 30% y un 90% en períodos de de resultados superior a un mes, lo que da una idea de la complejidad de la predicción de la producción eólica. 27%
Errores Bajos
95%
60%
40% Errores Medios
Errores Altos
Figura 2.9. Errores de los modelos de predicción
Los errores van a depender del carácter sinóptico de la zona, del régimen general de vientos, y de la calidad y la cantidad de los datos.
2.5.2 Apolo El modelo Apolo ha sido desarrollado por Casandra para la predicción en el corto plazo, y está basado en redes neuronales. El objetivo de Apolo es mejorar las predicciones en el corto plazo, lo que permita a los parques acudir a los Mercados Intradiarios a reducir el desvío generado en el Mercado Diario. Cada horizonte se trata con un modelo independiente, de forma que en realidad la puesta en operativa requiere seis modelos, uno por cada Mercado Intradiario. El modelo Apolo es un modelo de redes neuronales que permite modelar relaciones no lineales con variables externas. La penalización de los desvíos en el Mercado Eléctrico se realiza sobre el valor absoluto de los mismos, y el modelo incorpora esta información ajustando los parámetros minimizando la función de coste. Las variables que utiliza son, entre otras, las previsiones de Casandra, errores de Casandra y la producción del parque en tiempo real con los retardos adecuados. Por lo tanto, Apolo presenta dos grandes ventajas: Capturas dinámicas distintas en cada Intradiario e incorpora la metodología real del cálculo del desvío. Apolo no necesita una gran cantidad de información (como puede ser el caso del método de los análogos), pero sí es clave un buen acceso on-line ya que la predicción depende de él.
Error! Style not defined. Error! Style not defined.
41
Los modelos de corto plazo mejoran las predicciones realizadas por Casandra. La reducción media de los modelos Apolo supone un 11% de error menos que el de Casandra.
3 Descripción del Modelo
Error! Style not defined. Error! Style not defined.
3
43
Descripción del Modelo 3.1 Introducción Como ya se ha comentado anteriormente el modelo propuesto en este proyecto
tiene como objetivo utilizar técnicas de análogos y de razonamiento basado en casos para la predicción de la producción eólica. Después de una revisión del estado del arte de la predicción de la producción, se tomó como punto de partida para el desarrollo del modelo, el documento “El sistema de predicción analógica de la precipitación en el Instituto Nacional de Meteorología (PAP-INM)” (HOYO, 2000), el cual utiliza el método de los análogos para realizar predicción meteorológica. Sin embargo, el modelo propuesto contiene diferencias sustanciales con el de precipitación del INM. La más evidente es que aquel va a tratar de predecir la producción eólica en vez de una variable meteorológica, que es la precipitación. Este método es realmente novedoso en Casandra, y también en ciertos aspectos, en el mundo de la predicción de la producción eólica: •
Los modelos que Casandra Energy Sevices utiliza para predecir la producción de los parques eólicos no utilizan de ninguna forma el razonamiento basado en casos. Se recuerda que Casandra es un modelo híbrido (combina las series temporales con las ecuaciones que rigen la dinámica de la atmósfera), y Apolo es un modelo estadístico basado en redes neuronales.
•
Existen modelos para la predicción eólica que utilizan el método de los análogos, pero ninguno de ellos tiene como variable objeto de predicción la producción. Los modelos de análogos encontrados en la literatura predicen la velocidad del viento, y como paso posterior utilizan la velocidad predicha y la curva del parque (Fig. 3.1), la cual relaciona la velocidad del viento y la potencia generada por el parque, para hallar la potencia. Sin embargo este modelo trata de evitar el hecho de que al acudir a la curva de potencia del parque, pequeñas diferencias en la estimación de la velocidad pueden ocasionar grandes diferencias en la potencia, ya que ésta es proporcional al cubo del módulo de la velocidad del viento.
Error! Style not defined. Error! Style not defined.
44
Curva del parque 35000
30000
Producción (kw)
25000
20000
15000
10000
5000
0 0
5
10
15
20
25
30
Velocidad del viento (m/s)
Figura 3.1. Curva del parque
Sin embargo, existen similitudes entre el proceso general del método de predicción del INM y el modelo desarrollado en el proyecto. Durante la explicación minuciosa del modelo en los siguientes apartados, se irán indicando las principales diferencias y similitudes con el documento del INM.
35
Error! Style not defined. Error! Style not defined.
45
3.2 Descripción General del Modelo 3.2.1 Esquema básico del modelo Este apartado pretende dar una visión muy sencilla del funcionamiento del modelo, para que en los apartados posteriores se pueda profundizar en cada uno de los parámetros y mecanismos de funcionamiento del mismo. El modelo trata de predecir la producción de un caso problema (una hora futura concreta) del que se conocen unas características meteorológicas (campos predictores). La producción de este caso problema va a ser función de las diferentes producciones de unos casos que pertenecen a una base histórica de datos, la cual contiene casos pasados de los que se conocen sus producciones y sus campos predictores. Para relacionar al caso problema con cada uno de los casos históricos es necesario definir una medida de similitud, en la que se tengan en cuenta los campos predictores (características de cada caso). Según se parezca cada caso histórico con el problema (se parecerán en función de la medida de similitud entre ambos casos), la producción de dicho caso histórico será más o menos relevante a la hora de dar la estimación de la producción del caso problema. En la siguiente figura (Fig. 3.2) se expone de manera gráfica este esquema sencillo del funcionamiento del modelo.
Error! Style not defined. Error! Style not defined.
46
Base de datos históricos Caso 1: 02/03/02 1h Caso 2: 02/03/02 2h Caso 3: 02/03/02 3h Caso 4: 02/03/02 4h ■ ■ ■
a1, b1, c1 a2, b2, c2 a3, b3, c3 a4, b4, c4
J1
P1 P2 P3 P4
Caso problema
.
01/08/06 21h a, b, c
.
¿P?
. Jn
Caso n: 01/03/06 24h an, bn, cn Pn
P = P ( P1, P2, P3, …, Pn) Producción
Campos predictores = parámetros físicos Fecha: Día/Mes/Año Hora
Figura 3.2. Esquema sencillo del funcionamiento del modelo
3.2.2 Bases de datos meteorológicas El modelo parte de los datos generados por un modelo meteorológico global para conseguir las características meteorológicas o campos predictores. En este caso se utilizan los datos del GFS (Global Forecast System), desarrollado en el Centro Nacional de Predicción Medioambiental Estadounidense (Nacional Centre for Environmental Prediction). Como ya se explicaba con más detalle cuando se desarrollaba el funcionamiento de Casandra, el GFS proporciona una cantidad ingente de variables meteorológicas en una malla de simulación de 1º por 1º, que se traduce en la Península Ibérica en rejillas de 100 por 100 kilómetros. De la misma manera, se podrían haber utilizado los datos provenientes del otro gran modelo meteorológico global, el Centro Europeo, de donde se alimenta el PAP-INM. El modelo toma la información del GFS, ya que Casandra se alimenta de dicho modelo global. A continuación se plantea una bifurcación en el camino de los datos, antes de llegar a ser procesados por el modelo. Los datos del GFS pueden ir directamente al modelo, o
Error! Style not defined. Error! Style not defined.
47
bien, aplicárseles el Modelo de Pronóstico a Mesoscala (PROMES), descrito en el desarrollo de Casandra. El proyecto propone, de manera novedosa, que el modelo tome la segunda opción, ya que de ella se derivan varias ventajas: •
Tras el anidamiento que realiza el PROMES, las celdillas aumentan su resolución de 100 por 100 a 15 por 15 kilómetros, lo que permite una personalización de los resultados ofrecidos por el GFS para la Península Ibérica.
•
Al hacer que los datos pasen por el PROMES, se les dota de la información proporcionada por la dinámica de la atmósfera. Se recuerda que el PROMES es un modelo numérico atmosférico, lo que convierte al modelo en un modelo realmente híbrido, al mezclar un modelo numérico con el método de los análogos.
En la siguiente figura (Fig. 3.3) se expone de una manera gráfica el flujo de datos meteorológicos, con las dos opciones que se presentan, aunque como se ha explicado, se ha decidido desarrollar el modelo híbrido.
GFS/Centro Europeo (Rejillas de 100x100)
Método de los Análogos (Estadístico)
PROMES (Rejillas de 15x15)
Modelo del Proyecto Método de los Análogos con datos provenientes de un modelo físico (híbrido)
Figura 3.3. El flujo de los datos de entrada al modelo
Error! Style not defined. Error! Style not defined.
48
3.2.3 Los campos predictores El PROMES proporciona una gran cantidad de variables meteorológicas y parámetros físicos en cada una de las rejillas de la Península Ibérica, que son lo que se denominan como los campos predictores. Estos campos van a caracterizar al caso problema (caso del que se pretende predecir su producción) y a cada uno de los casos históricos (casos que sirven para dar la producción del caso problema), y como consecuencia serán los grandes protagonistas de la medida de similitud entre el caso problema y cada uno de los casos históricos. El PAP-INM utiliza cinco campos predictores: el módulo y la dirección del viento geostrófico en la capa de 500 hPa, el módulo y la dirección del viento geostrófico en la capa de 1000 hPa y la humedad relativa media de la capa comprendida entre los 1000 y los 700 hPa. Como es lógico, estos campos contienen gran parte de la información que afecta a la variable precipitación. Sin embargo, en el modelo, cada uno de los casos debe disponer de los campos predictores que contengan la mayor información posible acerca de la producción eólica. Tras la consulta con expertos meteorólogos de Casandra, los campos predictores que se exponen en la tabla 3.1, pueden contener información sobre la producción eólica. En esta tabla se adjuntan los campos predictores con su abreviatura respectiva. Campos Predictores
Nomenclatura
Componente zonal del módulo del viento en el nivel de 850 hPa
u850
Componente meridiana del módulo del viento en el nivel de 850 hPa
v850
Altura geopotencial en el nivel de 850 hPa
z850
Humedad en el nivel de 850 hPa
q850
Temperatura en el nivel de 850 hPa
t850
Componente zonal del módulo del viento en el nivel de presión 6σ
u6σ
Componente meridiana del módulo del viento en el nivel de presión 6σ
v6σ
Altura geopotencial en el nivel de presión 6σ
z6σ
Error! Style not defined. Error! Style not defined.
49
Componente zonal del módulo del viento en el nivel de 500 hPa
u500
Componente meridiana del módulo del viento en el nivel de 500 hPa
v500
Altura geopotencial en el nivel de 500 hPa
z500
Humedad en el nivel de 500 hPa
q500
Temperatura en el nivel de 500 hPa
t500
Componente zonal del módulo del viento en el nivel de presión 4σ
u4σ
Componente meridiana del módulo del viento en el nivel de presión 4σ
v4σ
Altura geopotencial en el nivel de presión 4σ
z4σ
Tabla 3.1. Los campos predictores para la producción eólica
Todos los campos que aparecen en la tabla 3.1 contienen información o están relacionados de alguna manera con la producción eólica. Ahora bien, entre ellos no todos aportan, como es lógico, la misma información. Por esta razón tiene que realizarse un proceso para optimizar el número de campos predictores que van a caracterizar a cada caso en cada parque (unos campos pueden ser más determinantes que otros dependiendo de las características propias de cada parque: orografía, rugosidad del terreno, etc.). El motivo es la necesidad de un compromiso entre los resultados que el modelo proporcione con el tiempo de ejecución del mismo. A medida que aumenta el número de campos predictores, también se incrementa el tiempo de ejecución. Por lo tanto, es primordial encontrar cuándo la información que aporta un campo no es significativa para los resultados del modelo. Para realizar este proceso de optimización se ha utilizado la “regla de error estándar 1” que se explica detenidamente en el apartado 3.2.5. Para comprender bien cómo funciona el modelo es muy importante el concepto de rejilla, que ya se introducía en el PROMES. El modelo tiene en cuenta tanto la rejilla (15 por 15 kilómetros) donde se encuentra el parque, como las ocho rejillas adyacentes a ésta. Para cada una de estas rejillas se dispone de los campos predictores, con lo cual el modelo tendrá que comparar los campos predictores del caso problema con el caso histórico en cada una de las rejillas.
Error! Style not defined. Error! Style not defined.
50
k=7
k=8
k=9
k=4
Parque Eólico
k=6
k=1
k=2
k=3
Figura 3.4. Rejilla del parque y adyacentes
El PAP-INM utiliza la información de todas las rejillas de la Península Ibérica, pero en predicción de la producción, tradicionalmente se consideran suficientes las nueve rejillas de la figura 3.4.
Error! Style not defined. Error! Style not defined.
51
3.2.4 La medida de similitud La clave de cualquier modelo que utilice las técnicas del razonamiento basado en casos es encontrar una medida óptima de similitud. La determinación de dicha medida incluye la selección de la combinación de campos predictores más eficaz, además de la formulación matemática de la medida que extraiga la máxima información de dichos campos. El proceso de búsqueda de la medida de similitud óptima que se ha realizado implica la comparación de los resultados obtenidos aplicando el método con diferentes medidas de similitud. La medida de similitud entre dos casos debe ser un escalar, susceptible de comparación y ordenación, que compendie la similitud que presentan ambos casos para los diferentes campos predictores. La estructura general de la medida de similitud entre el caso problema i y un caso histórico j es la siguiente:
J ij = w A ⋅ d ijA + w B ⋅ d ijB + ..... + wH ⋅ d ijH
(3.1)
•
Jij: La similitud entre el caso problema i y el caso histórico j.
•
wA, wB,….., wH: Los coeficientes de ponderación que se asignan a cada campo predictor (A, B,….H) para hacer más o menos relevantes a los campos, según la información que contengan sobre la producción eólica.
•
dijA, dijB,….., dijH: Las pseudodistancias euclídeas entre el caso problema y el histórico en cada uno de los campos predictores.
La estructura de la pseudodistancia euclídea entre el caso problema i y el caso histórico j en el campo predictor A es la siguiente: N
d ijA =
∑(A k =1
ik
− A jk ) 2 ⋅ p k N
∑p k =1
•
(3.2) k
dijA: La pseudodistancia euclídea entre el caso problema i y el histórico j.
Error! Style not defined. Error! Style not defined.
52
•
Aik: Campo predictor A del caso i en la rejilla k (k=1,…., N).
•
pk: Peso de la rejilla k. Estos pesos se asignan a cada rejilla del grid, ya que los campos predictores en ciertas rejillas pueden tener más o menos importancia que en otras, al estar más o menos relacionadas con la producción eólica.
Una gran diferencia con el PAP-INM estriba en la medida de similitud. Una vez que el PAP-INM calcula las pseudodistancias euclídeas para cada campo entre el caso problema y todos los casos de la base histórica, halla el valor del percentil en el que se encuentra cada una de esas pseudodistancias. A continuación, son esos percentiles los que son multiplicados por los factores w en la medida de similitud, en vez de las pseudodistancias euclídeas. Lo que se pretende lograr al hacer esta operación es dotar a la medida de similitud de la información general que aportan los percentiles sobre el resto de las pseudodistancias en un campo predictor determinado. Sin embargo, diferentes pruebas desarrolladas en el modelo han determinado que es mejor insertar las pseudodistancias directamente en el modelo, ya que al realizar los percentiles se está perdiendo información sobre la similitud entre ambos casos en un campo determinado. Al PAP-INM le es conveniente realizar el cálculo de los percentiles, ya que su base de datos histórica es mucho más extensa que la del modelo. Esta diferencia en las extensiones de las bases de casos históricos es debida a la juventud de la energía eólica, ya que sólo se dispone de registros de los contadores de los parques eólicos desde principios de este siglo. Como se ha introducido al describir las ecuaciones de la medida de similitud y la pseudodistancia euclídea, no todos los campos predictores tienen la misma relevancia, ni todas las rejillas igual importancia. Por esta razón aparecen los coeficientes w y p respectivamente, los cuales presentan dos dificultades, generarlos y seleccionarlos. Estos coeficientes w y p son generados mediante bases de datos históricas, realizando patrones de comportamiento, mapas de Kohonen (Fig. 3.5), de los diferentes campos en las distintas rejillas [KOHONEN (1990)]. Al no disponer de información sobre cómo generar estos coeficientes, se optó por este novedoso método matemático en el entorno de la predicción de la producción, al conseguir mejores resultados que con otros métodos basados en la experiencia de los expertos meteorólogos de Casandra. Después
Error! Style not defined. Error! Style not defined.
53
de la generación de una gran cantidad de patrones de comportamiento, se procede a seleccionar cuales son las mejores combinaciones para un parque determinado. Esta operación se realiza en el proceso de ajuste del modelo que será descrito en el apartado 3.2.6.
Figura 3.5. Patrones de comportamiento (Mapas de Kohonen)
3.2.5 El proceso de selección de análogos El proceso de selección de análogos es conocido en el modelo como “Predicción” o “Evaluación”. Se realiza una vez que ya se han seleccionado los coeficientes w y p en el proceso de ajuste y se ha realizado una verificación del ajuste (procesos descritos en el siguiente apartado). El primer paso de “Evaluación” es el cálculo de las medidas de similitud entre el caso problema y absolutamente todos los casos de la base de datos histórica. Este cálculo se realiza con cada una de las combinaciones de w y p que fueron seleccionadas en el proceso de ajuste del modelo. A continuación se procede a la selección de los casos históricos que más se parezcan al caso problema para cada combinación, es decir,
Error! Style not defined. Error! Style not defined.
54
los que menor valor de la medida de similitud tengan. Este concepto puede conllevar a equívoco, pero se recuerda que conceptualmente la medida de similitud es una medida basada en distancias, y cuánto menos distancia halla entre los casos, más se parecen entre sí. El número de casos históricos es un parámetro fundamental a la hora de presentar el resultado final de la producción. Tal es su relevancia que para cada parque se presenta la necesidad de buscar un óptimo de dicho parámetro. Para realizar este proceso se ha seguido la conocida “regla de error estándar 1” (BREIMAN, 1984). Esta regla fue creada inicialmente en el contexto de árboles de decisión. El objetivo era seleccionar el árbol más simple (en términos de número de parámetros) cuya precisión es comparable con el árbol que genera un valor mínimo en términos de error cuadrático medio. En primer lugar hay que identificar el modelo con mínimo error, el cual sería elegido si existiera únicamente el criterio de la precisión. Sin embargo, es importante considerar también la complejidad del modelo. Para ello se calcula σ, la cual representa la dispersión entre el error cometido por los distintos modelos. A continuación se establece el umbral (línea discontinua en las figuras) situado σ por encima del modelo con mínimo error, y se considera que en términos de error cualquier modelo que se sitúe por debajo de dicho umbral es comparable con el modelo óptimo. Por lo tanto se elegirá como modelo óptimo el modelo más simple (es decir, aquel que esté formado por el menor número de combinaciones) cuyo error sea inferior al del umbral establecido. Aparte de todas las predicciones que aportan cada uno de los casos históricos seleccionados, se realiza una ponderación de todas ellas en función de su similitud con el caso problema. La predicción final de la producción en esa hora (caso problema) es la media de las producciones históricas seleccionadas (tras numerosas pruebas con otro tipo de medidas estadísticas), incluida la ponderada calculada, para cada una de las combinaciones.
Error! Style not defined. Error! Style not defined.
55
3.2.6 El proceso de ajuste y verificación Para realizar la selección de las mejores combinaciones de w y p, parámetros fundamentales en la medida de similitud, se lleva a cabo el proceso de ajuste. El concepto del algoritmo de ajuste es operar con una parte de la base de casos históricos utilizándolos a cada uno de ellos como si fueran casos problemas, es decir, tomar como casos problemas casos de los que se conoce su producción. Como las producciones de estos casos históricos son conocidas, el modelo puede seleccionar las mejores combinaciones según se parezcan las predicciones realizadas sobre los casos históricos a la realidad. El primer paso es introducir en el modelo una división en rangos de la producción eólica del parque. Estos rangos no tienen porqué ser iguales, sino que se suelen tomar rangos más pequeños en la pendiente más acusada de la curva del parque. Cada producción de los casos históricos es colocada en los rangos de producción, como una probabilidad observada, es decir, 1 si la producción del caso histórico pertenece al rango, 0 si no pertenece a dicho rango. El PAP-INM sólo divide la precipitación en tres rangos (llueve mucho, llueve poco o no llueve). En el caso que atañe al proyecto, la experiencia ha demostrado que para la producción eólica se requiere un mayor número de rangos de producción. A continuación y para cada uno de los casos históricos tomados para el ajuste se realiza la medida de similitud con el resto de dichos casos. La medida de similitud se halla de misma manera que en “Predicción” (Ecuaciones 3.1 y 3.2). Una vez que se conoce la similitud entre un caso histórico y el resto de casos se puede estimar la probabilidad esperada de que la producción de dicho caso se encuentre en cada uno de los rangos de producción. Esta probabilidad estimada (en tanto por uno) se calcula conociendo las similitudes del caso histórico con el resto, y las producciones del resto de casos históricos. Este proceso se repite para cada uno de los casos históricos, con cada una de las combinaciones de w y p. El siguiente paso opera con las probabilidades observadas y las probabilidades esperadas de cada uno de los casos históricos. Los índices de calidad empleados en el proceso de ajuste son conocidos como el RPA (Ecuación 3.3) y el RPS (Ecuación 3.4).
Error! Style not defined. Error! Style not defined.
L
R
∑∑ F
RPA =
l =1 r =1
lr
− X lr (3.3)
L L
R
∑∑ ( F
RPS =
l =1 r =1
lr
56
− X lr ) 2
L
(3.4)
Donde en ambos casos: R
Flr = ∑ f lr
(3.5)
r =1
R
X lr = ∑ xlr
(3.6)
r =1
•
flr: Diagnóstico en tanto por uno de la probabilidad de que la producción del caso l se encuentre en el rango de producción r.
•
xlr: Observación de la producción del caso l en el rango de producción r (1 si la producción observada pertenece al rango r, 0 si no pertenece a dicho rango).
•
L: Número de casos históricos tomados para realizar el ajuste.
•
R: Número de rangos en que se divide la producción.
En base a los índices RPA y RPS se seleccionan las mejores combinaciones de w y p. El proceso de ajuste concluye con la selección de las combinaciones w y p. Se seleccionan las combinaciones que proporcionen unos índices de RPA y RPS más bajos, esto es, las que ajustan mejor las predicciones a la realidad. El número de combinaciones que son seleccionadas es otro parámetro fundamental en el modelo, el cual, al igual que el número de campos predictores y el número de producciones con el que se calcula la predicción de la producción en “Predicción”, debe ser optimizado. La generación de las combinaciones w y p que se introducen en el proceso de ajuste son generadas a través de patrones de comportamiento, como se ha comentado en el
Error! Style not defined. Error! Style not defined.
57
apartado 3.2.4, del módulo de la suma vectorial de los campos predictores u850 y v850. Sin embargo, en el PAP-INM, se parte de una zonificación de la precipitación, por componentes principales, que divide el área de estudio en cinco zonas: NW, NN, NE, SW, SE. El proceso de verificación del ajuste se basa en la misma idea que el proceso anterior. Tomando otra parte distinta de la base de datos histórica se calcula para cada uno de esos casos una estimación de su producción como se realiza en el ajuste. Como indicador numérico de la calidad de la predicción se ha empleado el índice Brier Score (BS) [HOYO (2000)], el cual es una medida del error cuadrático medio de las probabilidades previstas muy utilizado en predicciones probabilísticas.
1 R BS = ∑ ( f qr − x qr ) 2 Q r =1 •
(3.7)
BS: Brier Score para una determinada combinación de w y p seleccionada en el ajuste.
•
fqr: Diagnóstico en tanto por uno de la probabilidad de que la producción del caso q se encuentre en el rango de producción r.
•
xqr: Observación de la producción del caso q en el rango de producción r (1 si la producción observada pertenece al rango r, 0 si no pertenece a dicho rango).
•
Q: Número de casos históricos tomados para realizar la verificación.
•
R: Número de rangos en que se divide la producción.
El proceso de verificación concluye con el cálculo del BS para cada una de las combinaciones seleccionadas en el ajuste. Tanto el proceso de verificación como el de ajuste se realizan una única vez para cada parque. Una vez que el parque es ajustado, y el ajuste verificado, ya se puede proceder a realizar las predicciones de los casos problemas.
Error! Style not defined. Error! Style not defined.
58
3.3 Implantación del modelo en una herramienta informática 3.3.1 Introducción El modelo ha sido desarrollado en el lenguaje de programación Visual Basic (VBA). El diseño del sistema se ha representado mediante un diagrama de flujo de datos siguiendo las especificaciones de Métrica V3 del Consejo Superior de Informática (1999). El objetivo del DFD es la obtención de un modelo lógico de procesos que represente el sistema, con independencia de las restricciones físicas del entorno, facilitando así su comprensión por los usuarios. El sistema se divide en distintos niveles de detalle para simplificar la complejidad del sistema, representando los diferentes procesos de los que consta, y para facilitar el mantenimiento del sistema. La información más importante que contiene un DFD es el flujo o movimiento de los datos a través del sistema y sus transformaciones como resultado de la ejecución de los procesos. La descomposición o explosión por niveles se realiza de arriba abajo, es decir, se comienza en el nivel más general (nivel 0 o de contexto) y se termina en el más detallado, pasando por los niveles intermedios necesarios. Para explicar algunos procesos del modelo, no representables mediante un DFD, se ha recurrido a flujogramas para explicar sus algoritmos.
3.3.2 Diagrama de flujo de datos El nivel 0 o de contexto de la aplicación aparece en la figura 3.6. En él se reflejan todos los datos de entrada y de salida del modelo.
Error! Style not defined. Error! Style not defined.
59
Modelo de predicción: Nivel 0 (de contexto)
oficial.aj
oficial.ve
oficial.pr
combinaciones
Casos históricos para el proceso de ajuste
Casos históricos para el proceso de verificación
Casos históricos para la predicción
wp Combinaciones w y p seleccionadas por el modelo
1
Modelo de predicción
Modelo de Análogos
Combinaciones de w y p
Predicciones de los casos problemas
Verificación del ajuste
Predicción
Verificación
Campos predictores
campos futuros
de los casos problemas
Figura 3.6. Nivel 0 de la aplicación
Las entradas al modelo son las siguientes: •
“oficial.aj”: En este fichero se encuentran los casos históricos que sirven para realizar el ajuste del modelo, con sus respectivos campos predictores (en cada una de las rejillas) y su producción correspondiente.
•
“oficial.ve”: Este fichero contiene los casos históricos que sirven para realizar la verificación del ajuste del modelo, con sus respectivos campos predictores (en cada una de las rejillas) y su producción correspondiente.
•
“oficial.pr”: En este fichero se encuentran los casos históricos que sirven para realizar la predicción de los casos problema, con sus respectivos campos predictores (en cada una de las rejillas) y su producción correspondiente.
•
“combinaciones”: En este fichero se encuentran las diferentes combinaciones w y p de entre las cuales se seleccionan las mejores en el proceso de ajuste.
•
“campos futuros”: Este fichero contiene los campos predictores (en cada una de las rejillas) de los casos problema.
Error! Style not defined. Error! Style not defined.
60
El fichero “wp” es un fichero que el modelo crea, que contiene la selección de las mejores combinaciones, y del cual el modelo se retroalimenta para realizar la predicción. Los datos de salida del modelo son los siguientes: •
“Predicción”: Fichero en el que se encuentran las diferentes producciones estimadas para los casos problema.
•
“Verificación”: En este fichero se encuentran los índices de error Brier Score de cada una de las combinaciones seleccionadas en el algoritmo de ajuste del modelo.
La explosión del nivel 0 se refleja en la figura 3.7. En ella se observa como el modelo se divide en dos grandes bloques, ajuste y predicción, y los datos de entrada y salida de cada uno de ellos.
Modelo de predicción: Nivel 1 – Modelo de Análogos oficial.pr
oficial.aj
Casos históricos para el proceso de ajuste
1.1 oficial.ve Casos históricos para el proceso de verificación combinaciones
campos futuros Campos predictores
Modelo de Análogos
de los casos problemas
Proceso de Ajuste
Combinaciones de w y p 1
Configuración
2
Datos técnicos
Casos históricos para la predicción
Parámetros de configuración del programa
1.2
Modelo de Análogos
Predicción
wp
Predicciones de los casos problemas
w y p seleccionadas
Verificación
Verificación
del ajuste 1
Configuración
2
Datos técnicos
Parámetros técnicos del parque eólico
Parámetros de configuración del programa Predicción
Parámetros técnicos del parque eólico
Figura 3.7. Nivel 1 de la aplicación
En el nivel 1 se aprecian los dos grandes procesos de la aplicación. En el proceso de ajuste las entradas son “oficial.aj”, “oficial.ve” y “combinaciones”, y las salidas
Error! Style not defined. Error! Style not defined.
61
“Verificación” y “wp”. Ésta última es además entrada del proceso de predicción, junto con “oficial.pr” y “campos futuros”. La salida del segundo proceso es el fichero “Predicción” descrito en el nivel de contexto. Tanto el proceso de ajuste como el de predicción se nutren de dos ficheros que les aportan parámetros para llevar a cabo sus algoritmos correspondientes: •
“Configuración”: Contiene los nombres de los ficheros que el modelo debe leer (“datos técnicos”, “oficial.aj”, “oficial.ve”, “oficial.pr”, “combinaciones”, “wp” y “campos futuros”), si el modelo ya está ajustado o hay que realizar el proceso de ajuste, el número de rangos en que se divide la producción para el proceso de ajuste, cuáles son esos rangos, las fechas de las que se pretende obtener predicción, el numero de combinaciones que seleccionará el ajuste y el número de producciones con el que se dará la producción final.
•
“Datos técnicos”: Este fichero contiene el nombre del parque eólico, la ubicación de dicho parque, la potencia nominal, el número y modelo de los aerogeneradores, la altura de buje, la altitud del parque sobre el nivel del mar y la rejilla en la que se encuentra ubicado el parque.
La explosión del proceso de ajuste se muestra en la figura 3.8.
Error! Style not defined. Error! Style not defined.
62
Modelo de predicción : Nivel 2 – Proceso de Ajuste Rangos de producción, nº de wp, nº de producciones… 1
Ubicación, Potencia instalada, nº de aerogeneradores… 2
1.1.1
Proceso de Ajuste
1.1.5
Leer Configuración
Configuración
Datos técnicos
Combinaciones de w yp combinaciones
w y p seleccionadas
Lectura
Leer Combinaciones 1.1.4
Casos históricos para el proceso de ajuste
1.1.8 Proceso de Ajuste Verificación del ajuste
Proceso de Ajuste
Escribir wp Combinaciones w y p seleccionadas por el modelo
Brier Score
Proceso de Ajuste
1.1.9
Leer oficial.aj
oficial.aj
wp
Proceso de Ajuste
Escribir Verificación Verificación Lectura
1.1.7 oficial.ve
Proceso de Ajuste
1.1.6
Seleccionar wp
1.1.2 Proceso de Ajuste Leer Datos Técnicos 1.1.3
Proceso de Ajuste
del ajuste
Proceso de Ajuste
Leer oficial.ve
Casos históricos para el proceso de verificación
Verificación
Figura 3.8. Nivel 2. Explosión del proceso de ajuste
El primer paso del proceso de ajuste consiste en leer el fichero de configuración, el de datos técnicos, “combinaciones” y “oficial.aj”. Una vez leídos procede a realizar la selección de las mejores combinaciones mediante el algoritmo representado en el flujograma de la figura 3.9.
Error! Style not defined. Error! Style not defined.
63
Modelo de predicción : Flujograma de Selección de wp 1.1.5
Inicio
Proceso de ajuste
Sí
Seleccionar wp
Crear Frecuencias Observadas
¿Hay más campos predictores? No Caso histórico
Combinación Hallar Similitud Caso problema
Campo predictor
¿Hay más casos históricos?
Caso histórico
Hallar Frecuencias Esperadas
Sí
No Hallar RPA y RPS
Hallar Pseudodistancia Euclídea
Sí
¿Hay más combinaciones?
No
Seleccionar las mejores combinaciones
Fin Sí
¿Hay más casos históricos?
No
Figura 3.9. Nivel 3. Seleccionar wp
El flujograma describe el algoritmo de selección. Cada uno de los bloques del flujograma responde a la descripción realizada del proceso de ajuste en el apartado 3.2.6. Una vez seleccionadas las mejores combinaciones, éstas siguen dos caminos. En uno de ellos son escritas en el fichero “wp” (Proceso 1.1.6 del nivel 2 (Fig. 3.8)), y en otro son sometidas al proceso de verificación (Proceso 1.1.8 del nivel 2 (Fig. 3.8)). Para llevar a cabo este proceso también es necesaria la lectura del fichero “oficial.ve”. El algoritmo de verificación del ajuste no se puede representar mediante un DFD, como era el caso de la selección de las combinaciones. Este algoritmo es descrito gráficamente en el flujograma de la figura 3.10, mediante los bloques que se describían en el apartado 3.2.6.
Error! Style not defined. Error! Style not defined.
64
Modelo de predicción : Flujograma de Verificación del ajuste 1.1.8 Proceso de Ajuste Verificación del ajuste
Inicio Sí Crear Frecuencias Observadas
¿Hay más campos predictores? No Caso histórico
Combinación Hallar Similitud Caso problema
Campo predictor
¿Hay más casos históricos?
Caso histórico
Hallar Frecuencias Esperadas
Sí
No Hallar Brier Score
Hallar Pseudodistancia Euclídea
Sí
¿Hay más casos históricos?
Sí
¿Hay más combinaciones?
No
Figura 3.10. Nivel 3. Verificación del ajuste
No
Fin
Error! Style not defined. Error! Style not defined.
65
Una vez concluida la descomposición del proceso de ajuste, se va a realizar la explosión del proceso de predicción, la cual se muestra en la figura 3.11.
Modelo de predicción : Nivel 2 – Predicción Rangos de producción, nº de wp, nº de producciones… 1
1.2.1
Leer Configuración
Configuración
Ubicación, Potencia instalada, nº de aerogeneradores… 2
Predicción
1.2.2 Predicción Leer Datos Técnicos
Datos técnicos
Casos históricos para la predicción
1.2.3
Predicción
Leer oficial.pr
oficial.pr
w y p seleccionadas
1.2.4
1.2.6 Predicción Seleccionar Análogos
1.2.7
Escribir Predicción
Lectura
1.2.5 Predicción Leer campos futuros
campos futuros
Predicción
Predicción
Leer wp
wp
Predicciones de los casos problemas
Predicciones de los casos problemas
Predicción
Campos predictores de los casos problemas
Figura 3.11. Nivel 2. Explosión del proceso de predicción
El proceso de predicción comienza con la lectura del fichero de configuración, el de datos técnicos, “oficial.pr”, “wp” y “campos futuros”. Una vez leídos procede a realizar la selección de los análogos más parecidos a los casos problemas (Proceso 1.2.6 del nivel 2 (Fig. 3.11)) mediante el algoritmo representado en el flujograma de la figura 3.12. Los bloques de dicho flujograma fueron descritos en el apartado 3.2.5.
Error! Style not defined. Error! Style not defined.
66
Modelo de predicción : Flujograma de Seleccionar Análogos 1.2.6 Predicción Seleccionar Análogos
Inicio Sí Cálculo del número de casos problema
¿Hay más campos predictores? No Caso histórico
Combinación Hallar Similitud Caso problema ¿Hay más casos históricos?
Campo predictor
Sí
No Caso histórico
Sí
Sí
¿Hay más casos históricos?
Hallar producción ponderada
No
Hallar Pseudodistancia Euclídea
Sí
¿Hay más combinaciones?
No
Figura 3.12. Nivel 3. Seleccionar Análogos.
¿Hay más combinaciones?
No Fin
Error! Style not defined. Error! Style not defined.
67
3.4 Conclusiones La adaptación del PAP-INM a la predicción de la producción eólica ha sido un proceso en el que finalmente no quedan muchas características y propiedades del documento de partida. Aparte de las diferencias obvias en la variable de predicción (precipitación y la producción de parques eólicos) y las señaladas en cuanto a algoritmos durante la explicación de la descripción del modelo (medida de similitud, selección de óptimos mediante la “regla de error estándar 1”, generación de coeficientes mediante mapas de Kohonen, formulación de la producción final, etc.), una gran ventaja con la que cuenta el método del PAP-INM, es su potente base de casos históricos. Como ya se señala varias veces en el documento, la juventud de la energía eólica no favorece al modelo de los análogos, el cual se hará más potente según pase el tiempo, debido a la ampliación de las bases de casos históricos. El principal cuello de botella del modelo ha sido el tiempo de ejecución de la aplicación informática. Durante gran parte del desarrollo de la herramienta informática, existieron grandes dificultades para la visualización y mejora de los resultados debido a los extendidos tiempos de ejecución del programa. La imposibilidad de la obtención de resultados de largos períodos de producción, obligaron a la optimización de cada línea de código del programa. Esta optimización se centraba en la sustitución de determinados bucles por otros mucho más ágiles que desempeñaran la misma función, la búsqueda de algoritmos de ordenación de arrays que minimizaran al máximo el tiempo de ordenación, aperturas y cierres de ficheros mucho más eficientes, etc. Todo esto condujo a reducciones de tiempo realmente considerables (de meses a horas), gracias a las cuales se pudieron visualizar y mejorar los resultados de la aplicación informática.
4 Resultados
Error! Style not defined. Error! Style not defined.
4
69
Resultados 4.1 Introducción En este capítulo se presenta una aplicación real del modelo propuesto a un parque
eólico. Se mostrará el proceso completo, esto es, la optimización del ajuste de los parámetros y las predicciones obtenidas durante un largo período de tiempo (desde Abril 2005 hasta Diciembre 2005). Para poder evaluar la calidad de los resultados obtenidos, se compraran dichos resultados con los obtenidos por el modelo de predicción que utiliza Casandra. Las características del ordenador donde el programa ha sido ejecutado son las siguientes: Intel ®, Pentium ® 4 CPU 3.00 GHz 2.99 GHz, 2.00 GB de RAM Extensión de dirección física. El sistema instalado en dicho ordenador es Microsoft Windows XP Professional Versión 2002. El tiempo de ejecución de la aplicación puede ser dividido en el tiempo de ejecución del algoritmo de ajuste y el tiempo de ejecución de la predicción una vez puesto en operativo. Como se comenta en las conclusiones de la descripción del modelo, el tiempo de ejecución es vital ya que el modelo tiene que ser ejecutado diariamente para acudir al Mercado Diario, y en ocasiones seis veces más al día, si es utilizado para acudir a los Mercados Intradiarios. El tiempo de ejecución del proceso de ajuste del modelo (conviene recordar que este proceso sólo es necesario realizarlo teóricamente una vez en la vida del parque) es de aproximadamente 12 horas con una base histórica para el ajuste de 5000 casos, seleccionando entre 30 combinaciones de w y p. El tiempo de ejecución del algoritmo de predicción depende del número de combinaciones seleccionadas en el ajuste (en el parque donde se ha ejecutado el modelo el óptimo son 7 combinaciones), del número de casos de la base histórica para la predicción, que a fecha de hoy contiene alrededor de 30000 casos, del número de campos predictores utilizados (en el parque donde se ha ejecutado el modelo el óptimo son 8 campos predictores), y del número de casos problema de los que se pretenda predecir su producción. Para predecir un mes de casos problema, el tiempo oscila en torno a las tres horas y media. Cada mes no tiene el mismo número de horas, con lo
Error! Style not defined. Error! Style not defined.
70
que los casos problema pueden ser 720 ó 744, aunque también hay variaciones ya que existen días con 23 ó 25 horas en los cambios del horario de invierno y de verano. Para predecir un día, el modelo tarda aproximadamente cinco minutos, que será el tiempo requerido cada día en poder dar la predicción para acudir al Mercado Diario.
Error! Style not defined. Error! Style not defined.
71
4.2 Proceso de ajuste del parque El proceso de ajuste se ha realizado con una base de casos histórica para el ajuste de 5000 casos (del 02/03/2002 (01h) hasta el 27/09/2002 (19h)). Para el proceso de ajuste el parque es necesario dividir la producción del parque en rangos de producción y generar las combinaciones de w y p mediante patrones de comportamiento (mapas de Kohonen) para que el proceso de ajuste pueda realizar su selección. La división de la producción del parque en rangos de producción sirve, como era explicado en la descripción del modelo, para generar las frecuencias observadas y las frecuencias esperadas. En la figura 4.1 se muestra la curva del parque eólico que se ha tomado como ejemplo en el proyecto. A raíz de dicha curva se forman los rangos de producción que entran como input, mediante el fichero de configuración (ver figura 3.8) al proceso de ajuste.
Curva del parque 35000
30000
Producción (kw)
25000
20000
15000
10000
5000
0 0
5
10
15
20
Velocidad del viento (m/s)
Figura 4.1. Curva teórica del parque eólico
25
30
35
Error! Style not defined. Error! Style not defined.
72
La división en rangos de producción se ha realizado para intentar tomar todas las pendientes de la curva entre todos los rangos. La división realizada distinguía en 11 rangos de producción (kW): 0-2500, 2500-5000, 5000-8000, 8000-11000, 11000-13000, 13000-15000, 15000-17000, 17000-19000, 19000- 22000, 22000-25000 y 25000-28390. El último rango de todos debe tener como valor final la potencia nominal del parque, para que todos los casos posibles estén incluidos en algún rango. El otro parámetro importante que actúa como input del proceso de ajuste es el número de combinaciones de w y p que debe seleccionar. Al proceso de ajuste le llega un número de combinaciones (30) generadas mediante patrones de comportamiento (ver 3.2.6), de entre las cuales selecciona un número determinado de combinaciones mediante la “regla de error estándar 1” descrita en el apartado 3.2.5. El óptimo de ese número en este parque se ha establecido en 7, como se observa en la figura 4.2 y en la figura 4.3.
Mayo 2002 0,63
0,62
0,61
error
0,6
Modelo Óptimo 0,59
0,58
0,57
Línea Umbral 0,56
0,55 0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
nº combinaciones
Figura 4.2. Ejemplo para optimizar el número de combinaciones
Como se observa en la figura 4.2 el óptimo se alcanza en el modelo que utiliza 7 combinaciones conforme al criterio establecido. También se observa que a partir de un número elevado de combinaciones, el modelo no sólo no mejora significativamente, sino que aporta más error. Este resultado se obtiene en todos los períodos de estudio.
16
Error! Style not defined. Error! Style not defined.
73
En la figura 4.2 el período es mayo de 2002, y en la figura 4.3, el período es junio de 2002. En ambos casos el óptimo es el mismo.
Junio 2002 0,73
0,72
error
0,71
0,7
Modelo Óptimo
0,69
0,68
Línea Umbral 0,67 0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
nº combinaciones
Figura 4.3. Ejemplo para optimizar el número de combinaciones
El resultado del algoritmo de ajuste es la selección de las 7 mejores combinaciones de w y p. Los coeficientes w y p que fueron seleccionados se muestran en la tabla 4.1.
nº
w1
w2
w3
w4
w5
w6
w7
w8
p1
p2
p3
p4
p5
p6
p7
p8
p9
1
.11
.14
.07
.21
.16
.14
.09
.08
9.8
11.7
17.6
15.9
28.0
19.2
15.8
17.4
16.5
2
.13
.09
.07
.15
.04
.06
.20
.26
16.0
18.6
20.6
20.0
28.0
21.0
20.2
19.9
19.5
3
.10
.07
.06
.03
.16
.09
.25
.24
5.6
7.1
12.5
11.9
28.0
16.0
14.8
12.3
10.3
4
.11
.14
.07
.21
.16
.14
.09
.08
15.9
16.5
16.2
19.5
28.0
18.6
10.5
13.3
16.2
5
.10
.11
.16
.05
.14
.09
.2
.15
12.3
13.8
13.0
16.6
28.0
17.5
8.0
8.4
8.8
6
.13
.09
.07
.15
.04
.06
.20
.26
7.6
7.5
9.1
15.7
28.0
13.9
6.8
6.7
6.1
7
.10
.07
.06
.03
.16
.09
.25
.24
5.6
11.7
17.6
15.5
28.0
19.2
15.8
17.4
16.5
Tabla 4.1. Los coeficientes w y p seleccionados
16
Error! Style not defined. Error! Style not defined.
74
A continuación se realiza la verificación del ajuste del modelo. El proceso de verificación del ajuste se ha realizado con una base de casos histórica para la verificación de 5000 casos (del 27/09/2002 (20h) hasta el 24/04/2003 (03h)).El problema principal del Brier Score es su excesiva dependencia de los casos históricos que se establezcan para realizar la verificación. Como posteriormente se verá, los errores en las predicciones de las producciones oscilan entre un 30% y un 100%, con lo cual, el Brier Score da más información acerca de si el modelo está bien ajustado (proporcionando índices razonables de error de las combinaciones) que del índice de error global del modelo, que se obtendrá mediante las predicciones realizadas.
Error! Style not defined. Error! Style not defined.
75
4.3 El proceso de predicción 4.3.1 Optimización de parámetros Para ver el índice de error del modelo, se ha tomado un período problema lo suficientemente significativo, para ver el índice de error del modelo frente a la realidad y cómo se comporta frente al modelo de predicción para el Mercado Diario Casandra. El período problema abarca del 01/04/2005 (1h) hasta el 31/12/2005 (24h), lo que significa la predicción de 6601 casos problema. A la hora de realizar la base de casos histórica para la predicción, hay que intentar que contenga el mayor número de casos posible. En esta ocasión se han tomado 28277 casos históricos, del 02/03/2002 (01h) hasta el 31/03/2005 (24h) y del 01/01/2006 (01h) hasta el 01/03/2006 (24h). El proceso de predicción tiene como input las combinaciones seleccionadas por el proceso de ajuste. Se ha realizado un estudio para determinar los óptimos de dos parámetros importantes en el modelo, el número de campos predictores que caracterizan a los casos (este estudio es aplicable tanto a los casos que aparecen en el proceso de ajuste y verificación, como a los casos que aparecen en “Predicción”), y el número de producciones finales seleccionadas que aporta cada combinación a la predicción final. El criterio seguido para determinar el óptimo ha sido el mismo que en el apartado 4.2, la “regla de error estándar 1” (BREIMAN, 1984) que se explicaba en la descripción del modelo. En las siguientes gráficas se observa como el óptimo es utilizar 8 campos predictores de los 16 que aportan información. Se incluyen dos gráficas (Mayo 2002 (Fig. 4.4) y Junio 2002 (Fig. 4.5)) como representantes del comportamiento general en todos los períodos de ajuste. Como se observa en las figuras, al aumentar el número de campos predictores a partir de uno determinado, el error que reduce ya no es significativo.
Error! Style not defined. Error! Style not defined.
76
Mayo 2002 0,8
0,75
0,7
error
Modelo Óptimo 0,65
0,6
Línea Umbral 0,55
0,5 0
2
4
6
8
10
12
14
16
18
16
18
nº campos predictores
Figura 4.4. Ejemplo para optimizar el número de campos predictores
Junio 2002 0,95
0,9
error
0,85
Modelo Óptimo 0,8
0,75
0,7
Línea Umbral 0,65 0
2
4
6
8
10
12
14
nº campos predictores
Figura 4.5. Ejemplo para optimizar el número de campos predictores
Error! Style not defined. Error! Style not defined.
77
Los ocho campos predictores más significativos fueron, por este orden:
Campos Predictores
Nomenclatura
Componente zonal del módulo del viento en el nivel de 850 hPa
u850
Componente meridiana del módulo del viento en el nivel de 850 hPa
v850
Altura geopotencial en el nivel de 850 hPa
z850
Humedad en el nivel de 850 hPa
q850
Temperatura en el nivel de 850 hPa
t850
Componente zonal del módulo del viento en el nivel de presión 6σ
u6σ
Componente meridiana del módulo del viento en el nivel de presión 6σ
v6σ
Altura geopotencial en el nivel de presión 6σ
z6σ
Tabla 4.2. Los campos predictores óptimos
El óptimo para hallar el número de producciones que aporta cada combinación a la predicción, es utilizar 21 producciones de cada combinación. Se incluyen dos gráficas (Mayo 2002 (Fig. 4.6) y Junio 2002 (Fig. 4.7)) como representantes del comportamiento general en todos los períodos de prueba. Como se observa en las figuras al aumentar el número de producciones a partir de uno determinado, el error que reduce ya no es significativo, y a partir de otro determinado, ya no sólo no reduce el error, sino que lo aumenta.
Error! Style not defined. Error! Style not defined.
78
Mayo 2002 0,75 0,73 0,71 0,69
error
0,67 0,65
Modelo Óptimo 0,63 0,61 0,59 0,57
Línea Umbral
0,55 0
10
20
30
40
50
60
nºproducciones
Figura 4.6. Ejemplo para optimizar el número de producciones
Junio 2002
0,825
0,805
0,785
error
0,765
0,745
Modelo Óptimo 0,725
0,705
0,685
Línea Umbral
0,665 0
10
20
30
40
nºproducciones
Figura 4.7. Ejemplo para optimizar el número de producciones
50
60
Error! Style not defined. Error! Style not defined.
79
4.3.2 Resultados del modelo En este apartado se muestran los resultados obtenidos en el período problema Abril 2005 – Diciembre 2005. En la siguiente tabla (tabla 4.3) se muestran los índices de error obtenidos por el modelo en el período. En el siguiente apartado se comparan estos resultados con los obtenidos por Casandra.
Período
Casos
Error
Abril 2005
01/04/2005 (1h) – 30/04/2005 (24h) 720 casos
0.49
Mayo 2005
01/05/2005 (1h) – 31/05/2005 (24h) 744 casos
0.55
Junio 2005
01/06/2005 (1h) – 30/06/2005 (24h) 720 casos
0.66
Julio 2005
01/07/2005 (1h) – 31/07/2005 (24h) 744 casos
0.62
Agosto 2005
01/08/2005 (1h) – 31/08/2005 (24h) 744 casos
0.74
Septiembre 2005
01/09/2005 (1h) – 30/09/2005 (24h) 720 casos
1.11
Octubre 2005
01/10/2005 (1h) – 31/10/2005 (24h) 745 casos
0.33
Noviembre 2005
01/11/2005 (1h) – 30/11/2005 (24h) 720 casos
0.41
Diciembre 2005
01/12/2005 (1h) – 31/12/2005 (24h) 744 casos
0.48
Tabla 4.3. Error del modelo de análogos en el período problema
El error del modelo se ha obtenido de la siguiente mediante la siguiente fórmula: L
error =
∑ predicción − producción _ real l =1
L
∑ producción _ real l =1
•
predicción: Estimación de energía en kWh dada por el modelo.
•
producción real: Registro de la producción eólica en kWh del caso.
(4.1)
Error! Style not defined. Error! Style not defined.
•
80
L: Número de casos del período problema
A continuación se muestran gráficamente las comparativas de las predicciones con las producciones reales en cada mes problema.
Abril 2005 30000 Modelo de Análogos Producciones reales 25000
kW
20000
15000
10000
5000
0 1
50
99
148
197
246
295
344
393
442
491
540
horas
Figura 4.8. Comparativa Análogos-Reales del mes de Abril 2005
589
638
687
Error! Style not defined. Error! Style not defined.
81
Mayo 2005 30000 Modelo de Análogos Producciones reales 25000
kW
20000
15000
10000
5000
0 1
50
99
148
197
246
295
344
393
442
491
540
589
638
687
horas
Figura 4.9. Comparativa Análogos-Reales del mes de Mayo 2005
Junio 2005 30000 Modelo de Análogos Producciones reales 25000
kW
20000
15000
10000
5000
0 1
50
99
148
197
246
295
344
393
442
491
540
horas
Figura 4.10. Comparativa Análogos-Reales del mes de Junio 2005
589
638
687
736
Error! Style not defined. Error! Style not defined.
82
Julio 2005 25000 Modelo de Análogos Producciones reales 20000
kW
15000
10000
5000
0 1
50
99
148
197
246
295
344
393
442
491
540
589
638
687
736
horas
Figura 4.11. Comparativa Análogos-Reales del mes de Julio 2005
Agosto 2005 30000 Modelo de Análogos Producciones reales 25000
kW
20000
15000
10000
5000
0 1
50
99
148
197
246
295
344
393
442
491
540
horas
Figura 4.12. Comparativa Análogos-Reales del mes de Agosto 2005
589
638
687
736
Error! Style not defined. Error! Style not defined.
83
Septiembre 2005 30000 Modelo de Análogos Producciones reales 25000
kW
20000
15000
10000
5000
0 1
50
99
148
197
246
295
344
393
442
491
540
589
638
687
horas
Figura 4.13. Comparativa Análogos-Reales del mes de Septiembre 2005
Octubre 2005 30000 Modelo de Análogos Producciones reales 25000
kW
20000
15000
10000
5000
0 1
50
99
148
197
246
295
344
393
442
491
540
horas
Figura 4.14. Comparativa Análogos-Reales del mes de Octubre 2005
589
638
687
736
Error! Style not defined. Error! Style not defined.
84
Noviembre 2005 30000 Modelo de Análogos Producciones reales 25000
kW
20000
15000
10000
5000
0 1
50
99
148
197
246
295
344
393
442
491
540
589
638
687
horas
Figura 4.15. Comparativa Análogos-Reales del mes de Noviembre 2005
Diciembre 2005 30000 Modelo de Análogos Producciones reales 25000
kW
20000
15000
10000
5000
0 1
50
99
148
197
246
295
344
393
442
491
540
horas
Figura 4.16. Comparativa Análogos-Reales del mes de Diciembre 2005
589
638
687
736
Error! Style not defined. Error! Style not defined.
85
Se aprecia en las gráficas cómo el modelo capta perfectamente en la mayoría de las veces, la tendencia de la producción. En la siguiente gráfica (Fig. 4.17) se observa claramente cómo el modelo de análogos sigue la tendencia de la curva de la producción real. Se ha escogido precisamente un mes problema con numerosas subidas y bajadas en la producción.
Octubre 2005 30000 Modelo de Análogos Producciones reales 25000
kW
20000
15000
10000
5000
0 1
50
99
148
197
246
295
344
393
442
491
540
589
638
687
horas
Figura 4.17. Seguimiento del modelo de la tendencia de la curva de las producciones
Sin embargo, debido a la formulación óptima (que combina un gran número de producciones de diferentes casos seleccionados en el proceso de selección de análogos), el modelo tiene en ocasiones dificultades para seguir las altas producciones y los ceros en el parque. De hecho conseguir un cero en el modelo es muy difícil con la dimensión actual de la base de casos históricos, porque es muy complicado que todos los casos seleccionados tengan producción nula, aunque la predicción sí será una estimación baja. Además estos ceros no sólo se producen por falta de viento, sino que existen averías, mantenimiento, etc., que también los provocan. La ausencia de información acerca de la indisponibilidad de las máquinas impide al modelo poder detectar los ceros debidos a este motivo, y beneficiarse así de lo que le aportara esta variable explicativa. En la figura 4.18 se muestran las dificultades mencionadas.
736
Error! Style not defined. Error! Style not defined.
86
Septiembre 2005 30000 Modelo de Análogos Producciones reales 25000
kW
20000
15000
10000
5000
0 1
50
99
148
197
246
295
344
393
442
491
540
589
638
687
horas
Figura 4.18. Seguimiento del modelo a producciones altas y bajas
4.3.3 Análogos vs. Casandra En este apartado se va a comparar el modelo de análogos con Casandra, el modelo de predicción para el Mercado Diario, en el período problema (Abril 2005-Diciembre 2005). Como fue mencionado en la descripción de los modelos de predicción, el modelo Casandra se perfila como la mejor opción dentro del catálogo de productos que se encuentran en el mercado español y por extensión a nivel mundial. En diciembre de 2005 se perfiló como el método de predicción con un menor desvío de kilowatios por parque lo que significa que es el modelo que más ahorro genera por desvíos para los parques. El modelo Casandra es un modelo vivo que continuamente está implantando nuevas mejoras que le permiten seguir disminuyendo sus errores. La predicción por conjuntos, un post proceso estadístico basado en un modelo global y la combinación de predicciones con Apolo son sólo una primera fase en la actualización del modelo Casandra 2.
Error! Style not defined. Error! Style not defined.
87
Conviene recordar que los errores en la predicción de la producción oscilan entre un 30% y un 100% en los modelos profesionales. En la tabla 4.4 se muestran los errores de Casandra frente a los errores del modelo de Análogos en el período problema.
Período
Error Análogos
Error Casandra
Abril 2005
0.49
0.46
Mayo 2005
0.55
0.54
Junio 2005
0.66
0.71
Julio 2005
0.62
0.61
Agosto 2005
0.74
0.64
Septiembre 2005
1.11
0.93
Octubre 2005
0.33
0.34
Noviembre 2005
0.41
0.38
Diciembre 2005
0.48
0.49
Tabla 4.4. Error del modelo de análogos y de Casandra
De los nueve meses de los que consta el período problema, el modelo de análogos supera a Casandra en tres de ellos, y en otros cuatro se encuentra a menos de un tres por ciento de error. Sólo en Agosto y Septiembre 2005, el modelo de análogos es inferior a Casandra, y esto es debido a la gran cantidad de producciones nulas que se produjeron en esos meses estivales. A continuación se muestran las gráficas comparativas de ambos modelos con la realidad desde Abril 2005 a Diciembre 2005.
Error! Style not defined. Error! Style not defined.
88
Abril 2005 30.000 Casandra Modelo de Análogos Producciones reales 25.000
kW
20.000
15.000
10.000
5.000
0 1
50
99
148
197
246
295
344
393
442
491
540
589
638
687
horas
Figura 4.19. Comparativa Análogos-Casandra del mes de Abril 2005
Mayo 2005 30.000 Casandra Modelo de Análogos Producciones reales 25.000
kW
20.000
15.000
10.000
5.000
0 1
50
99
148
197
246
295
344
393
442
491
540
horas
Figura 4.20. Comparativa Análogos-Casandra del mes de Mayo 2005
589
638
687
736
Error! Style not defined. Error! Style not defined.
89
Junio 2005 30.000 Casandra Modelo de Análogos Producciones reales 25.000
kW
20.000
15.000
10.000
5.000
0 1
50
99
148
197
246
295
344
393
442
491
540
589
638
687
horas
Figura 4.21. Comparativa Análogos-Casandra del mes de Junio 2005
Julio 2005 25000 Modelo de Análogos Producciones reales Casandra 20000
kW
15000
10000
5000
0 1
50
99
148
197
246
295
344
393
442
491
540
horas
Figura 4.22. Comparativa Análogos-Casandra del mes de Julio 2005
589
638
687
736
Error! Style not defined. Error! Style not defined.
90
Agosto 2005 30000 Modelo de Análogos Producciones reales Casandra 25000
kW
20000
15000
10000
5000
0 1
50
99
148
197
246
295
344
393
442
491
540
589
638
687
horas
Figura 4.23. Comparativa Análogos-Casandra del mes de Agosto 2005
Septiembre 2005 30000 Modelo de Análogos Producciones reales Casandra 25000
kW
20000
15000
10000
5000
0 1
50
99
148
197
246
295
344
393
442
491
540
horas
Figura 4.24. Comparativa Análogos-Casandra del mes de Septiembre 2005
589
638
687
736
Error! Style not defined. Error! Style not defined.
91
Octubre 2005 30000 Modelo de Análogos Producciones reales Casandra 25000
kW
20000
15000
10000
5000
0 1
50
99
148
197
246
295
344
393
442
491
540
589
638
687
736
horas
Figura 4.25. Comparativa Análogos-Casandra del mes de Octubre 2005
Noviembre 2005 30000 Modelo de Análogos Producciones reales Casandra 25000
kW
20000
15000
10000
5000
0 1
50
99
148
197
246
295
344
393
442
491
540
horas
Figura 4.26. Comparativa Análogos-Casandra del mes de Noviembre 2005
589
638
687
Error! Style not defined. Error! Style not defined.
92
Diciembre 2005 30000 Modelo de Análogos Producciones reales Casandra 25000
kW
20000
15000
10000
5000
0 1
50
99
148
197
246
295
344
393
442
491
540
589
638
687
horas
Figura 4.27. Comparativa Análogos-Casandra del mes de Diciembre 2005
Una de las apreciaciones que se obtienen con las gráficas es que en ocasiones Casandra es más suave en su trazo que el modelo de análogos, que es más oscilante. Esto supone en que en ocasiones Casandra no alcance altas producciones, ni producciones que se salen de ese rango suave, mientras que el modelo de análogos es más sensible a cambios oscilantes en las producciones reales. Este efecto se aprecia en la figura 4.28.
736
Error! Style not defined. Error! Style not defined.
93
Abril 2005 30.000 Casandra Modelo de Análogos Producciones reales 25.000
kW
20.000
15.000
10.000
5.000
0 1
50
99
148
197
246
295
344
393
442
491
540
589
638
687
horas
Figura 4.28. Comparativa Análogos-Casandra
Otra idea que se desprende de las gráficas comparativas es que Casandra sufre con las altas producciones más aún que el modelo de análogos. Sin embargo Casandra es más sensible a las producciones nulas, de las cuales muchas de ellas serían detectadas por el modelo de análogos con los datos de disponibilidad de las máquinas. Ambos efectos se recogen en la siguiente gráfica (Fig. 4.29).
Error! Style not defined. Error! Style not defined.
94
Diciembre 2005 30000 Modelo de Análogos Producciones reales Casandra 25000
kW
20000
15000
10000
5000
0 1
50
99
148
197
246
295
344
393
442
491
540
589
638
687
horas
Figura 4.29. Comparativa Análogos-Casandra
4.3.4 Combinación del modelo de Análogos con Casandra Una de las posibilidades que el modelo de análogos ofrece a Casandra Energy Services, es la combinación de sus predicciones junto a las de Casandra. En la siguiente tabla (tabla 4.5) se recogen los errores de dicha combinación, junto a los de ambos modelos de predicción por separado.
736
Error! Style not defined. Error! Style not defined.
Período
Error Análogos
95
Error Casandra
Error Análogos y Casandra
Abril 2005
0.49
0.46
0.45
Mayo 2005
0.55
0.54
0.51
Junio 2005
0.66
0.71
0.65
Julio 2005
0.62
0.61
0.58
Agosto 2005
0.74
0.64
0.65
Septiembre 2005
1.11
0.93
1
Octubre 2005
0.33
0.34
0.33
Noviembre 2005
0.41
0.38
0.37
Diciembre 2005
0.48
0.49
0.47
Tabla 4.5. Error del modelo de análogos, de Casandra y de su combinación
Como se observa en la tabla, la combinación de ambos modelos mejora en todas las ocasiones excepto una, Septiembre 2005 (período con gran cantidad de ceros de producción), a la mejor de las dos predicciones, ya sea Casandra o el modelo de análogos. A continuación se muestran las gráficas comparativas entre la combinación de ambos modelos de predicción y las producciones reales.
Error! Style not defined. Error! Style not defined.
96
Abril 2005 30.000 Producciones reales Análogos y Casandra 25.000
kW
20.000
15.000
10.000
5.000
0 1
50
99
148
197
246
295
344
393
442
491
540
589
638
687
horas
Figura 4.30. Comparativa Análogos y Casandra con las producciones reales en Abril 2005
Mayo 2005 30.000 Producciones reales Análogos y Casandra 25.000
kW
20.000
15.000
10.000
5.000
0 1
50
99
148
197
246
295
344
393
442
491
540
589
638
horas
Figura 4.31. Comparativa Análogos y Casandra con las producciones reales en Mayo 2005
687
736
Error! Style not defined. Error! Style not defined.
97
Junio 2005 30.000 Producciones reales Análogos y Casandra 25.000
kW
20.000
15.000
10.000
5.000
0 1
50
99
148
197
246
295
344
393
442
491
540
589
638
687
horas
Figura 4.32. Comparativa Análogos y Casandra con las producciones reales en Junio 2005
Julio 2005 25.000 Producciones reales Análogos y Casandra 20.000
kW
15.000
10.000
5.000
0 1
50
99
148
197
246
295
344
393
442
491
540
589
638
horas
Figura 4.33. Comparativa Análogos y Casandra con las producciones reales en Julio 2005
687
736
Error! Style not defined. Error! Style not defined.
98
Agosto 2005 30.000 Producciones reales Análogos y Casandra 25.000
kW
20.000
15.000
10.000
5.000
0 1
50
99
148
197
246
295
344
393
442
491
540
589
638
687
horas
Figura 4.34. Comparativa Análogos y Casandra con las producciones reales en Agosto 2005
Septiembre 2005 30.000 Producciones reales Análogos y Casandra 25.000
kW
20.000
15.000
10.000
5.000
0 1
50
99
148
197
246
295
344
393
442
491
540
589
638
horas
Figura 4.35. Comparativa Análogos y Casandra con las producciones reales en Septiembre 2005
687
736
Error! Style not defined. Error! Style not defined.
99
Octubre 2005 30.000 Producciones reales Análogos y Casandra 25.000
kW
20.000
15.000
10.000
5.000
0 1
50
99
148
197
246
295
344
393
442
491
540
589
638
687
736
horas
Figura 4.36. Comparativa Análogos y Casandra con las producciones reales en Octubre 2005
Noviembre 2005 30.000 Producciones reales Análogos y Casandra 25.000
kW
20.000
15.000
10.000
5.000
0 1
50
99
148
197
246
295
344
393
442
491
540
589
638
horas
Figura 4.37. Comparativa Análogos y Casandra con las producciones reales en Noviembre 2005
687
Error! Style not defined. Error! Style not defined.
100
Diciembre 2005 30.000 Producciones reales Análogos y Casandra 25.000
kW
20.000
15.000
10.000
5.000
0 1
50
99
148
197
246
295
344
393
442
491
540
589
638
687
horas
Figura 4.38. Comparativa Análogos y Casandra con las producciones reales en Diciembre 2005
La combinación de Casandra con el modelo de análogos ha sido realizada mediante la media de ambas predicciones. Como se comentaba en la comparativa entre ambos modelos, Casandra se comporta ligeramente mejor en las producciones bajas y los análogos mejor en las altas. Por esta razón a la hora de llevar a cabo las combinación de ambos modelos se realizaron pruebas que si la media de ambas correspondía a un rango bajo de producción diera más importancia a Casandra, y si por el contrario, la media se encontraba en un rango alto de producción la combinación otorgara más relevancia al modelo de análogos. Sin embargo, esta prueba no supuso cambios significativos en los resultados, debido a que los comportamientos positivos de un modelo frente a otro no son realmente importantes.
736
Error! Style not defined. Error! Style not defined.
101
4.4 Conclusiones La primera conclusión que se obtiene con los resultados del modelo de análogos, es que el modelo realizado tiene ligado un error que está situado dentro de los límites en los que se encuentran los modelos de predicción profesionales, siguiendo perfectamente la tendencia general de las producciones reales. Los resultados del modelo de análogos no sólo consiguen estar dentro de los márgenes de los modelos de predicción de los promotores eólicos, sino que se encuentran en paridad con los de Casandra, el modelo de predicción con un menor desvío de kilowatios por parque, el que más ahorro genera por desvíos para los parques eólicos. Los resultados del modelo de análogos revelan que este modelo va a ser de gran utilidad a Casandra Energy Services en su labor de la predicción de la producción eólica, no sólo por la obtención de un modelo de predicción para acudir al Mercado Diario, sino porque su combinación con Casandra genera un error inferior al mejor modelo de predicción (ya sea Casandra o Análogos) en cada período problema, con el consecuente ahorro económico en desvíos para los parques.
5 Conclusiones y Desarrollos Futuros
Error! Style not defined. Error! Style not defined.
5
103
Conclusiones y Desarrollos Futuros 5.1 Conclusiones Tras la revisión del estado del arte de la predicción de la producción eólica y la
obtención de los resultados del modelo de análogos, se deduce que los métodos de análogos y de razonamiento basado en casos son perfectamente válidos en el mundo de la predicción de la producción. Este método se suma así a los modelos basados en las ecuaciones dinámicas de la atmósfera, en series temporales, en redes neuronales artificiales, etc., para predecir la producción, siendo tan potente como otras técnicas híbridas. La adaptación del PAP-INM a la predicción de la producción eólica ha sido un proceso en el que finalmente no quedan muchas características y propiedades del documento de partida. Aparte de las diferencias obvias en la variable de predicción (precipitación y la producción de parques eólicos) y las señaladas en cuanto a algoritmos durante la explicación de la descripción del modelo (medida de similitud, selección de óptimos mediante la “regla de error estándar 1”, generación de coeficientes mediante mapas de Kohonen, formulación de la producción final, etc.). Los resultados obtenidos por el modelo de análogos son resultados cuyos errores están dentro de los márgenes típicos de los modelos de predicción. Recordando las conclusiones del capítulo de resultados, el modelo de análogos ha conseguido unos errores del orden de Casandra, la mejor opción dentro del catálogo de productos que se encuentran en el mercado español y por extensión a nivel mundial. En los períodos problema donde se ha ejecutado el modelo, el modelo de análogos ha sido en ocasiones superior a Casandra y viceversa, pero sin grandes diferencias entre los errores. Esto permite que ambos modelos puedan ser combinados para conseguir reducir el error del mejor de ambos en cada modelo. Esta prueba ha tenido unos resultados favorables, ya que la combinación de ambos modelos mejora a la mejor de las dos predicciones, ya sea Casandra o el modelo de Análogos. El proyecto es de gran utilidad para Gamesa Energía ya que le proporciona otra herramienta de predicción, que abre otra línea de investigación para Casandra Energy
Error! Style not defined. Error! Style not defined.
104
Services, con la que el agente vendedor puede acudir al Mercado Eléctrico, cuyos resultados combinados con los de su otro modelo de predicción mejoran su predicción actual, con el consecuente ahorro económico para sus clientes, al disminuir los desvíos generados por los parques eólicos. El modelo de análogos no sólo es válido para acudir al Mercado Diario de Electricidad, sino que también puede ser utilizado para realizar predicciones con campos predictores más recientes (lo cual generalmente implica más fiabilidad para la predicción), lo cual permita llevar los resultados del modelo a los diferentes Mercados Intradiarios, donde corregir las ofertas realizadas en el Mercado Diario. Esta opción es posible gracias a la reducción de los tiempos de ejecución de la herramienta. La aplicación informática del proyecto es además una herramienta muy general. Todos los parámetros del modelo pueden ser modificados para obtener nuevos resultados mediante sus diferentes combinaciones y cambios de valor. La herramienta se ha desarrollado en el marco de la predicción eólica, pero sin embargo podría se utilizada para predecir otras variables. Dichas variables pueden estar por tanto relacionadas con el mundo de la energía, como con otros terrenos, como puede ser el financiero. Por ejemplo, la variable podría ser desde los precios del mercado eléctrico en los Estados Unidos (cuyos campos predictores serían la época del año, las temperaturas, la velocidad del viento, índices de sequía, etc.) hasta los tipos de interés (cuyos campos predictores serían la inflación, la tendencia de las empresas del IBEX, etc.)
Error! Style not defined. Error! Style not defined.
105
5.2 Desarrollos Futuros Posibles desarrollos futuros del proyecto serían: •
Mejorar las salidas de la herramienta aprovechando el entorno de Excel para Visual Basic.
•
Implementar un interfaz con el usuario que agilice la configuración de los distintos ficheros.
•
Continuar con la optimización de los tiempos de ejecución de la aplicación.
•
Buscar otras formas de generación de combinaciones w y p para cada parque, e incluso añadir a la herramienta un módulo generador de esas combinaciones.
6 Bibliografía
Error! Style not defined.
6
107
Bibliografía 6.1 Documentos
AYUSO, J. J. (1994). Predicción estadística operativa en el INM, vol. B-34 de Monografías del Instituto Nacional de Meteorología. Ministerio de Medio Ambiente, Madrid. BENISTON, M. (1998). From turbulence to climate: Numerical Investigations of the atmosphere with a hierarchy of models. Springer-Verlag. BERGMAN, M. J., DELLEUR, J. W. (1985). Kalman filter estimation and prediction of daily streamflow: 1- review, algorithm and simulation experiments; 2- application to the potomac river. Water Resources Bulletin, 21(5):815-832. BJARNE, H. (2001). Weather Prediction Using Case-Based Reasoning and Fuzzy Set Theory. Meteorological Service of Canada, Environment Canada. New Brunswick Weather Centre. BJARNE, H. (2004). A fuzzy logic based analog forecasting system for ceiling and visibility. 38th Congress of the Canadian Meteorological and Oceanographic Society, Edmonton, Alberta. BREIMAN, L. (1984). Classification and Regression Trees. Wadsworth International Group, Belmont, CA. BRILLINGER, D. J. (1975). Time Series: Data Analysis and Theory. Holt, Rinehart and Winston. BURNSTEIN, M. H (1989). Analogy vs. CBR. The purpose of mapping. Proceedings from the Case-Based Reasoning Workshop, Pensacola Beach, Florida. Ed. Morgan Kaufmann. COFIÑO, A. (2003). Técnicas Estadísticas y Neuronales de Agrupamiento Adaptativo para la predicción probabilística de fenómenos meteorológicos locales. Aplicación en el Corto Plazo y en la Predicción Estacional. Tesis Doctoral. E.T.S.I. Caminos, Canales y Puertos. Universidad de Cantabria. COFIÑO, A., PRIMO, C., CANO, R., SORDO, C., and GUTIÉRREZ, J. M. (2003). Downscaling demeter seasonal ensemble precipitation forecasts in the tropics during el niño episodes. Geophysical Research Abstracts 5:14586. CONSEJO SUPERIOR DE INFORMÁTICA (1999). Métrica Versión 3. Mantenimiento de Sistemas de Información (Proceso MSI). Ministerio de Administraciones Públicas. CHATFIELD, C. (2003). The Analysis of Time Series: An Introduction. Ed. CRC Press, 6th ed.
Error! Style not defined.
108
EWCBR (1993). First European Workshop on Case-Based Reasoning. Posters and Presentations. University of Kaiserlautern. FURUNDZIC, D. (1998). Application example of neural networks for time series analysis: rainfall-runoff modelling. Signal Processing, 64:383-396. GARCÍA DE JALÓN, J., RODRÍGUEZ, J., BRAZÁLEZ, A. (1999). Aprenda Visual Basic 6.0. Escuela Superior de Ingenieros Industriales de San Sebastián. GARCÍA, L., FERNÁNDEZ, F. (2006). Generación eléctrica con energía eólica: presente y futuro. Análisis de situación y prospectiva de nuevas tecnologías energéticas nº 1. Ed. Asociación Nacional de Ingenieros del ICAI. GIEBEL, G. (2003). The state of art in short-term prediction of wind power. A literature overview. Development of a next generation wind resource forecasting system for the large-scale integration of onshore and offshore wind farms. Project Anemos. GREEN, J. (1999). Excel 2000 VBA Programmer`s Reference. Ed. Wrox Press, 1st ed. GUTIÉRREZ, J. M., COFIÑO, A. and RODRÍGUEZ, M. A. (2004). Clustering methods for statistical downscaling in short-range weather forecast. Monthly Weather Review. HOLTON, J. (1992). An Introduction to Dynamic Meteorology. Ed. Academic Press. HOYO, J., FERNÁNDEZ, A., MESTRE, A., PERAL, C. (2000). Sistema de predicción analógica de la precipitación del I.N.M. (P.A.P.-I.N.M.) Nota técnica número 1 del Servicio de Aplicaciones Meteorológicas. Ministerio de Medio Ambiente. KALNAY, E. (2003). Atmospheric Modelling, Data Assimilation and Predictability. Ed. Cambridge University Press. KOHONEN, T. (1990). The self-organizing map. Proc. IEEE 78, pp. 1464-1480. KOLODNER, J. (1992). An introduction to case-based reasoning. Artificial Intelligence Review 26. LORENZ, E. N. (1969). Atmospheric predictability as revealed by naturally occuring analogues. Journal of the Atmospheric Sciences, 26:636-646. MATÉ, C. (2003). Métodos Estadísticos de la Ingeniería. Universidad Pontificia de Comillas de Madrid. MUÑOZ, A. (1996). Aplicación de técnicas de redes neuronales al diagnóstico de procesos industriales. Tesis Doctoral. E.T.S.I. ICAI. Universidad Pontificia Comillas de Madrid. MUÑOZ, A., VILLAR, J. (1995). Neural network approach to the diagnosis of the boiler combustion in a coal power plant. ICANN’95, Industrial Conference, Paris, 1995 MURPHY, A. H. (1993). What is a good forecast? An essay on the nature of goodness in weather forecasting. Weather and Forecasting, 8:281-293. PEÑA, D. (1987). Estadística: Modelos y Métodos vol. 2 Modelos Linelaes y Series Temporales. Ed. Alianza Universidad Textos.
Error! Style not defined.
109
PÉREZ ARRIAGA, J. I. (2005). Libro Blanco de la Electricidad. Ministerio de Industria. Plan de Fomento de las Energías Renovables en España para el período 2000 – 2010. Aprobado por acuerdo del Consejo de Ministros celebrado el 30 de diciembre de 1999. Publicado por el IDAE. PLAZA, E., AAMODT, A. (1994). Case-Based Reasoning: Foundational Issues, Methodological Variations and System Approaches. AI Communications. IOS Press, Vol. 7: 1, pp. 39-59. Real Decreto 436 / 2004, de 12 de marzo, por el que se establece la metodología para la actualización y sistematización del régimen jurídico y económico de la actividad de la producción de la energía eléctrica en régimen especial. BOE nº 75 de 27 de marzo de 2004. VON STORCH, H. (1999). The analog method as a simple statistical downscaling technique: Comparison with more complicated methods. Journal of Climate, 12:3505-3506. WESS, S. (1994). Reasoning with cases. Theory and Practice. University of Kaiserlautern. WHITE, F. M. (1988). Mecánica de Fluidos. Ed. McGrawHill. ZACK, J. (2003). Overview of Wind Energy Generation Forecasting. New York State energy research and development authority. True Wind Solutions and AWS Scientific, Inc.
Error! Style not defined.
6.2 Sitios web www.cne.es www.gamesa.es www.icai.es www.idae.es www.inm.es www.omel.es www.ree.es www.unican.es
110
Error! Style not defined.
111
Anexo A: Manual de usuario A.1 Requisitos del sistema El modelo de análogos requiere: •
Sistema operativo: Windows 2000, Windows XP o Windows 2003.
•
Microsoft Office: Microsoft Excel 2000 o Microsoft Excel 2003.
•
Requisitos mínimos de hardware: 1 MB de espacio en disco para instalar el programa en el PC. 256 MB RAM. CD- ROM drive (para la instalación del programa).
Error! Style not defined.
112
A.2 Instalación Copiar el contenido del CD en una carpeta de programas. Para crear un acceso directo en el escritorio, hacer clic en el botón derecho del ratón, y seleccionar “Crear acceso directo”. A continuación se arrastra el nuevo icono al escritorio.
Error! Style not defined.
113
A.3 Configuración En este apartado se pretende dar información acerca de la estructura que deben tener los ficheros de entrada del programa y de cómo interpretar los ficheros de salida del mismo. Para la ubicación en el PC de todos estos ficheros se recomienda la creación de una carpeta que será indicada en una celdilla de Excel del programa. Por ejemplo: “C:\CBR\”. El funcionamiento interno del programa está descrito en los apartados 3.2 y 3.3 del documento. FICHERO DE CONFIGURACIÓN Se recomienda para este fichero el nombre “fichero_de_configuracion.txt” y una cabecera como la siguiente: %FICHERO DE CONFIGURACION PARA PREDICCION DE LA PRODUCCION %FECHA: DD / MM / AA
HORA: HH / MM
%============================================================ A continuación de la cabecera se establece la información y los parámetros que aporta el fichero de configuración. •
DATOSPARQUE: Detrás del “;” con que finaliza esta cabecera se escribe el nombre del fichero donde se encuentran los datos técnicos del parque eólico. Tras escribir el nombre se finaliza con “;”. Para el nombre de este fichero se recomienda: “datostecnicos.txt”.
•
AP: Detrás del “;” con que finaliza esta cabecera se escribe un dígito: 0 ó 1, según se vaya a realizar el proceso de ajuste y el de verificación o el de predicción respectivamente. Tras escribir el dígito se finaliza con “;”.
•
NUMRANGOS: Detrás del “;” con que finaliza esta cabecera se escribe un dígito, que es el número de rangos en que se divide la producción más uno, es decir, el número de valores que forman la división en rangos. Tras escribir el dígito se finaliza con “;”.
Error! Style not defined.
•
114
RANGOS: Detrás del “;” con que finaliza esta cabecera se escriben todos los números que forman los rangos de producción, empezando por 0 y terminando con la potencia nominal en kW, separados por “;”. Se cierra la línea con “;”.
•
DATOSAJUSTE: Detrás del “;” con que finaliza esta cabecera se escribe el nombre del fichero donde se encuentran los casos históricos para el proceso de ajuste. Tras escribir el nombre se finaliza con “;”. Para el nombre de este fichero se recomienda: “oficial.aj.txt”.
•
DATOSVERIFICACION: Detrás del “;” con que finaliza esta cabecera se escribe el nombre del fichero donde se encuentran los casos históricos para el proceso de verificación. Tras escribir el nombre se finaliza con “;”. Para el nombre de este fichero se recomienda: “oficial.ve.txt”.
•
COMBINACIONES: Detrás del “;” con que finaliza esta cabecera se escribe el nombre del fichero donde se encuentran las combinaciones de w y p que entran al proceso de ajuste. Tras escribir el nombre se finaliza con “;”. Para el nombre de este fichero se recomienda: “combinacionesoficial.txt”.
•
FECHA: Detrás del “;” con que finaliza esta cabecera se escribe la fecha en la que se va a realizar la predicción, DD;MM;AA;HH;DD;MM;AA;HH;, siendo el primer caso el comienzo de la predicción y el segundo caso el final de la predicción.
•
DATOSPREDICCION: Detrás del “;” con que finaliza esta cabecera se escribe el nombre del fichero donde se encuentran los casos históricos para el proceso de predicción. Tras escribir el nombre se finaliza con “;”. Para el nombre de este fichero se recomienda: “oficial.pr.txt”.
•
WP: Detrás del “;” con que finaliza esta cabecera se escribe el nombre del fichero donde se van a escribir las combinaciones seleccionadas por el proceso de ajuste. Tras escribir el nombre se finaliza con “;”. Para el nombre de este fichero se recomienda: “wp.txt”.
•
DATOSFUT: Detrás del “;” con que finaliza esta cabecera se escribe el nombre del fichero donde se encuentran los campos predictores de los casos
Error! Style not defined.
115
de los cuales se va a realizar la predicción. Tras escribir el nombre se finaliza con
“;”.
Para
el
nombre
de
este
fichero
se
recomienda:
“camposfuturosoficial.txt”. •
NUMFINAL: Detrás del “;” con que finaliza esta cabecera se escribe un dígito, que es el número de combinaciones que selecciona el proceso de ajuste. Tras escribir el dígito se finaliza con “;”.
•
NUMPROD: Detrás del “;” con que finaliza esta cabecera se escribe un dígito, que es el número de producciones finales para dar la producción. Tras escribir el dígito se finaliza con “;”.
Un ejemplo de este fichero es el siguiente: DATOSPARQUE;datostecnicos.txt; AP;1; NUMRANGOS;12; RANGOS;0;2500;5000;8000;11000;13000;15000;17000;19000;22000;25000;28390; DATOSAJUSTE;oficial.aj.txt; DATOSVERIFICACION;oficial.ve.txt; COMBINACIONES;combinacionesoficial.txt; FECHA;01;10;2005;01;31;10;2005;24; DATOSPREDICCION;oficial.pr.txt; WP;wp.txt; DATOSFUT;camposfuturosoficial.pr.txt; NUMFINAL;7; NUMPROD;21;
Error! Style not defined.
116
FICHERO DE DATOS TÉCNICOS Se recomienda para este fichero el nombre “datostecnicos.txt” y una cabecera como la siguiente: % FICHERO DE LOS DATOS TÉCNICOS DEL PARQUE %FECHA: DD / MM / AA
HORA: HH / MM
%============================================================ A continuación de la cabecera se establece la información y los parámetros que aporta el fichero de datos técnicos. •
NOMBRE: Detrás del “;” con que finaliza esta cabecera se escribe el nombre del parque eólico. Tras escribir el nombre se finaliza con “;”.
•
POTENCIA: Detrás del “;” con que finaliza esta cabecera se escribe un número que es la potencia del parque en MW. Tras escribirlo se finaliza con “;”.
•
UBICACION: Detrás del “;” con que finaliza esta cabecera se escribe el nombre de la provincia donde se encuentra parque eólico. Tras escribir el nombre se finaliza con “;”.
•
AEROGENERADORES: Detrás del “;” con que finaliza esta cabecera se escribe el nombre del modelo de los aerogeneradores del parque eólico. Tras escribir el nombre se finaliza con “;”.
•
NUMERO_DE_AEROGENERADORES: Detrás del “;” con que finaliza esta cabecera se escribe el número de aerogeneradores que hay en el parque. Tras escribirlo se finaliza con “;”.
•
ALTURA_DE_BUJE: Detrás del “;” con que finaliza esta cabecera se escribe el valor de la altura de buje del parque. Tras escribirlo se finaliza con “;”.
•
POTENCIA_UNITARIA: Detrás del “;” con que finaliza esta cabecera se escribe un número que es la potencia unitaria de los aerogeneradores del parque en kW. Tras escribirlo se finaliza con “;”.
Error! Style not defined.
•
117
ALTITUD: Detrás del “;” con que finaliza esta cabecera se escribe un número que es la altura sobre el nivel del mar del parque en m. Tras escribirlo se finaliza con “;”.
•
REJILLA: Detrás del “;” con que finaliza esta cabecera se escribe un número que es la rejilla donde se encuentra el parque. Tras escribirlo se finaliza con “;”.
FICHERO DE COMBINACIONES Se recomienda para este fichero el nombre “combinacionesoficial.txt” y una cabecera como la siguiente: % FICHERO DE COMBINACIONES PARA EL AJUSTE DEL PARQUE %FECHA: DD / MM / AA
HORA: HH / MM
%============================================================ A continuación de la cabecera se establecen los parámetros que aporta del fichero. •
NUMERO_DE_COMBINACIONES: Detrás del “;” con que finaliza esta cabecera se escribe un número que es el número de combinaciones que le van a entrar al proceso de ajuste. Tras escribirlo se finaliza con “;”.
•
NUMERO_DE_W: Detrás del “;” con que finaliza esta cabecera se escribe un número que es el número de w, esto es, de campos predictores, que lleva cada combinación. Tras escribirlo se finaliza con “;”.
•
NUMERO_DE_P: Detrás del “;” con que finaliza esta cabecera se escribe un número que es el número de p, esto es, de rejillas, que lleva cada combinación. Tras escribirlo se finaliza con “;”.
•
NUMERO_DE_COMBINACIONES_FINALES: Detrás del “;” con que finaliza esta cabecera se escribe un número que es el número de combinaciones que va a seleccionar el proceso de ajuste. Este número, como
Error! Style not defined.
118
es lógico, deberá coincidir con el escrito en el fichero de configuración. Tras escribirlo se finaliza con “;”.
A continuación se recomienda un comentario: %============================================================ % CASO;w1;w2;......;p1;p2;.....; %============================================================ Debajo de esta cabecera se escriben las combinaciones que entran al proceso de ajuste. Se escriben tantas como se indicó en el número de combinaciones, tantas w como en número de w y tantas p como en número de p. 1;w1,w2,w3……;p1;p2;p3;…….; 2; w1,w2,w3……;p1;p2;p3;…….; 3; w1,w2,w3……;p1;p2;p3;…….; etc. Esta misma estructura de fichero sirve para el fichero que contiene las combinaciones seleccionadas por el proceso de ajuste con la salvedad que el número de combinaciones coincide con el número de combinaciones finales. Se recomienda como nombre “wp.txt”. FICHERO DE DATOS HISTÓRICOS PARA EL AJUSTE Se recomienda para este fichero el nombre “oficial.aj.txt” y una cabecera como la siguiente: % FICHERO DE LOS DATOS HISTÓRICOS PARA EL AJUSTE %FECHA: DD / MM / AA
HORA: HH / MM
%============================================================
Error! Style not defined.
119
A continuación de la cabecera se establecen los parámetros que aporta del fichero. •
NUMERO_DE_CASOS: Detrás del “;” con que finaliza esta cabecera se escribe un número que es el número de casos históricos para el proceso de ajuste. Tras escribirlo se finaliza con “;”.
•
NUMERO_DE_CAMPOS_PREDICTORES: Detrás del “;” con que finaliza esta cabecera se escribe un número que es el número de campos predictores que lleva cada caso en cada rejilla. Tras escribirlo se finaliza con “;”.
•
NUMERO_DE_REJILLAS: Detrás del “;” con que finaliza esta cabecera se escribe un número que es el número de rejillas que lleva cada caso. Tras escribirlo se finaliza con “;”.
A continuación se recomienda un comentario: %============================================================ %DIA;MES;AÑO;HORA;CAMPO1.1;CAMPO2.1;…;CAMPO1.2;…;CONTADOR; %============================================================ Debajo de esta cabecera se escriben los casos históricos para el proceso de ajuste. Se escriben tantos como se indicó en el número de casos, tantos campos predictores en tantas rejillas como en número de campos predictores y número de rejillas respectivamente. Al final de cada caso se incluye la producción de esa hora en el parque en kW. día;mes;año;hora;campo1rejilla1;campo2rejilla1;…;campo1rejilla2;campo2rejilla2;…; producción; día;mes;año;hora;campo1rejilla1;campo2rejilla1;…;campo1rejilla2;campo2rejilla2;…; producción; etc.
Error! Style not defined.
120
La estructura descrita para este fichero es válida tanto para el fichero de verificación y para el fichero de predicción. Los nombres recomendados para este fichero son “oficial.ve.txt” y “oficial.pr.txt” respectivamente. Esta estructura también es válida para el fichero de los campos futuros (”camposfuturosoficial.txt”) con la obvia salvedad de que no incluye las producciones de los casos.
FICHERO DEL RESULTADO DE LA VERIFICACIÓN Este
fichero
es
una
salida
del
programa.
Bajo
el
nombre
“Resultado_de_la_verificación” indica el Brier Score para cada combinación seleccionada por el ajuste.
FICHERO DE LA PREDICCIÓN DE LA PRODUCCIÓN Este
fichero
es
una
salida
del
programa.
Bajo
el
nombre
“Predicción_de_la_producción” contiene las producciones seleccionadas por cada combinación para cada caso problema además de la ponderada de todas ellas.
Error! Style not defined.
121
A.4 Ejecución Una vez configurados los ficheros ya se puede proceder a la ejecución del modelo de análogos. Para ello hacer doble clic con el botón izquierdo del ratón en el icono del programa, o bien, hacer clic con el botón derecho y seleccionar la opción “Abrir”. Una vez abierto aparece el mensaje siguiente (Fig. A.1). En ella se selecciona “Habilitar macros”.
Figura A.1. Advertencia de seguridad
Error! Style not defined.
122
Si la seguridad del Excel es muy alta, las macros no se ejecutarán. Por ello es necesario
establecer
un
nivel
de
seguridad
medio.
Para
ello
seleccionar
“Herramientas”, “Macro”, “Seguridad”. Este proceso se refleja en las siguientes figuras.
Figura A.2. Seguridad de las macros
Error! Style not defined.
123
Figura A.3. Seguridad
Error! Style not defined.
124
El interfaz con el usuario se muestra en la figura A.4. Al hacer clic en el botón “Ejecutar programa” comenzará la ejecución del mismo.
Figura A.4. Interfaz del programa