Implementación de las técnicas de predicción en la generación de energía eléctrica en el sector industrial

Implementation of prediction techniques in the generation of electrical energy in the industrial sector

Jesús Abraham Castorena Peña
Universidad Autónoma de Coahuila, México
Alicia Elena Silva Ávila
Universidad Autónoma de Coahuila, México
Rodolfo Martínez Zúñiga
Universidad Autónoma de Coahuila, México
Gloria Elisa Campos Posada
Universidad Autónoma de Coahuila, México
Jehú Efraín Martínez Castro
Universidad Autónoma de Coahuila, México

Revista de Investigación en Tecnologías de la Información

ISSN-e: 2387-0893

Periodicidad: Bianual

vol. 8, núm. 15, 2020

revista.riti@gmail.com

Recepción: Noviembre 19, 2019

Aprobación: Febrero 20, 2020



DOI: https://doi.org/:10.36825/RITI.08.15.003

© Revista de Investigación en Tecnologías de la Información (RITI) 2020

Resumen: Las técnicas de predicción actualmente cuentan con un gran potencial, mediante ellas se pueden obtener estimaciones o pronósticos de valores futuros de una manera confiable, las cuales pueden ser utilizadas para la toma de decisiones. Ahora bien, las industrias son unas de las mayores consumidoras de electricidad, por lo que, muchas de ellas utilizan generadores eléctricos propios para poder cumplir con la demanda de energía que requieren sus procesos. Pero también, dentro de este proceso existen problemas o situaciones no beneficiosas, uno de ellos, es que, si no hay monitoreo y control en la generación de energía eléctrica de una manera adecuada, provocará gran pérdida de recursos monetarios. Por tal motivo, se propone implementar las técnicas de predicción dentro del proceso de generación de energía para comparar y seleccionar la técnica que muestre el mejor pronóstico de consumo y así evitar la pérdida de recursos en la industria.

Palabras clave: Técnicas de Predicción, Energía, Toma de Decisiones, Industria.

Abstract: Prediction techniques currently have great potential, through them you can obtain estimates or forecasts of future values in a reliable way, which can be used for decision making. However, industries are one of the largest consumers of electricity, so many of them use their own electric generators to be able to meet the energy demand that their processes require. But also, within this process there are problems or situations that are not beneficial, one of them, is that, if there is no monitoring and control in the generation of electrical energy in an adequate way, it will cause a great loss of monetary resources. For this reason, it is proposed to implement the prediction techniques within the power generation process to compare and select the technique that shows the best consumption forecast and thus avoid the loss of resources in the industry.

Keywords: Techniques of Prediction, Energy, Decision Making, Industry.

1. Introducción

El objetivo principal de las técnicas de predicción es obtener estimaciones o pronósticos de valores futuros de una serie temporal a partir de información histórica contenida en la serie observada hasta el momento actual, en otras palabras, se trata de la predicción de los valores futuros posibles de las variables en base a los valores previos de esas variables [1].

Existen muchos tipos de técnicas de predicción, así como una gran cantidad de aplicaciones útiles en la vida para el ser humano, desde las más simples como lo pueden ser el azar, hasta en los negocios dentro de una empresa [2].Algunos de los campos en donde las técnicas de predicción pueden ser muy útiles son:

Es precisamente en este último campo de energías donde se desarrolló esta investigación, en la producción de energía eléctrica que genera una empresa para abastecer sus procesos. Utilizando datos históricos recolectados de su generador, y a la selección de las técnicas de predicción como lo son la regresión lineal y promedios móviles, estimar los valores futuros del generador. Se planteo a la empresa realizar un estudio con los métodos de regresión lineal y promedios móviles ya que la empresa empleaba el método de hojas de cálculo para administrar la generación de energía eléctrica.

El proceso seguido para el desarrollo de esta investigación es la que se describe a continuación:

2. Estado del arte

Las técnicas emplean datos históricos para predecir eventos futuros. Normalmente, los datos históricos se utilizan para crear un modelo matemático que capture las tendencias importantes. Estas técnicas de predicción se usan entonces con los datos actuales para predecir lo que pasará a continuación, o bien para sugerir acciones con el fin de obtener resultados óptimos [3].

Dentro de las principales técnicas de predicción más utilizadas actualmente para pronosticar los valores futuros sobre la demanda de energía se encuentran el modelo de series temporales, modelo de promedios móviles, modelo de promedio autorregresivos integrado (ARIMA), técnicas de inteligencia artificialy modelos de regresión lineal y polinomial [4].

2.1 Técnicas de regresión

En este tipo de técnicas se hace vital el uso de la regresión, que, en estadística, es un proceso para estimar las relaciones entre variables. Incluye muchas maneras para el modelado y análisis de diversas variables, cuando la atención se centra en la relación entre una variable dependiente y una o más variables independientes. Más específicamente, la regresión ayuda a entender cómo el valor de la variable dependiente varía al cambiar el valor de una de las variables independientes, manteniendo el valor de las otras variables independientes fijas [5]. Convirtiéndose así en uno de los métodos estadísticos más utilizados para modelar un conjunto de datos de sección transversal.

2.2 Regresión lineal

Existen muchas técnicas de regresión en función del tipo de variables y de la forma funcional supuesta entre ellas. Las más elementales (aunque las más potentes en el sentido de que se puede obtener más información) son las lineales, las cuales son una herramienta simple de aprendizaje automático para predecir un parámetro desconocido basadas en variables independientes determinadas. Asimismo, permite probar si existe influencia de las variables independientes a la variable dependiente [6].

El modelado de análisis de regresión que involucra una variable independiente y una variable dependiente para el cual la relación entre las variables se aproxima por medio de una recta se llama regresión lineal simple. En la regresión simple se tiene una única variable predictora. Mientras que, si se integran dos o más variables regresoras o predictoras, se debe recurrir al uso del modelo regresión múltiple [7][8]. A partir de la regresión lineal es posible obtener predicciones sobre la variable dependiente con base a los valores de la variable dependiente[9], la ecuación de análisis de regresión lineal simple está dada por:

(1)

Donde,

= Valor estimado de la variable dependiente.

= Intercepto de la ecuación de regresión estimada.

= Pendiente de la ecuación de regresión estimada.

= Valor de la variable independiente.

2.2.1 Confiabilidad de resultados

Para que los resultados de la regresión sean confiables (una forma coloquial de referirse a: insesgados, es decir que sus resultados sean parecidos a los reales; y óptimos, es decir que su varianza sea mínima) es necesario que:

2.3 Regresión polinomial

La regresión polinomial es una forma de regresión lineal en la que la relación entre la variable independiente x y la variable dependiente y es modelada como un polinomio de grado n en x[10], elcual se ajusta a un comportamiento o relación no lineal entre el valor de x y la correspondiente media condicional de y, denotada E (y | x). En este modelo solo aparece una variable explicativa continua, x, a la cual se le puede ajustar potencias mayores de x, como , , , …, y añadirlas al modelo junto a x para describir diversos tipos de curvaturas en relación con la variable y x.

La ecuación del modelo de regresión polinomial de orden k para una variable independiente está dada por:

(2)

Donde,

= Valor estimado de la variable dependiente.

= Parámetros del modelo o coeficientes de regresión.

= Predictores.

2.4 Promedio móvil

Esta técnica de predicción forma parte de una serie de métodos conocidos como métodos de suavización; que tienen como objetivo suavizar las fluctuaciones aleatorias causadas por el componente irregular de las series de tiempo [11].

La utilización de esta técnica supone que la serie de tiempo es estable, esto es, que los datos que la componen se generan sin variaciones importantes entre un dato y otro, aunque muestren un crecimiento o un decrecimiento lo hagan con una tendencia constante. Asimismo, un análisis técnico de promedio móviles es usado comúnmente como una de las técnicas de predicción para predecir futuros movimientos en los datos, a partir de datos pasados [12].

De esta manera, se utiliza como pronóstico para el siguiente periodo el promedio de los n valores de los datos más recientes de la serie de tiempo. Expresado de una forma matemática, seria:

(3)

El término móvil indica que, mientras se dispone de una nueva observación para la serie de tiempo, reemplaza a la observación más antigua de la ecuación, y se calcula un promedio nuevo. Como resultado, el promedio cambiará, o se moverá, conforme surjan nuevas observaciones.

No existe una regla específica que nos indique cómo seleccionar la base del promedio móvil n. Si la variable que se va a pronosticar no presenta variaciones considerables, se recomienda que el valor de n sea grande. Por el contrario, es aconsejable un valor de n pequeño si la variable muestra patrones cambiantes.

2.5 Inteligencia artificial

La inteligencia artificial (IA) hace referencia a la capacidad que tienen las máquinas de emular el comportamiento del ser humano [13] a través de sus distintas ramas como lo son: lógica difusa, redes neuronales, árboles de decisión y algoritmos genéticos (Tabla 1), entre otras, las cuales han permitido el desarrollo de nuevas tecnologías de tipo inteligente que sean capaces de resolver problemas complejos, así como automatizar y optimizar procesos o servicios empresariales de forma eficaz y eficiente sin la menor intervención del factor humano. La IA implica estudiar el diseño de máquinas inteligentes, de tal manera que puedan dar soluciones reales relacionadas con la toma de decisiones en las organizaciones [14].

Tabla 1.
Técnicas de Inteligencia Artificial.
Técnica Definición
Lógica difusa Rama de la inteligencia artificial que permite manejar datos imprecisos y ambiguos para tomar decisiones como lo haría una persona [15].
Redes neuronales Paradigmas computacionales basados en modelos matemáticos para extraer información útil y producir inferencias a partir de los datos disponibles gracias a su capacidad de aprendizaje [16].
Arboles de decisión Técnica de predicción la cual consiste en la representación analítica de todos los eventos (sucesos) mediante nodos de un posible problema y que sirve para categorizar una serie de condiciones que ocurren en forma repetitiva para la solución de un problema [17].
Algoritmos genéticos Los algoritmos genéticos (GA) son procedimientos de búsqueda probabilística que generan soluciones a problemas de optimización utilizando técnicas inspiradas en la evolución natural, como la herencia, la mutación, la selección y el cruce [18].
Elaboración propia.

2.6 Modelos ARIMA

Los modelos ARIMA representan un modelo autorregresivo integrado de promedio móvil, los cuales suelen aplicarse solamente a series de tiempo estacionarias, es decir, al conjunto de datos de tiempo con media y varianza constantes. Estos modelos se representan mediante el término ARIMA(p,d,q), donde p hace referencia al orden del modelo autorregresivo, d a la diferenciación y q al término de media móvil con q términos de error. Este tipo de modelos se aplica tanto para datos discretos o continuos [19]. La forma general de estos modelos tiene la forma de una ARMA la cual consiste en [20]:

Donde,

(4)

Donde,

= Variable temporal.

= Número de rezagos necesarios para pronosticar un valor actual.

= Parámetros del modelo.

= Valores actuales de la serie.

Los procesos ARIMA desatacan una serie de consideraciones antes de hacer uso de este tipo de modelo, entre las cuales están: la cantidad de datos necesario para el modelado, donde la sugerencia es un mínimo de 50 observaciones, así como, así como el uso de datos espaciados equidistantemente en el tiempo, es decir en intervalos discretos de tiempo.

3. Materiales y métodos

Existen diversos modelos de predicción de acuerdo con la revisión de la literatura y en baseal número de los datos reales obtenidos del proceso en sitiose procedió a implementar las técnicas de promedios móviles, regresión lineal simple y regresión polinomialgrado trespara analizar el comportamiento del conjunto de datos.

3.1.Recopilación de datos

Tabla 2.
Datos históricos de consumo de potencia en el periodo.
Mes Semana Generador Mes Semana Generador
01 1 16775.52 07 25 16282.44
01 2 16539.86 07 26 16606.21
01 3 18235.70 07 27 16023.45
01 4 24696.88 07 28 23158.93
02 5 16679.56 08 29 15821.72
02 6 16581.61 08 30 16811.81
02 7 17116.90 08 31 16465.39
02 8 16698.90 08 32 20292.55
03 9 16914.81 09 33 15361.49
03 10 18633.02 09 34 13581.82
03 11 18575.21 09 35 15198.85
03 12 26370.34 09 36 22797.48
04 13 18224.50 10 37 16609.06
04 14 19254.62 10 38 17370.16
04 15 19238.11 10 39 17542.20
04 16 24780.47 10 40 24808.18
05 17 16137.64 11 41 15422.54
05 18 15471.03 11 42 16961.61
05 19 15037.45 11 43 17483.50
05 20 19737.63 11 44 21908.86
06 21 14044.53 12 45 16775.52
06 22 16291.16 12 46 16539.86
06 23 16251.63 12 47 18235.70
06 24 21246.83 12 48 24696.88
Elaboración propia.

Enseguida se muestra la Tabla 3 con los valores atípicos los cuales proporcionan valores extremos que pueden sesgar la aplicación de los métodos y que fueron identificados mediante la prueba de Dixon, el cual utilizó 1000000 simulaciones Monte Carlo para calcular el valor-p de cada una de las observaciones con un intervalo de confianza al 99% (Tabla 4 y Tabla 5).

Tabla 3.
Valores atípicos eliminados de la muestra mediante la prueba de Dixon.
Semana Generador
4 24696.88
12 26370.34
16 24780.47
20 19737.63
24 21246.83
28 23158.93
32 20292.55
36 22797.48
40 24808.18
44 21908.86
48 24696.88
Elaboración propia.

Tabla 4.
Estadísticos descriptivos.
Variable Observaciones Obs. Con datos perdidos Obs. Sin datos perdidos Mínimo Máximo Media Desv. Típica
Generador 48 0 48 13581.823 26370.341 18172.712 3113.050
Elaboración propia.

Tabla 5.
Prueba de Dixon para valores atípicos / Prueba bilateral.
R10 (Valor observado) R10 (Valor crítico) Valor-p (bilateral) alfa
0.122 0.259 0.514 0.05
Elaboración propia.

3.2. Comparación de técnicas

Una vez que se obtienen los datos históricos y se eliminan los datos atípicos, se procedió a demostrar cuál de las técnicas de predicción es la más adecuada para pronosticar el consumo de los próximos tres meses de energía eléctrica. Para ello se graficaron los datos obtenidos en la Tabla 1 con cada uno de los métodos aquí descritos, los cuales pueden observarse en las Figuras 1, 2 y 3.

Comportamiento de los datos históricos. Promedios
móviles.
Figura 1.
Comportamiento de los datos históricos. Promedios móviles.
Elaboración propia.

Comportamiento de los datos históricos. Regresión lineal
simple.
Figura 2.
Comportamiento de los datos históricos. Regresión lineal simple.
Elaboración propia.

Comportamiento de los datos históricos. Regresión lineal
polinomial grado 6.
Figura 3.
Comportamiento de los datos históricos. Regresión lineal polinomial grado 6.
Elaboración propia.

Se aplicaron dos técnicas como lo son el error cuadrático medioy porcentaje de error medio absoluto para determinar cuál es el método de predicción más adecuado para pronosticar el consumo de energía eléctrica en la empresa.

Error cuadrático medio

Donde,

= Número de observaciones.

= Consumo de energía real.

= Consumo de energía pronosticada.

En la Tabla 6 se muestra los valores obtenidos del ECM (Error cuadrático Medio) por los distintitos modelos propuestos.

Tabla 6.
Resultados de aplicar la técnica ECM de las desviaciones de consumo de energía.
Regresión Lineal Polinómico grado 3 Media móvilgrado 2
Consumo de Energía 1515656.761 1133515.937 333623.431
Elaboración propia.

Porcentaje de Error Medio Absoluto

Donde,

= Número de observaciones.

= Consumo de energía real.

= Consumo de energía pronosticada.

4. Resultados

Con la aplicación de las técnicas de predicción, los datos pronosticados a corto plazo de los siguientes tres meses sobre el consumo de energía eléctrica a partir de que se concluye el ciclo de medición en sitio, sería los mostrados en la Tabla 7, bajo el método de promedios móviles grado 2 que fue el modelo que mostró el mejor comportamiento de la serie de datos, según el porcentaje de error medio absoluto y error cuadrático medio con un 2.67% y 333623.431 respectivamente.

Tabla 7.
Predicción de consumo para los 3 meses siguientes mediante promedios móviles de grado 2.
Mes/semana Promedio móvilgrado 2
(1/1) 19609.83
(1/2) 20891.90
(1/3) 22315.65
(1/4) 23199.38
(2/1) 21173.53
(2/2) 21163.95
(2/3) 23337.63
(2/4) 23889.73
(3/1) 21993.61
(3/2) 21899.95
(3/3) 24196.04
(3/4) 24745.37
Elaboración propia.

5. Agradecimiento

Se agradece las facilidades prestadas para la realización de esta investigación a la Universidad Autónoma de Coahuila.

6. Conclusiones

El análisis del comportamiento de los datos de consumo de energía reveló, que cuanto menor sea el número de períodos utilizados para el cálculo de promedio móvil, el pronóstico responde más rápido a los cambios presentados que tienen los datos históricos, proporcionado una mejor proyección de los datos futuros. Asimismo, a partir del análisis de los modelos propuestos para realizar el pronóstico del consumo de energía, el método de promedios móviles fue el que ofreció una mejor proyección y un porcentaje de error bajo como se observa en la Tabla 8.

Tabla 8.
Resultados de aplicar el porcentaje de error medio absoluto.
Regresión lineal Polinómico grado 3 Media móvil grado 2
Consumo de Energía 5.81% 5.16% 2.67%
Elaboración propia.

Una vez que se han aplicado las técnicas de predicción usando el historial de generación eléctrica y que se han comparado los resultados obtenidos por ambas técnicas para seleccionar la más adecuada, se puede concluir lo siguiente:

Referencias

[1] Toro Ocampo, E. M., Molina Cabrera, A., Garcés Ruiz, A. (2006). Pronóstico de bolsa de valores empleando técnicas inteligentes. Tecnura, 9 (18), 57-66.

[2] Arahal, M. R., Berenguel , M., Rodríguez, F. (2006). Técnicas de predicción con aplicaciones en Ingeniería. Sevilla: Secretariado de Publicaciones de la Universidad de Sevilla.

[3] Rueda, V. M., Velásquez Heano, J. D., Franco Cardona, C. J. (2011). Avances recientes en la predicción de la demanda de electricidad usando modelos no lineales. Dyna, 78 (167), 36-43.

[4] Astorga Gómez, J. M., Aróstica Córdova, R. A., Iriarte Salinas, Y. A. (2016). Estimación del factor K en transformadores de distribución usando modelos de regresión lineal. Tecnura, 20 (48), 29-40.

[5] Seber, G., Lee, A. J. (2003). Linear Regression Analysis (2 ed.). New York: John Wiley & Sons.

[6] Permai, S. D.,Tanty, H. (2018). Linear regression model using bayesian approach for energy performance of residential building. Procedia Computer Science, 135,671-677. doi: http://dx.doi.org/10.1016/j.procs.2018.08.219

[7] Carrasquilla, A., Chacón, A., Núñez, K., Gómez, O., Valverde, J., Guerrero, M. (2016). Regresión lineal simple y múltiple: aplicación en la predicción de variables naturales relacionadas con el crecimiento microalgal. Tecnología en Marcha, 29 (suppl. 5), 33-45. doi: https://dx.doi.org/10.18845/tm.v29i8.2983

[8] Berlanga, V., Vilà, R. (2013). Cómo obtener un Modelo de Regresión Logística Binaria con SPSS. Reire Revista D'Innovació I Recerca En Educació, 7 (2), 105-118.

[9] Barman, U., Dev Choudhury, R. (2020). Smartphone image based digital chlorophyll meter to estimate the value of citrus leaves chlorophyll using Linear Regression, LMBP-ANN and SCGBP-ANN. Journal of King Saud University - Computer and Information Sciences, in press. doi: https://doi.org/10.1016/j.jksuci.2020.01.005

[10] Golizadeh Akhlaghi, Y., Ma, X., Zhao, X., Shittu, S., Li, J. (2019). A statistical model for dew point air cooler based on the multiple polynomial regression approach. Energy, 181,868-881. doi: https://doi.org/10.1016/j.energy.2019.05.213

[11] Anderson, D. R., Sweeney, D. J., Williams, T. A., Camm, J. D., Martin, K. (2011). Métodos cuantitativos para los negocio (11 ed.). México, D.F.: Cengage Learning.

[12] Chien-Hua, C., Xuan-Qi, S., Jun-Biao, L. (2016). The role of information uncertainty in moving-average technical analysis: A study of individual stock-option issuance in Taiwan. Finance Research Letters, 18, 263–272. doi: https://doi.org/10.1016/j.frl.2016.04.026

[13] Chayakrit, K., HongJu, Z., Wang, Z., Mehmet, A., Takeshi, K. (2017). Artificial Intelligence in Precision Cardiovascular Medicine. Journal of the American College of Cardiology, 69 (21), 2657-2664. doi: https://doi.org/10.1016/j.jacc.2017.03.571

[14] Matos Ramírez, N. (2014). La inteligencia artificial. Nuevo enfoque en la evaluación de las máquinas en el complejo cosecha – transporte - recepción de la caña de azúcar. Revista Ingeniería agrícola, 4 (2), 60-64. Recuperado de https://revistas.unah.edu.cu/index.php/IAgric/article/view/646

[15] Meana-Llorián, D., González García, C., Pelayo G-Bustelo, B. C., Cueva Lovelle, J. M.,Garcia Fernandez, N. (2017). IoFClime: The fuzzy logic and the Internet of Things to control indoor temperature regarding the outdoor ambient conditions. Future Generation Computer Systems, 76, 275-284.

[16] Sprockel Díaz, J. J., Diaztagle Fernández, J. J., González Guerrero, E. (2017). Diagnóstico automático del síndrome coronario agudo utilizando un sistema multiagente basado en redes neuronales. Revista Colombiana de Cardiología, 24 (3), 255-260. doi: https://doi.org/10.1016/j.rccar.2016.11.010

[17] Solarte Martínez, G. R., Soto Mejía, J. A. (2011). Arboles de decisiones en el diagnóstico de enfermedades cardiovasculares. Scientia Et Technica, XVI (49), 104-109.

[18] Boggi, S., Fano, W. G. (2020). Numerical response and causality study of the magnetic permeabilityfrequency function of NiZn ferrites using Genetic Algorithm. Journal of Magnetism and Magnetic Materials, 500, 1-5. doi: https://doi.org/10.1016/j.jmmm.2019.166305

[19] Gallego-Nicasio Moraleda, J., Rodríguez Aranda, A., Mínguez Novella, J., Jiménez Perez, F. (2018). Modelos ARIMA para la predicción del gasto conjunto de oxígeno de vuelo y otros gases en el Ejército del Aire. Sanidad Militar, 74 (4), 223-229. doi: https://doi.org/10.4321/s1887-85712018000400002

[20] Amaris, G., Ávila, H., Guerrero, T. (2017). Aplicación de modelo ARIMA para el análisis de series de volúmenes anuales en el río Magdalena. Tecnura, 21 (52),88-10. doi: http://dx.doi.org/10.14483/udistrital.jour.tecnura.2017.2.a07

Modelo de publicación sin fines de lucro para conservar la naturaleza académica y abierta de la comunicación científica
HTML generado a partir de XML-JATS4R