EL RETO

EL RETO

Para el análisis de los datos se han creado tres muestras aleatorias estratificadas por municipio.

Cada muestra se tomó con aproximadamente seis millones de registros históricos comprendidos entre los años 2010 y 2020, estos registros incluyen: el código de cuenta del cliente, periodo al que corresponde la facturación, cantidad de energía facturada en kWh/m, clase del servicio, estrato socioeconómico, municipio donde se encuentra localizado el predio, ciclo de facturación, sector Urbano o Rural.

Los participantes deberán desarrollar una solución que logre predecir el comportamiento de la variable cantidad de energía facturada en kWh/m con la mayor precisión posible, para determinar la precisión se utilizara como referencia el primer trimestre del año en curso y realizar la comparación con datos reales.

En síntesis, los participantes deberán procesar 10 años de registros históricos comprendidos entre enero del 2010 y diciembre del 2020, para predecir lo más preciso posible, los valores para enero, febrero y marzo del 2021. 

La solución deberá ser un proyecto de software, emplear herramientas y lenguajes de programación Open Source, Software libre o de licencia gratuita, compilar, ejecutar el análisis de los registros históricos y generar los registros pronosticados en un archivo CSV.