INDUSTRIA: GOBIERNO

SOLUCIÓN: BIG DATA / DATA SCIENCE / CLOUD + APPS

PROYECTO: BIG DATA

Cliente:

Sunat

Industria:

Gobierno

Solución:

Big Data / Data Science / Cloud + Apps

Proyecto:

Big Data

SITUACIÓN INICIAL

La Superintendencia Nacional de Administración Tributaria (Sunat) es la entidad recaudadora de impuestos del gobierno del Perú, y desde el 2018 ha extendido el uso de facturas electrónicas como parte de sus objetivos de formalizar la economía y reducir la evasión tributaria

DESAFÍO

Sunat tenía el reto de levantar a una base de datos en Azure la historia de 5 años de facturas electrónicas, que sumaban varios cientos de millones de archivos XML, procesarlas para extraer los datos en un formato plano, e integrarlo con las herramientas analíticas con las que cuenta.

IMPLEMENTACIÓN

Analytics trabajo en conjunto con Sunat y Microsoft Consulting Services para la evaluación y ejecución del proceso de carga histórica inicial y de carga diaria de sincronización de la información hacia el ambiente de Hive de determinadas estructuras de datos desde diversos ambientes, tales como Informix, Azure Windows Table y Cosmos DB. La construcción del proceso incluyó el uso de:

  • Azure Storage Account
  • Azure Data Factory
  • Hive

RESULTADO

El proceso implementado mejoró el rendimiento en el tiempo de carga respecto a diversos procesos que se tenían en evaluación y/o ejecución, lo cual permitía realizar las cargas de información que se tenían estimados en un tiempo mayor a 10 meses a un tiempo no mayor de dos semanas.