Cómo conectar Tango Gestión con un data warehouse en la nube

Si tu empresa usa Tango Gestión, ya sabés cómo es la historia: los datos están ahí adentro, pero sacarlos es un dolor de cabeza. Exportar a Excel, armar reportes manuales, cruzar planillas entre ventas, compras y stock. Cada vez que alguien pide un número, empieza una cacería.

El problema no es Tango. Tango hace bien lo que tiene que hacer: facturar, manejar stock, registrar compras y ventas. El problema es que Tango no fue diseñado para ser tu herramienta de análisis. Y forzarlo a serlo termina en planillas infinitas, datos desactualizados y decisiones a ciegas.

La solución es sacar los datos de Tango y llevarlos a un lugar donde se puedan analizar de verdad. Eso es un data warehouse en la nube. Y en esta guía te mostramos exactamente cómo hacerlo.

Qué es un data warehouse y por qué te importa

Un data warehouse es una base de datos diseñada específicamente para analítica. A diferencia de la base de datos de Tango (que está optimizada para registrar transacciones), un data warehouse está optimizado para responder preguntas: ¿cuánto vendí el mes pasado? ¿Cuál es mi margen por producto? ¿Qué clientes me deben más de 90 días?

Cuando tus datos viven en un data warehouse, podés:

Armar dashboards que se actualizan solos
Cruzar ventas con stock con compras en una sola vista
Hacer análisis históricos de años sin que Tango se ponga lento
Compartir información con tu equipo sin depender de quien "sabe usar Tango"

Nosotros usamos Google BigQuery como data warehouse. Es serverless (no necesitás mantener servidores), escala automáticamente, y el costo para una PyME es de pocos dólares por mes.

La arquitectura completa: de Tango a dashboard

Antes de meternos en el paso a paso, te muestro el panorama completo de lo que vamos a construir:

Tango Gestión (tu servidor local) → Agente de extracción (Python) → Google Cloud Storage (archivos crudos) → BigQuery (data warehouse) → dbt (transformación) → Looker Studio (dashboards)

Parece mucho, pero cada pieza tiene un rol claro y una vez armado corre solo. Vamos parte por parte.

Paso 1: Entender qué datos tiene Tango

Tango Gestión corre sobre SQL Server Express (o SQL Server full, dependiendo de la versión). Toda la información que ves en pantalla — clientes, productos, facturas, stock, proveedores — vive en tablas SQL que podés consultar directamente.

Las tablas más relevantes para analítica son:

GVA12 / GVA14: comprobantes de venta (cabecera y detalle)
GVA53: saldos de stock
STA11: artículos
GVA01 / GVA24: clientes y condiciones de venta
CPA01 / CPA04: proveedores y comprobantes de compra
SBA01: cuentas corrientes

No necesitás sacar todas las tablas. Empezá por las que responden las preguntas más urgentes de tu negocio. En nuestra experiencia, ventas + stock + cobranzas cubren el 80% de lo que una PyME necesita ver.

⚠️

Nunca modifiques las tablas de Tango directamente. Toda operación sobre la base de datos tiene que ser de solo lectura (SELECT). Modificar datos puede romper la integridad del sistema.

Paso 2: Extraer los datos automáticamente

La extracción se hace con un agente liviano en Python que corre en el mismo servidor donde está Tango (o en cualquier máquina que tenga acceso a la base SQL Server).

El agente hace tres cosas:

Se conecta a SQL Server usando pyodbc y ejecuta queries de solo lectura sobre las tablas de Tango
Genera archivos CSV comprimidos (.csv.gz) con los datos extraídos
Sube los archivos a Google Cloud Storage vía HTTPS

El agente se agenda con el Programador de Tareas de Windows para correr una o dos veces por día (típicamente de madrugada, cuando nadie usa Tango). Cada ejecución tarda entre 1 y 5 minutos dependiendo del volumen de datos.

# Ejemplo simplificado del flujo de extracción
import pyodbc
import pandas as pd
from google.cloud import storage
 
# Conexión a SQL Server (Tango)
conn = pyodbc.connect(
    'DRIVER={SQL Server};'
    'SERVER=localhost;'
    'DATABASE=TANGO;'
    'Trusted_Connection=yes;'
)
 
# Extracción de comprobantes de venta
query = """
    SELECT GVA12.*, GVA14.COD_ARTICU, GVA14.CANTIDAD, GVA14.PRECIO
    FROM GVA12
    INNER JOIN GVA14 ON GVA12.NCOMP_IN_V = GVA14.NCOMP_IN_V
    WHERE GVA12.FECHA_EMIS >= DATEADD(month, -3, GETDATE())
"""
df = pd.read_sql(query, conn)
 
# Compresión y upload a Cloud Storage
df.to_csv('/tmp/ventas.csv.gz', compression='gzip', index=False)
# ... upload a GCS bucket

ℹ️

El agente no necesita credenciales de Tango. Se conecta directo a la instancia de SQL Server con autenticación de Windows. No toca la aplicación de Tango en ningún momento.

¿Y si mi Tango está en un hosting o servidor remoto?

Si Tango no está en una máquina local sino en un servidor de un proveedor (como suele pasar con Tango en la nube o Terminal Server), el agente se instala directamente en ese servidor. Solo necesitás que el proveedor te dé acceso para instalar Python y programar una tarea. Es un script liviano que no afecta el rendimiento de Tango.

Paso 3: Almacenar en la nube (Data Lake)

Los archivos CSV comprimidos llegan a un bucket de Google Cloud Storage organizado por fecha:

gs://richmond-analytics-datalake/
  └── tu-empresa/
      └── raw/
          ├── 2026-04-20/
          │   ├── ventas.csv.gz
          │   ├── stock.csv.gz
          │   └── clientes.csv.gz
          └── 2026-04-19/
              ├── ventas.csv.gz
              └── ...

Esta es tu "copia de seguridad inteligente" de datos. Aunque Tango siga funcionando normal, tenés un historial completo de tus datos en la nube, organizado y versionado. Eso solo ya tiene valor: si alguna vez necesitás ver cómo estaba tu stock hace 6 meses, lo tenés.

El costo de almacenamiento para una PyME típica es de menos de USD 1 por mes. Literalmente centavos.

Paso 4: Cargar en BigQuery (Data Warehouse)

Desde Cloud Storage, los datos se cargan automáticamente en BigQuery como tablas crudas (raw). Esta carga se puede disparar automáticamente cada vez que llega un archivo nuevo, o programarla con Cloud Scheduler.

En esta etapa los datos llegan tal cual salieron de Tango: mismos nombres de columna, mismos formatos, mismos códigos. Todavía no son fáciles de analizar — pero ya están en un lugar donde podemos trabajarlos.

BigQuery
└── tu_empresa_raw
    ├── raw_comp_venta       (GVA12 + GVA14)
    ├── raw_clientes         (GVA01)
    ├── raw_articulos        (STA11)
    ├── raw_stock            (GVA53)
    ├── raw_comp_compra      (CPA04)
    └── raw_cta_cte          (SBA01)

Paso 5: Transformar con dbt (el paso clave)

Acá es donde los datos crudos se convierten en información útil. dbt (data build tool) es una herramienta que transforma datos usando SQL puro, con testing y documentación incluida.

Qué hace dbt en nuestro pipeline:

Limpieza: renombra columnas crípticas de Tango (como GVA12.T_COMP → tipo_comprobante), convierte formatos de fecha, maneja valores nulos
Estandarización: normaliza categorías, unifica códigos, crea campos calculados (margen, antigüedad de deuda, días de stock)
Modelado: crea dimensiones y tablas de hechos listas para analítica

El resultado son tablas limpias y claras:

BigQuery
└── tu_empresa_analytics
    ├── dim_clientes         (nombre, zona, categoría, antigüedad)
    ├── dim_articulos        (descripción, rubro, familia, costo)
    ├── fact_ventas          (fecha, cliente, artículo, cantidad, monto, margen)
    ├── fact_compras         (fecha, proveedor, artículo, cantidad, monto)
    ├── fact_stock           (artículo, depósito, cantidad, valorización)
    └── fact_cta_cte         (cliente, comprobante, monto, saldo, antigüedad)

💡

La ventaja de dbt es que cada transformación queda documentada y testeada. Si un cálculo de margen da mal, hay un test que lo detecta automáticamente. Es la diferencia entre una planilla frágil y un sistema robusto.

Paso 6: Visualizar en Looker Studio (Dashboards)

Con los datos limpios en BigQuery, construir dashboards es la parte más rápida. Usamos Looker Studio (gratuito de Google) que se conecta nativamente con BigQuery.

Los 5 dashboards que armamos como base:

Ejecutivo: ventas totales, margen, top clientes, tendencia mensual
Ventas: análisis por vendedor, producto, zona, comparativa interanual
Stock: niveles actuales, quiebres, sobrestock, rotación
Cobranzas: deuda total, antigüedad, clientes morosos, evolución
Compras: montos por proveedor, plazos de pago, comparativa de precios

Cada dashboard se actualiza automáticamente con cada extracción. Tu equipo entra a un link, ve los números del día, y toma decisiones. Sin pedirle a nadie que "pase los datos".

Cuánto cuesta todo esto

Seamos concretos con los números mensuales para una PyME típica:

Google Cloud Storage: menos de USD 1/mes
BigQuery: entre USD 5 y USD 20/mes (depende del volumen de consultas)
Looker Studio: gratis
Servidor del agente: ya lo tenés (es el mismo donde corre Tango)
Cloud Scheduler + Functions: menos de USD 1/mes

Costo de infraestructura total: USD 10-25 por mes. Menos que una licencia de cualquier herramienta de reporting.

El costo de desarrollo e implementación es aparte y depende de la complejidad de tu caso, pero es una inversión que se hace una vez. Una vez armado, el pipeline corre solo con costos operativos mínimos.

Cuánto tiempo lleva implementarlo

Para una PyME con Tango estándar:

Semana 1: Mapeo de tablas de Tango, definición de queries, instalación del agente
Semana 2: Configuración de Cloud Storage + BigQuery, primeras cargas
Semana 3: Transformaciones dbt (staging + analytics)
Semana 4: Dashboards en Looker Studio + ajustes con el equipo

En un mes tenés el pipeline completo funcionando. Y a partir de ahí, agregar nuevas tablas, nuevos dashboards o nuevos análisis es incremental — no empezás de cero cada vez.

¿Y si no uso Tango?

La arquitectura es la misma para cualquier ERP o sistema que corra sobre una base de datos relacional. Si usás SAP Business One, Colppy, Bejerman, o cualquier otro, lo que cambia son las queries de extracción y los modelos de transformación. La infraestructura de nube es idéntica.

Incluso si tu fuente de datos es un Excel que alguien exporta todos los días, podemos empezar por ahí y profesionalizar después.

Conclusión

Tener los datos de tu empresa atrapados en un ERP local es como tener dinero en una caja fuerte sin llave. Sabés que está ahí, pero no podés usarlo cuando lo necesitás.

Conectar Tango con un data warehouse en la nube no es un proyecto de innovación. Es infraestructura básica que cualquier PyME debería tener: datos accesibles, dashboards actualizados, y decisiones basadas en información real en vez de intuición.

El costo es bajo, la implementación es rápida, y el impacto es inmediato desde el primer dashboard que tu equipo abre por la mañana.

En Richmond Analytics diseñamos y construimos esta arquitectura para PyMEs. Si usás Tango y querés ver tus datos en dashboards que se actualizan solos, hablemos.