En el mundo de la contabilidad y la administración, pocas tareas consumen tanto tiempo y son tan propensas a errores humanos como la transcripción manual de documentos físicos. Los comprobantes de retención del Impuesto al Valor Agregado (IVA) son un ejemplo clásico: decenas de papeles con formatos variados que deben ingresarse con absoluta precisión en nuestros sistemas.
Un error en un dígito del RIF, un número de factura mal copiado o un monto de IVA retenido incorrecto puede derivar en dolores de cabeza durante las declaraciones mensuales y, en el peor de los casos, en sanciones fiscales.
Hoy quiero compartir el procedimiento técnico y lógico detrás de la transformación de un lote de imágenes de comprobantes físicos en una base de datos estructurada y limpia en Google Sheets, lista para ser procesada a tu excel o incluso dentro del propio Google Sheets. Este proceso no es magia, es la aplicación de tecnología avanzada de reconocimiento de datos al servicio de la rigurosidad contable.
Usa Inteligencia Articficial para transcribir retenciones automáticamente
La IA ha llegado para quedarse y, por ende, deberás tenerla presente si quieres ofrecer un mejor servicio contable optimizando los recursos. Para transcribir retenciones (casi) automáticamente sigue los pasos que te cuento en esta entra del blog.
1. Tener a mano los comprobantes
La idea de este artículo surgió debido a un caso práctico: Mi socia me envió a mi Whatsapp una retenciones en ventas de un cliente para presentar su declaración del IVA. Estas fueron enviadas por Whatsapp, aunque en realidad el medio es diferente, pues lo que importa es que podamos adjuntarla a nuestra aplicación Google Gemini.
Si observamos las imágenes de los comprobantes, notaremos un reto inmediato para cualquier contador (o para un software): la falta de estandarización.
Aunque la providencia SNAT/2025/00054 dicta qué datos deben aparecer, el diseño varía drásticamente entre un agente de retención y otro. Unos colocan el RIF en la cabecera, otros en el pie de página; algunos usan tablas complejas para las facturas afectadas, mientras que otros lo simplifican.
El procedimiento de extracción de datos para la IA debe ser capaz de "leer" e interpretar estas estructuras variables.
2. Análisis Estructural del Documento
El primer paso no es leer letras, sino entender la geometría del documento del que quieres extraer información. La herramienta de procesamiento (en este caso Gemini, la inteligencia artificial que utilicé) primero identificará los bloques de información clave:
- Fecha de emisión: ¿Cuándo fue emitido el comprobante? Se busca la fecha de emisión por parte del agente de retención.
- Encabezado del Agente: ¿Quién emite? Se busca el nombre legal y el RIF del Agente de Retención.
- Datos del Comprobante: Se localizan números únicos como el "Número de Comprobante" y la "Fecha de Emisión".
- Cuerpo de la Operación (La Tabla): Esta es la parte crítica. Se debe identificar la grilla donde se detallan las facturas, bases imponibles y, crucialmente, el Monto del IVA Retenido.
3. Ingresa a Gemini
Si aún no lo sabes te lo digo: Google tiene una IA 100% gratuita y muy eficiente llamada Gemini.
Ingresas acá > https://gemini.google.com/app?hl=es, te registras con tu correo Gmail y sin ninguna restricción posible puedes comenzar a hacer un sinfín de cosas para tu negocio o estudio contable (o tus clases en la Universidad, ¿Por qué no?)
4. Carga las fotos de los comprobantes
En el cuadro de chat, dale al signo de "+" para adjuntar las fotos que vas a extraer (los comprobantes de retención, en este caso) Pueden ser fotos como tal o bien archivos PDF. En lo particular prefiero éstos últimos ya que son menos propensos a errores.
Si trabajarás con fotos, te recomiendo que añadas la herramienta "Crear imágenes", es un agente de IA para crear y analizar mucho mejor las imágenes.
Una vez cargues todas las imágenes escribe este prompt:
Transcribe los datos de las imágenes adjuntas en un tabla de google sheets. Los encabezados deben ser #, fecha de retención, Nombre y apellido o Razón social del agente de retención, RIF del agente de retención, Número de comprobante de retención, Número de factura(s) afectada(s) y monto del IVA Retenido
Nota importante: El prompt es el texto que le das a la IA conversacional para que realice las acciones que desees.
Una vez que sabe dónde buscar, la IA procede a extraer el texto. Un OCR tradicional puede confundir un "8" con una "B" si la impresión es mala. Sin embargo, un procesamiento avanzado utiliza el contexto.
Por ejemplo, si el sistema sabe que está leyendo un campo de "RIF", esperará una estructura específica (Letra-Número-Número).
Si está leyendo el "Monto Retenido", esperará números con dos decimales y separadores de miles. Esta validación contextual es vital para asegurar la precisión fiscal.
En el caso de las imágenes proporcionadas, el sistema tuvo que diferenciar entre los múltiples montos presentes (Total Compras, Base Imponible, Impuesto IVA) para extraer únicamente el "IVA Retenido", que es el dato final que nos interesa para el libro de ventas.
5. Revisa bien los datos
Con los datos "crudos" extraídos, el siguiente paso es la normalización. Esto significa darle un formato coherente para que sea útil en una hoja de cálculo:
- Fechas: Asegurar que todas tengan el mismo formato (DD/MM/AAAA).
- Montos: Eliminar símbolos de moneda si es necesario y asegurar que los separadores decimales sean compatibles con Google Sheets (coma o punto, según la configuración regional).
- RIF: Garantizar la presencia del guion separador (J-12345678-9) para uniformidad.
Deberás verificar que al información sea igual a las fotos o PDF, ya que la IA generalmente comete errores. Una vez que todo esté okey, es momento del siguiente paso.
6. Exportación a Google Sheets
Finalmente, los datos limpios se vuelcan en una estructura tabular. Para contadores y administradores, la estructura de las columnas es fundamental para facilitar el trabajo posterior (como usar excel, tablas dinámicas o importar a un sistema administrativo).
Elige las siguientes columnas por su relevancia fiscal:
- (Índice): Para control interno.
- Razón social del agente de retención: Para identificar al proveedor.
- RIF del agente: Dato clave para el cruce de información en el portal fiscal.
- Número de comprobante: Esencial para la declaración.
- Número de factura(s) afectada(s): Para la conciliación bancaria y de cuentas por pagar.
- Monto del IVA Retenido: El valor financiero exacto de la operación.
El resultado final es una tabla de Google Sheets impecable, generada en segundos a partir de fotos tomadas con un celular que puedes copiar y pegar a tu excel. Dándole a "Exportar a Hojas de Cálculo" podás crear una hoja de cálculo de Google para exportar como excel. Y luego sólo queda trabajar los datos como desees.
Para los estudiantes y profesionales de la contabilidad, el mensaje es claro: nuestra labor se está transformando. Nuestro valor añadido ya no reside en la velocidad para teclear datos, sino en nuestra capacidad para analizar, auditar y validar la información que las nuevas herramientas nos proporcionan.
Adoptar estas tecnologías no es una opción, es una ventaja competitiva esencial en la administración moderna que permite optimizar tu servicio de contabilidad, sobre todo si apenas estás empezando.
¿Te ha sido útil? Si es asó déjame tu comentario en la sección de abajo.
Con cariño,
Luis Alberto.