Claude Code en Producción: Lo Que Aprendimos Construyendo +12 Productos con Agentes IA
El cuello de botella eres tú
Hay una verdad que pocos quieren escuchar: el cuello de botella en el desarrollo de software ya no es la tecnología. Eres tú.
Kent Beck, creador de Extreme Programming, lo resumió así: "No soy un ingeniero 10x. Soy un ingeniero 1,000x... con IA proporcionándome el 99.5% del código." Si uno de los arquitectos más influyentes de la industria lo dice abiertamente, quizás sea hora de escuchar.
La IA puede escribir, refactorizar, testear y desplegar código a una velocidad que ningún equipo humano puede igualar. Pero la mayoría de las organizaciones siguen operando como si el recurso escaso fuera la máquina y no la persona que la dirige.
En ITERRUPTIVO vivimos esa transformación en carne propia. Pasamos de ser una software factory con un modelo tradicional a convertirnos en una AI-First Software Factory donde los agentes IA no son herramientas que usamos — son el equipo. Y el camino para llegar ahí no fue teórico. Fue un proceso de más de cinco años construyendo productos reales para clientes reales.
Este artículo cuenta esa historia sin adornos: qué funcionó, qué no, y qué cambiamos.
El inicio: un ERP, un developer y Claude Code
Todo empezó con Command Center, un ERP que construimos para el grupo Ecoplaza — un ecosistema de más de 700 emprendedores que necesitaba gestionar operaciones complejas en múltiples módulos.
En ese momento, nuestro approach era lo que la mayoría consideraría "sensato": usábamos Claude Code con supervisión humana cuidadosa. Cada cambio se aprobaba manualmente. Cada línea de código se revisaba. La IA aceleraba, pero el humano seguía siendo el gatekeeper de todo.
Lo que sí era diferente es que un solo developer senior podía manejar un ERP completo — múltiples módulos, soporte, iteraciones — porque la IA comprimía el tiempo de planificación, ideación y ejecución. Usábamos el framework SDD (Spec-Driven Development), que nos permitía convertir requerimientos en especificaciones estructuradas que la IA podía consumir directamente.
El resultado fue revelador: entregamos un sistema con funcionalidad masiva en una fracción del tiempo que habría tomado con un equipo tradicional. Pero todavía estábamos lejos de lo que vendría después.
La evolución: de la supervisión al bypass
La transición no fue un evento. Fue una serie de momentos donde nos dimos cuenta de que nuestro modelo tenía un techo.
Fase 1: Supervisión estricta. Revisábamos todo. El humano aprobaba cada commit, cada decisión de arquitectura, cada línea. Funcionaba, pero la velocidad estaba limitada por la capacidad de atención del developer.
Fase 2: Confianza selectiva. Empezamos a darle más autonomía a la IA en tareas que ya habíamos validado múltiples veces. Si Claude Code había demostrado que sabía manejar migraciones de base de datos correctamente en 50 ocasiones, dejamos de revisar cada migración línea por línea.
Fase 3: Bypass de permisos. Acá fue donde todo cambió. Tomamos una decisión radical: dejemos que la IA planifique y ejecute de extremo a extremo. Nosotros nos convertimos en auditores. Solo intervenimos cuando hay preguntas de lógica de negocio o cuando algo necesita corrección.
Esta decisión no fue impulsiva. Vino después de observar un patrón que se repetía: cada vez que intervenimos innecesariamente, el ciclo se alentaba sin mejorar la calidad. El costo de la supervisión excesiva superaba el beneficio.
Hoy, la IA propone la arquitectura, implementa el código, corre los tests, verifica visualmente los resultados y despliega. Nosotros auditamos el output y nos aseguramos de que el propósito del producto se cumpla.
Cómo funciona hoy: multi-sesión, ojos propios y agentes especializados
Nuestro setup actual sería irreconocible para alguien que nos vio trabajar en 2021. Así opera ITERRUPTIVO hoy:
Agentes como equipo, no como herramientas
Tenemos agentes especializados por rol: Architect (decisiones técnicas, evaluación de tecnología), Frontend Developer, Backend Developer, QA Engineer, Security Agents, Code Reviewer y DevOps. Cada uno tiene su scope definido y sus capacidades calibradas.
No es un chatbot que "ayuda" a un developer. Es un agente que recibe un requerimiento, lo descompone, lo implementa, lo testea y lo entrega. El developer humano — si es que interviene — actúa como auditor.
Multi-sesión simultánea
Corremos múltiples sesiones de Claude Code en paralelo. Mientras una sesión construye una feature, auditamos el output de otra, y una tercera está corriendo checks de seguridad.
Esto no es teoría. Es nuestro workflow diario. Como dijo Guillermo Rauch, CEO de Vercel: "Los problemas de IA se resuelven con más IA." No hay razón para procesar secuencialmente lo que puede correr en paralelo.
Playwright: dándole ojos a la IA
Una de las decisiones más importantes que tomamos fue integrar Playwright como el sistema visual del agente. La IA no solo escribe código — lo ve funcionando. Toma screenshots, detecta errores visuales, verifica flujos de usuario completos.
Esto transformó nuestra capacidad de QA. El agente abre el browser, navega la aplicación como un usuario real, identifica problemas y los corrige autónomamente. Sin intervención humana.
ADB para mobile: la prueba completa
Para testing mobile, usamos ADB (Android Debug Bridge). La IA puede interactuar con teléfonos y tablets reales: ejecutar comandos, tomar capturas de pantalla, validar flujos end-to-end que cruzan web, mobile y backend.
Esto significa que nuestro QA autónomo no se limita a desktop. Cubre la experiencia completa del usuario, en todas las plataformas.
Comunicación agente-a-agente
Inspirados en papers de investigación publicados por Google, implementamos comunicación directa entre agentes. El agente de desarrollo puede escalar un hallazgo de seguridad al agente de pentesting. El agente de QA puede reportar un bug directamente al agente de backend.
Esta orquestación elimina el overhead de comunicación humana — que en equipos tradicionales consume una porción enorme del ciclo de desarrollo.
Seguridad en paralelo: no puedes ir a 300 km/h sin frenos
Acá hay algo que mucha gente que adopta IA para desarrollo pasa por alto: la velocidad sin seguridad es un desastre esperando pasar.
Si tienes un Ferrari que va a 300 km/h, necesitas los mejores frenos del mundo. Eso es exactamente lo que construimos.
Cristian Luciano, nuestro Head de Cybersecurity, evolucionó la seguridad para que sea tan autónoma como el desarrollo. La plataforma Robin Hood — con 9 agentes de pentesting especializados — corre en paralelo con cada entrega.
No esperamos 6 meses para hacer una auditoría. Cada vez que un agente de desarrollo termina una feature, los agentes de seguridad la atacan automáticamente. Los hallazgos — validados con exploits reales, no teóricos — van directamente al agente de desarrollo para remediación inmediata.
El resultado: la velocidad de desarrollo no compromete la seguridad. Ambas crecen juntas.
El nuevo rol: auditor, no coder
Esta es la parte que incomoda a mucha gente en la industria, pero hay que decirla: la profesión del futuro no es escribir código. Es auditar lo que la IA produce.
Nuestro trabajo en ITERRUPTIVO se transformó radicalmente. Hoy nos enfocamos en:
- Propósito: asegurarnos de que lo que se construye resuelve el problema correcto.
- Calidad del output: verificar que el producto cumple con los estándares de excelencia.
- Decisiones de negocio: la IA no sabe qué quiere el mercado. Nosotros sí.
- Corrección de rumbo: cuando algo se desvía, intervenimos. Pero solo cuando es necesario.
El 80% del tiempo que antes se gastaba escribiendo código ahora se dedica a pensar mejor, entender mejor el problema y asegurarse de que la solución sea la correcta.
Qué cambió: resultados concretos
Después de más de cinco años operando con este modelo y construyendo más de 12 productos (Command Center, Robin Hood, Leakint, EPTokens, entre otros), estos son los cambios más significativos:
Compresión de timelines. Proyectos que en un modelo tradicional tomarían meses se entregan en semanas. La IA no tiene horarios, no se enferma, no tiene reuniones de standup de 45 minutos.
Cobertura imposible para equipos humanos. Un equipo de 5 developers puede cubrir un scope limitado. Múltiples agentes trabajando en paralelo cubren frontend, backend, QA, seguridad y DevOps simultáneamente.
Calidad consistente. Los agentes no tienen días malos. No se distraen. No toman atajos porque es viernes. Cada output pasa por las mismas validaciones, cada vez.
Costo radicalmente menor. No necesitamos 15 developers para hacer el trabajo de 15 developers. Eso se traduce directamente en precios más competitivos para nuestros clientes.
Seguridad integrada, no agregada. Como la seguridad es autónoma y corre en paralelo, no es un afterthought. Es parte del proceso desde la primera línea de código.
Lo que no funciona (y lo admitimos)
Sería deshonesto decir que todo es perfecto. Algunas lecciones aprendidas:
- La IA necesita contexto excelente. Si los requerimientos son vagos, el output es mediocre. Basura entra, basura sale. La calidad de las especificaciones es más crítica que nunca.
- No todo se puede automatizar todavía. Decisiones de UX que requieren empatía profunda con el usuario final, negociaciones con stakeholders, priorización estratégica — eso sigue siendo humano.
- El setup inicial no es trivial. Llegar a este nivel de autonomía tomó años de iteración. No es "instalar Claude Code y listo." Es construir procesos, pipelines, validaciones, y cultura alrededor de los agentes.
El nombre lo dice todo
ITERRUPTIVO significa iterativamente disruptivo. El software nunca termina. La mejora continua no para. Cada entrega debe tener un valor masivo, y ese valor se entrega en el menor tiempo posible.
Ese principio es el que nos trajo hasta acá: un equipo donde los agentes IA son el motor de ejecución y los humanos somos los que definimos el propósito y auditamos que se cumpla.
No es el futuro. Es lo que estamos haciendo hoy.
¿Quieres ver cómo funciona?
Si te interesa entender en detalle cómo operamos, ver una sesión real de desarrollo con agentes autónomos, o evaluar si este modelo aplica para tu empresa, agenda una demo con nosotros.
No es una presentación de slides. Es una demostración en vivo de cómo los agentes construyen software.