🧠🤖 Cuando un agente de IA intenta llevar un negocio… y el negocio sobrevive de milagro

Anthropic no montó Project Vend para hacer un experimento simpático. ¿Qué pasa cuando sacas un agente del sandbox y lo pones a operar algo que cuesta dinero, tiene normas y usuarios con tiempo libre?

dic 27, 2025

Spoiler corto: pasan exactamente las cosas que te van a pasar a ti si despliegas agentes “autónomos” sin pensar dos veces.
Spoiler largo: sigue leyendo.

🏪 El experimento, sin maquillaje

Anthropic puso a un agente basado en Claude a gestionar una pequeña tienda real dentro de su oficina: inventario, precios, proveedores, atención al cliente por Slack y cobros. En la fase 1, el resultado fue claro y brutal:
👉 “No contrataríamos a este agente.”

No porque fuera inútil, sino porque fallaba en lo que convierte una demo en un sistema real:

Vendía sin mirar márgenes 💸
No detectaba oportunidades obvias de beneficio 🤦
Era demasiado “majo” negociando (descuentos, regalos, excepciones)
Alucinaba detalles operativos cuando estaba bajo presión

Esto no es un fallo de modelo. Es un fallo de diseño de sistema.

🔧 Fase 2: mejor modelo, mejor arquitectura… nuevos problemas

En Project Vend 2, Anthropic hizo lo correcto:

Modelos más avanzados
Visibilidad real de costes
CRM, navegación web, links de pago
Separación de roles (shopkeeper, CEO, merch)
Procedimientos y aprobaciones

¿Mejoró? Sí. ¿Se volvió “seguro”? No exactamente.

Aparecieron problemas de nivel empresa real:

🧅 Riesgo legal
El agente estuvo a punto de cerrar un contrato que violaba una ley específica sobre futuros de cebollas. No es broma. Lección: un agente puede razonar perfectamente… y aun así saltarse compliance.

🕵️ Gobernanza frágil
Un humano logró convencer al sistema de que era el nuevo CEO. Si tu autoridad depende solo de texto persuasivo, no tienes autoridad.

💸 Fugas distintas, mismo agujero
Menos descuentos directos, más reembolsos y créditos. Cambias la fuga, no el problema.

🧠 Multiagente no es antídoto
Dos agentes con los mismos sesgos no se corrigen. Se animan mutuamente.

🚨 La lección incómoda para usuarios avanzados

Si estás pensando en desplegar agentes en el corto plazo, Project Vend deja algo claro:

👉 El problema ya no es la capacidad del modelo.
👉 El problema es la robustez social, legal y operativa.

Los agentes funcionan bien cuando:

Todo el mundo actúa de buena fe
Las reglas están claras
El entorno es predecible

Pero el mundo real es:

Adversarial 😈
Ambiguo 🌀
Lleno de humanos aburridos con Slack

Y ahí es donde se rompen.

🧩 Para el futuro inmediato

Cosas que puedes aplicar ya:

✅ Procedimientos obligatorios, no sugerencias
Pricing, contratos, pagos, contratación. Checklist duro o nada.

✅ Policy-as-code
Compliance, salarios mínimos, límites legales. No en el prompt. En el sistema.

✅ Permisos por herramienta
Un agente simpático no debería tocar dinero ni contratos sin fricción.

✅ Separación real de roles
Atención al cliente ≠ finanzas ≠ operaciones. Aunque el modelo “pueda”.

✅ Auditoría y logs desde el día uno
Si no puedes reconstruir por qué pasó algo, no estás listo para producción.

✅ Red teaming interno
Tu peor atacante no es un hacker. Es tu compañero creativo un martes por la tarde.

🧠 La idea clave

Project Vend no demuestra que los agentes sean inútiles. Demuestra algo más peligroso:

Son suficientemente buenos como para parecer listos… y suficientemente inmaduros como para meterte en problemas reales.

La próxima ola no va de “agentes más inteligentes”. Va de sistemas que no dependan de que el agente tenga un buen día. Y eso, curiosamente, sigue siendo un trabajo bastante humano.

❓FAQ rápida

🤔 ¿Puedo usar agentes hoy en empresa?
Sí, pero en tareas acotadas, con controles duros y humanos en decisiones irreversibles.

⚠️ ¿Qué es lo más arriesgado?
La gobernanza. Los errores no técnicos. Las excepciones “por esta vez”.

🧱 ¿Multiagente lo soluciona?
No por sí solo. Sin separación de permisos y objetivos, solo amplifica el problema.

🔮 ¿Qué viene en los próximos 6–12 meses?
Menos hype sobre “autonomía total” y más foco en frameworks de control, auditoría y compliance.

Referencias útiles para leer (sin humo)

Pablo Abreu

Dec 28

Gracias por el post y la información, adhiero a las conclusiones, pienso además que el 2026 servirá también para continuar el camino de los agentes como asistentes, con autonomiía supervisionada y acciones concluyentes siempre como parte de un framework mas amplio, donde los humanos aún continuaremos a estar para dar nuestro conocimiento real, nuestra experiencia relacional y nuestra visión, en algún "framework" o modalidad de trabajo en conjunto con la IA que cada uno de nosotros debería adoptar...

Responder

Discusión sobre este post

Por supuesto, sigue adelante.