
Anuncios en ChatGPT y privacidad & Gemini 3.1 Pro y ARC-AGI - Noticias de IA (21 feb 2026)
February 21, 202612m 50s
Audio is streamed directly from the publisher (mcdn.podbean.com) as published in their RSS feed. Play Podcasts does not host this file. Rights-holders can request removal through the copyright & takedown page.
Show Notes
Por favor, apoya este pódcast visitando a nuestros patrocinadores:
- Consensus: IA para la investigación. Obtén un mes gratis - https://get.consensus.app/automated_daily
- KrispCall: Telefonía en la nube agéntica - https://try.krispcall.com/tad
- Prezi: Crea presentaciones con IA rápidamente - https://try.prezi.com/automated_daily
Apoya directamente a The Automated Daily:
Cómprame un café: https://buymeacoffee.com/theautomateddaily
Temas de hoy: Anuncios en ChatGPT y privacidad - OpenAI activa anuncios en ChatGPT y crece el debate sobre asistentes “ambientales” con micrófono/cámara. Claves: publicidad, datos, edge inference, DuckDuckGo Duck.ai, C2PA. Gemini 3.1 Pro y ARC-AGI - Google lanza Gemini 3.1 Pro con mejoras fuertes en razonamiento (ARC-AGI-2) y se comparan resultados en un nuevo harness tipo ARC-AGI-3. Claves: memoria, planificación, Claude Opus, límites de acciones. Frameworks de agentes y sandboxes - Nuevas ideas para coordinar agentes (Cord) y reducir riesgos al ejecutar comandos (Cursor sandbox). Claves: árboles de dependencias, spawn vs fork, Landlock/seccomp, Seatbelt, WSL2. Optimización automática con GEPA - GEPA presenta optimize_anything para optimizar cualquier artefacto textual con evaluación externa y ‘Actionable Side Information’. Claves: búsqueda Pareto, prompts, código, SVG, agentes ARC-AGI. Inferencia gestionada en Crusoe Cloud - Crusoe Managed Inference promete baja latencia y alto throughput con caché KV a nivel clúster (MemoryAlloy). Claves: TTFT 9.9x, batching dinámico, catálogo de modelos, pricing por token. Ciberseguridad AI: SANS Summit 2026 - SANS impulsa dos frentes: su AI Cybersecurity Summit 2026 y el Secure AI Blueprint para gobernanza y controles. Claves: OWASP AI, prompt injection, agentic failures, CPE, formación GIAC. Drama OpenAI vs Anthropic y estrategia - La rivalidad Altman–Amodei se vuelve pública mientras analistas cuestionan el ‘foso’ competitivo de OpenAI. Claves: anuncios, distribución, modelo de negocio, Pentágono vs Anthropic, valoración y adopción. Xbox cambia de líder con AI - Microsoft Gaming cambia de era: se retira Phil Spencer y entra Asha Sharma con un discurso contra el ‘AI slop’. Claves: franquicias, nuevos modelos de negocio, futuro del juego.
-https://www.sans.org/cyber-security-training-events/ai-summit-2026
-https://arxiv.org/abs/2602.16301
-https://juno-labs.com/blogs/every-company-building-your-ai-assistant-is-an-ad-company
-https://www.neowin.net/news/phil-spencer-is-exiting-microsoft-as-ai-executive-takes-over-xbox/
-https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/
-https://www.june.kim/cord
-https://www.testingcatalog.com/google-test-notebooklm-integration-for-opal-workflows/
-https://x.com/scaling01/status/2024640940657246235
-https://tomtunguz.com/9-observations-using-ai-agents/
-https://daoudclarke.net/2026/02/19/repeating-prompt
-https://www.crusoe.ai/cloud/managed-inference
-https://www.sans.org/mlp/ai-security-blueprint
-https://cursor.com/blog/agent-sandboxing
-https://9to5mac.com/2026/02/19/duckduckgo-rolls-out-ai-powered-image-editing-on-duck-ai/
-https://mojodojo.io/blog/meta-is-systematically-killing-our-agency/
-https://gepa-ai.github.io/gepa/blog/2026/02/18/introducing-optimize-anything/
-https://fortune.com/2026/02/19/openai-anthropic-sam-altman-dario-amodei-refused-to-hold-hands-ai-super-bowl-ad-war-ceos-big-tech-conflict/
-https://thezvi.wordpress.com/2026/02/19/ai-156-part-1-they-do-mean-the-effect-on-jobs/
-https://www.ben-evans.com/benedictevans/2026/2/19/how-will-openai-compete-nkg2x
Transcripcion del Episodio
Anuncios en ChatGPT y privacidad
Primero, el tema que atraviesa casi todo lo demás: monetización y privacidad. Según un análisis que ha estado circulando fuerte, OpenAI anunció de forma discreta el 16 de enero que ChatGPT empezaría a mostrar publicidad, y para el 9 de febrero los anuncios ya estaban activos. La lectura del autor no es “OpenAI malo”, sino un problema estructural: si el asistente se financia con anuncios y, a la vez, la industria empuja hacia dispositivos siempre encendidos —micrófonos, cámaras, detección de presencia, wearables, incluso conciencia “multi-habitación”—, el incentivo a recolectar contexto se vuelve enorme.
El punto clave aquí es una frase que vale oro en diseño de sistemas: “la política es una promesa; la arquitectura es una garantía”. Es decir, puedes prometer que no vendes datos, pero si el sistema técnicamente puede enviarlos a la nube, la tentación y el riesgo siguen ahí. El texto propone una salida: inferencia local, en el borde, sin telemetría y sin ‘phoning home’. Con hardware actual y modelos más eficientes, dice, ya podrías correr todo el pipeline en casa —voz a texto, memoria, razonamiento y voz de vuelta— en una cajita silenciosa, con pago único. Quizá menos capaz que la nube… pero con una propiedad valiosa: no existe el canal para filtrar tu vida privada.
Gemini 3.1 Pro y ARC-AGI
En esa misma línea de “IA sí, pero con límites”, DuckDuckGo está desplegando edición de imágenes por IA dentro de Duck.ai. La promesa: gratis, sin cuenta, y con medidas de privacidad antes de enviar el pedido a un modelo de OpenAI: eliminan metadatos, retiran la IP, y guardan la imagen subida localmente en el dispositivo. Además, las imágenes editadas se etiquetan con metadatos compatibles con C2PA, un detalle importante para trazabilidad. Y ojo: DuckDuckGo insiste en que esto es opcional y separado del buscador; incluso ofrece una interfaz explícitamente sin IA en noai.duckduckgo.com. Es una postura interesante: no vender “magia”, sino control.
Frameworks de agentes y sandboxes
Pasemos a modelos y benchmarks, porque esta semana hay movimiento grande en Google. Se anunció Gemini 3.1 Pro, pensado para tareas complejas donde una respuesta rápida no alcanza. Google lo está desplegando desde el 19 de febrero en su ecosistema: Gemini API y AI Studio para desarrolladores, Vertex AI para empresas, y para consumidores en la app de Gemini y en NotebookLM —aunque con acceso privilegiado para suscriptores Pro y Ultra.
El dato que Google está usando como bandera: en ARC-AGI-2, un benchmark de patrones lógicos nuevos, Gemini 3.1 Pro marca 77,1% verificado, y la compañía afirma que es más del doble que Gemini 3 Pro. Y lo ilustran con demos muy de “producto”: generar SVGs animados listos para web desde texto, montar un dashboard aeroespacial que visualiza la órbita de la Estación Espacial Internacional con telemetría pública, o crear una experiencia 3D interactiva de murmuraciones de estorninos con seguimiento de manos y audio generativo.
Pero, y esto es importante, cuando el modelo se somete a entornos más “agenticos”, el rendimiento se matiza.
Optimización automática con GEPA
Un ejemplo: un post en X sobre un harness de pruebas estilo ARC-AGI-3, en un entorno de puzzles 2D con presupuesto de acciones y una memoria editable en pantalla, obliga al modelo a responder en JSON y a operar paso a paso. El autor admite que su harness anterior era defectuoso y ahora construyó una plataforma de depuración con trazas: antes/después por acción, costos, tokens, estado, acciones y todo el I/O.
Con ese marco, Gemini 3.1 Pro mejora en identificar la tarea frente a 3.0 Pro, pero falla en ejecución: malinterpreta señales visuales, se pierde rotaciones de 90 grados de elementos de interfaz, y a menudo se queda sin movimientos. También se critica que usa poco la herramienta de memoria: apenas deja un par de frases sueltas. En cambio, Claude 4.6 Opus (Thinking) aparece como más sólido: planifica mejor, detecta transformaciones críticas y mantiene memoria más estructurada. Aun así, choca contra límites del entorno —por ejemplo, un cap de 50 movimientos— y puede fallar en precisión de “clics” aunque conceptualmente sepa la solución.
La idea que queda: no es solo “razonar”, es operar con memoria útil y disciplina de ejecución. Esa brecha es justo donde los agentes se ganan o se caen.
Inferencia gestionada en Crusoe Cloud
Hablando de agentes: hay dos historias que encajan como piezas. La primera es Cord, un proyecto open source de June Kim para coordinar “árboles” de agentes donde el propio agente decide cómo descomponer el trabajo en tiempo de ejecución, en lugar de depender de flujos predefinidos por el desarrollador. Su tesis es que el trabajo real no es una cadena lineal: es un árbol de dependencias con ramas paralelas y contexto compartido.
Cord introduce una distinción muy práctica de flujo de contexto: spawn, donde el agente hijo arranca limpio y solo recibe resultados explícitamente dependientes; y fork, donde hereda el contexto acumulado de sus “hermanos”. Eso reduce contaminación cuando investigas en paralelo, pero permite síntesis cuando toca. Debajo, cada agente es un proceso de Claude Code CLI con herramientas MCP y una base SQLite compartida; hay primitivas como spawn, fork, ask, complete y read_tree. Y un detalle que me encanta: el humano es un nodo más del árbol; cuando un ask queda listo, el sistema se detiene y pregunta en terminal, guarda la respuesta y desbloquea el resto.
Ciberseguridad AI: SANS Summit 2026
La segunda pieza es seguridad operacional para agentes que ejecutan comandos. Cursor cuenta que los agentes ya son lo bastante capaces como para correr comandos de terminal por su cuenta, y que autoaprobarlos aumenta productividad… pero eleva el riesgo de borrar bases de datos, filtrar secretos o romper despliegues. Pedir aprobación humana para todo suena seguro, pero en la práctica genera “fatiga de aprobación”, especialmente con varios agentes.
La solución: sandboxing de agentes en macOS, Linux y Windows. La promesa es simple: el agente corre libre dentro de un entorno controlado y solo pide permiso cuando necesita “salir”, típicamente para acceder a internet. Cursor afirma que así se pide aprobación un 40% menos, ahorrando interrupciones.
Lo técnico es jugoso: en macOS usan Seatbelt vía sandbox-exec con políticas finas generadas en runtime; en Linux combinan Landlock (restricción de filesystem) y seccomp (filtrado de syscalls), con overlay filesystem y copias bloqueadas de archivos ignorados. En Windows, tiran de WSL2 porque un sandbox nativo equivalente para herramientas de desarrollo es mucho más difícil, y dicen estar trabajando con Microsoft en primitivas necesarias. Esto es un patrón claro: los agentes no solo necesitan “inteligencia”, necesitan barandillas de sistema operativo.
Drama OpenAI vs Anthropic y estrategia
Ahora, optimización automática: GEPA presentó optimize_anything, una API declarativa para optimizar cualquier artefacto representable como texto —código, prompts, arquitecturas de agentes, SVGs, configuraciones— siempre que tú definas qué significa “mejor” con un evaluador. El loop es: probar candidato, medir, capturar diagnósticos y volver a proponer mejoras.
La idea más útil aquí es ASI, Actionable Side Information: el feedback del evaluador se devuelve al modelo en forma de diagnósticos accionables, casi como si fueran “gradientes” en optimización numérica. Además, usan búsqueda Pareto: en vez de colapsar métricas a un promedio, mantienen una frontera de soluciones eficientes para conservar alternativas fuertes en distintos criterios. Enseñan un ejemplo simpático —un pelícano en bicicleta en SVG— y afirman resultados serios en varias áreas: desde acelerar tareas con Claude Code hasta evolucionar agentes para ARC-AGI, pasando por generación de kernels CUDA. Si esto madura, podríamos ver una nueva capa de ‘auto-mejora’ de herramientas de desarrollo… con evaluadores bien diseñados como pieza central.
Xbox cambia de líder con AI
Infraestructura: Crusoe lanzó Managed Inference en Crusoe Cloud, un servicio gestionado de inferencia con foco en baja latencia y alto throughput. Presumen hasta 9,9x mejor tiempo al primer token y hasta 5x más tokens por segundo frente a vLLM con Llama-3.3-70B en un despliegue de 4 nodos.
Atribuyen la mejora a MemoryAlloy, una “tela” de memoria a nivel clúster y caché KV compartida que evita prefills duplicados, habilita sesiones persistentes y enruta solicitudes de forma inteligente. Le suman batching dinámico y speculative decoding. Y empujan un catálogo de modelos —desde DeepSeek y Qwen3 hasta Gemma y otros— con precios por millón de tokens y tarifas más bajas para tokens cacheados. Si estás construyendo agentes, esto importa porque la experiencia del usuario muchas veces depende más del TTFT y la consistencia que de una décima en un benchmark.
Story 9
Seguridad y gobernanza: SANS viene con doble anuncio. Por un lado, su AI Cybersecurity Summit 2026 será el 20 y 21 de abril, con cursos opcionales del 22 al 27, tanto presencial en Arlington, Virginia, como en formato online en vivo. Lo preside Rob T. Lee y la parte del summit da 12 CPE.
La agenda apunta a un equilibrio realista: usar AI/ML para mejorar defensa, pero también estudiar ataques potenciados por IA que están cambiando el terreno. Prometen charlas técnicas, talleres prácticos, un expo hall de herramientas, y mucho networking —incluyendo eventos Summit@Night. Entre los talleres destacados: uno de “pizzería inteligente” con OWASP AI Exchange para ver prompt injection, fuga de datos, poisoning, riesgos de supply chain y bases vectoriales; y un CTF tipo FinBot sobre fallos en flujos agenticos como goal hijacking, mal uso de herramientas y RCE inesperado.
En lo práctico: el summit-only online aparece como gratuito para charlas seleccionadas; el summit-only presencial figura a 525 dólares más impuestos. Hay paquetes Summit + Curso desde 5.250, y early bird de 500 dólares de descuento en cursos selectos con el código EarlyBirdNA si se paga antes del 5 de marzo. Además, SANS está empujando su “Secure AI Blueprint” con tres ejes —Proteger IA, Utilizar IA, Gobernar IA— como marco para reducir riesgo a medida que la adopción corre más rápido que la seguridad organizacional.
Story 10
Cierro con industria y poder. Primero, la escena incómoda: en el India AI Impact Summit, Sam Altman y Dario Amodei compartieron foto con el primer ministro Modi y, mientras otros líderes se tomaban de la mano, ellos evitaron el gesto y levantaron el puño. Es anecdótico, sí, pero llega tras un cruce público por la campaña de Anthropic durante el Super Bowl —“Ads are coming to AI. But not to Claude”— que apuntaba a la idea de anuncios en asistentes.
Y, más allá del chisme, hay lectura estratégica. Benedict Evans plantea que OpenAI enfrenta preguntas duras: no tiene un liderazgo tecnológico claramente defendible, su enorme base de usuarios parece tener uso superficial —muchos prueban, pocos pagan—, los incumbentes ya igualan capacidades y tienen distribución, y el roadmap de investigación condiciona qué producto puede salir. En paralelo, en el roundup de TheZvi se suma el choque Pentágono–Anthropic sobre usos militares, además de señales económicas: revisiones a la baja de empleo con PIB fuerte, interpretadas como productividad; y un ecosistema cada vez más polarizado sobre cuán rápido se automatiza el trabajo profesional.
En conjunto, el tablero se aclara: publicidad, distribución, infraestructura y gobernanza se están volviendo tan importantes como el próximo salto de modelo.
Suscríbete a fuentes específicas por edición:
- Space news
* Apple Podcast English
* Spotify English
* RSS English Spanish French
- Top news
* Apple Podcast English Spanish French
* Spotify English Spanish French
* RSS English Spanish French
- Tech news
* Apple Podcast English Spanish French
* Spotify English Spanish Spanish
* RSS English Spanish French
- Hacker news
* Apple Podcast English Spanish French
* Spotify English Spanish French
* RSS English Spanish French
- AI news
* Apple Podcast English Spanish French
* Spotify English Spanish French
* RSS English Spanish French
Visit our website at https://theautomateddaily.com/
Send feedback to [email protected]
Youtube
LinkedIn
X (Twitter)
- Consensus: IA para la investigación. Obtén un mes gratis - https://get.consensus.app/automated_daily
- KrispCall: Telefonía en la nube agéntica - https://try.krispcall.com/tad
- Prezi: Crea presentaciones con IA rápidamente - https://try.prezi.com/automated_daily
Apoya directamente a The Automated Daily:
Cómprame un café: https://buymeacoffee.com/theautomateddaily
Temas de hoy: Anuncios en ChatGPT y privacidad - OpenAI activa anuncios en ChatGPT y crece el debate sobre asistentes “ambientales” con micrófono/cámara. Claves: publicidad, datos, edge inference, DuckDuckGo Duck.ai, C2PA. Gemini 3.1 Pro y ARC-AGI - Google lanza Gemini 3.1 Pro con mejoras fuertes en razonamiento (ARC-AGI-2) y se comparan resultados en un nuevo harness tipo ARC-AGI-3. Claves: memoria, planificación, Claude Opus, límites de acciones. Frameworks de agentes y sandboxes - Nuevas ideas para coordinar agentes (Cord) y reducir riesgos al ejecutar comandos (Cursor sandbox). Claves: árboles de dependencias, spawn vs fork, Landlock/seccomp, Seatbelt, WSL2. Optimización automática con GEPA - GEPA presenta optimize_anything para optimizar cualquier artefacto textual con evaluación externa y ‘Actionable Side Information’. Claves: búsqueda Pareto, prompts, código, SVG, agentes ARC-AGI. Inferencia gestionada en Crusoe Cloud - Crusoe Managed Inference promete baja latencia y alto throughput con caché KV a nivel clúster (MemoryAlloy). Claves: TTFT 9.9x, batching dinámico, catálogo de modelos, pricing por token. Ciberseguridad AI: SANS Summit 2026 - SANS impulsa dos frentes: su AI Cybersecurity Summit 2026 y el Secure AI Blueprint para gobernanza y controles. Claves: OWASP AI, prompt injection, agentic failures, CPE, formación GIAC. Drama OpenAI vs Anthropic y estrategia - La rivalidad Altman–Amodei se vuelve pública mientras analistas cuestionan el ‘foso’ competitivo de OpenAI. Claves: anuncios, distribución, modelo de negocio, Pentágono vs Anthropic, valoración y adopción. Xbox cambia de líder con AI - Microsoft Gaming cambia de era: se retira Phil Spencer y entra Asha Sharma con un discurso contra el ‘AI slop’. Claves: franquicias, nuevos modelos de negocio, futuro del juego.
-https://www.sans.org/cyber-security-training-events/ai-summit-2026
-https://arxiv.org/abs/2602.16301
-https://juno-labs.com/blogs/every-company-building-your-ai-assistant-is-an-ad-company
-https://www.neowin.net/news/phil-spencer-is-exiting-microsoft-as-ai-executive-takes-over-xbox/
-https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/
-https://www.june.kim/cord
-https://www.testingcatalog.com/google-test-notebooklm-integration-for-opal-workflows/
-https://x.com/scaling01/status/2024640940657246235
-https://tomtunguz.com/9-observations-using-ai-agents/
-https://daoudclarke.net/2026/02/19/repeating-prompt
-https://www.crusoe.ai/cloud/managed-inference
-https://www.sans.org/mlp/ai-security-blueprint
-https://cursor.com/blog/agent-sandboxing
-https://9to5mac.com/2026/02/19/duckduckgo-rolls-out-ai-powered-image-editing-on-duck-ai/
-https://mojodojo.io/blog/meta-is-systematically-killing-our-agency/
-https://gepa-ai.github.io/gepa/blog/2026/02/18/introducing-optimize-anything/
-https://fortune.com/2026/02/19/openai-anthropic-sam-altman-dario-amodei-refused-to-hold-hands-ai-super-bowl-ad-war-ceos-big-tech-conflict/
-https://thezvi.wordpress.com/2026/02/19/ai-156-part-1-they-do-mean-the-effect-on-jobs/
-https://www.ben-evans.com/benedictevans/2026/2/19/how-will-openai-compete-nkg2x
Transcripcion del Episodio
Anuncios en ChatGPT y privacidad
Primero, el tema que atraviesa casi todo lo demás: monetización y privacidad. Según un análisis que ha estado circulando fuerte, OpenAI anunció de forma discreta el 16 de enero que ChatGPT empezaría a mostrar publicidad, y para el 9 de febrero los anuncios ya estaban activos. La lectura del autor no es “OpenAI malo”, sino un problema estructural: si el asistente se financia con anuncios y, a la vez, la industria empuja hacia dispositivos siempre encendidos —micrófonos, cámaras, detección de presencia, wearables, incluso conciencia “multi-habitación”—, el incentivo a recolectar contexto se vuelve enorme.
El punto clave aquí es una frase que vale oro en diseño de sistemas: “la política es una promesa; la arquitectura es una garantía”. Es decir, puedes prometer que no vendes datos, pero si el sistema técnicamente puede enviarlos a la nube, la tentación y el riesgo siguen ahí. El texto propone una salida: inferencia local, en el borde, sin telemetría y sin ‘phoning home’. Con hardware actual y modelos más eficientes, dice, ya podrías correr todo el pipeline en casa —voz a texto, memoria, razonamiento y voz de vuelta— en una cajita silenciosa, con pago único. Quizá menos capaz que la nube… pero con una propiedad valiosa: no existe el canal para filtrar tu vida privada.
Gemini 3.1 Pro y ARC-AGI
En esa misma línea de “IA sí, pero con límites”, DuckDuckGo está desplegando edición de imágenes por IA dentro de Duck.ai. La promesa: gratis, sin cuenta, y con medidas de privacidad antes de enviar el pedido a un modelo de OpenAI: eliminan metadatos, retiran la IP, y guardan la imagen subida localmente en el dispositivo. Además, las imágenes editadas se etiquetan con metadatos compatibles con C2PA, un detalle importante para trazabilidad. Y ojo: DuckDuckGo insiste en que esto es opcional y separado del buscador; incluso ofrece una interfaz explícitamente sin IA en noai.duckduckgo.com. Es una postura interesante: no vender “magia”, sino control.
Frameworks de agentes y sandboxes
Pasemos a modelos y benchmarks, porque esta semana hay movimiento grande en Google. Se anunció Gemini 3.1 Pro, pensado para tareas complejas donde una respuesta rápida no alcanza. Google lo está desplegando desde el 19 de febrero en su ecosistema: Gemini API y AI Studio para desarrolladores, Vertex AI para empresas, y para consumidores en la app de Gemini y en NotebookLM —aunque con acceso privilegiado para suscriptores Pro y Ultra.
El dato que Google está usando como bandera: en ARC-AGI-2, un benchmark de patrones lógicos nuevos, Gemini 3.1 Pro marca 77,1% verificado, y la compañía afirma que es más del doble que Gemini 3 Pro. Y lo ilustran con demos muy de “producto”: generar SVGs animados listos para web desde texto, montar un dashboard aeroespacial que visualiza la órbita de la Estación Espacial Internacional con telemetría pública, o crear una experiencia 3D interactiva de murmuraciones de estorninos con seguimiento de manos y audio generativo.
Pero, y esto es importante, cuando el modelo se somete a entornos más “agenticos”, el rendimiento se matiza.
Optimización automática con GEPA
Un ejemplo: un post en X sobre un harness de pruebas estilo ARC-AGI-3, en un entorno de puzzles 2D con presupuesto de acciones y una memoria editable en pantalla, obliga al modelo a responder en JSON y a operar paso a paso. El autor admite que su harness anterior era defectuoso y ahora construyó una plataforma de depuración con trazas: antes/después por acción, costos, tokens, estado, acciones y todo el I/O.
Con ese marco, Gemini 3.1 Pro mejora en identificar la tarea frente a 3.0 Pro, pero falla en ejecución: malinterpreta señales visuales, se pierde rotaciones de 90 grados de elementos de interfaz, y a menudo se queda sin movimientos. También se critica que usa poco la herramienta de memoria: apenas deja un par de frases sueltas. En cambio, Claude 4.6 Opus (Thinking) aparece como más sólido: planifica mejor, detecta transformaciones críticas y mantiene memoria más estructurada. Aun así, choca contra límites del entorno —por ejemplo, un cap de 50 movimientos— y puede fallar en precisión de “clics” aunque conceptualmente sepa la solución.
La idea que queda: no es solo “razonar”, es operar con memoria útil y disciplina de ejecución. Esa brecha es justo donde los agentes se ganan o se caen.
Inferencia gestionada en Crusoe Cloud
Hablando de agentes: hay dos historias que encajan como piezas. La primera es Cord, un proyecto open source de June Kim para coordinar “árboles” de agentes donde el propio agente decide cómo descomponer el trabajo en tiempo de ejecución, en lugar de depender de flujos predefinidos por el desarrollador. Su tesis es que el trabajo real no es una cadena lineal: es un árbol de dependencias con ramas paralelas y contexto compartido.
Cord introduce una distinción muy práctica de flujo de contexto: spawn, donde el agente hijo arranca limpio y solo recibe resultados explícitamente dependientes; y fork, donde hereda el contexto acumulado de sus “hermanos”. Eso reduce contaminación cuando investigas en paralelo, pero permite síntesis cuando toca. Debajo, cada agente es un proceso de Claude Code CLI con herramientas MCP y una base SQLite compartida; hay primitivas como spawn, fork, ask, complete y read_tree. Y un detalle que me encanta: el humano es un nodo más del árbol; cuando un ask queda listo, el sistema se detiene y pregunta en terminal, guarda la respuesta y desbloquea el resto.
Ciberseguridad AI: SANS Summit 2026
La segunda pieza es seguridad operacional para agentes que ejecutan comandos. Cursor cuenta que los agentes ya son lo bastante capaces como para correr comandos de terminal por su cuenta, y que autoaprobarlos aumenta productividad… pero eleva el riesgo de borrar bases de datos, filtrar secretos o romper despliegues. Pedir aprobación humana para todo suena seguro, pero en la práctica genera “fatiga de aprobación”, especialmente con varios agentes.
La solución: sandboxing de agentes en macOS, Linux y Windows. La promesa es simple: el agente corre libre dentro de un entorno controlado y solo pide permiso cuando necesita “salir”, típicamente para acceder a internet. Cursor afirma que así se pide aprobación un 40% menos, ahorrando interrupciones.
Lo técnico es jugoso: en macOS usan Seatbelt vía sandbox-exec con políticas finas generadas en runtime; en Linux combinan Landlock (restricción de filesystem) y seccomp (filtrado de syscalls), con overlay filesystem y copias bloqueadas de archivos ignorados. En Windows, tiran de WSL2 porque un sandbox nativo equivalente para herramientas de desarrollo es mucho más difícil, y dicen estar trabajando con Microsoft en primitivas necesarias. Esto es un patrón claro: los agentes no solo necesitan “inteligencia”, necesitan barandillas de sistema operativo.
Drama OpenAI vs Anthropic y estrategia
Ahora, optimización automática: GEPA presentó optimize_anything, una API declarativa para optimizar cualquier artefacto representable como texto —código, prompts, arquitecturas de agentes, SVGs, configuraciones— siempre que tú definas qué significa “mejor” con un evaluador. El loop es: probar candidato, medir, capturar diagnósticos y volver a proponer mejoras.
La idea más útil aquí es ASI, Actionable Side Information: el feedback del evaluador se devuelve al modelo en forma de diagnósticos accionables, casi como si fueran “gradientes” en optimización numérica. Además, usan búsqueda Pareto: en vez de colapsar métricas a un promedio, mantienen una frontera de soluciones eficientes para conservar alternativas fuertes en distintos criterios. Enseñan un ejemplo simpático —un pelícano en bicicleta en SVG— y afirman resultados serios en varias áreas: desde acelerar tareas con Claude Code hasta evolucionar agentes para ARC-AGI, pasando por generación de kernels CUDA. Si esto madura, podríamos ver una nueva capa de ‘auto-mejora’ de herramientas de desarrollo… con evaluadores bien diseñados como pieza central.
Xbox cambia de líder con AI
Infraestructura: Crusoe lanzó Managed Inference en Crusoe Cloud, un servicio gestionado de inferencia con foco en baja latencia y alto throughput. Presumen hasta 9,9x mejor tiempo al primer token y hasta 5x más tokens por segundo frente a vLLM con Llama-3.3-70B en un despliegue de 4 nodos.
Atribuyen la mejora a MemoryAlloy, una “tela” de memoria a nivel clúster y caché KV compartida que evita prefills duplicados, habilita sesiones persistentes y enruta solicitudes de forma inteligente. Le suman batching dinámico y speculative decoding. Y empujan un catálogo de modelos —desde DeepSeek y Qwen3 hasta Gemma y otros— con precios por millón de tokens y tarifas más bajas para tokens cacheados. Si estás construyendo agentes, esto importa porque la experiencia del usuario muchas veces depende más del TTFT y la consistencia que de una décima en un benchmark.
Story 9
Seguridad y gobernanza: SANS viene con doble anuncio. Por un lado, su AI Cybersecurity Summit 2026 será el 20 y 21 de abril, con cursos opcionales del 22 al 27, tanto presencial en Arlington, Virginia, como en formato online en vivo. Lo preside Rob T. Lee y la parte del summit da 12 CPE.
La agenda apunta a un equilibrio realista: usar AI/ML para mejorar defensa, pero también estudiar ataques potenciados por IA que están cambiando el terreno. Prometen charlas técnicas, talleres prácticos, un expo hall de herramientas, y mucho networking —incluyendo eventos Summit@Night. Entre los talleres destacados: uno de “pizzería inteligente” con OWASP AI Exchange para ver prompt injection, fuga de datos, poisoning, riesgos de supply chain y bases vectoriales; y un CTF tipo FinBot sobre fallos en flujos agenticos como goal hijacking, mal uso de herramientas y RCE inesperado.
En lo práctico: el summit-only online aparece como gratuito para charlas seleccionadas; el summit-only presencial figura a 525 dólares más impuestos. Hay paquetes Summit + Curso desde 5.250, y early bird de 500 dólares de descuento en cursos selectos con el código EarlyBirdNA si se paga antes del 5 de marzo. Además, SANS está empujando su “Secure AI Blueprint” con tres ejes —Proteger IA, Utilizar IA, Gobernar IA— como marco para reducir riesgo a medida que la adopción corre más rápido que la seguridad organizacional.
Story 10
Cierro con industria y poder. Primero, la escena incómoda: en el India AI Impact Summit, Sam Altman y Dario Amodei compartieron foto con el primer ministro Modi y, mientras otros líderes se tomaban de la mano, ellos evitaron el gesto y levantaron el puño. Es anecdótico, sí, pero llega tras un cruce público por la campaña de Anthropic durante el Super Bowl —“Ads are coming to AI. But not to Claude”— que apuntaba a la idea de anuncios en asistentes.
Y, más allá del chisme, hay lectura estratégica. Benedict Evans plantea que OpenAI enfrenta preguntas duras: no tiene un liderazgo tecnológico claramente defendible, su enorme base de usuarios parece tener uso superficial —muchos prueban, pocos pagan—, los incumbentes ya igualan capacidades y tienen distribución, y el roadmap de investigación condiciona qué producto puede salir. En paralelo, en el roundup de TheZvi se suma el choque Pentágono–Anthropic sobre usos militares, además de señales económicas: revisiones a la baja de empleo con PIB fuerte, interpretadas como productividad; y un ecosistema cada vez más polarizado sobre cuán rápido se automatiza el trabajo profesional.
En conjunto, el tablero se aclara: publicidad, distribución, infraestructura y gobernanza se están volviendo tan importantes como el próximo salto de modelo.
Suscríbete a fuentes específicas por edición:
- Space news
* Apple Podcast English
* Spotify English
* RSS English Spanish French
- Top news
* Apple Podcast English Spanish French
* Spotify English Spanish French
* RSS English Spanish French
- Tech news
* Apple Podcast English Spanish French
* Spotify English Spanish Spanish
* RSS English Spanish French
- Hacker news
* Apple Podcast English Spanish French
* Spotify English Spanish French
* RSS English Spanish French
- AI news
* Apple Podcast English Spanish French
* Spotify English Spanish French
* RSS English Spanish French
Visit our website at https://theautomateddaily.com/
Send feedback to [email protected]
Youtube
X (Twitter)