
OpenClaw y seguridad empresarial & Agentes en mensajería y Telegram - Noticias de IA (17 feb 2026)
February 17, 202613m 35s
Audio is streamed directly from the publisher (mcdn.podbean.com) as published in their RSS feed. Play Podcasts does not host this file. Rights-holders can request removal through the copyright & takedown page.
Show Notes
Por favor, apoya este pódcast visitando a nuestros patrocinadores:
- Descubre el futuro del audio con IA con ElevenLabs - https://try.elevenlabs.io/tad
- Prezi: Crea presentaciones con IA rápidamente - https://try.prezi.com/automated_daily
- Crea cualquier formulario, sin código, con Fillout. 50% de créditos adicionales por registrarte - https://try.fillout.com/the_automated_daily
Apoya directamente a The Automated Daily:
Cómprame un café: https://buymeacoffee.com/theautomateddaily
Temas de hoy: OpenClaw y seguridad empresarial - OpenClaw se vuelve viral y a la vez peligroso: permisos de usuario, marketplace de “skills” y riesgo de exfiltración. Zenity empuja webinars y mejores prácticas de gobernanza, sandboxing y mínimo privilegio. Agentes en mensajería y Telegram - Manus AI lanza agentes persistentes con memoria usando Telegram como “puerta de entrada”, pero el bot es suspendido poco después. El caso subraya dependencia de plataformas, fricción de integraciones y costos por créditos. Delegación inteligente entre agentes - Un paper de arXiv propone “Intelligent AI Delegation” para asignar subtareas con autoridad, responsabilidad y límites claros. Apunta a redes de delegación humano‑IA en la futura “agentic web”. Programar con agentes y “editar en vivo” - Desde un acortador de enlaces con botón “Edit with Shelley” hasta un task switcher en Zig hecho con ayuda de Claude, crece el patrón de software editable por agentes. A la vez, emergen prácticas de seguridad: contenedores, revisión de diffs y permisos acotados. Modelos, tokenizadores y modo rápido - Microsoft acelera su independencia con modelos MAI y mega‑infraestructura; mientras, se analiza el tokenizer o200k_base y llegan “fast modes” de OpenAI y Anthropic con enfoques distintos. OpenRouter lanza un router de modelos gratuitos para simplificar inferencia sin costo. RL para agentes y prompts verificables - MiniMax explica cómo su framework Forge escala RL para agentes con datos asíncronos, rewards por herramientas y eficiencia por prefix trees. Otro trabajo, Composition‑RL, compone prompts “fáciles” para mantener señal verificable en RLVR. Calidad de datos y juicio humano - Welo Data insiste en que muchos proyectos de IA fallan por evaluaciones humanas no calibradas ni auditables. Propone “sistemas de calidad” con trazabilidad, monitoreo de drift, loops de QA y gobernanza del juicio humano. Backlash: slop, acoso y OSS - Crece el malestar: PRs basura, reportes de bugs alucinados y hasta acoso automatizado en open source; además, herramientas de “roast” personal elevan el riesgo de bullying. La discusión se mueve de ‘qué puede hacer la IA’ a ‘quién paga los costos’. Voz en tiempo real: PersonaPlex - NVIDIA publica PersonaPlex‑7B: conversación full‑duplex de voz a voz, capaz de interrumpir y responder con baja latencia. Señala un salto hacia asistentes hablados más naturales, aunque por ahora centrados en inglés y GPUs NVIDIA.
-https://zenity.io/resources/webinars/openclaw-how-to-secure-agent-assistants
-https://zenity.io/resources/webinars/foundations-of-ai-security
-https://arxiv.org/abs/2602.11865
-https://github.com/HenryNdubuaku/maths-cs-ai-compendium
-https://blog.exe.dev/software-as-wiki
-https://www.testingcatalog.com/manus-ai-launched-24-7-agent-via-telegram-and-got-suspended/
-https://codemade.net/blog/building-for-one/
-https://winbuzzer.com/2026/02/13/microsoft-mustafa-suleyman-ai-self-sufficiency-openai-mai-models-xcxwbn/
-https://www.testingcatalog.com/xai-tests-parralel-agents-and-arena-mode-for-grok-build/
-https://metehan.ai/blog/reverse-engineering-the-gpt-5-tokenizer-aeo-geo/
-https://go.welodata.ai/l/976893/2026-01-23/8njgp
-https://joshcollinsworth.com/blog/sloptimism
-https://www.vulnu.com/p/the-problem-isnt-openclaw-its-the-architecture
-https://welodata.ai/ai-data-quality-systems-human-judgment-at-scale/
-https://x.com/neural_avb/status/2022715561390776524
-https://welodata.ai/ai-data-quality-systems/
-https://openrouter.ai/openrouter/free
-https://www.jeffgeerling.com/blog/2026/ai-is-destroying-open-source/
-https://steipete.me/posts/2026/openclaw
-https://venturebeat.com/infrastructure/nvidia-groq-and-the-limestone-race-to-real-time-ai-why-enterprises-win-or
-https://danielmiessler.com/blog/nobody-is-talking-about-generalized-hill-climbing
-https://arxiv.org/abs/2602.12036
-https://www.seangoedecke.com/fast-llm-inference/
-https://anthony.noided.media/blog/ai/programming/2026/02/14/i-guess-i-kinda-get-why-people-hate-ai.html
-https://huggingface.co/nvidia/personaplex-7b-v1
Transcripcion del Episodio
OpenClaw y seguridad empresarial
Arranquemos con el tema que más se repite hoy: los agentes, cuando dejan de “responder” y empiezan a “hacer”. OpenClaw —antes ClawdBot y MoltBot— se está volviendo viral por una razón simple: es útil. Se instala, corre en tu propio dispositivo y puede ejecutar acciones como si fueras tú. Pero ahí está el problema: hereda exactamente tus permisos. En un entorno corporativo eso equivale a darle a un “nuevo compañero” acceso a tu sesión, tus credenciales, tus documentos y tus herramientas, a veces sin segmentación ni límites claros.
Agentes en mensajería y Telegram
En paralelo, se describió una oleada de “skills” maliciosas en el marketplace de OpenClaw, un patrón muy parecido a un ataque de cadena de suministro: extensiones que parecen legítimas, y que además empujan a la ingeniería social con pasos de instalación tipo “pega este comando en tu terminal”. OpenClaw respondió con escaneo de terceros —incluyendo colaboración con VirusTotal—, pero la crítica de fondo es más incómoda: si combinas agente + herramientas + marketplace, acabas de crear una superficie de ataque escalable. Y los prompts del sistema no son un control de seguridad; en cuanto el agente lee contenido no confiable —web, correos, tickets— la inyección de prompt se vuelve un riesgo operativo.
Delegación inteligente entre agentes
Aquí encaja el argumento de “seguridad de adultos” para agentes: sandbox por defecto (VMs o contenedores), credenciales de mínimo privilegio, allowlists de herramientas, control de egreso de red, aprobaciones para acciones de alto impacto, y sobre todo: logging de acciones ejecutadas, no solo del chat. Es el mismo salto mental que hicimos con microservicios o CI/CD: no basta con que funcione; tiene que ser observable y gobernable.
Programar con agentes y “editar en vivo”
Y en ese clima, Zenity está aprovechando la ola con dos frentes educativos y comerciales. Por un lado, un webinar on‑demand centrado en “OpenClaw Security” para explicar riesgos empresariales y prácticas para alinear asistentes de agentes con la postura de seguridad. Por otro, una serie de tres sesiones llamada “Foundations of AI Security” dentro de su Learning Lab, con fechas a finales de febrero y principios de marzo, que cubren desde qué son los agentes hasta amenazas como data leakage, prompt injection y shadow AI, y un cierre sobre estrategia de ciclo de vida, monitoreo y respuesta. Incluso ofrecen un certificado si completas las tres. La letra pequeña también importa: formularios con datos laborales y consentimiento para comunicaciones de marketing, con opción de retirar consentimiento después. Es decir: formación, sí, pero también embudo comercial.
Modelos, tokenizadores y modo rápido
Dato político‑industrial: Peter Steinberger, creador de OpenClaw, anunció que se une a OpenAI para “llevar agentes a todo el mundo”. Dice que OpenClaw seguirá siendo open source y que lo moverán a una fundación para mantener independencia, con apoyo y patrocinio. Es una jugada interesante: por un lado, acceso a modelos y a investigación punta; por otro, la tensión habitual entre comunidad abierta y el empuje por hacer productos masivos y seguros. Si OpenClaw es el símbolo de “agentes para todos”, la próxima pregunta es quién define los límites: ¿el usuario, la empresa o el proveedor del modelo?
RL para agentes y prompts verificables
Pasemos a mensajería, porque aquí es donde los agentes se vuelven cotidianos. Manus AI lanzó una función de “Agents” para crear agentes personales con identidad y memoria persistente. La idea práctica es fuerte: usar Telegram como puerta de entrada, de modo que el agente esté disponible 24/7 desde un chat, y el mismo hilo se vea en web y móvil. Suena a “configuración casi de un clic”. El giro: poco después, Telegram suspendió la cuenta del bot siempre encendido de Manus. No hay explicación pública clara, y eso deja una lección: si tu agente depende de un canal externo, tu producto también depende de sus políticas, su tolerancia al spam, y sus decisiones de seguridad. Además, Manus es por créditos; y los flujos largos consumen créditos rápido. En agentes persistentes, el precio no es un detalle: es parte del diseño.
Calidad de datos y juicio humano
En investigación, apareció en arXiv el paper “Intelligent AI Delegation”. La tesis es que, a medida que los agentes asumen tareas complejas, no basta con dividir subtareas por heurísticas simples. Hace falta delegación adaptativa, con transferencias explícitas de autoridad, responsabilidad y rendición de cuentas. No es solo “tú haces A y yo hago B”, sino quién está autorizado a actuar, quién responde si algo falla, y qué límites y roles están definidos. Es un marco pensado para redes de delegación multi‑parte, lo que algunos ya llaman una “agentic web”: agentes y humanos colaborando en cadenas largas, con fallos inevitables y necesidad de confianza.
Backlash: slop, acoso y OSS
Ahora, el lado más divertido —y también más inquietante—: el software que se comporta como un wiki. En exe.dev, construyeron un acortador interno llamado “slinky” y lo raro es el botón “Edit with Shelley”. Lo pulsas y te lleva a un agente, en la misma VM, para modificar el servicio directamente. El autor quería agregar enlaces con parámetros tipo plantilla —por ejemplo, /trace/foo que se expande a una URL enorme de Honeycomb con el trace id insertado—, y el agente lo implementó en un cambio prácticamente de una sola pasada. La idea seduce: si no te gusta cómo funciona, lo editas. La pregunta profesional: ¿cuánto control de cambios, revisiones y aislamiento necesitas para que ese “editar” no se convierta en “romper” o “exfiltrar”?
Voz en tiempo real: PersonaPlex
Otro ejemplo: FastTab, un task switcher para KDE Plasma en X11, escrito en Zig y con OpenGL, pensado para responder instantáneo porque el selector visual nativo tarda hasta un segundo. Su autor admite que no habría intentado el proyecto sin ayuda de IA: empezó sin saber Zig ni internals de X11 y en días tenía un prototipo, iterando con Claude y luego refinando. Pero también comparte disciplina: desarrollo incremental con git, revisar diffs, y para no darle llaves de tu casa al agente, ejecutar en contenedores aislados. Interesante detalle: incluso hay que decirle explícitamente al modelo sus limitaciones del entorno —sin X11, sin instalar paquetes— para no gastar tokens en intentos imposibles. Y remata con una verdad bastante honesta: la IA te da el 80%, pero el 20% final —estructura, tests, rendimiento— sigue siendo ingeniería.
Story 10
Hablando de agentes que programan: xAI estaría empujando Grok Build hacia un IDE en el navegador. Lo más llamativo es “Parallel Agents”: un prompt, múltiples agentes en paralelo, con salidas lado a lado y tracker de contexto. Incluso se menciona un “Arena mode”, tipo torneo con ranking automático. La promesa es velocidad por concurrencia. El riesgo es conocido: más agentes también significa más superficie para errores sutiles, y más necesidad de verificación y pruebas. Con agentes, el costo no es solo computacional; es el costo de revisar.
Story 11
En modelos e infraestructura, Microsoft está dejando claro que quiere independencia real: su línea interna MAI para reducir dependencia de OpenAI, empujada por Mustafa Suleyman. Hablan de compute a escala de gigavatios, del chip Maia 200 para inferencia más barata, y de una red de centros de datos —Fairwater— descrita como una “superfábrica”. Aun así, seguirán comprando Nvidia y AMD, y Azure sigue ampliando catálogo con modelos de terceros como Claude, Llama o Mistral. Mensaje entre líneas: el futuro de la nube será multi‑modelo y multi‑hardware, y nadie quiere estar atado a un solo proveedor.
Story 12
En el plano más técnico‑curioso, se publicó un reverse engineering experimental del tokenizer o200k_base —el que el autor asocia con modelos tipo GPT‑4o y la familia “o*”— usando tiktoken y un vocabulario público en Azure. Hallazgo clave: el pre‑tokenizado ahora es más consciente de camelCase y PascalCase, lo que mejora cómo se parten identificadores de código antes del BPE. Y el reporte sugiere que el salto de 50k a 200k tokens no mejora tanto prosa en inglés, pero sí ayuda bastante a código, URLs y scripts no latinos. Es de esas piezas que no te dicen “cómo piensa” el modelo, pero sí te enseñan qué optimiza el producto.
Story 13
También vimos comparativas de “fast mode” en modelos de programación: Anthropic promete alrededor de 2,5× más tokens por segundo en su Opus sirviendo el mismo modelo, mientras OpenAI presume más de 1000 tokens por segundo, pero con un modelo distinto y más propenso a errores, supuestamente apoyado por hardware tipo Cerebras. Debate interesante: ¿prefieres velocidad con más fallos, o menos velocidad con más fiabilidad? Para agentes que ejecutan herramientas, el error cuesta caro.
Story 14
Y para desarrolladores con ganas de experimentar sin pagar, OpenRouter lanzó “openrouter/free”: un router de modelos gratuitos detrás de una API con ventana de contexto grande y selección aleatoria filtrada por capacidades como visión, tool calling o salidas estructuradas. En la práctica, esto baja la fricción para prototipos, aunque el rendimiento y la consistencia dependerán del modelo que toque en cada llamada.
Story 15
En entrenamiento, MiniMax explicó cómo su modelo M2.5 llegó a ser competitivo con un enfoque de RL llamado Forge: desacoplan generación de trayectorias y el loop de entrenamiento con un pool de datos, entrenan sobre múltiples “scaffolds” sin reescribir agentes, y añaden rewards que penalizan llamadas malformadas a herramientas o premian terminar rápido y bien. También hablan de trucos de eficiencia como prefix trees para reutilizar prefijos compartidos y acelerar entrenamiento de forma drástica. Y en la misma línea de RL con recompensas verificables, salió “Composition‑RL”: en vez de depender solo de prompts difíciles, compone varios prompts fáciles —de pass rate 1— para crear nuevos problemas todavía verificables, manteniendo señal de aprendizaje cuando el modelo ya “se sabe” lo básico.
Story 16
Si tu organización entrena o evalúa modelos, otro tema de hoy es menos glamoroso pero decisivo: calidad de datos. Welo Data insiste en que muchos proyectos fallan no por el modelo, sino porque el juicio humano detrás de la evaluación no está calibrado ni es auditable. Su propuesta es diseñar el “sistema de calidad” antes de escalar: marcos de decisión, ejemplos de referencia, rutas de escalado de ambigüedad, monitoreo de drift, loops de QA y trazabilidad. También advierten contra usar LLMs como jueces sin supervisión gobernada: puedes automatizar inconsistencia y sesgo a gran escala. Es un recordatorio útil: si no puedes explicar por qué una etiqueta es correcta, no puedes defender tu producto cuando algo sale mal.
Story 17
Y cerramos con la parte social, que está cada vez más presente. Jeff Geerling advierte que la IA “agentic” y el contenido basura están dañando el open source: desde historias retractadas por citas alucinadas, hasta el caso de curl pausando su bug bounty porque los reportes útiles bajaron fuerte mientras subían envíos generados por IA, con más discusión y menos fixes. Incluso GitHub ya ofrece la opción de desactivar pull requests, algo impensable hace años. Cuando el cuello de botella pasa a ser el tiempo del revisor, la “productividad” se convierte en deuda.
Story 18
En esa misma vibra, hay textos que ponen el dedo en la llaga: herramientas de “roast” personal a partir de tu GitHub que se sienten sorprendentemente crueles, y el miedo de que esto amplifique el bullying, especialmente en menores, con deepfakes y acoso hiper‑personalizado. Y otro autor describe una ansiedad laboral nueva: no “si trabajaré”, sino “si podré volver a ser contratado” en profesiones que la IA puede automatizar parcialmente. No es una predicción apocalíptica; es el registro de que, para mucha gente, el día a día con IA ya se siente peor: estafas más creíbles, aprendizaje erosionado por trampas, y feeds inundados de slop.
Story 19
Como contrapunto tecnológico, NVIDIA publicó PersonaPlex‑7B‑v1, un modelo de voz a voz en tiempo real, full‑duplex, capaz de escuchar y hablar a la vez, con interrupciones y solapamientos naturales. Se condiciona con un prompt de voz para estilo y un prompt de texto para la persona. Está basado en arquitectura tipo Moshi y optimizado para GPUs NVIDIA. Es una señal clara de hacia dónde se mueven los asistentes: menos “habla y espera” y más conversación fluida. El reto, de nuevo, será llevar esa naturalidad a productos que también sean seguros, controlables y transparentes.
Suscríbete a fuentes específicas por edición:
- Space news
* Apple Podcast English
* Spotify English
* RSS English Spanish French
- Top news
* Apple Podcast English Spanish French
* Spotify English Spanish French
* RSS English Spanish French
- Tech news
* Apple Podcast English Spanish French
* Spotify English Spanish Spanish
* RSS English Spanish French
- Hacker news
* Apple Podcast English Spanish French
* Spotify English Spanish French
* RSS English Spanish French
- AI news
* Apple Podcast English Spanish French
* Spotify English Spanish French
* RSS English Spanish French
Visit our website at https://theautomateddaily.com/
Send feedback to [email protected]
Youtube
LinkedIn
X (Twitter)
- Descubre el futuro del audio con IA con ElevenLabs - https://try.elevenlabs.io/tad
- Prezi: Crea presentaciones con IA rápidamente - https://try.prezi.com/automated_daily
- Crea cualquier formulario, sin código, con Fillout. 50% de créditos adicionales por registrarte - https://try.fillout.com/the_automated_daily
Apoya directamente a The Automated Daily:
Cómprame un café: https://buymeacoffee.com/theautomateddaily
Temas de hoy: OpenClaw y seguridad empresarial - OpenClaw se vuelve viral y a la vez peligroso: permisos de usuario, marketplace de “skills” y riesgo de exfiltración. Zenity empuja webinars y mejores prácticas de gobernanza, sandboxing y mínimo privilegio. Agentes en mensajería y Telegram - Manus AI lanza agentes persistentes con memoria usando Telegram como “puerta de entrada”, pero el bot es suspendido poco después. El caso subraya dependencia de plataformas, fricción de integraciones y costos por créditos. Delegación inteligente entre agentes - Un paper de arXiv propone “Intelligent AI Delegation” para asignar subtareas con autoridad, responsabilidad y límites claros. Apunta a redes de delegación humano‑IA en la futura “agentic web”. Programar con agentes y “editar en vivo” - Desde un acortador de enlaces con botón “Edit with Shelley” hasta un task switcher en Zig hecho con ayuda de Claude, crece el patrón de software editable por agentes. A la vez, emergen prácticas de seguridad: contenedores, revisión de diffs y permisos acotados. Modelos, tokenizadores y modo rápido - Microsoft acelera su independencia con modelos MAI y mega‑infraestructura; mientras, se analiza el tokenizer o200k_base y llegan “fast modes” de OpenAI y Anthropic con enfoques distintos. OpenRouter lanza un router de modelos gratuitos para simplificar inferencia sin costo. RL para agentes y prompts verificables - MiniMax explica cómo su framework Forge escala RL para agentes con datos asíncronos, rewards por herramientas y eficiencia por prefix trees. Otro trabajo, Composition‑RL, compone prompts “fáciles” para mantener señal verificable en RLVR. Calidad de datos y juicio humano - Welo Data insiste en que muchos proyectos de IA fallan por evaluaciones humanas no calibradas ni auditables. Propone “sistemas de calidad” con trazabilidad, monitoreo de drift, loops de QA y gobernanza del juicio humano. Backlash: slop, acoso y OSS - Crece el malestar: PRs basura, reportes de bugs alucinados y hasta acoso automatizado en open source; además, herramientas de “roast” personal elevan el riesgo de bullying. La discusión se mueve de ‘qué puede hacer la IA’ a ‘quién paga los costos’. Voz en tiempo real: PersonaPlex - NVIDIA publica PersonaPlex‑7B: conversación full‑duplex de voz a voz, capaz de interrumpir y responder con baja latencia. Señala un salto hacia asistentes hablados más naturales, aunque por ahora centrados en inglés y GPUs NVIDIA.
-https://zenity.io/resources/webinars/openclaw-how-to-secure-agent-assistants
-https://zenity.io/resources/webinars/foundations-of-ai-security
-https://arxiv.org/abs/2602.11865
-https://github.com/HenryNdubuaku/maths-cs-ai-compendium
-https://blog.exe.dev/software-as-wiki
-https://www.testingcatalog.com/manus-ai-launched-24-7-agent-via-telegram-and-got-suspended/
-https://codemade.net/blog/building-for-one/
-https://winbuzzer.com/2026/02/13/microsoft-mustafa-suleyman-ai-self-sufficiency-openai-mai-models-xcxwbn/
-https://www.testingcatalog.com/xai-tests-parralel-agents-and-arena-mode-for-grok-build/
-https://metehan.ai/blog/reverse-engineering-the-gpt-5-tokenizer-aeo-geo/
-https://go.welodata.ai/l/976893/2026-01-23/8njgp
-https://joshcollinsworth.com/blog/sloptimism
-https://www.vulnu.com/p/the-problem-isnt-openclaw-its-the-architecture
-https://welodata.ai/ai-data-quality-systems-human-judgment-at-scale/
-https://x.com/neural_avb/status/2022715561390776524
-https://welodata.ai/ai-data-quality-systems/
-https://openrouter.ai/openrouter/free
-https://www.jeffgeerling.com/blog/2026/ai-is-destroying-open-source/
-https://steipete.me/posts/2026/openclaw
-https://venturebeat.com/infrastructure/nvidia-groq-and-the-limestone-race-to-real-time-ai-why-enterprises-win-or
-https://danielmiessler.com/blog/nobody-is-talking-about-generalized-hill-climbing
-https://arxiv.org/abs/2602.12036
-https://www.seangoedecke.com/fast-llm-inference/
-https://anthony.noided.media/blog/ai/programming/2026/02/14/i-guess-i-kinda-get-why-people-hate-ai.html
-https://huggingface.co/nvidia/personaplex-7b-v1
Transcripcion del Episodio
OpenClaw y seguridad empresarial
Arranquemos con el tema que más se repite hoy: los agentes, cuando dejan de “responder” y empiezan a “hacer”. OpenClaw —antes ClawdBot y MoltBot— se está volviendo viral por una razón simple: es útil. Se instala, corre en tu propio dispositivo y puede ejecutar acciones como si fueras tú. Pero ahí está el problema: hereda exactamente tus permisos. En un entorno corporativo eso equivale a darle a un “nuevo compañero” acceso a tu sesión, tus credenciales, tus documentos y tus herramientas, a veces sin segmentación ni límites claros.
Agentes en mensajería y Telegram
En paralelo, se describió una oleada de “skills” maliciosas en el marketplace de OpenClaw, un patrón muy parecido a un ataque de cadena de suministro: extensiones que parecen legítimas, y que además empujan a la ingeniería social con pasos de instalación tipo “pega este comando en tu terminal”. OpenClaw respondió con escaneo de terceros —incluyendo colaboración con VirusTotal—, pero la crítica de fondo es más incómoda: si combinas agente + herramientas + marketplace, acabas de crear una superficie de ataque escalable. Y los prompts del sistema no son un control de seguridad; en cuanto el agente lee contenido no confiable —web, correos, tickets— la inyección de prompt se vuelve un riesgo operativo.
Delegación inteligente entre agentes
Aquí encaja el argumento de “seguridad de adultos” para agentes: sandbox por defecto (VMs o contenedores), credenciales de mínimo privilegio, allowlists de herramientas, control de egreso de red, aprobaciones para acciones de alto impacto, y sobre todo: logging de acciones ejecutadas, no solo del chat. Es el mismo salto mental que hicimos con microservicios o CI/CD: no basta con que funcione; tiene que ser observable y gobernable.
Programar con agentes y “editar en vivo”
Y en ese clima, Zenity está aprovechando la ola con dos frentes educativos y comerciales. Por un lado, un webinar on‑demand centrado en “OpenClaw Security” para explicar riesgos empresariales y prácticas para alinear asistentes de agentes con la postura de seguridad. Por otro, una serie de tres sesiones llamada “Foundations of AI Security” dentro de su Learning Lab, con fechas a finales de febrero y principios de marzo, que cubren desde qué son los agentes hasta amenazas como data leakage, prompt injection y shadow AI, y un cierre sobre estrategia de ciclo de vida, monitoreo y respuesta. Incluso ofrecen un certificado si completas las tres. La letra pequeña también importa: formularios con datos laborales y consentimiento para comunicaciones de marketing, con opción de retirar consentimiento después. Es decir: formación, sí, pero también embudo comercial.
Modelos, tokenizadores y modo rápido
Dato político‑industrial: Peter Steinberger, creador de OpenClaw, anunció que se une a OpenAI para “llevar agentes a todo el mundo”. Dice que OpenClaw seguirá siendo open source y que lo moverán a una fundación para mantener independencia, con apoyo y patrocinio. Es una jugada interesante: por un lado, acceso a modelos y a investigación punta; por otro, la tensión habitual entre comunidad abierta y el empuje por hacer productos masivos y seguros. Si OpenClaw es el símbolo de “agentes para todos”, la próxima pregunta es quién define los límites: ¿el usuario, la empresa o el proveedor del modelo?
RL para agentes y prompts verificables
Pasemos a mensajería, porque aquí es donde los agentes se vuelven cotidianos. Manus AI lanzó una función de “Agents” para crear agentes personales con identidad y memoria persistente. La idea práctica es fuerte: usar Telegram como puerta de entrada, de modo que el agente esté disponible 24/7 desde un chat, y el mismo hilo se vea en web y móvil. Suena a “configuración casi de un clic”. El giro: poco después, Telegram suspendió la cuenta del bot siempre encendido de Manus. No hay explicación pública clara, y eso deja una lección: si tu agente depende de un canal externo, tu producto también depende de sus políticas, su tolerancia al spam, y sus decisiones de seguridad. Además, Manus es por créditos; y los flujos largos consumen créditos rápido. En agentes persistentes, el precio no es un detalle: es parte del diseño.
Calidad de datos y juicio humano
En investigación, apareció en arXiv el paper “Intelligent AI Delegation”. La tesis es que, a medida que los agentes asumen tareas complejas, no basta con dividir subtareas por heurísticas simples. Hace falta delegación adaptativa, con transferencias explícitas de autoridad, responsabilidad y rendición de cuentas. No es solo “tú haces A y yo hago B”, sino quién está autorizado a actuar, quién responde si algo falla, y qué límites y roles están definidos. Es un marco pensado para redes de delegación multi‑parte, lo que algunos ya llaman una “agentic web”: agentes y humanos colaborando en cadenas largas, con fallos inevitables y necesidad de confianza.
Backlash: slop, acoso y OSS
Ahora, el lado más divertido —y también más inquietante—: el software que se comporta como un wiki. En exe.dev, construyeron un acortador interno llamado “slinky” y lo raro es el botón “Edit with Shelley”. Lo pulsas y te lleva a un agente, en la misma VM, para modificar el servicio directamente. El autor quería agregar enlaces con parámetros tipo plantilla —por ejemplo, /trace/foo que se expande a una URL enorme de Honeycomb con el trace id insertado—, y el agente lo implementó en un cambio prácticamente de una sola pasada. La idea seduce: si no te gusta cómo funciona, lo editas. La pregunta profesional: ¿cuánto control de cambios, revisiones y aislamiento necesitas para que ese “editar” no se convierta en “romper” o “exfiltrar”?
Voz en tiempo real: PersonaPlex
Otro ejemplo: FastTab, un task switcher para KDE Plasma en X11, escrito en Zig y con OpenGL, pensado para responder instantáneo porque el selector visual nativo tarda hasta un segundo. Su autor admite que no habría intentado el proyecto sin ayuda de IA: empezó sin saber Zig ni internals de X11 y en días tenía un prototipo, iterando con Claude y luego refinando. Pero también comparte disciplina: desarrollo incremental con git, revisar diffs, y para no darle llaves de tu casa al agente, ejecutar en contenedores aislados. Interesante detalle: incluso hay que decirle explícitamente al modelo sus limitaciones del entorno —sin X11, sin instalar paquetes— para no gastar tokens en intentos imposibles. Y remata con una verdad bastante honesta: la IA te da el 80%, pero el 20% final —estructura, tests, rendimiento— sigue siendo ingeniería.
Story 10
Hablando de agentes que programan: xAI estaría empujando Grok Build hacia un IDE en el navegador. Lo más llamativo es “Parallel Agents”: un prompt, múltiples agentes en paralelo, con salidas lado a lado y tracker de contexto. Incluso se menciona un “Arena mode”, tipo torneo con ranking automático. La promesa es velocidad por concurrencia. El riesgo es conocido: más agentes también significa más superficie para errores sutiles, y más necesidad de verificación y pruebas. Con agentes, el costo no es solo computacional; es el costo de revisar.
Story 11
En modelos e infraestructura, Microsoft está dejando claro que quiere independencia real: su línea interna MAI para reducir dependencia de OpenAI, empujada por Mustafa Suleyman. Hablan de compute a escala de gigavatios, del chip Maia 200 para inferencia más barata, y de una red de centros de datos —Fairwater— descrita como una “superfábrica”. Aun así, seguirán comprando Nvidia y AMD, y Azure sigue ampliando catálogo con modelos de terceros como Claude, Llama o Mistral. Mensaje entre líneas: el futuro de la nube será multi‑modelo y multi‑hardware, y nadie quiere estar atado a un solo proveedor.
Story 12
En el plano más técnico‑curioso, se publicó un reverse engineering experimental del tokenizer o200k_base —el que el autor asocia con modelos tipo GPT‑4o y la familia “o*”— usando tiktoken y un vocabulario público en Azure. Hallazgo clave: el pre‑tokenizado ahora es más consciente de camelCase y PascalCase, lo que mejora cómo se parten identificadores de código antes del BPE. Y el reporte sugiere que el salto de 50k a 200k tokens no mejora tanto prosa en inglés, pero sí ayuda bastante a código, URLs y scripts no latinos. Es de esas piezas que no te dicen “cómo piensa” el modelo, pero sí te enseñan qué optimiza el producto.
Story 13
También vimos comparativas de “fast mode” en modelos de programación: Anthropic promete alrededor de 2,5× más tokens por segundo en su Opus sirviendo el mismo modelo, mientras OpenAI presume más de 1000 tokens por segundo, pero con un modelo distinto y más propenso a errores, supuestamente apoyado por hardware tipo Cerebras. Debate interesante: ¿prefieres velocidad con más fallos, o menos velocidad con más fiabilidad? Para agentes que ejecutan herramientas, el error cuesta caro.
Story 14
Y para desarrolladores con ganas de experimentar sin pagar, OpenRouter lanzó “openrouter/free”: un router de modelos gratuitos detrás de una API con ventana de contexto grande y selección aleatoria filtrada por capacidades como visión, tool calling o salidas estructuradas. En la práctica, esto baja la fricción para prototipos, aunque el rendimiento y la consistencia dependerán del modelo que toque en cada llamada.
Story 15
En entrenamiento, MiniMax explicó cómo su modelo M2.5 llegó a ser competitivo con un enfoque de RL llamado Forge: desacoplan generación de trayectorias y el loop de entrenamiento con un pool de datos, entrenan sobre múltiples “scaffolds” sin reescribir agentes, y añaden rewards que penalizan llamadas malformadas a herramientas o premian terminar rápido y bien. También hablan de trucos de eficiencia como prefix trees para reutilizar prefijos compartidos y acelerar entrenamiento de forma drástica. Y en la misma línea de RL con recompensas verificables, salió “Composition‑RL”: en vez de depender solo de prompts difíciles, compone varios prompts fáciles —de pass rate 1— para crear nuevos problemas todavía verificables, manteniendo señal de aprendizaje cuando el modelo ya “se sabe” lo básico.
Story 16
Si tu organización entrena o evalúa modelos, otro tema de hoy es menos glamoroso pero decisivo: calidad de datos. Welo Data insiste en que muchos proyectos fallan no por el modelo, sino porque el juicio humano detrás de la evaluación no está calibrado ni es auditable. Su propuesta es diseñar el “sistema de calidad” antes de escalar: marcos de decisión, ejemplos de referencia, rutas de escalado de ambigüedad, monitoreo de drift, loops de QA y trazabilidad. También advierten contra usar LLMs como jueces sin supervisión gobernada: puedes automatizar inconsistencia y sesgo a gran escala. Es un recordatorio útil: si no puedes explicar por qué una etiqueta es correcta, no puedes defender tu producto cuando algo sale mal.
Story 17
Y cerramos con la parte social, que está cada vez más presente. Jeff Geerling advierte que la IA “agentic” y el contenido basura están dañando el open source: desde historias retractadas por citas alucinadas, hasta el caso de curl pausando su bug bounty porque los reportes útiles bajaron fuerte mientras subían envíos generados por IA, con más discusión y menos fixes. Incluso GitHub ya ofrece la opción de desactivar pull requests, algo impensable hace años. Cuando el cuello de botella pasa a ser el tiempo del revisor, la “productividad” se convierte en deuda.
Story 18
En esa misma vibra, hay textos que ponen el dedo en la llaga: herramientas de “roast” personal a partir de tu GitHub que se sienten sorprendentemente crueles, y el miedo de que esto amplifique el bullying, especialmente en menores, con deepfakes y acoso hiper‑personalizado. Y otro autor describe una ansiedad laboral nueva: no “si trabajaré”, sino “si podré volver a ser contratado” en profesiones que la IA puede automatizar parcialmente. No es una predicción apocalíptica; es el registro de que, para mucha gente, el día a día con IA ya se siente peor: estafas más creíbles, aprendizaje erosionado por trampas, y feeds inundados de slop.
Story 19
Como contrapunto tecnológico, NVIDIA publicó PersonaPlex‑7B‑v1, un modelo de voz a voz en tiempo real, full‑duplex, capaz de escuchar y hablar a la vez, con interrupciones y solapamientos naturales. Se condiciona con un prompt de voz para estilo y un prompt de texto para la persona. Está basado en arquitectura tipo Moshi y optimizado para GPUs NVIDIA. Es una señal clara de hacia dónde se mueven los asistentes: menos “habla y espera” y más conversación fluida. El reto, de nuevo, será llevar esa naturalidad a productos que también sean seguros, controlables y transparentes.
Suscríbete a fuentes específicas por edición:
- Space news
* Apple Podcast English
* Spotify English
* RSS English Spanish French
- Top news
* Apple Podcast English Spanish French
* Spotify English Spanish French
* RSS English Spanish French
- Tech news
* Apple Podcast English Spanish French
* Spotify English Spanish Spanish
* RSS English Spanish French
- Hacker news
* Apple Podcast English Spanish French
* Spotify English Spanish French
* RSS English Spanish French
- AI news
* Apple Podcast English Spanish French
* Spotify English Spanish French
* RSS English Spanish French
Visit our website at https://theautomateddaily.com/
Send feedback to [email protected]
Youtube
X (Twitter)