Deconstrucción del marco de IA: de agentes inteligentes a la exploración de la Descentralización
Introducción
El desarrollo de la pista de los agentes de IA es asombroso. Desde que el "terminal de la verdad" desató la fiebre de los agentes, la narrativa de la combinación de IA y criptomonedas ha tenido cambios casi semanales. Recientemente, la atención del mercado se ha dirigido hacia proyectos "de marco" dominados por la narrativa técnica. Este segmento ha visto surgir varios proyectos sorpresas con capitalización de mercado de más de cien millones e incluso más de mil millones en solo unas pocas semanas.
Este tipo de proyectos ha dado lugar a un nuevo modelo de emisión de activos: emitir monedas a partir de repositorios de código de GitHub, y los Agentes desarrollados en base a marcos también pueden emitir tokens nuevamente. Este modelo de "marco en la base, Agente en la cima", aunque superficialmente similar a las plataformas de emisión de activos, en realidad es un modelo de infraestructura exclusivo de la era de la IA. Este artículo comenzará con una visión general del marco y explorará el profundo impacto del marco de IA en el campo de las criptomonedas.
I. ¿Qué es un marco?
El marco de IA es un conjunto de herramientas o plataformas de desarrollo de bajo nivel que integran módulos, bibliotecas y herramientas preconstruidos, simplificando el proceso de construcción de modelos de IA complejos. Se puede entender como el sistema operativo de la era de la IA, como Windows o Linux en el escritorio, o iOS y Android en dispositivos móviles. Cada marco tiene sus características, y los desarrolladores pueden elegir libremente según sus necesidades.
Aunque el "marco de IA" es un concepto emergente en el campo de las criptomonedas, su trayectoria de desarrollo ha sido de casi 14 años. En el campo tradicional de la IA, hay varios marcos maduros disponibles, como TensorFlow de Google, PyTorch de Meta, entre otros.
Los proyectos de marco que han surgido en el ámbito de las criptomonedas están diseñados principalmente para satisfacer la gran demanda de agentes generada por la ola de IA, y se están expandiendo gradualmente hacia otras áreas, formando marcos de IA en diferentes sectores. A continuación, se presentan algunas introducciones a los marcos más populares:
1.1 Eliza
Eliza es un marco de simulación multiagente, diseñado para crear, desplegar y gestionar agentes de IA autónomos. Desarrollado en TypeScript, tiene una buena compatibilidad y capacidad de integración de API.
Eliza se centra principalmente en escenarios de redes sociales y admite la integración en múltiples plataformas, incluyendo Discord, X/Twitter, Telegram, entre otras. En cuanto al procesamiento de contenido multimedia, soporta análisis de documentos PDF, extracción de contenido de enlaces, transcripción de audio, procesamiento de video, análisis de imágenes, entre otras funciones.
Eliza actualmente admite cuatro principales casos de uso:
Aplicaciones de tipo asistente de IA
Rol de las redes sociales
Trabajadores del conocimiento
Roles interactivos
En cuanto al soporte de modelos, Eliza puede utilizar modelos de código abierto para la inferencia local y también admite el uso de servicios de inferencia en la nube a través de API.
1.2 G.A.M.E
G.A.M.E (Generative Autonomous Multimodal Entities Framework) es un marco de IA multimodal generativa y de gestión lanzado por Virtual, dirigido principalmente al diseño de NPC inteligentes en juegos. La característica de este marco es que los usuarios sin conocimientos de programación también pueden utilizarlo, solo necesitan modificar parámetros para participar en el diseño de Agentes.
El diseño central de G.A.M.E adopta una arquitectura modular en la que múltiples subsistemas trabajan de manera colaborativa, incluyendo la interfaz de sugerencias de Agent, el subsistema de percepción, el motor de planificación estratégica, el contexto mundial, el módulo de procesamiento de diálogos y otros componentes.
El flujo de trabajo de este marco es el siguiente: el desarrollador inicia el Agente a través de la interfaz de indicaciones del Agente, el subsistema de percepción recibe la entrada y la transmite al motor de planificación estratégica. El motor de planificación estratégica utiliza varios sistemas e información para formular y ejecutar un plan de acción. El módulo de aprendizaje monitorea continuamente los resultados de las acciones del Agente y ajusta el comportamiento en consecuencia.
Además del campo de los juegos, el marco G.A.M.E también es aplicable a los escenarios del metaverso, y varios proyectos ya han adoptado este marco para su desarrollo.
1.3 Rig
Rig es una herramienta de código abierto escrita en el lenguaje Rust, diseñada para simplificar el desarrollo de aplicaciones de modelos de lenguaje de gran tamaño (LLM). Proporciona una interfaz de operación unificada que permite a los desarrolladores interactuar fácilmente con múltiples proveedores de servicios LLM y bases de datos vectoriales.
Las características principales de Rig incluyen:
Interfaz unificada
Arquitectura modular
Seguridad de tipo
Alto rendimiento
El flujo de trabajo de Rig es el siguiente: la solicitud del usuario primero pasa por la "capa de abstracción del proveedor", luego en la capa central, el agente inteligente invoca varias herramientas o consulta el almacenamiento de vectores para obtener información. Finalmente, a través de mecanismos como la generación aumentada por recuperación (RAG), el sistema genera respuestas precisas y significativas que se devuelven al usuario.
Rig es adecuado para construir sistemas de respuesta a preguntas, herramientas de búsqueda de documentos, chatbots o asistentes virtuales con capacidad de percepción contextual e incluso apoya la creación de contenido.
1.4 ZerePy
ZerePy es un marco de código abierto basado en Python, diseñado para simplificar el proceso de despliegue y gestión de Agentes de IA en la plataforma X (anteriormente Twitter). Hereda las funciones centrales del proyecto Zerebro, pero adopta un diseño más modular y fácil de expandir.
ZerePy proporciona una interfaz de línea de comandos (CLI) que facilita a los usuarios gestionar y controlar los Agentes de IA desplegados. Su arquitectura central se basa en un diseño modular que incluye:
Integración de LLM
Integración de la plataforma X
Sistema de conexión modular
Sistema de memoria (en planificación)
En comparación con el proyecto Eliza de a16z, ZerePy se centra más en simplificar el proceso de implementación de un Agente de IA en plataformas sociales específicas (X), inclinándose hacia aplicaciones prácticas.
Dos, la réplica del ecosistema BTC
El camino de desarrollo de los Agentes de IA tiene muchas similitudes con el ecosistema reciente de BTC. El desarrollo del ecosistema de BTC se puede resumir en: BRC20 - competencia entre múltiples protocolos - BTC L2 - BTCFi centrado en Babylon. Por otro lado, los Agentes de IA se desarrollan más rápido sobre la base de un stack tecnológico de IA tradicional maduro, y su camino se puede resumir en: competencia entre el marco de Agentes de tipo GOAT/ACT y Agentes de IA analíticos/sociales.
A pesar de las similitudes, es poco probable que la pista de AI Agent se dirija hacia la homogeneización y la burbuja como lo hace el ecosistema BTC. Los proyectos de marco de AI ofrecen nuevas ideas para el desarrollo de infraestructura, más como una futura cadena pública, mientras que Agent se asemeja más a futuros Dapp.
En el actual ecosistema de criptomonedas, tenemos miles de cadenas públicas y decenas de miles de Dapps. Las cadenas generales incluyen BTC, Ethereum y varias cadenas heterogéneas, mientras que las cadenas de aplicaciones son aún más diversas. El debate futuro puede pasar de la disputa entre EVM y cadenas heterogéneas a una disputa de marcos, y la cuestión clave radica en cómo lograr la Descentralización o "cadena" y cuál es el significado de desarrollar estos proyectos en la blockchain.
Tres, ¿cuál es el significado de estar en la cadena?
Cuando la blockchain se combina con cualquier cosa, debe enfrentar una pregunta central: ¿tiene sentido esta combinación? Al revisar la experiencia exitosa de DeFi, sus ventajas radican en ofrecer una mayor accesibilidad, mejor eficiencia y menores costos, así como la seguridad sin necesidad de un centro de confianza. Basado en este pensamiento, la cadena de AI Agent puede tener las siguientes razones:
Reducir los costos de uso, aumentar la accesibilidad y la selectividad, para que los usuarios comunes también puedan participar en el "derecho a alquilar" de la IA.
Proporcionar soluciones de seguridad basadas en blockchain que satisfagan las necesidades de seguridad durante la interacción entre el Agente y el mundo real o virtual.
Crear un modelo financiero de blockchain único, como permitir que los usuarios comunes participen en la provisión automática de liquidez o en los recursos necesarios para la inversión, como la potencia de cálculo y el etiquetado de datos.
Implementar un proceso de razonamiento transparente y trazable puede ser más atractivo que el navegador de agente proporcionado por los gigantes de Internet tradicionales.
Cuatro, nuevas oportunidades en la economía creativa
Los proyectos de tipo marco podrían ofrecer oportunidades de emprendimiento similares a GPT Store en el futuro. Aunque actualmente publicar agentes a través de un marco sigue siendo complejo para los usuarios comunes, simplificar el proceso de construcción de agentes y ofrecer combinaciones de funciones complejas probablemente ocupará una ventaja en el futuro. Esto dará lugar a una economía creativa de Web3 más interesante que GPT Store.
A diferencia de la actual tienda GPT, que está dominada principalmente por empresas tradicionales de Web2, la economía creativa de la IA en el ámbito de Web3 podría ser más equitativa e introducir una economía comunitaria para perfeccionar a los agentes. Esto brindará oportunidades de participación a las personas comunes, y los futuros proyectos de memes de IA podrían ser más inteligentes y divertidos que los agentes existentes.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Descomposición del marco de IA: del agente inteligente al futuro plano de Descentralización
Deconstrucción del marco de IA: de agentes inteligentes a la exploración de la Descentralización
Introducción
El desarrollo de la pista de los agentes de IA es asombroso. Desde que el "terminal de la verdad" desató la fiebre de los agentes, la narrativa de la combinación de IA y criptomonedas ha tenido cambios casi semanales. Recientemente, la atención del mercado se ha dirigido hacia proyectos "de marco" dominados por la narrativa técnica. Este segmento ha visto surgir varios proyectos sorpresas con capitalización de mercado de más de cien millones e incluso más de mil millones en solo unas pocas semanas.
Este tipo de proyectos ha dado lugar a un nuevo modelo de emisión de activos: emitir monedas a partir de repositorios de código de GitHub, y los Agentes desarrollados en base a marcos también pueden emitir tokens nuevamente. Este modelo de "marco en la base, Agente en la cima", aunque superficialmente similar a las plataformas de emisión de activos, en realidad es un modelo de infraestructura exclusivo de la era de la IA. Este artículo comenzará con una visión general del marco y explorará el profundo impacto del marco de IA en el campo de las criptomonedas.
I. ¿Qué es un marco?
El marco de IA es un conjunto de herramientas o plataformas de desarrollo de bajo nivel que integran módulos, bibliotecas y herramientas preconstruidos, simplificando el proceso de construcción de modelos de IA complejos. Se puede entender como el sistema operativo de la era de la IA, como Windows o Linux en el escritorio, o iOS y Android en dispositivos móviles. Cada marco tiene sus características, y los desarrolladores pueden elegir libremente según sus necesidades.
Aunque el "marco de IA" es un concepto emergente en el campo de las criptomonedas, su trayectoria de desarrollo ha sido de casi 14 años. En el campo tradicional de la IA, hay varios marcos maduros disponibles, como TensorFlow de Google, PyTorch de Meta, entre otros.
Los proyectos de marco que han surgido en el ámbito de las criptomonedas están diseñados principalmente para satisfacer la gran demanda de agentes generada por la ola de IA, y se están expandiendo gradualmente hacia otras áreas, formando marcos de IA en diferentes sectores. A continuación, se presentan algunas introducciones a los marcos más populares:
1.1 Eliza
Eliza es un marco de simulación multiagente, diseñado para crear, desplegar y gestionar agentes de IA autónomos. Desarrollado en TypeScript, tiene una buena compatibilidad y capacidad de integración de API.
Eliza se centra principalmente en escenarios de redes sociales y admite la integración en múltiples plataformas, incluyendo Discord, X/Twitter, Telegram, entre otras. En cuanto al procesamiento de contenido multimedia, soporta análisis de documentos PDF, extracción de contenido de enlaces, transcripción de audio, procesamiento de video, análisis de imágenes, entre otras funciones.
Eliza actualmente admite cuatro principales casos de uso:
En cuanto al soporte de modelos, Eliza puede utilizar modelos de código abierto para la inferencia local y también admite el uso de servicios de inferencia en la nube a través de API.
1.2 G.A.M.E
G.A.M.E (Generative Autonomous Multimodal Entities Framework) es un marco de IA multimodal generativa y de gestión lanzado por Virtual, dirigido principalmente al diseño de NPC inteligentes en juegos. La característica de este marco es que los usuarios sin conocimientos de programación también pueden utilizarlo, solo necesitan modificar parámetros para participar en el diseño de Agentes.
El diseño central de G.A.M.E adopta una arquitectura modular en la que múltiples subsistemas trabajan de manera colaborativa, incluyendo la interfaz de sugerencias de Agent, el subsistema de percepción, el motor de planificación estratégica, el contexto mundial, el módulo de procesamiento de diálogos y otros componentes.
El flujo de trabajo de este marco es el siguiente: el desarrollador inicia el Agente a través de la interfaz de indicaciones del Agente, el subsistema de percepción recibe la entrada y la transmite al motor de planificación estratégica. El motor de planificación estratégica utiliza varios sistemas e información para formular y ejecutar un plan de acción. El módulo de aprendizaje monitorea continuamente los resultados de las acciones del Agente y ajusta el comportamiento en consecuencia.
Además del campo de los juegos, el marco G.A.M.E también es aplicable a los escenarios del metaverso, y varios proyectos ya han adoptado este marco para su desarrollo.
1.3 Rig
Rig es una herramienta de código abierto escrita en el lenguaje Rust, diseñada para simplificar el desarrollo de aplicaciones de modelos de lenguaje de gran tamaño (LLM). Proporciona una interfaz de operación unificada que permite a los desarrolladores interactuar fácilmente con múltiples proveedores de servicios LLM y bases de datos vectoriales.
Las características principales de Rig incluyen:
El flujo de trabajo de Rig es el siguiente: la solicitud del usuario primero pasa por la "capa de abstracción del proveedor", luego en la capa central, el agente inteligente invoca varias herramientas o consulta el almacenamiento de vectores para obtener información. Finalmente, a través de mecanismos como la generación aumentada por recuperación (RAG), el sistema genera respuestas precisas y significativas que se devuelven al usuario.
Rig es adecuado para construir sistemas de respuesta a preguntas, herramientas de búsqueda de documentos, chatbots o asistentes virtuales con capacidad de percepción contextual e incluso apoya la creación de contenido.
1.4 ZerePy
ZerePy es un marco de código abierto basado en Python, diseñado para simplificar el proceso de despliegue y gestión de Agentes de IA en la plataforma X (anteriormente Twitter). Hereda las funciones centrales del proyecto Zerebro, pero adopta un diseño más modular y fácil de expandir.
ZerePy proporciona una interfaz de línea de comandos (CLI) que facilita a los usuarios gestionar y controlar los Agentes de IA desplegados. Su arquitectura central se basa en un diseño modular que incluye:
En comparación con el proyecto Eliza de a16z, ZerePy se centra más en simplificar el proceso de implementación de un Agente de IA en plataformas sociales específicas (X), inclinándose hacia aplicaciones prácticas.
Dos, la réplica del ecosistema BTC
El camino de desarrollo de los Agentes de IA tiene muchas similitudes con el ecosistema reciente de BTC. El desarrollo del ecosistema de BTC se puede resumir en: BRC20 - competencia entre múltiples protocolos - BTC L2 - BTCFi centrado en Babylon. Por otro lado, los Agentes de IA se desarrollan más rápido sobre la base de un stack tecnológico de IA tradicional maduro, y su camino se puede resumir en: competencia entre el marco de Agentes de tipo GOAT/ACT y Agentes de IA analíticos/sociales.
A pesar de las similitudes, es poco probable que la pista de AI Agent se dirija hacia la homogeneización y la burbuja como lo hace el ecosistema BTC. Los proyectos de marco de AI ofrecen nuevas ideas para el desarrollo de infraestructura, más como una futura cadena pública, mientras que Agent se asemeja más a futuros Dapp.
En el actual ecosistema de criptomonedas, tenemos miles de cadenas públicas y decenas de miles de Dapps. Las cadenas generales incluyen BTC, Ethereum y varias cadenas heterogéneas, mientras que las cadenas de aplicaciones son aún más diversas. El debate futuro puede pasar de la disputa entre EVM y cadenas heterogéneas a una disputa de marcos, y la cuestión clave radica en cómo lograr la Descentralización o "cadena" y cuál es el significado de desarrollar estos proyectos en la blockchain.
Tres, ¿cuál es el significado de estar en la cadena?
Cuando la blockchain se combina con cualquier cosa, debe enfrentar una pregunta central: ¿tiene sentido esta combinación? Al revisar la experiencia exitosa de DeFi, sus ventajas radican en ofrecer una mayor accesibilidad, mejor eficiencia y menores costos, así como la seguridad sin necesidad de un centro de confianza. Basado en este pensamiento, la cadena de AI Agent puede tener las siguientes razones:
Reducir los costos de uso, aumentar la accesibilidad y la selectividad, para que los usuarios comunes también puedan participar en el "derecho a alquilar" de la IA.
Proporcionar soluciones de seguridad basadas en blockchain que satisfagan las necesidades de seguridad durante la interacción entre el Agente y el mundo real o virtual.
Crear un modelo financiero de blockchain único, como permitir que los usuarios comunes participen en la provisión automática de liquidez o en los recursos necesarios para la inversión, como la potencia de cálculo y el etiquetado de datos.
Implementar un proceso de razonamiento transparente y trazable puede ser más atractivo que el navegador de agente proporcionado por los gigantes de Internet tradicionales.
Cuatro, nuevas oportunidades en la economía creativa
Los proyectos de tipo marco podrían ofrecer oportunidades de emprendimiento similares a GPT Store en el futuro. Aunque actualmente publicar agentes a través de un marco sigue siendo complejo para los usuarios comunes, simplificar el proceso de construcción de agentes y ofrecer combinaciones de funciones complejas probablemente ocupará una ventaja en el futuro. Esto dará lugar a una economía creativa de Web3 más interesante que GPT Store.
A diferencia de la actual tienda GPT, que está dominada principalmente por empresas tradicionales de Web2, la economía creativa de la IA en el ámbito de Web3 podría ser más equitativa e introducir una economía comunitaria para perfeccionar a los agentes. Esto brindará oportunidades de participación a las personas comunes, y los futuros proyectos de memes de IA podrían ser más inteligentes y divertidos que los agentes existentes.