Деконструкция AI-структуры: от интеллектуальных агентов до Децентрализация исследований
Введение
Скорость развития сектора AI Agent впечатляет. С тех пор как "терминал правды" вызвал бум Agent, нарратив о сочетании ИИ и криптовалюты едва ли не каждую неделю претерпевает изменения. В последнее время внимание рынка сместилось на "фреймворковые" проекты, которые доминируют в техническом нарративе. Этот сегмент за считанные недели произвел несколько черных лошадок с капитализацией более миллиарда и даже более десяти миллиардов.
Эти проекты породили новую модель выпуска активов — создание токенов на основе кода из репозиториев GitHub, а также агенты, разработанные на этих фреймах, могут снова выпускать токены. Эта модель "фрейм как основа, агент сверху", хотя на первый взгляд похожа на платформу для выпуска активов, на самом деле является инфраструктурной моделью, уникальной для эпохи ИИ. В этой статье мы начнем с обзора фреймов и обсудим глубокое влияние AI фреймов на сферу криптовалют.
Один. Что такое рамка?
AI-фреймворк представляет собой набор интегрированных модулей, библиотек и инструментов, который упрощает процесс создания сложных AI-моделей. Его можно рассматривать как операционную систему эпохи AI, подобно настольным Windows, Linux или мобильным iOS и Android. Каждый фреймворк имеет свои особенности, и разработчики могут свободно выбирать в зависимости от потребностей.
Хотя "AI-рамки" являются новым понятием в области криптовалют, их история развития насчитывает почти 14 лет. В традиционной области искусственного интеллекта уже существует множество зрелых рамок на выбор, таких как TensorFlow от Google, PyTorch от Meta и др.
Фреймворки, появляющиеся в области криптовалют, в основном разработаны для удовлетворения большого спроса на агентов, вызванного ажиотажем вокруг ИИ, и постепенно расширяются на другие сегменты, формируя различные специализированные фреймворки ИИ. Вот несколько популярных фреймворков:
1.1 Элиза
Eliza — это многоагентная симуляционная платформа, специально предназначенная для создания, развертывания и управления автономными AI-агентами. Разработанная на TypeScript, она обладает хорошей совместимостью и возможностями интеграции API.
Eliza в основном ориентирована на сценарии социальных медиа и поддерживает интеграцию с несколькими платформами, включая Discord, X/Twitter, Telegram и другие. В области обработки медиа-контента поддерживаются такие функции, как анализ PDF-документов, извлечение содержимого из ссылок, транскрипция аудио, обработка видео, анализ изображений и другие.
Eliza в настоящее время поддерживает четыре основных варианта использования:
Приложения класса AI-ассистентов
Роль социальных медиа
Работники знаний
Интерактивные роли
В области поддержки моделей Eliza может использовать открытые модели для локального вывода, а также поддерживает использование облачных сервисов вывода через API.
1.2 G.A.M.E
G.A.M.E (Генеративная Автономная Мультимодальная Сущность Фреймворк) – это автоматизированный многофункциональный AI фреймворк, разработанный компанией Virtual, ориентированный на проектирование интеллектуальных NPC в играх. Особенностью данного фреймворка является то, что даже пользователи без программирования могут его использовать, просто изменяя параметры для участия в проектировании Агентов.
Основной дизайн G.A.M.E основан на модульной архитектуре с несколькими подсистемами, работающими совместно, включая интерфейс подсказок Agent, подсистему восприятия, движок стратегического планирования, контекст мира, модуль обработки диалогов и другие компоненты.
Рабочий процесс этой структуры заключается в следующем: разработчик запускает Агент через интерфейс подсказок, подсистема восприятия принимает вводимые данные и передает их в движок стратегического планирования. Движок стратегического планирования разрабатывает и реализует план действий, используя различные системы и информацию. Учебный модуль постоянно контролирует результаты действий Агента и соответственно корректирует его поведение.
Кроме игровой сферы, фреймворк G.A.M.E также применим в сценариях метавселенной, уже несколько проектов используют этот фреймворк для разработки.
1.3 Риг
Rig — это инструмент с открытым исходным кодом, написанный на языке Rust, предназначенный для упрощения разработки приложений на основе крупных языковых моделей (LLM). Он предоставляет единый интерфейс, позволяющий разработчикам легко взаимодействовать с несколькими поставщиками LLM и векторными базами данных.
Основные характеристики Rig включают:
Единый интерфейс
Модульная архитектура
Типобезопасность
Высокая эффективность
Рабочий процесс Rig заключается в следующем: запрос пользователя сначала проходит через "абстрактный уровень поставщика", затем в ядре интеллектуальный агент вызывает различные инструменты или запрашивает векторное хранилище для получения информации. Наконец, с помощью механизмов, таких как извлечение с усилением генерации (RAG), система генерирует точный и значимый ответ, который возвращается пользователю.
Rig подходит для создания систем ответа на вопросы, инструментов поиска документов, чат-ботов или виртуальных помощников с контекстной осведомленностью, а также поддерживает создание контента.
1.4 ZerePy
ZerePy — это основанный на Python открытый фреймворк, предназначенный для упрощения процесса развертывания и управления AI Agent на платформе X (бывший Twitter). Он унаследовал основные функции проекта Zerebro, но использует более модульный и удобный для расширения дизайн.
ZerePy предоставляет командный интерфейс (CLI), который упрощает пользователям управление и контроль за развернутым AI Agent. Его основная архитектура основана на модульном дизайне, включая:
Интеграция LLM
Интеграция на платформе X
Модульная система соединений
Система памяти (в планах)
В отличие от проекта Eliza от a16z, ZerePy больше сосредоточен на упрощении процесса развертывания AI Agent на определенной социальной платформе (X), ориентируясь на практическое применение.
Два, копия экосистемы BTC
Путь развития AI Agent имеет много схожего с недавней экосистемой BTC. Развитие экосистемы BTC можно обобщить как: BRC20 - конкуренция между множеством протоколов - BTC L2 - BTCFi с центром на Babylon. AI Agent развивается быстрее на основе зрелого традиционного стека технологий ИИ, его путь можно обобщить как: GOAT/ACT - конкуренция между Social-агентами/аналитическими AI Agent.
Несмотря на схожесть, сектор AI-агентов вряд ли пойдет по пути однородности и раздувания пузырей, как экосистема BTC. Проекты AI-рамок предлагают новые идеи для развития инфраструктуры, больше похожие на будущие публичные блокчейны, в то время как агенты напоминают будущие Dapp.
В текущей экосистеме криптовалют у нас есть тысячи публичных блокчейнов и десятки тысяч Dapp. Универсальные цепочки включают BTC, Ethereum и различные гетерогенные цепочки, в то время как прикладные цепочки более разнообразны. Будущие споры могут перейти от противостояния EVM и гетерогенных цепочек к борьбе за фреймворки, ключевой вопрос заключается в том, как реализовать Децентрализацию или "цепочечность", а также в значении разработки этих проектов на блокчейне.
Три, каково значение блокчейна?
При объединении блокчейна с чем-либо необходимо столкнуться с ключевым вопросом: имеет ли это объединение смысл? Оглядываясь на успешный опыт DeFi, его преимущества заключаются в обеспечении более высокой доступности, лучшей эффективности и более низких затратах, а также в безопасности без необходимости доверять централизованным системам. Исходя из этой идеи, можно выделить несколько причин для цепочечной реализации AI Agent:
Снизить затраты на использование, повысить доступность и выбор, чтобы обычные пользователи тоже могли участвовать в "аренде прав" на ИИ.
Предоставление безопасных решений на основе блокчейна, удовлетворяющих требованиям безопасности при взаимодействии Агентов с реальным или виртуальным миром.
Создание уникальной модели финансов на основе блокчейн, такой как вовлечение обычных пользователей в автоматическое создание рынка или инвестиции в ресурсы, необходимые Агенту, такие как вычислительная мощность и разметка данных.
Реализация прозрачного и отслеживаемого процесса вывода может быть более привлекательной, чем агентский браузер, предлагаемый традиционными интернет-гигантами.
Четыре. Новые возможности креативной экономики
Проекты на основе фреймворков в будущем могут предоставить предпринимательские возможности, подобные GPT Store. Хотя в настоящее время публикация агентов через фреймворк все еще сложна для обычных пользователей, упрощение процесса создания агентов и предоставление сложных комбинаций функций фреймворка, скорее всего, займет преимущество в будущем. Это создаст более интересную экономику креативов Web3, чем GPT Store.
В отличие от текущего GPT Store, который в основном контролируется традиционными компаниями Web2, AI креативная экономика в области Web3 может быть более справедливой и привлечь сообщество для улучшения агентов. Это предоставит обычным людям возможность участвовать, а будущие AI Meme проекты могут быть более умными и интересными, чем существующие агенты.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Деконструкция AI-фрейма: от интеллектуальных агентов к будущему плану децентрализации
Деконструкция AI-структуры: от интеллектуальных агентов до Децентрализация исследований
Введение
Скорость развития сектора AI Agent впечатляет. С тех пор как "терминал правды" вызвал бум Agent, нарратив о сочетании ИИ и криптовалюты едва ли не каждую неделю претерпевает изменения. В последнее время внимание рынка сместилось на "фреймворковые" проекты, которые доминируют в техническом нарративе. Этот сегмент за считанные недели произвел несколько черных лошадок с капитализацией более миллиарда и даже более десяти миллиардов.
Эти проекты породили новую модель выпуска активов — создание токенов на основе кода из репозиториев GitHub, а также агенты, разработанные на этих фреймах, могут снова выпускать токены. Эта модель "фрейм как основа, агент сверху", хотя на первый взгляд похожа на платформу для выпуска активов, на самом деле является инфраструктурной моделью, уникальной для эпохи ИИ. В этой статье мы начнем с обзора фреймов и обсудим глубокое влияние AI фреймов на сферу криптовалют.
Один. Что такое рамка?
AI-фреймворк представляет собой набор интегрированных модулей, библиотек и инструментов, который упрощает процесс создания сложных AI-моделей. Его можно рассматривать как операционную систему эпохи AI, подобно настольным Windows, Linux или мобильным iOS и Android. Каждый фреймворк имеет свои особенности, и разработчики могут свободно выбирать в зависимости от потребностей.
Хотя "AI-рамки" являются новым понятием в области криптовалют, их история развития насчитывает почти 14 лет. В традиционной области искусственного интеллекта уже существует множество зрелых рамок на выбор, таких как TensorFlow от Google, PyTorch от Meta и др.
Фреймворки, появляющиеся в области криптовалют, в основном разработаны для удовлетворения большого спроса на агентов, вызванного ажиотажем вокруг ИИ, и постепенно расширяются на другие сегменты, формируя различные специализированные фреймворки ИИ. Вот несколько популярных фреймворков:
1.1 Элиза
Eliza — это многоагентная симуляционная платформа, специально предназначенная для создания, развертывания и управления автономными AI-агентами. Разработанная на TypeScript, она обладает хорошей совместимостью и возможностями интеграции API.
Eliza в основном ориентирована на сценарии социальных медиа и поддерживает интеграцию с несколькими платформами, включая Discord, X/Twitter, Telegram и другие. В области обработки медиа-контента поддерживаются такие функции, как анализ PDF-документов, извлечение содержимого из ссылок, транскрипция аудио, обработка видео, анализ изображений и другие.
Eliza в настоящее время поддерживает четыре основных варианта использования:
В области поддержки моделей Eliza может использовать открытые модели для локального вывода, а также поддерживает использование облачных сервисов вывода через API.
1.2 G.A.M.E
G.A.M.E (Генеративная Автономная Мультимодальная Сущность Фреймворк) – это автоматизированный многофункциональный AI фреймворк, разработанный компанией Virtual, ориентированный на проектирование интеллектуальных NPC в играх. Особенностью данного фреймворка является то, что даже пользователи без программирования могут его использовать, просто изменяя параметры для участия в проектировании Агентов.
Основной дизайн G.A.M.E основан на модульной архитектуре с несколькими подсистемами, работающими совместно, включая интерфейс подсказок Agent, подсистему восприятия, движок стратегического планирования, контекст мира, модуль обработки диалогов и другие компоненты.
Рабочий процесс этой структуры заключается в следующем: разработчик запускает Агент через интерфейс подсказок, подсистема восприятия принимает вводимые данные и передает их в движок стратегического планирования. Движок стратегического планирования разрабатывает и реализует план действий, используя различные системы и информацию. Учебный модуль постоянно контролирует результаты действий Агента и соответственно корректирует его поведение.
Кроме игровой сферы, фреймворк G.A.M.E также применим в сценариях метавселенной, уже несколько проектов используют этот фреймворк для разработки.
1.3 Риг
Rig — это инструмент с открытым исходным кодом, написанный на языке Rust, предназначенный для упрощения разработки приложений на основе крупных языковых моделей (LLM). Он предоставляет единый интерфейс, позволяющий разработчикам легко взаимодействовать с несколькими поставщиками LLM и векторными базами данных.
Основные характеристики Rig включают:
Рабочий процесс Rig заключается в следующем: запрос пользователя сначала проходит через "абстрактный уровень поставщика", затем в ядре интеллектуальный агент вызывает различные инструменты или запрашивает векторное хранилище для получения информации. Наконец, с помощью механизмов, таких как извлечение с усилением генерации (RAG), система генерирует точный и значимый ответ, который возвращается пользователю.
Rig подходит для создания систем ответа на вопросы, инструментов поиска документов, чат-ботов или виртуальных помощников с контекстной осведомленностью, а также поддерживает создание контента.
1.4 ZerePy
ZerePy — это основанный на Python открытый фреймворк, предназначенный для упрощения процесса развертывания и управления AI Agent на платформе X (бывший Twitter). Он унаследовал основные функции проекта Zerebro, но использует более модульный и удобный для расширения дизайн.
ZerePy предоставляет командный интерфейс (CLI), который упрощает пользователям управление и контроль за развернутым AI Agent. Его основная архитектура основана на модульном дизайне, включая:
В отличие от проекта Eliza от a16z, ZerePy больше сосредоточен на упрощении процесса развертывания AI Agent на определенной социальной платформе (X), ориентируясь на практическое применение.
Два, копия экосистемы BTC
Путь развития AI Agent имеет много схожего с недавней экосистемой BTC. Развитие экосистемы BTC можно обобщить как: BRC20 - конкуренция между множеством протоколов - BTC L2 - BTCFi с центром на Babylon. AI Agent развивается быстрее на основе зрелого традиционного стека технологий ИИ, его путь можно обобщить как: GOAT/ACT - конкуренция между Social-агентами/аналитическими AI Agent.
Несмотря на схожесть, сектор AI-агентов вряд ли пойдет по пути однородности и раздувания пузырей, как экосистема BTC. Проекты AI-рамок предлагают новые идеи для развития инфраструктуры, больше похожие на будущие публичные блокчейны, в то время как агенты напоминают будущие Dapp.
В текущей экосистеме криптовалют у нас есть тысячи публичных блокчейнов и десятки тысяч Dapp. Универсальные цепочки включают BTC, Ethereum и различные гетерогенные цепочки, в то время как прикладные цепочки более разнообразны. Будущие споры могут перейти от противостояния EVM и гетерогенных цепочек к борьбе за фреймворки, ключевой вопрос заключается в том, как реализовать Децентрализацию или "цепочечность", а также в значении разработки этих проектов на блокчейне.
Три, каково значение блокчейна?
При объединении блокчейна с чем-либо необходимо столкнуться с ключевым вопросом: имеет ли это объединение смысл? Оглядываясь на успешный опыт DeFi, его преимущества заключаются в обеспечении более высокой доступности, лучшей эффективности и более низких затратах, а также в безопасности без необходимости доверять централизованным системам. Исходя из этой идеи, можно выделить несколько причин для цепочечной реализации AI Agent:
Снизить затраты на использование, повысить доступность и выбор, чтобы обычные пользователи тоже могли участвовать в "аренде прав" на ИИ.
Предоставление безопасных решений на основе блокчейна, удовлетворяющих требованиям безопасности при взаимодействии Агентов с реальным или виртуальным миром.
Создание уникальной модели финансов на основе блокчейн, такой как вовлечение обычных пользователей в автоматическое создание рынка или инвестиции в ресурсы, необходимые Агенту, такие как вычислительная мощность и разметка данных.
Реализация прозрачного и отслеживаемого процесса вывода может быть более привлекательной, чем агентский браузер, предлагаемый традиционными интернет-гигантами.
Четыре. Новые возможности креативной экономики
Проекты на основе фреймворков в будущем могут предоставить предпринимательские возможности, подобные GPT Store. Хотя в настоящее время публикация агентов через фреймворк все еще сложна для обычных пользователей, упрощение процесса создания агентов и предоставление сложных комбинаций функций фреймворка, скорее всего, займет преимущество в будущем. Это создаст более интересную экономику креативов Web3, чем GPT Store.
В отличие от текущего GPT Store, который в основном контролируется традиционными компаниями Web2, AI креативная экономика в области Web3 может быть более справедливой и привлечь сообщество для улучшения агентов. Это предоставит обычным людям возможность участвовать, а будущие AI Meme проекты могут быть более умными и интересными, чем существующие агенты.