Como o Web3 pode desempenhar um papel em cada etapa da cadeia industrial de IA

AI+Web3: Torres e Praças

TL;DR

  1. Projetos Web3 com conceito de IA tornaram-se alvos de atração de capital nos mercados primário e secundário.

  2. As oportunidades do Web3 na indústria de IA manifestam-se principalmente em: utilizar incentivos distribuídos para coordenar a longa cauda de potenciais fornecedores ( através de dados, armazenamento e computação ); ao mesmo tempo, estabelecer um mercado descentralizado para modelos de código aberto e agentes de IA.

  3. A IA é aplicada principalmente na indústria Web3 em finanças on-chain( pagamentos criptográficos, transações, análise de dados) e assistência ao desenvolvimento.

  4. A utilidade do AI+Web3 está na complementaridade entre ambos: o Web3 promete combater a centralização do AI, enquanto o AI promete ajudar o Web3 a expandir seu alcance.

AI+Web3: Torres e Praças

Introdução

Nos últimos dois anos, o desenvolvimento da IA acelerou-se, e o surgimento do ChatGPT deu início a uma nova era de inteligência artificial generativa, também provocando um aumento de entusiasmo no campo do Web3.

Com o apoio do conceito de IA, o financiamento de projetos Web3 teve um aumento significativo. Apenas no primeiro semestre de 2024, 64 projetos Web3+IA concluíram financiamento, dos quais o sistema operacional baseado em IA Zyber365 alcançou um financiamento máximo de 100 milhões de dólares na rodada A.

O mercado secundário está mais próspero, dados da Coingecko mostram que o valor total de mercado da área de IA já alcançou 48,5 bilhões de dólares, com um volume de negociação de quase 8,6 bilhões de dólares nas últimas 24 horas. Os avanços nas principais tecnologias de IA trouxeram benefícios evidentes, como o aumento de 151% no preço médio do setor de IA após o lançamento da Sora da OpenAI. O efeito de IA também se espalhou para o setor de criptomoedas que atrai capital, Meme: o primeiro conceito de Agent de IA, o MemeCoin GOAT, rapidamente ganhou popularidade, com uma avaliação de 1,4 bilhões de dólares, gerando uma onda de memes de IA.

A pesquisa e os tópicos relacionados a AI+Web3 estão em alta, desde AI+Depin até AI Memecoin, passando por AI Agent e AI DAO, a emoção de FOMO já é difícil de acompanhar a velocidade da nova rotação narrativa.

A combinação do conceito AI+Web3, repleto de dinheiro fácil, oportunidades e fantasias futuras, não pode deixar de ser vista como um casamento arranjado de capital. É difícil para nós julgar se este é o campo dos especuladores ou a véspera de uma explosão ao amanhecer.

Para responder a esta questão, a chave está em pensar: ficará melhor com o outro? Será que podemos beneficiar do modelo do outro? Este artigo tenta examinar este padrão: como o Web3 pode atuar em cada etapa do stack tecnológico de IA, e o que a IA pode trazer de novo ao Web3?

Parte.1 Quais são as oportunidades do Web3 sob a pilha de IA?

Antes de abordar este tópico, precisamos entender a pilha tecnológica dos grandes modelos de IA:

Modelos de IA podem ser comparados ao cérebro humano; nas fases iniciais, como um bebê, precisam observar e absorver uma enorme quantidade de informações externas para entender o mundo, esta é a fase de "coleta" de dados. Como os computadores não possuem múltiplos sentidos como os humanos, é necessário "pré-processar" as informações não rotuladas antes do treinamento, transformando-as em um formato compreensível para o computador.

Após a entrada de dados, a IA constrói um modelo com capacidade de compreensão e previsão através de "treinamento", semelhante ao modo como um bebê gradualmente entende e aprende sobre o mundo exterior. Os parâmetros do modelo são como a capacidade linguística de um bebê que se ajusta continuamente. O conteúdo de aprendizagem é dividido em áreas ou obtido através da comunicação com outras pessoas para receber feedback e correções, entrando na fase de "ajuste fino".

Após as crianças aprenderem a falar, conseguem compreender e expressar-se em novos diálogos, semelhante à fase de "raciocínio" de um grande modelo de IA, podendo realizar análises preditivas sobre novas entradas. Os bebês expressam sentimentos, descrevem objetos e resolvem problemas através da linguagem, semelhante a um grande modelo de IA que, após ser treinado, é aplicado em várias tarefas específicas, como classificação de imagens, reconhecimento de voz, etc.

O Agente de IA está mais próximo da próxima forma do grande modelo: capaz de executar tarefas de forma independente em busca de objetivos complexos, possui habilidades de pensamento, memória e planejamento, e pode usar ferramentas para interagir com o mundo.

Em relação aos pontos críticos de cada pilha de IA, o Web3 atualmente formou um ecossistema interconectado de múltiplos níveis, abrangendo todas as fases do processo de modelos de IA.

AI+Web3:Torre e Praça

Uma, Camada Básica: Airbnb de Poder de Cálculo e Dados

Poder de cálculo

Atualmente, um dos maiores custos da IA é a potência computacional e a energia necessárias para treinar e inferir modelos.

Como o LLAMA3 da Meta precisa de 16.000 GPUs NVIDIA H100 durante 30 dias para concluir o treinamento. A versão de 80 GB tem um preço unitário de 30.000 a 40.000 dólares, exigindo um investimento em hardware de 400 a 700 milhões de dólares, com um consumo de energia mensal de 1,6 bilhões de quilowatts-hora, resultando em despesas energéticas de quase 20 milhões de dólares.

A descompressão do poder computacional de IA é um dos primeiros campos de interseção entre Web3 e IA ------ DePin( rede de infraestrutura física descentralizada). DePin Ninja listou mais de 1400 projetos, com representantes de compartilhamento de poder GPU como io.net, Aethir, Akash, Render Network, entre outros.

Lógica principal: a plataforma permite que os proprietários de recursos de GPU ociosos contribuam com poder de computação de forma descentralizada sem permissão, semelhante a um mercado online entre compradores e vendedores como o Uber ou o Airbnb, aumentando a utilização de recursos de GPU subutilizados, enquanto os usuários finais obtêm recursos de computação eficientes e de baixo custo; ao mesmo tempo, o mecanismo de staking garante que os provedores de recursos sejam punidos em caso de violação do controle de qualidade ou interrupção da rede.

Características:

  • Agregar recursos de GPU ociosos: principalmente para centros de dados de terceiros de pequeno e médio porte, fazendas de criptomoedas e outros recursos excessivos de computação, hardware de mineração PoS como FileCoin e máquinas de mineração ETH. Também há projetos dedicados a iniciar dispositivos com uma barreira de entrada mais baixa, como o exolab que utiliza MacBook, iPhone, iPad e outros dispositivos locais para estabelecer uma rede de computação para inferência de modelos grandes.

  • Voltado para o mercado de longo alcance de poder computacional de IA: a. Lado técnico: mais adequado para passos de inferência. O treinamento depende de um super cluster de GPUs, enquanto a inferência tem requisitos de desempenho de GPU relativamente baixos, como a Aethir que se concentra em renderização de baixa latência e inferência de IA. b. Lado da demanda: as pequenas e médias empresas de poder computacional não treinarão grandes modelos de forma independente, mas otimizarão e ajustarão os grandes modelos existentes, o que é naturalmente adequado para recursos computacionais ociosos distribuídos.

  • Propriedade descentralizada: o significado da tecnologia blockchain é que os proprietários de recursos mantêm sempre o controle sobre os recursos, podendo ajustar-se de forma flexível enquanto obtêm lucros.

Dados

Os dados são a base da IA. Sem dados, o cálculo é como uma planta flutuante, sem utilidade; a relação entre dados e modelos é como "Lixo entra, lixo sai"; a quantidade e qualidade dos dados determinam a qualidade final da saída do modelo. Para o treinamento de modelos de IA, os dados determinam a capacidade linguística, a capacidade de compreensão, os valores e a expressão humanizada. Atualmente, as principais dificuldades na demanda por dados para IA são:

  • Sede de dados: O treinamento de modelos de IA depende de uma enorme quantidade de dados de entrada. A OpenAI treinou o GPT-4 com uma quantidade de parâmetros na casa dos trilhões.

  • Qualidade dos dados: Com a combinação da IA com vários setores, surgem novas exigências quanto à atualidade, diversidade, especialização dos dados e à incorporação de novas fontes de dados, como as emoções das redes sociais.

  • Privacidade e conformidade: as empresas em vários países estão gradualmente reconhecendo a importância de conjuntos de dados de qualidade e estão restringindo a coleta de dados.

  • Alto custo de processamento de dados: grande volume de dados e processamento complexo. As empresas de IA gastam mais de 30% do custo de P&D na coleta e processamento de dados básicos.

As soluções Web3 manifestam-se em quatro aspectos:

  1. Coleta de dados: a captura gratuita de dados do mundo real esgota-se rapidamente, os gastos das empresas de IA com dados aumentam anualmente, mas não retribuem os verdadeiros contribuidores, a plataforma desfruta de toda a criação de valor, como o Reddit que obteve 203 milhões de dólares em receitas através de acordos de licenciamento de dados com empresas de IA.

Permitir que os verdadeiros contribuintes dos usuários participem na criação de valor dos dados, obtendo dados valiosos mais privados a baixo custo através de redes distribuídas e mecanismos de incentivo, é a visão do Web3.

  • Grass: Camada de dados e rede descentralizada, os usuários executam nós que contribuem com largura de banda ociosa para retransmitir o tráfego e capturar dados em tempo real, recebendo recompensas em tokens.

  • Vana: Introduzir o conceito de pool de liquidez de dados (DLP), onde os usuários fazem upload de dados privados para um DLP específico, podendo escolher flexivelmente se autorizam ou não o uso por terceiros.

  • PublicAI: Os usuários podem usar a etiqueta #AI或#Web3 no X e @PublicAI para realizar a coleta de dados.

  1. Pré-processamento de dados: No processamento de dados de IA, a coleta de dados geralmente é barulhenta e contém erros, e deve ser limpa e convertida para um formato utilizável antes do treinamento, envolvendo tarefas repetitivas como padronização, filtragem e tratamento de valores ausentes. Esta fase é uma das poucas etapas manuais na indústria de IA, gerando a indústria de rotuladores de dados; à medida que a demanda por qualidade de dados nos modelos aumenta, o nível de exigência também se eleva, sendo naturalmente adequada para mecanismos de incentivo descentralizados do Web3.
  • A Grass e a OpenLayer consideram adicionar uma etapa de anotação de dados.

  • A Synesis apresentou o conceito "Train2earn", enfatizando a qualidade dos dados, onde os usuários fornecem dados rotulados, anotações, etc., para receber recompensas.

  • O projeto de rotulagem de dados Sapien gamifica as tarefas de marcação, onde os usuários apostam pontos para ganhar mais pontos.

  1. Privacidade e Segurança dos Dados: é necessário esclarecer que privacidade e segurança dos dados são dois conceitos distintos. A privacidade dos dados envolve o processamento de dados sensíveis, enquanto a segurança dos dados protege as informações contra acessos não autorizados, destruição e roubo. Vantagens das tecnologias de privacidade do Web3 e cenários potenciais de aplicação: (1) treinamento de dados sensíveis; (2) colaboração de dados: múltiplos proprietários de dados participam juntos do treinamento de IA, sem necessidade de compartilhar os dados originais.

Atuais tecnologias de privacidade no Web3:

  • Ambiente de Execução Confiável ( TEE ), como Super Protocol

  • Criptografia homomórfica totalmente (FHE), como BasedAI, Fhenix.io, Inco Network

  • Tecnologia de conhecimento zero ( zk ), como o Protocolo Reclaim que utiliza a tecnologia zkTLS para gerar provas de conhecimento zero de tráfego HTTPS, permitindo que os usuários importem de forma segura atividades, reputação e dados de identidade de sites externos, sem expor informações sensíveis.

Este campo ainda está no início, a maioria dos projetos está em exploração, e o dilema atual é o alto custo computacional, como:

  • O framework zkML EZKL leva cerca de 80 minutos para gerar a prova do modelo 1M-nanoGPT.

  • Os dados da Modulus Labs mostram que o custo do zkML é mais de 1000 vezes superior ao da computação pura.

  1. Armazenamento de dados: é necessário um local para armazenar dados on-chain e gerar LLM. Com a disponibilidade de dados (DA) como uma questão central, a capacidade de processamento do Ethereum antes da atualização Danksharding era de 0,08 MB. O treinamento de modelos de IA e a inferência em tempo real geralmente requerem uma taxa de transferência de dados de 50-100 GB por segundo. Essa diferença de magnitude torna difícil para as soluções on-chain existentes lidar com aplicações de IA intensivas em recursos.
  • 0g.AI é um projeto representante. É uma solução de armazenamento centralizado projetada para atender às altas demandas de desempenho da IA, com características principais: alto desempenho e escalabilidade, suportando upload e download rápidos de grandes conjuntos de dados através de técnicas avançadas de fragmentação e codificação de correção de erros, com velocidade de transferência de dados próxima a 5GB por segundo.

Dois, Middleware: Treinamento e Inferência do Modelo

Mercado descentralizado de modelos de código aberto

A discussão sobre modelos de IA fechados vs abertos continua. A abertura traz inovação coletiva, uma vantagem incomparável em relação aos fechados, mas como aumentar a motivação dos desenvolvedores sem um modelo de lucro? Em abril, o fundador da Baidu, Li Yanhong, afirmou que "modelos abertos ficarão cada vez mais atrasados".

A Web3 propõe a possibilidade de um mercado de modelos descentralizado e de código aberto: tokenização do próprio modelo, reservando uma certa proporção de tokens para a equipe e direcionando parte da receita futura para os detentores de tokens.

  • O protocolo Bittensor estabelece um mercado P2P de modelos de código aberto, composto por dezenas de "sub-redes". Os provedores de recursos ( competem entre si em computação, coleta/armazenamento de dados e talentos em aprendizado de máquina ) para atender os objetivos de proprietários específicos de sub-rede. Cada sub-rede pode interagir e aprender umas com as outras para alcançar uma inteligência mais robusta. As recompensas são distribuídas por votação da comunidade e são ainda distribuídas entre as sub-redes com base no desempenho competitivo.

  • A ORA introduz o conceito de emissão de modelo inicial (IMO), tokenizando modelos de IA, que podem ser comprados, vendidos e desenvolvidos através de uma rede descentralizada.

  • Sentient, uma plataforma AGI descentralizada que incentiva a colaboração, construção, replicação e expansão de modelos de IA, e recompensa os contribuintes.

  • Spectral Nova, focado na criação e aplicação de modelos de IA e ML.

raciocínio verificável

Para o problema do "caixa-preta" da inferência de IA, a solução padrão do Web3 é comparar os resultados das operações repetidas por múltiplos validadores, mas a escassez de "chips Nvidia" de alta qualidade está a aumentar significativamente os custos da inferência de IA, e essa abordagem enfrenta desafios.

Mais esperançoso é a execução de provas ZK para o cálculo de inferência de IA fora da cadeia, sem a necessidade de validação de permissão para o cálculo do modelo de IA na cadeia. É necessário criptografar a prova na cadeia para garantir que o cálculo fora da cadeia foi concluído corretamente (, caso o conjunto de dados não tenha sido adulterado ), ao mesmo tempo que garante que todos os dados permaneçam confidenciais.

Principais vantagens:

  • Escalabilidade: as provas de conhecimento zero podem confirmar rapidamente uma grande quantidade de cálculos fora da cadeia. Mesmo com o aumento do número de transações, uma única prova pode verificar todas as transações.

  • Proteção de privacidade: os detalhes dos dados e do modelo de IA são mantidos em sigilo, e as partes podem verificar que os dados e modelos não foram comprometidos.

  • Sem necessidade de confiança: é possível confirmar os cálculos sem depender de partes centralizadas.

  • Integração Web2: por definição, Web2 é uma integração off-chain, a inferência verificável pode ajudar a levar seus conjuntos de dados e cálculos de IA para a blockchain, contribuindo para aumentar a adoção do Web3.

Atualmente, a tecnologia Web3 para raciocínio verificável:

  • zkML: Combina provas de conhecimento zero com aprendizagem automática, garantindo a confidencialidade dos dados e do modelo, permitindo cálculos verificáveis sem revelar atributos subjacentes, como o provedor ZK baseado em ZKML da Modulus Labs, que verifica de forma eficaz se os fornecedores de IA executam corretamente os algoritmos na cadeia, atualmente os clientes são basicamente DApps na cadeia.

  • opML: Utilizando o princípio da agregação otimista, melhorando o cálculo de ML através da verificação do tempo de ocorrência de disputas.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 3
  • Compartilhar
Comentário
0/400
AirdropHuntervip
· 7h atrás
ainda não foi enganado por idiotas por grandes fundos
Ver originalResponder0
OnChainDetectivevip
· 7h atrás
Olhei por três dias para o fluxo de capital, todas as baleias estão acumulando conceitos de ai.
Ver originalResponder0
MEVSupportGroupvip
· 7h atrás
É apenas o novo brinquedo dos capitalistas.
Ver originalResponder0
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)