2025-08-01 14:27:48

Comparado a outros modelos sem uso de ferramentas, alcança desempenho de ponta em:

🔘 LiveCodeBench V6, que avalia o desempenho de código competitivo
🔘 O Último Exame da Humanidade, um benchmark desafiador que mede a experiência de um modelo em diferentes domínios, incluindo ciência.

H-5.81%

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

14 gostos

Recompensa
14
4
Partilhar

Comentar

0/400

RegenRestorer

· 08-01 14:57

A melhoria de desempenho é bastante evidente.

Ver originalResponder0

NervousFingers

· 08-01 14:55

Vale a pena seguir de perto

Ver originalResponder0

DeadTrades_Walking

· 08-01 14:53

Uma performance realmente impressionante

Ver originalResponder0

LuckyBlindCat

· 08-01 14:41

Desempenho subiu tanto

Ver originalResponder0

Tópico
1/3
1CandyDrop Airdrop Event 6.0
44k Popularidade
2White House Crypto Report
48k Popularidade
3Join Alpha RION Airdrop to Earn $40
32k Popularidade
4Fed Holds Rates Decision
9k Popularidade
5July Spark Program TOP 10 Creators Announced
2k Popularidade

Pino