Turnamen Catur LLM selesai: OpenAI o3 meraih juara, xAI Grok 4 tidak memenangkan satu pun papan dan kalah total.

2025-08-14 07:45:49

Turnamen Catur Internasional Kaggle AI berakhir, dan o3 yang tidak terlatih mengalahkan Grok 4 4-0, menunjukkan kemampuan penalaran yang kuat. (Sinopsis: Musk mengancam akan menuntut Apple: Peringkat App Store memiliki perilaku monopoli, dengan jahat menekan Ggrok) (Suplemen latar belakang: Grok 4 dibuka untuk penggunaan gratis hari ini, Musk xAI dan GPT-5 saling berhadapan) Baru-baru ini, Kaggle Google mengadakan "Pertandingan Pameran Catur Kecerdasan Buatan" mengumumkan hasilnya pada 14 Agustus, model bahasa besar serba guna OpenAI o3 menyapu Grok 4 xAI dengan 4:0 untuk memenangkan kejuaraan, dan menjadi LLM pertama yang menyelesaikan lawan tanpa pelatihan khusus. Sebanyak 8 tim AI berpartisipasi dalam acara tersebut selama tiga hari, dan sistem gugur diputuskan. Sorotan Kompetisi Model Bahasa Menurut laporan OpenTools.ai, O3 menyerahkan finis 4:0 dalam tiga game berturut-turut dalam proses maju sepenuhnya, dan menyingkirkan O4 mini ringannya sendiri di semifinal. Sebaliknya, Grok 4 sering memimpin pada satu titik di set awal, tetapi "kalah" berkali-kali di akhir acara (mengorbankan Ratu yang paling dapat ditindaklanjuti). Grandmaster catur Hikaru Nakamura berkomentar bahwa o3 memiliki "sangat sedikit kesalahan" dan menunjukkan bahwa Grok 4 sering mengalami peledakan diri taktis. Mantan juara dunia Magnus Carlsen menggambarkan gaya catur Grok seperti menonton seorang anak bermain catur. Dia memperkirakan bahwa Elo Grok adalah sekitar 800 dan O3 adalah sekitar 1200, jauh di bawah AI catur manusia atau khusus teratas. Elo: Sistem penilaian profesional (bahasa Inggris: Elo rating system) mengacu pada metode evaluasi yang dibuat oleh fisikawan Hungaria-Amerika Arpad Elo untuk mengukur tingkat berbagai aktivitas permainan, yang merupakan standar otoritatif yang diakui untuk evaluasi tingkat permainan saat ini, dan banyak digunakan dalam catur, Go, sepak bola, bola basket, dan olahraga lainnya. Skor tertinggi untuk Chess Elo ditetapkan oleh Magnus Carlsen dengan 2882 poin. AI tujuan umum bergulat dengan AI khusus Sistem khusus seperti Stockfish telah lama memegang sekitar 3644 Elo berdasarkan pencarian mendalam dan penilaian domain. LLM tujuan umum belajar melalui korpus lintas domain skala besar, dan bermain catur hanyalah perpanjangan dari kemampuan penalaran. Meskipun o3 mampu mengalahkan Grok 4, masih kalah dari Stockfish awal tahun ini, menunjukkan bahwa model umum masih memiliki celah dalam stabilitas dan kedalaman inferensi dalam permainan catur. Laporan terkait Berjudi di OpenAI, Son Masayoshi "berbalik" lagi Pengembang Ethereum menginstal "plugin AI berbahaya" diretas, dompet terenkripsi dikosongkan dalam tiga hari, dan sepuluh tahun pengalaman keamanan informasi tidak berguna a16z Wawasan terbaru: e-commerce tradisional sudah mati? Platform asli AI mendefinisikan ulang masalah "berbelanja" "Turnamen catur LLM berakhir: OpenAI o3 menang, xAI Grok 4 ditutup tanpa menang" Artikel ini pertama kali diterbitkan di "Tren Dinamis - Media Berita Blockchain Paling Berpengaruh" dari BlockTempo.

XAI-7.62%

GROK-6.82%

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Posting ulang
Bagikan

Komentar

0/400

Tidak ada komentar

Topik
#Gate Releases August Reserves Report
8k Popularitas
#BTC Hits New ATH
95k Popularitas
#Show My Alpha Points
125k Popularitas
#ETH Countdown To A New High
6k Popularitas
#Circle Launches ARC
4k Popularitas

Sematkan

peta situs