LLM satranç turnuvası sona erdi: OpenAI o3 şampiyon oldu, xAI Grok 4 hiç kazanamadı ve tamamen yenildi.

Kaggle AI uluslararası satranç turnuvası sona erdi, özel olarak eğitilmemiş o3, 4-0 ile Grok 4'ü mağlup ederek güçlü bir akıl yürütme yeteneği sergiledi. (Öncelik durumu: Musk, Apple'a dava açma tehdidinde bulundu: App Store sıralamasında tekel davranışları var, Grok'u kötü niyetle bastırıyor) (Arka plan bilgisi: Grok 4 bugün ücretsiz kullanım için açıldı, Musk xAI ile GPT-5 arasında doğrudan bir çatışma var) Yakın zamanda Google'a ait Kaggle tarafından düzenlenen "Yapay Zeka Satranç Gösteri Turnuvası" 14 Ağustos'ta sonuçları açıkladı, OpenAI genel büyük dil modeli o3, xAI'nin Grok 4'ünü 4-0'lık bir skorla mağlup ederek şampiyon oldu ve özel bir eğitim almadan rakibini tam olarak mağlup eden ilk LLM oldu. Turnuvada toplam 8 grup AI yer aldı, üç gün sürdü ve eleme usulüyle sonuçlandı. Dil modeli yarışması dikkat çekici noktaları OpenTools.ai raporuna göre, o3, ilerleme sürecinde arka arkaya üç maçta da 4-0'lık bir tam skor elde etti ve yarı finalde kendi hafif versiyonu o4 mini'yi eledi. Buna karşın, Grok 4 genellikle erken aşamalarda önde gitti, ancak turnuvanın sonunda birkaç kez "geriye düştü" (hareket gücü en yüksek olan Queen'i feda etti). Satranç büyük ustası Hikaru Nakamura, o3'ü "çok az hata yapan" biri olarak değerlendirdi ve Grok 4'ün sıkça taktiksel kendini yok etme hataları yaptığını belirtti. Eski dünya şampiyonu Magnus Carlsen, Grok'un oyun stilini şöyle tanımladı: Çocukların satranç oynamasını izlemek gibi. Grok'un Elo puanını yaklaşık 800, o3'ün ise yaklaşık 1200 olduğunu tahmin etti; bu değerler üst düzey insan oyuncuları veya uzman AI'ların çok altında. Elo: Profesyonel bir puanlama sistemi (İngilizce: Elo rating system), Macar asıllı Amerikalı fizikçi Arpad Elo tarafından oluşturulan, çeşitli oyun faaliyetlerinin seviyesini ölçen bir değerlendirme yöntemidir ve günümüzde oyun seviyesinin değerlendirilmesinde kabul görmüş otorite standardıdır. Bu sistem yaygın olarak satranç, go, futbol, basketbol gibi spor dallarında kullanılır. Satrançta en yüksek Elo puanı Magnus Carlsen tarafından 2882 puan olarak belirlenmiştir. Genel AI ile uzman AI arasındaki çekişme Stockfish gibi uzman sistemler derin arama ve alan puanlaması ile uzun süre boyunca yaklaşık 3644 Elo puanına sahip olmuştur. Genel LLM'ler ise büyük ölçekli çok alanlı verilerle öğrenerek satranç oynamayı sadece akıl yürütme yeteneğinin bir uzantısı olarak değerlendirir. O3, Grok 4'ü yenebilmiş olsa da, bu yıl daha önce Stockfish'e karşı kaybetmiştir; bu da genel modellerin satranç oyunundaki akıl yürütme stabilitesi ve derin hesaplama konusunda hala bir fark olduğunu göstermektedir. İlgili haberler: Açık AI'ye büyük bahis, Son Masashi bir kez daha "bir hamleyle geri döndü" Ethereum geliştiricisi "kötü niyetli AI eklentisi" yükledi, kripto cüzdanı üç günde boşaldı, on yıllık siber güvenlik deneyimi de işe yaramadı a16z'nin son içgörüleri: Geleneksel e-ticaret öldü mü? AI yerel platformları "alışveriş" kavramını yeniden tanımlıyor 〈LLM Satranç Turnuvası sona erdi: OpenAI o3 şampiyon oldu, xAI Grok 4 hiç maç kazanamadı ve tam olarak mağlup oldu〉 bu makale ilk olarak BlockTempo'da yayınlandı.

XAI-9.48%
GROK-9.39%
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Repost
  • Share
Comment
0/400
No comments
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)