Докторський AI? Маск XAI запустив Grok 4: багатокористувацьке міркування, функція ринку прогнозів одночасно

Компанія штучного інтелекту xAI, очолювана Маском, кілька годин тому офіційно представила нове покоління AI моделі Grok 4, що називається «найрозумнішим AI на землі». Ця модель поєднує в собі безпрецедентні можливості міркування, академічний рівень доктора наук та інтеграцію використання кількох інструментів, та встановила рекорди в кількох бенчмарках. Він очікує, що Grok 4 принесе суттєві технічні винаходи або академічне значення протягом року.

Представляємо Grok 4, найпотужнішу AI модель у світі. Дивіться пряму трансляцію зараз:

— xAI (@xai) 10 липня 2025 року

Два варіанти: Grok 4 та Grok 4 Heavy

По-перше, Grok 4 ділиться на просту однопосередницьку версію (Single-Agent Version) Grok 4, а також багатопосередницьку версію (Multi-Agent Version) Grok 4 Heavy.

Grok 4: Базова версія, що використовує одного AI агента для вирішення проблем.

Grok 4 Heavy: використовує мульти-агентну співпрацю (multi-agent collaboration), дозволяючи кільком агентам спочатку вирішувати проблеми окремо, а потім, як у «навчальній групі», ділитися рішеннями та порівнювати результати, щоб отримати остаточну відповідь.

Наразі компанія також представила найдорожчий підписний план "SuperGrok Heavy", вартістю 300 доларів на місяць. Підписники плану можуть першими спробувати послугу Grok 4 Heavy, а також отримати пріоритетний доступ до майбутніх функцій.

Інтелект на рівні доктора філософії: від повної оцінки SAT до генія в усіх полях

Далі, xAI стверджує, що Grok 4 має академічні та логічні здібності, що перевищують людські, ставши одним з найближчих до загального штучного інтелекту (AGI) на даний момент. Він може отримувати майже максимальні бали на таких іспитах, як SAT, GRE та інші, і демонструє рівень знань вище доктора у всіх предметах.

Крім того, Grok 4 встановив нові рекорди в кількох показових бенчмарках, демонструючи невидані раніше межі можливостей. Зокрема, це включає:

У складних питаннях для аспірантів (GPQA), американський математичний іспит (AIME 2025), американський математичний олімпійський конкурс (USAMO) та інші високоякісні виклики з математичної логіки займають перше місце серед існуючих AI моделей.

У тестуванні бізнес-операцій автоматів Vending-Bench вдалося подвоїти доходи від активів, продемонструвавши стабільну та послідовну здатність до формування стратегій.

Біомедичний дослідницький центр ARC Institute використовує Grok 4 для автоматизації своїх дослідницьких процесів, ефективно просуваючи проведення експериментів.

Інші сфери, такі як медична візуалізація, розробка фінансових стратегій та розробка ігор, вже мають практичні застосування.

Одночасно, в остаточному випробуванні людства (Humanity’s Last Exam, HLE), Grok 4 може вирішити 25.4% завдань без допомоги, тоді як версія Grok 4 Heavy може вирішити 44.4% завдань, займаючи перше місце серед існуючих AI моделей.

Використання суперкомп'ютера Colossus для навчання Grok 4 значно підвищує обчислювальну ефективність.

xAI повідомила, що за появою Grok 4 стоїть подвійний стрибок у апаратному забезпеченні та навчальних стратегіях: "Обсяг навчання Grok 4 у 100 разів більший, ніж у Grok 2."

Завдяки нашому суперкомп'ютеру Colossus з приблизно 200000 графічних процесорів H100, від попереднього навчання до підкріплювального навчання (RLHF), Grok 4 посилив модель у фокусуванні та точності під час розв'язання задачі.

Команда підкреслює, що оскільки складність питань, написаних людьми, вже «неможливо ефективно навчити» Grok 4, реальний світ стане остаточним місцем тестування, наприклад, чи можна насправді створити корисні винаходи або технології, щоб оцінити їхню фактичну ефективність.

Інтеграція інструментів та взаємодія з реальністю: Grok 4 рухається до операційного ШІ

Одночасно, Grok 4 не лише буде думати, а й навчиться, як вирішувати проблеми реального світу. xAI зазначає, що на відміну від інших моделей, Grok 4 інтегрує здатність використовувати інструменти в процес навчання, підвищуючи практичні та адаптивні здібності:

Протягом наступних кількох місяців Grok 4 інтегрується з інженерними аналітичними інструментами, які використовують Tesla та SpaceX, занурюючись у більш складне інженерне середовище. Ми також плануємо до кінця цього року надати потужні корпоративні інструменти та високоточні фізичні моделі для великих компаній.

Команда доповнила: «Поточна мета полягає в тому, щоб Grok міг управляти гуманоїдним роботом Optimus та перевірити реальність і ефективність його логіки та креативності в фізичному світі.»

(Хуэйда Хуан Жэньсюн: чіпи Huawei вже наздогнали NVIDIA H20, робот Optimus від Маска відкриває трильйонові можливості)

Виходячи за межі людських можливостей розумування: чи може Grok 4 створювати нові винаходи?

Далі йдеться про гордість xAI – функцію логічного міркування. Grok 4 не лише здатен вичавлювати знання з навчальних даних, а й володіє логічним мисленням, розвинутим через підкріплене навчання. Він може самостійно формулювати рішення проблем у невідомих ситуаціях і проводити колективну дискусію з кількома агентами, зрештою, подібно до людських науковців, роблячи власні висновки:

Grok 4 був розроблений як спосіб мислення, що виходить з «першопринципів», здатний самостійно виявляти проблеми, будувати логіку та виконувати складні дедукції, що є недосяжним для інших AI у минулому.

xAI очікує, що Grok 4 винайде справжні практичні нові технології вже цього року, а найпізніше наступного року, і протягом наступних двох років може виявити наукові принципи, які досі невідомі людству.

(Інтерв'ю з Маском: надзвичайний розум ШІ вибухне, підприємці повинні прагнути до «корисного», а не «великого» життя)

Від прогнозів ринку до створення ігор: Застосування Grok 4 знову розширюється

Нарешті, xAI також продемонстрував практичний потенціал Grok 4 у багатьох сферах, таких як голосова взаємодія та фінансовий бізнес. Наприклад, у випадку аналізу тенденцій подій, Grok 4 Heavy може переглядати прогнозний ринок Polymarket, використовуючи статистичні розрахунки та логічні здібності, всього за кілька хвилин прогнозуючи ймовірність перемоги команди Доджерс у Світовій серії на рівні 21,6%, демонструючи потужність миттєвих обчислень, що перевищує традиційні інструменти кількісного аналізу.

Grok 4 через дані Polymarket оцінює шанси команди Доджерс на перемогу у Світовій Серії MLB

(X оголосив про співпрацю з Polymarket як офіційним партнером ринку прогнозів )

Майбутнє бачення Grok також вражає, xAI заявляє, що майбутні версії отримають можливості розуміння відео та інтерактивності в іграх, зможуть грати в ігри та оцінювати так зване «задоволення», навіть інтегрувати ігрові рушії для створення інтерактивного та художнього контенту. Сюди входять телевізійні шоу, фільми та відеоігри.

У голосовій сфері Grok 4 також отримав значне оновлення. Нова модель вводить різні стилі голосу та акценти, що робить розмову більш природною та плавною. На презентації також було спеціально проведено порівняння з GPT, підкреслюючи, що Grok 4 не тільки не перериває користувача, але й значно скорочує час затримки на обдумування та відповідь, що стало великою перевагою його інтерфейсу.

Grok 4 не просто інструмент, а й прискорювач розвитку людської цивілізації

Народження Grok 4 не лише означає, що ШІ переходить на більш глибокий етап мислення та застосування, за словами Маска, це також має потенціал викликати розумову революцію, яка охопить освіту, науку, бізнес та креативну індустрію, і Grok дійсно братиме в цьому участь, а не буде лише мовною моделлю або допоміжним інструментом.

Команда розробників xAI має велике і радикальне бачення майбутнього, підкреслюючи: «ШІ сьогодні більше не просто допомагає нам думати, а спільно з нами створює світ.»

Ця стаття Докторський рівень ШІ? Маск xAI запустив Grok 4: багатоагентне мислення, функція прогнозування ринку в одному огляді. Спочатку з'явилася на Лан Новини ABMedia.

Переглянути оригінал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити