Міфічний GPT не може створити автомобіль вашої мрії

Після вибуху ChatGPT модель штучного інтелекту стала гарячою точкою для багатьох технологічних компаній. Здається, що штучний інтелект має надприродну силу: від розмов у чаті до генерації зображень і закінчуючи робочим столом.

Божевільне захоплення поширилося на автомобільну промисловість, і практики почали думати: чи можливо дозволити GPT виготовляти автомобілі?

Деякі автомобільні компанії оголосили, що вони будуть застосовувати технологію великомасштабних моделей, тоді як інші заявили, що отримають доступ до сторонніх великих моделей, а деякі автомобільні компанії поспішили випустити систему автоматичного водіння зі словом GPT.

Деякі практики сказали Shentu, що розумна кабіна та автоматичне водіння можуть бути першими сценаріями застосування великих моделей. Серед них найбільш очікуваним є автономне водіння.

Автономне водіння – це надзвичайно складна траса. Крім технологічних гігантів, таких як Google і Baidu, велика кількість талановитих підприємців присвятили себе цьому і спалили мільярди доларів, але поки вони не досягли задовільних результатів.

Велика модель штучного інтелекту вводить автоматичне водіння, цього разу буде інакше?

Який зв'язок між GPT і автомобілями?

GPT не має прямого зв’язку з автомобілями на поверхні, але насправді він має глибокий зв’язок. Історія має початися шість років тому.

У червні 2017 року Маск, бос Tesla, викрадав словацького дослідника з OpenAI. Цією людиною був Андрій Карпаті, який пізніше став директором ШІ Tesla.

У той час Маск виявляв великий інтерес до штучного інтелекту, а також був одним із засновників OpenAI. Невдовзі після того, як найняв Андрея Карпаті, Маск залишив раду директорів OpenAI.Він вважав, що і Tesla, і OpenAI досліджують штучний інтелект, і в майбутньому можуть виникнути конфлікти інтересів.

Пізніше Андрій Карпаті переписав алгоритм автопілота в Tesla і розробив технологію чистого візуального сприйняття BEV, яка вивела автопілот Tesla на новий етап. А його колишній власник, OpenAI, зробив ставку на загальний штучний інтелект і нарешті розробив GPT.

З точки зору продукту, GPT від OpenAI і BEV від Tesla є абсолютно різними видами. Але з точки зору базової технології всі вони покладаються на технологію штучного інтелекту, особливо на застосування моделі Google Transformer.

Transformer — це архітектура нейронної мережі глибокого навчання, запропонована 8 вченими Google AI у 2017 році. Це надзвичайно важливий винахід в індустрії штучного інтелекту. «Т» у популярному сьогодні ChatGPT відноситься до моделі Transformer.

На відміну від традиційних нейронних мереж RNN і CNN, Transformer використовує механізм самоконтролю для визначення зв’язку та кореляції різних елементів у послідовності, а також має хорошу здатність обробляти дані часових рядів. Це дозволяє йому демонструвати видатну продуктивність у таких завданнях, як машинний переклад, узагальнення тексту та системи відповідей на запитання.

Тому Transformer вперше був використаний у сфері НЛП (розширена обробка природної мови) для розуміння людського тексту та мови.

Попереднє навчання на моделі Transformer, після безперервного тонкого налаштування та повторення, OpenAI послідовно запустив великі моделі мовного навчання, такі як GPT-1, GPT-2, GPT-3 і GPT-4. ChatGPT — це діалоговий робот, розроблений OpenAI після тонкого налаштування моделі GPT-3. Оскільки він може взаємодіяти в розмовній манері, звичайним людям легко користуватися, і він більш «розумний», ніж чат-боти в минулому, тому він сяє.

По суті, модель GPT від ChatGPT, модель LaMDA від Google і модель Wenxin від Baidu мають однакове походження.

Використання моделі Transformer для природної мови дало початок програмам для чату, таким як ChatGPT; використання її в комп’ютерному зорі також досягло дивовижних результатів. Піонером у цьому плані є Tesla.

Андрій Карпаті був відповідальним за керівництво командою комп’ютерного бачення для автономного водіння під час його перебування на посаді директора зі штучного інтелекту Tesla.Об’єднавши модель Transformer, Tesla успішно розробила технологію BEV.

Повна назва BEV - Bird's Eye View, тобто вид з висоти пташиного польоту. Він може перетворювати 2D-зображення, зняті камерою, у 3D-зображення шляхом з’єднання та рівномірно перетворювати їх у кут огляду для обробки, утворюючи «ракурс Бога». Причина цього в тому, що водіння здійснюється в тривимірному просторі, і те, що люди бачать, є тривимірним світом, а не двовимірним зображенням.

Це абсолютно нове рішення сприйняття буде продемонстровано Андрієм Карпаті на Tesla AI DAY у серпні 2021 року. З цієї причини Tesla без вагань переписала алгоритм автопілота та реконструювала інфраструктуру для навчання глибоких нейронних мереж.

Це перший випадок, коли технологія великих моделей була застосована в галузі автономного водіння.

Озираючись назад сьогодні, хоча GPT наразі в основному використовується в області обробки природної мови, ми не можемо дозволити GPT керувати автомобілем, але технологія великої моделі ШІ, яка стоїть за нею, особливо архітектура Transformer, насправді їздить автономно. застосоване поле.

Від обробки природної мови до комп’ютерного бачення, дві сфери об’єднали структуру моделювання на основі архітектури Transformer, що полегшило спільне моделювання.

І в міру поглиблення розуміння штучного інтелекту автомобільні компанії все більше й більше стають схожими на компанії штучного інтелекту. На додаток до Tesla, Li Auto оголосила про своє бачення компанії на початку цього року, заявивши, що до 2030 року стане компанією штучного інтелекту. Цього року він запустить міську навігаційну систему водіння NOA, а технічною підтримкою є модель BEV perception і Transformer.

Здається, немає ніякої різниці між тим, щоб дозволити ШІ спілкуватися з людьми та дозволити ШІ керувати автомобілем, за винятком того, що сценарії приземлення обох різняться. Люди завжди сповнені фантазії, коли справа стосується застосування базової технології до конкретних продуктів.

GPT вчить те, що стосується автоматичного водіння

З початку цього року потужні можливості, продемонстровані GPT, шокували зовнішній світ. Загальний штучний інтелект більше не є повітряним замком. Люди в індустрії автономного водіння почали думати, що, можливо, застосування генеративного ШІ на мовних моделях можна перенести на автономне водіння.

По суті, мовна модель — це математична модель людської мови. Комп’ютер досі не розуміє природної мови, але він перетворює мовні проблеми на математичні за допомогою математичного моделювання. Природна мова розуміється опосередковано шляхом передбачення ймовірності появи наступного слова в історії даного тексту.

Перемикаючись на сцену водіння, враховуючи поточне дорожнє середовище, навігаційну карту та історію поведінки водія, чи може велика модель передбачити наступну дію під час водіння?

Ю Кай, засновник Horizon, сказав на Форумі 100 електромобілів, який відбувся у квітні цього року, що ChatGPT дуже надихнув його: «Ми продовжуватимемо використовувати великі дані, більші дані, більші моделі та неконтрольоване навчання. Люди намагаються так само, як ви дізнаєтеся з великої кількості неконтрольованого та немаркованого природного тексту». Він стверджує, що послідовність керування кожним водієм схожа на наші тексти природною мовою. Далі він хоче побудувати велику мовну модель, яка повертатиметься до автономного водіння.

Теоретично ця ідея здійсненна. ШІ вже має здатність до навчання. Згідно з моделлю адаптивної мови, машина продовжуватиме ітераційну оптимізацію відповідно до відгуків користувача, вивчатиме звички користувача, а потім покращуватиме модель. Поточний ChatGPT використовує цю технологію. Тоді машині не складно навчитися водіння водія.

Тіньовий режим Tesla призначений для передачі даних про водіння реальних водіїв машинному навчанню. Мета навчання алгоритму досягається шляхом порівняння поведінки людей-водіїв.

Після того, як GPT розпочав новий виток буму штучного інтелекту, когнітивний вплив на галузь полягає в тому, що зі збільшенням масштабу параметрів моделі кількість даних зростає експоненціально, що є так званою великою моделлю. Після досягнення певної критичної точки , Моделі можуть раптово стати розумними.

У минулому дані, необхідні моделі на етапі навчання, позначалися вручну. Візьмемо як приклад автономне водіння. Розміщувач даних використовує велику кількість зображень, щоб позначити та повідомити машині, що таке кіт, що таке собака та скільки видів котів і собак існує. Анотатор схожий на вчителя машини, що вчить її знову і знову розуміти світ.

Проблема в тому, чого не навчив учитель, машина все одно не зможе. Типовим прикладом є те, що Tesla багато разів потрапляла в аварію з автопілотом, і транспортний засіб врізався у велику вантажівку, яка була перекинута, оскільки машина не могла її розпізнати.

Хе Юхуа, партнер-засновник Hegao Capital, навів Shentu такий приклад: у Гуанчжоу часті літні дощові дні, і в деяких сценах з тьмяним світлом у повітрі буде велика кількість літаючих комах. Коли машина проїжджає, вогні вмикаються, і тисячі літаючих комах можуть вдаритися по передній частині автомобіля. У цьому випадку система сприйняття автономного водіння автомобіля може прийняти його за стіну.

Система автоматичного водіння не може вичерпати всі кутові випадки (екстремальні сценарії), що є основною складністю її розробки.

Те, що ChatGPT захоплює, - це немарковані дані всієї мережі. У самоконтрольованому навчанні самі дані використовуються як контрольний сигнал, а не покладаються на позначені людиною мітки. Одного разу люди виявили, що в процесі перетравлення цих даних велика модель раптом має можливість виводити інші випадки з одного прикладу.

Отже, якщо велика модель автономного водіння також може вивчати поведінку людини за кермом без нагляду, без необхідності навчання «вчителя», чи означає це, що система раптово змінилася на «старого водія»?

"Водіння" GPT не є надійним

Мрії прекрасні, а шлях до їх здійснення завжди дуже тонкий.

Щоб модель штучного інтелекту, схожа на ChatGPT, використовувала свою потужність у сфері автономного водіння, на даний момент необхідно вирішити принаймні такі проблеми.

По-перше, це джерело даних.

Джерела даних ChatGPT дуже багаті, включаючи Вікіпедію, книги, новинні статті, наукові журнали тощо, що еквівалентно загальнодоступним даним усієї мережі як її живлення.

Автономне водіння буває іншим. Дані про водіння водія та дані про керування транспортним засобом не розголошуються, і багато з них стосуються конфіденційності. Виробники автомобілів і компанії, що займаються безпілотним керуванням, працюють незалежно, а дані закриті й не поширюються, що ускладнює отримання даних. Без даних автономне водіння – це вода без джерела.

Хе Чжицян, президент Lenovo Venture Capital, сказав Shentu, що суттю автономного водіння є наявність даних, а дані дуже важливі для тренувань моделей. Такі OEM-виробники, як BYD, мають дані, але їхні алгоритми все ще потребують вдосконалення. Нові виробники автомобілів, такі як Wei Xiaoli, добре володіють алгоритмами, але їх продажі автомобілів недостатні. Компанії, які мають як дані, так і алгоритми, можуть повністю використовувати великі моделі.

По-друге, обмежений спосіб розгортання обчислювальної системи.

Ю Кай вважає, що OpenAI і ChatGPT обчислюють у хмарі, яка має достатній запас енергії, живлення та дуже хорошу систему. Однак, якщо автомобіль покладається на акумулятор і розсіювання тепла автомобіля, то це завдання відмінно, а це означає, що автоматичне водіння не може використовувати таку велику модель і такий великий розрахунок.

Споживання обчислювальної потужності великими моделями призвело до того, що виробники хмарних обчислень стали першою групою гравців, які отримали дивіденди на цій хвилі буму ШІ. Розвиток хмарних обчислень великими компаніями також відкриває шлях для великих моделей. Але з боку автомобіля це буде протиріччям.

Більша проблема полягає в тому, що надійність великих моделей не перевірена.

Люди, які користувалися ChatGPT, знають, що ChatGPT іноді говорить нісенітницю, іноді правильну, а іноді неправильну. Це відоме в індустрії як схильність до галюцинацій, схильність створювати нереальний контент, який взагалі не має походження. Великі моделі щось вигадують, не піклуючись про його правдивість і точність.

Спілкування може бути нісенітницею, але автоматичне водіння ні. Результат будь-якого неправильного виведення може бути фатальним.

«ChatGPT досяг значного прогресу, але автоматичне водіння ще не з’явилося, тому що автоматичне водіння, особливо безпілотне водіння, може мати нульовий рівень відмовостійкості, що є питанням людського життя», — сказав Ю Кай.

Лонг Чжиюн, який колись працював головним операційним директором стартап-компанії ШІ в Силіконовій долині, вважає, що неконтрольованість, непередбачуваність і ненадійність є найбільшою загрозою для комерціалізації великих моделей. Типовим проявом є те, що велика модель має схильність до галюцинацій.

Зараз нереально, щоб система автоматичного водіння навчилася вибирати та розрізняти та стабільно видавати оптимальне рішення.

Інсайдер компанії штучного інтелекту сказав Shentu: «Дійсно є багато проривів у візуальному сприйнятті на рівні алгоритму. Але сцена автомобіля надто вимоглива. Я особисто не думаю, що буде великий прорив у короткостроковій перспективі. Ви можете звернути увагу на особливі рухи Сла».

Однак останнім часом у технологічному середовищі з’явилася тенденція, згідно з якою компанії, великі й малі, хочуть поглянути на гарячі точки GPT. Деякі виробники автомобілів оголосили, що збираються застосувати технологію, схожу на GPT, і купа крутих концепцій збиває людей з пантелику.

Наприклад, компанія з автономного водіння під традиційною автомобільною компанією випустила велику генеративну модель для автономного водіння, яку називають «першою в галузі», яка використовує цю модель для тренування автономного водіння.

Інвестор, який тривалий час звертав увагу на трек для розумних автомобілів, запитав лідера галузі, що він думає про цю модель, і інша сторона відповіла чотирма словами: «ТМ нісенітниця».

«Це просто піар-акція», — прокоментував Shentu інвестор.

Автономне водіння, його скинуть і перезапустять?

Під впливом Tesla в поєднанні з хвилею ШІ, що з’являється цього року, індустрія автономного водіння поступово наближається до великих моделей, великої обчислювальної потужності та великих даних.

Вплив великих моделей на автономне водіння ще недостатньо значний, але люди з гострим нюхом демонструють двоїсте ставлення.

Так само, як коли Tesla використовувала Transformer для перетворення даних кількох камер із простору зображень у простір BEV, вона не вагаючись повалила оригінальну архітектуру та переписала алгоритм. Застосування великих моделей зараз також може означати, що початковий алгоритм автоматичного водіння буде скинутий і перезапущений.

Хе Чжицян вважає, що великі моделі матимуть величезний вплив на автономне водіння. У минулому багато маленьких моделей використовувалися для автономного водіння, але тепер це стала великою моделлю, і, можливо, доведеться повторювати все заново. Індустрія автономного водіння буде змінена.

Чжао Дунсян, директор з автономного водіння в компанії, що займається розробкою чіпів ШІ, сказав Shentu, що загальна наскрізна зміна рівнозначна повторенню всього заново.

Перетасування — це можливість для нових учасників і загроза для лідерів. Історія з обгоном на повороті часто трапляється в період стрімких технологічних змін. В епоху швидких технологій чим більше інвестицій у старий маршрут, тим більшими можуть бути безповоротні витрати, і тим важче повернути назад. Для OEM-виробників або компаній, що займаються автономним водінням, щоб застосувати нову технологію, необхідно враховувати не лише ефект, але й вартість.

Чжао Дунсян сказав, що на поточному етапі немає сенсу змінювати технічний шлях автоматичного водіння: «Тепер технічні можливості галузі непогані. Кожен витратив стільки грошей і робив це так довго. немає істотного поліпшення, немає мотивації змінюватися».

На AI DAY наприкінці минулого року Tesla модернізувала BEV до мережі зайнятості (мережа зайнятості), і здатність узагальнення була додатково покращена. Займаючи мережу, система сприйняття автопілота Tesla може визначити, чи потрібно їй уникати її, не знаючи, який об’єкт вона бачить, таким чином вирішуючи проблеми з довгим хвостом.

Незалежно від того, який технічний маршрут, зараз він зазнає швидких змін і ітерацій. Маленькі моделі в минулому можуть бути замінені великими моделями, а сьогоднішні великі моделі також можуть бути замінені деякими новими видами в майбутньому.

Але в будь-якому випадку практика натирання гарячих точок і трюків не сприяє технічному прогресу. «Це погана звичка стежити за спекою, і корисно виробляти продукти приземленим способом», — сказав Чжао Дунсян.

До справжньої «королівської бомби» автономного водіння ще далеко. Нам потрібно залишатися в захваті від кожного раунду технологічних змін. Міфічний GPT не може створити автомобіль вашої мрії, але принаймні зміни відбулися.

Переглянути оригінал
Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити