После взрыва ChatGPT модель ИИ стала горячей точкой для многих технологических компаний. От разговоров в чате до создания изображений и настольного офиса кажется, что ИИ обладает сверхъестественной силой, чтобы разрушить все за одну ночь.
Помешательство распространилось на автомобильную промышленность, и специалисты-практики начали думать: можно ли позволить GPT производить автомобили?
Некоторые автомобильные компании объявили, что будут применять технологию крупномасштабных моделей, в то время как другие заявили, что получат доступ к крупным моделям сторонних производителей, а некоторые автомобильные компании поспешили выпустить систему автоматического вождения со словом GPT.
Некоторые практики сказали Shentu, что умная кабина и автоматическое вождение могут быть первыми сценариями применения больших моделей. Среди них наиболее ожидаемым является автономное вождение.
Автономное вождение — чрезвычайно сложная трасса. Помимо технологических гигантов, таких как Google и Baidu, большое количество талантливых предпринимателей посвятили себя этому и сожгли миллиарды долларов, но пока не добились удовлетворительных результатов.
Большая модель ИИ переходит на автоматическое вождение, будет ли на этот раз по-другому?
Какова связь между GPT и автомобилями?
GPT не имеет прямого отношения к автомобилям на поверхности, но на самом деле имеет глубокое отношение. История должна начаться шесть лет назад.
В июне 2017 года Маск, босс Tesla, переманил словацкого исследователя из OpenAI. Этим человеком был Андрей Карпати, который позже стал директором Tesla по искусственному интеллекту.
В то время Маск проявлял большой интерес к искусственному интеллекту, а также был одним из основателей OpenAI. Вскоре после найма Андрея Карпати Маск покинул совет директоров OpenAI, так как считал, что и Tesla, и OpenAI занимаются исследованиями ИИ, и в будущем могут возникнуть конфликты интересов.
Позже Андрей Карпати переписал алгоритм автопилота в Tesla и разработал технологию чистого визуального восприятия BEV, которая вывела автопилот Tesla на новый этап. А его бывший владелец, OpenAI, поставил все фишки на общий искусственный интеллект и, наконец, разработал GPT.
С точки зрения продукта OpenAI GPT и Tesla BEV — совершенно разные виды. Но с точки зрения базовой технологии все они полагаются на технологию искусственного интеллекта, особенно на применение модели Google Transformer.
Transformer — это архитектура нейронной сети с глубоким обучением, предложенная 8 учеными Google AI в 2017 году. Это чрезвычайно важное изобретение в индустрии искусственного интеллекта. Буква «Т» в сегодняшнем популярном ChatGPT относится к модели Transformer.
В отличие от традиционных нейронных сетей RNN и CNN, Transformer использует механизм самоконтроля для определения связи и корреляции различных элементов в последовательности и обладает хорошей способностью обрабатывать данные временных рядов. Это позволяет ему демонстрировать выдающуюся производительность в таких задачах, как машинный перевод, суммирование текста и системы ответов на вопросы.
Поэтому Transformer впервые был использован в области НЛП (расширенная обработка естественного языка) для понимания человеческого текста и языка.
Предварительное обучение на модели Transformer, после непрерывной тонкой настройки и итерации, OpenAI последовательно запускает большие модели обучения языку, такие как GPT-1, GPT-2, GPT-3 и GPT-4. ChatGPT — это диалоговый робот, разработанный OpenAI после тонкой настройки модели GPT-3. Поскольку он может взаимодействовать в диалоговом режиме, обычные люди просты в использовании, и он более «умный», чем чат-боты в прошлом, поэтому он сияет.
По сути, модель GPT ChatGPT, модель Google LaMDA и модель Baidu Wenxin имеют одно и то же происхождение.
Использование модели Transformer для естественного языка привело к созданию чат-приложений, таких как ChatGPT, использование ее в компьютерном зрении также дало потрясающие результаты.Пионером в этом отношении является Tesla.
Андрей Карпати возглавлял группу компьютерного зрения для автономного вождения во время своего пребывания на посту директора Tesla по искусственному интеллекту.Объединив модель Transformer, Tesla успешно разработала технологию BEV.
Полное название BEV — Bird's Eye View, то есть вид с высоты птичьего полета. Он может преобразовывать 2D-изображения, снятые камерой, в 3D-изображения путем объединения и равномерно преобразовывать их под углом обзора для обработки, формируя «перспективу Бога». Причина этого в том, что вождение осуществляется в трехмерном пространстве, а то, что люди видят, — это трехмерный мир, а не 2D-изображение.
Это совершенно новое решение для восприятия будет продемонстрировано Андреем Карпати на Tesla AI DAY в августе 2021 года. По этой причине Тесла, не колеблясь, переписал алгоритм автопилота и реконструировал инфраструктуру для обучения глубоких нейронных сетей.
Это первый случай, когда технология больших моделей была применена в индустрии автономного вождения.
Оглядываясь назад сегодня, хотя GPT в настоящее время в основном используется в области обработки естественного языка, мы не можем позволить GPT управлять автомобилем, но стоящая за ним технология больших моделей искусственного интеллекта, особенно архитектура Transformer, фактически управляется автономно. применено поле.
От обработки естественного языка до компьютерного зрения, эти две области объединили структуру моделирования на основе архитектуры Transformer, что упрощает совместное моделирование.
И по мере углубления понимания ИИ автомобильные компании все больше и больше становятся похожими на компании искусственного интеллекта. В дополнение к Tesla, Li Auto объявила о своем видении компании в начале этого года, заявив, что к 2030 году она станет компанией с искусственным интеллектом. В этом году компания запустит городскую систему вождения с помощью навигации NOA, а техническая поддержка — это восприятие BEV и модель Transformer.
Кажется, нет никакой разницы между тем, чтобы ИИ разговаривал с людьми, и тем, чтобы ИИ вел машину, за исключением того, что сценарии посадки в этих двух случаях различны. Люди всегда полны воображения, когда дело доходит до применения базовой технологии к конкретным продуктам.
GPT учит тому, что такое автоматическое вождение
С начала этого года мощные возможности, продемонстрированные GPT, потрясли весь мир. Общий искусственный интеллект больше не является воздушным замком. Люди в индустрии автономного вождения начали думать, что, возможно, применение генеративного ИИ на языковых моделях можно перенести на автономное вождение.
По сути, языковая модель — это математическая модель человеческого языка. Компьютер по-прежнему не понимает естественный язык, но с помощью математического моделирования превращает языковые проблемы в математические. Естественный язык понимается косвенно, путем предсказания вероятности появления следующего слова в истории данного текста.
Переключившись на сцену вождения, учитывая текущую дорожную обстановку, навигационную карту и историю поведения водителя за рулем, может ли большая модель предсказать следующее действие за рулем?
Ю Кай, основатель Horizon, сказал на Форуме 100 электромобилей, состоявшемся в апреле этого года, что ChatGPT очень вдохновил его: «Мы продолжим использовать большие данные, большие данные, большие модели и неконтролируемое обучение. диске, точно так же, как вы учитесь на большом количестве неконтролируемого и немаркированного естественного текста». Он утверждает, что последовательности действий каждого водителя подобны нашим текстам на естественном языке. Затем он хочет построить большую языковую модель, которая вернется к автономному вождению.
Теоретически эта идея осуществима. У ИИ уже есть способность учиться. Согласно адаптивной языковой модели, машина будет продолжать итеративно оптимизировать в соответствии с отзывами пользователя, изучать привычки пользователя, а затем улучшать модель. Текущий ChatGPT использует эту технологию. Тогда машине не составит труда изучить манеру вождения водителя.
Теневой режим Tesla заключается в передаче данных о вождении реальных водителей для машинного обучения. Цель обучения алгоритма достигается путем сравнения поведения людей-водителей.
После того, как GPT запустила новый виток бума ИИ, когнитивное влияние на отрасль заключается в том, что при увеличении масштаба параметров модели объем данных увеличивается экспоненциально, что является так называемой большой моделью.После достижения определенной критической точки , Модели могут внезапно стать умными.
Раньше данные, необходимые модели на этапе обучения, помечались вручную. Взяв в качестве примера автономное вождение, маркировщик данных использует большое количество изображений, чтобы пометить и сообщить машине, что такое кошка, что такое собака и сколько существует типов кошек и собак. Аннотатор подобен учителю машины, снова и снова обучая ее понимать мир.
Проблема в том, что чему не научил учитель, того не может и машина. Типичным примером является то, что Tesla много раз попадала в аварии с автопилотом, и автомобиль врезался в большой грузовик, который перевернулся, потому что машина не могла его распознать.
Хэ Юхуа, партнер-основатель Hegao Capital, привел такой пример Shentu: в Гуанчжоу часто бывают летние дождливые дни, и в некоторых сценах с тусклым светом в воздухе будет большое количество летающих насекомых. Когда мимо проезжает машина, включаются огни, и перед автомобилем могут бить тысячи летающих насекомых. В этом случае автономная система восприятия вождения автомобиля может принять его за стену.
Система автоматического вождения не может исчерпать все угловые случаи (экстремальные сценарии), что является серьезной трудностью при ее разработке.
Что ChatGPT захватывает, так это немаркированные данные всей сети. При самоконтролируемом обучении сами данные используются в качестве контрольного сигнала, а не полагаются на ярлыки, помеченные человеком. Однажды люди обнаружили, что в процессе обработки этих данных большая модель внезапно получает возможность делать выводы о других случаях из одного экземпляра.
Итак, если большая модель автономного вождения также может изучать поведение человека за рулем без присмотра, без необходимости «учителя», чтобы научить его, означает ли это, что система внезапно превратилась в «старого водителя»?
GPT "вождение", ненадежно
Мечты прекрасны, а путь к их осуществлению всегда очень тернист.
Чтобы модель ИИ, подобная ChatGPT, могла проявить свою мощь в области автономного вождения, в настоящее время необходимо решить как минимум следующие проблемы.
Во-первых, это источник данных.
Источники данных ChatGPT очень богаты, включая Википедию, книги, новостные статьи, научные журналы и т. д., что эквивалентно общедоступным данным всей сети в качестве ее питания.
Автономное вождение бывает разным. Данные о вождении водителя и данные о вождении транспортного средства не разглашаются, и многие из них связаны с конфиденциальностью. Производители автомобилей и компании, занимающиеся самоуправлением, работают независимо, а данные закрыты и не распространяются, что затрудняет получение данных. Без данных автономное вождение — это вода без источника.
Хэ Чжицян, президент Lenovo Venture Capital, сказал Shentu, что основа автономного вождения — это наличие данных, а данные очень важны для моделей обучения. OEM-производители, такие как BYD, имеют данные, но их алгоритмы все еще нуждаются в доработке.Производители новых автомобилей, такие как Wei Xiaoli, хороши в алгоритмах, но их продажи автомобилей недостаточны. Компании, располагающие как данными, так и алгоритмами, могут в полной мере использовать большие модели.
Во-вторых, вычислительный метод развертывания системы ограничен.
Ю Кай считает, что OpenAI и ChatGPT вычисляют в облаке, которое имеет достаточный запас энергии, электропитание и очень хорошую систему.Однако, если автомобиль полагается на аккумулятор и тепловыделение автомобиля, то это проблема большой, что означает, что автоматическое вождение не может использовать такую большую модель и такой большой расчет.
Потребление вычислительной мощности большими моделями привело к тому, что производители облачных вычислений стали первой группой игроков, получивших дивиденды на этой волне бума ИИ. Развитие облачных вычислений крупными компаниями также открывает путь для крупных моделей. Но со стороны автомобиля это будет противоречие.
Большая проблема заключается в том, что надежность больших моделей не была проверена.
Люди, которые использовали ChatGPT, знают, что ChatGPT иногда говорит ерунду, иногда правильно, а иногда неправильно. В индустрии это известно как склонность к галлюцинациям, склонность к созданию нереального контента, который вообще не имеет никакого происхождения. Большие модели выдумывают вещи, не заботясь об их правдивости и точности.
Беседа может быть ерундой, но автоматическое вождение — нет. Результат любого неправильного вывода может быть фатальным.
«ChatGPT добился больших успехов, но автоматическое вождение еще не наступило, потому что автоматическое вождение, особенно беспилотное вождение, может иметь нулевую отказоустойчивость, что является вопросом человеческой жизни», — сказал Ю Кай.
Лонг Чжиён, который когда-то работал главным операционным директором стартапа в области искусственного интеллекта в Силиконовой долине, считает, что неконтролируемость, непредсказуемость и ненадежность — это самые большие угрозы для коммерциализации крупных моделей. Типичным проявлением является склонность крупной модели к галлюцинациям.
Теперь для системы автоматического вождения нереально научиться выбирать и различать и стабильно выводить оптимальное решение.
Инсайдер компании искусственного интеллекта сказал Shentu: «Действительно есть много прорывов в визуальном восприятии на уровне алгоритмов. Но сцена с автомобилем слишком требовательна. Лично я не думаю, что в краткосрочной перспективе произойдет большой прорыв. . Вы можете обратить внимание на специальные движения Sla."
Однако в последнее время в технологическом кругу наблюдается тенденция, когда компании, большие и малые, хотят взглянуть на горячие точки GPT. Некоторые автопроизводители объявили, что собираются применить технологию, подобную GPT, и куча крутых концепций сбивает людей с толку.
Например, компания по автономному вождению в рамках традиционной автомобильной компании выпустила большую генеративную модель для автономного вождения, которую называют «первой в отрасли», использующей эту модель для обучения автономному вождению.
Инвестор, который долгое время обращал внимание на умную автомобильную гусеницу, спросил лидера отрасли, что он думает об этой модели, и другая сторона ответила четырьмя словами: «ТМ чепуха».
«Это просто пиар-акция», — прокомментировал Шенту инвестор.
Автономное вождение, будет ли оно свергнуто и перезапущено?
Ведомая Tesla, в сочетании с волной искусственного интеллекта, появившейся в этом году, индустрия автономного вождения постепенно приближается к направлению больших моделей, больших вычислительных мощностей и больших данных.
Влияние больших моделей на автономное вождение еще недостаточно сильное, но люди с острым обонянием проявили двойственное отношение.
Точно так же, как когда Tesla использовала Transformer для преобразования данных с нескольких камер из пространства изображения в пространство BEV, она, не колеблясь, отвергла исходную архитектуру и переписала алгоритм. Применение больших моделей теперь может также означать, что первоначальный алгоритм автоматического вождения будет свергнут и перезапущен.
Хэ Чжицян считает, что большие модели окажут огромное влияние на автономное вождение. В прошлом для автономного вождения использовалось множество небольших моделей, но теперь это стало большой моделью, и, возможно, придется делать все заново. Индустрия автономного вождения будет перетасована.
Чжао Дунсян, директор по автономному вождению в компании по производству микросхем искусственного интеллекта, сказал Shentu, что полное сквозное изменение равносильно повторению всего этого.
Перетасовка — это возможность для новых участников и угроза для лидеров. История обгона на повороте часто происходит в период стремительного технического прогресса. В эпоху быстрых технологий чем больше инвестиций в старый маршрут, тем больше могут быть невозвратные издержки и тем труднее его изменить. Для OEM-производителей или компаний, занимающихся автономным вождением, при использовании новой технологии необходимо учитывать не только эффект, но и стоимость.
Чжао Дунсян сказал, что на нынешнем этапе бессмысленно менять технический маршрут автоматического вождения: «Сейчас технические возможности отрасли неплохие. Все потратили столько денег и сделали это так долго. нет существенного улучшения, нет мотивации к изменениям».
В День AI в конце прошлого года Tesla модернизировала BEV до сети занятости (сеть занятости), и способность к обобщению была дополнительно улучшена. Занимая сеть, система восприятия автопилота Теслы может решить, нужно ли ей избегать ее, не зная, какой объект она видит, тем самым решая больше проблем с длинным хвостом.
Каким бы ни был технический маршрут, сейчас он претерпевает быстрые изменения и итерации. Маленькие модели прошлого могут быть заменены большими моделями, а сегодняшние большие модели также могут быть заменены некоторыми новыми видами в будущем.
Но в любом случае практика затирания горячих точек и создания уловок не способствует техническому прогрессу. «Следовать за жарой — плохая привычка, а делать продукты простым способом — полезно», — сказал Чжао Дунсян.
Настоящая «королевская бомба» автономного вождения еще далека от появления. Что нам нужно сделать, так это трепетать перед каждым этапом технологических изменений. Мифический GPT не может построить машину вашей мечты, но, по крайней мере, изменения произошли.
Посмотреть Оригинал
Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».
Мифический GPT не может построить машину вашей мечты
После взрыва ChatGPT модель ИИ стала горячей точкой для многих технологических компаний. От разговоров в чате до создания изображений и настольного офиса кажется, что ИИ обладает сверхъестественной силой, чтобы разрушить все за одну ночь.
Помешательство распространилось на автомобильную промышленность, и специалисты-практики начали думать: можно ли позволить GPT производить автомобили?
Некоторые автомобильные компании объявили, что будут применять технологию крупномасштабных моделей, в то время как другие заявили, что получат доступ к крупным моделям сторонних производителей, а некоторые автомобильные компании поспешили выпустить систему автоматического вождения со словом GPT.
Некоторые практики сказали Shentu, что умная кабина и автоматическое вождение могут быть первыми сценариями применения больших моделей. Среди них наиболее ожидаемым является автономное вождение.
Автономное вождение — чрезвычайно сложная трасса. Помимо технологических гигантов, таких как Google и Baidu, большое количество талантливых предпринимателей посвятили себя этому и сожгли миллиарды долларов, но пока не добились удовлетворительных результатов.
Большая модель ИИ переходит на автоматическое вождение, будет ли на этот раз по-другому?
Какова связь между GPT и автомобилями?
GPT не имеет прямого отношения к автомобилям на поверхности, но на самом деле имеет глубокое отношение. История должна начаться шесть лет назад.
В июне 2017 года Маск, босс Tesla, переманил словацкого исследователя из OpenAI. Этим человеком был Андрей Карпати, который позже стал директором Tesla по искусственному интеллекту.
В то время Маск проявлял большой интерес к искусственному интеллекту, а также был одним из основателей OpenAI. Вскоре после найма Андрея Карпати Маск покинул совет директоров OpenAI, так как считал, что и Tesla, и OpenAI занимаются исследованиями ИИ, и в будущем могут возникнуть конфликты интересов.
Позже Андрей Карпати переписал алгоритм автопилота в Tesla и разработал технологию чистого визуального восприятия BEV, которая вывела автопилот Tesla на новый этап. А его бывший владелец, OpenAI, поставил все фишки на общий искусственный интеллект и, наконец, разработал GPT.
С точки зрения продукта OpenAI GPT и Tesla BEV — совершенно разные виды. Но с точки зрения базовой технологии все они полагаются на технологию искусственного интеллекта, особенно на применение модели Google Transformer.
Transformer — это архитектура нейронной сети с глубоким обучением, предложенная 8 учеными Google AI в 2017 году. Это чрезвычайно важное изобретение в индустрии искусственного интеллекта. Буква «Т» в сегодняшнем популярном ChatGPT относится к модели Transformer.
В отличие от традиционных нейронных сетей RNN и CNN, Transformer использует механизм самоконтроля для определения связи и корреляции различных элементов в последовательности и обладает хорошей способностью обрабатывать данные временных рядов. Это позволяет ему демонстрировать выдающуюся производительность в таких задачах, как машинный перевод, суммирование текста и системы ответов на вопросы.
Поэтому Transformer впервые был использован в области НЛП (расширенная обработка естественного языка) для понимания человеческого текста и языка.
Предварительное обучение на модели Transformer, после непрерывной тонкой настройки и итерации, OpenAI последовательно запускает большие модели обучения языку, такие как GPT-1, GPT-2, GPT-3 и GPT-4. ChatGPT — это диалоговый робот, разработанный OpenAI после тонкой настройки модели GPT-3. Поскольку он может взаимодействовать в диалоговом режиме, обычные люди просты в использовании, и он более «умный», чем чат-боты в прошлом, поэтому он сияет.
По сути, модель GPT ChatGPT, модель Google LaMDA и модель Baidu Wenxin имеют одно и то же происхождение.
Использование модели Transformer для естественного языка привело к созданию чат-приложений, таких как ChatGPT, использование ее в компьютерном зрении также дало потрясающие результаты.Пионером в этом отношении является Tesla.
Андрей Карпати возглавлял группу компьютерного зрения для автономного вождения во время своего пребывания на посту директора Tesla по искусственному интеллекту.Объединив модель Transformer, Tesla успешно разработала технологию BEV.
Полное название BEV — Bird's Eye View, то есть вид с высоты птичьего полета. Он может преобразовывать 2D-изображения, снятые камерой, в 3D-изображения путем объединения и равномерно преобразовывать их под углом обзора для обработки, формируя «перспективу Бога». Причина этого в том, что вождение осуществляется в трехмерном пространстве, а то, что люди видят, — это трехмерный мир, а не 2D-изображение.
Это совершенно новое решение для восприятия будет продемонстрировано Андреем Карпати на Tesla AI DAY в августе 2021 года. По этой причине Тесла, не колеблясь, переписал алгоритм автопилота и реконструировал инфраструктуру для обучения глубоких нейронных сетей.
Это первый случай, когда технология больших моделей была применена в индустрии автономного вождения.
Оглядываясь назад сегодня, хотя GPT в настоящее время в основном используется в области обработки естественного языка, мы не можем позволить GPT управлять автомобилем, но стоящая за ним технология больших моделей искусственного интеллекта, особенно архитектура Transformer, фактически управляется автономно. применено поле.
От обработки естественного языка до компьютерного зрения, эти две области объединили структуру моделирования на основе архитектуры Transformer, что упрощает совместное моделирование.
И по мере углубления понимания ИИ автомобильные компании все больше и больше становятся похожими на компании искусственного интеллекта. В дополнение к Tesla, Li Auto объявила о своем видении компании в начале этого года, заявив, что к 2030 году она станет компанией с искусственным интеллектом. В этом году компания запустит городскую систему вождения с помощью навигации NOA, а техническая поддержка — это восприятие BEV и модель Transformer.
Кажется, нет никакой разницы между тем, чтобы ИИ разговаривал с людьми, и тем, чтобы ИИ вел машину, за исключением того, что сценарии посадки в этих двух случаях различны. Люди всегда полны воображения, когда дело доходит до применения базовой технологии к конкретным продуктам.
GPT учит тому, что такое автоматическое вождение
С начала этого года мощные возможности, продемонстрированные GPT, потрясли весь мир. Общий искусственный интеллект больше не является воздушным замком. Люди в индустрии автономного вождения начали думать, что, возможно, применение генеративного ИИ на языковых моделях можно перенести на автономное вождение.
По сути, языковая модель — это математическая модель человеческого языка. Компьютер по-прежнему не понимает естественный язык, но с помощью математического моделирования превращает языковые проблемы в математические. Естественный язык понимается косвенно, путем предсказания вероятности появления следующего слова в истории данного текста.
Переключившись на сцену вождения, учитывая текущую дорожную обстановку, навигационную карту и историю поведения водителя за рулем, может ли большая модель предсказать следующее действие за рулем?
Ю Кай, основатель Horizon, сказал на Форуме 100 электромобилей, состоявшемся в апреле этого года, что ChatGPT очень вдохновил его: «Мы продолжим использовать большие данные, большие данные, большие модели и неконтролируемое обучение. диске, точно так же, как вы учитесь на большом количестве неконтролируемого и немаркированного естественного текста». Он утверждает, что последовательности действий каждого водителя подобны нашим текстам на естественном языке. Затем он хочет построить большую языковую модель, которая вернется к автономному вождению.
Теоретически эта идея осуществима. У ИИ уже есть способность учиться. Согласно адаптивной языковой модели, машина будет продолжать итеративно оптимизировать в соответствии с отзывами пользователя, изучать привычки пользователя, а затем улучшать модель. Текущий ChatGPT использует эту технологию. Тогда машине не составит труда изучить манеру вождения водителя.
Теневой режим Tesla заключается в передаче данных о вождении реальных водителей для машинного обучения. Цель обучения алгоритма достигается путем сравнения поведения людей-водителей.
После того, как GPT запустила новый виток бума ИИ, когнитивное влияние на отрасль заключается в том, что при увеличении масштаба параметров модели объем данных увеличивается экспоненциально, что является так называемой большой моделью.После достижения определенной критической точки , Модели могут внезапно стать умными.
Раньше данные, необходимые модели на этапе обучения, помечались вручную. Взяв в качестве примера автономное вождение, маркировщик данных использует большое количество изображений, чтобы пометить и сообщить машине, что такое кошка, что такое собака и сколько существует типов кошек и собак. Аннотатор подобен учителю машины, снова и снова обучая ее понимать мир.
Проблема в том, что чему не научил учитель, того не может и машина. Типичным примером является то, что Tesla много раз попадала в аварии с автопилотом, и автомобиль врезался в большой грузовик, который перевернулся, потому что машина не могла его распознать.
Хэ Юхуа, партнер-основатель Hegao Capital, привел такой пример Shentu: в Гуанчжоу часто бывают летние дождливые дни, и в некоторых сценах с тусклым светом в воздухе будет большое количество летающих насекомых. Когда мимо проезжает машина, включаются огни, и перед автомобилем могут бить тысячи летающих насекомых. В этом случае автономная система восприятия вождения автомобиля может принять его за стену.
Система автоматического вождения не может исчерпать все угловые случаи (экстремальные сценарии), что является серьезной трудностью при ее разработке.
Что ChatGPT захватывает, так это немаркированные данные всей сети. При самоконтролируемом обучении сами данные используются в качестве контрольного сигнала, а не полагаются на ярлыки, помеченные человеком. Однажды люди обнаружили, что в процессе обработки этих данных большая модель внезапно получает возможность делать выводы о других случаях из одного экземпляра.
Итак, если большая модель автономного вождения также может изучать поведение человека за рулем без присмотра, без необходимости «учителя», чтобы научить его, означает ли это, что система внезапно превратилась в «старого водителя»?
GPT "вождение", ненадежно
Мечты прекрасны, а путь к их осуществлению всегда очень тернист.
Чтобы модель ИИ, подобная ChatGPT, могла проявить свою мощь в области автономного вождения, в настоящее время необходимо решить как минимум следующие проблемы.
Во-первых, это источник данных.
Источники данных ChatGPT очень богаты, включая Википедию, книги, новостные статьи, научные журналы и т. д., что эквивалентно общедоступным данным всей сети в качестве ее питания.
Автономное вождение бывает разным. Данные о вождении водителя и данные о вождении транспортного средства не разглашаются, и многие из них связаны с конфиденциальностью. Производители автомобилей и компании, занимающиеся самоуправлением, работают независимо, а данные закрыты и не распространяются, что затрудняет получение данных. Без данных автономное вождение — это вода без источника.
Хэ Чжицян, президент Lenovo Venture Capital, сказал Shentu, что основа автономного вождения — это наличие данных, а данные очень важны для моделей обучения. OEM-производители, такие как BYD, имеют данные, но их алгоритмы все еще нуждаются в доработке.Производители новых автомобилей, такие как Wei Xiaoli, хороши в алгоритмах, но их продажи автомобилей недостаточны. Компании, располагающие как данными, так и алгоритмами, могут в полной мере использовать большие модели.
Во-вторых, вычислительный метод развертывания системы ограничен.
Ю Кай считает, что OpenAI и ChatGPT вычисляют в облаке, которое имеет достаточный запас энергии, электропитание и очень хорошую систему.Однако, если автомобиль полагается на аккумулятор и тепловыделение автомобиля, то это проблема большой, что означает, что автоматическое вождение не может использовать такую большую модель и такой большой расчет.
Потребление вычислительной мощности большими моделями привело к тому, что производители облачных вычислений стали первой группой игроков, получивших дивиденды на этой волне бума ИИ. Развитие облачных вычислений крупными компаниями также открывает путь для крупных моделей. Но со стороны автомобиля это будет противоречие.
Большая проблема заключается в том, что надежность больших моделей не была проверена.
Люди, которые использовали ChatGPT, знают, что ChatGPT иногда говорит ерунду, иногда правильно, а иногда неправильно. В индустрии это известно как склонность к галлюцинациям, склонность к созданию нереального контента, который вообще не имеет никакого происхождения. Большие модели выдумывают вещи, не заботясь об их правдивости и точности.
Беседа может быть ерундой, но автоматическое вождение — нет. Результат любого неправильного вывода может быть фатальным.
«ChatGPT добился больших успехов, но автоматическое вождение еще не наступило, потому что автоматическое вождение, особенно беспилотное вождение, может иметь нулевую отказоустойчивость, что является вопросом человеческой жизни», — сказал Ю Кай.
Лонг Чжиён, который когда-то работал главным операционным директором стартапа в области искусственного интеллекта в Силиконовой долине, считает, что неконтролируемость, непредсказуемость и ненадежность — это самые большие угрозы для коммерциализации крупных моделей. Типичным проявлением является склонность крупной модели к галлюцинациям.
Теперь для системы автоматического вождения нереально научиться выбирать и различать и стабильно выводить оптимальное решение.
Инсайдер компании искусственного интеллекта сказал Shentu: «Действительно есть много прорывов в визуальном восприятии на уровне алгоритмов. Но сцена с автомобилем слишком требовательна. Лично я не думаю, что в краткосрочной перспективе произойдет большой прорыв. . Вы можете обратить внимание на специальные движения Sla."
Однако в последнее время в технологическом кругу наблюдается тенденция, когда компании, большие и малые, хотят взглянуть на горячие точки GPT. Некоторые автопроизводители объявили, что собираются применить технологию, подобную GPT, и куча крутых концепций сбивает людей с толку.
Например, компания по автономному вождению в рамках традиционной автомобильной компании выпустила большую генеративную модель для автономного вождения, которую называют «первой в отрасли», использующей эту модель для обучения автономному вождению.
Инвестор, который долгое время обращал внимание на умную автомобильную гусеницу, спросил лидера отрасли, что он думает об этой модели, и другая сторона ответила четырьмя словами: «ТМ чепуха».
«Это просто пиар-акция», — прокомментировал Шенту инвестор.
Автономное вождение, будет ли оно свергнуто и перезапущено?
Ведомая Tesla, в сочетании с волной искусственного интеллекта, появившейся в этом году, индустрия автономного вождения постепенно приближается к направлению больших моделей, больших вычислительных мощностей и больших данных.
Влияние больших моделей на автономное вождение еще недостаточно сильное, но люди с острым обонянием проявили двойственное отношение.
Точно так же, как когда Tesla использовала Transformer для преобразования данных с нескольких камер из пространства изображения в пространство BEV, она, не колеблясь, отвергла исходную архитектуру и переписала алгоритм. Применение больших моделей теперь может также означать, что первоначальный алгоритм автоматического вождения будет свергнут и перезапущен.
Хэ Чжицян считает, что большие модели окажут огромное влияние на автономное вождение. В прошлом для автономного вождения использовалось множество небольших моделей, но теперь это стало большой моделью, и, возможно, придется делать все заново. Индустрия автономного вождения будет перетасована.
Чжао Дунсян, директор по автономному вождению в компании по производству микросхем искусственного интеллекта, сказал Shentu, что полное сквозное изменение равносильно повторению всего этого.
Перетасовка — это возможность для новых участников и угроза для лидеров. История обгона на повороте часто происходит в период стремительного технического прогресса. В эпоху быстрых технологий чем больше инвестиций в старый маршрут, тем больше могут быть невозвратные издержки и тем труднее его изменить. Для OEM-производителей или компаний, занимающихся автономным вождением, при использовании новой технологии необходимо учитывать не только эффект, но и стоимость.
Чжао Дунсян сказал, что на нынешнем этапе бессмысленно менять технический маршрут автоматического вождения: «Сейчас технические возможности отрасли неплохие. Все потратили столько денег и сделали это так долго. нет существенного улучшения, нет мотивации к изменениям».
В День AI в конце прошлого года Tesla модернизировала BEV до сети занятости (сеть занятости), и способность к обобщению была дополнительно улучшена. Занимая сеть, система восприятия автопилота Теслы может решить, нужно ли ей избегать ее, не зная, какой объект она видит, тем самым решая больше проблем с длинным хвостом.
Каким бы ни был технический маршрут, сейчас он претерпевает быстрые изменения и итерации. Маленькие модели прошлого могут быть заменены большими моделями, а сегодняшние большие модели также могут быть заменены некоторыми новыми видами в будущем.
Но в любом случае практика затирания горячих точек и создания уловок не способствует техническому прогрессу. «Следовать за жарой — плохая привычка, а делать продукты простым способом — полезно», — сказал Чжао Дунсян.
Настоящая «королевская бомба» автономного вождения еще далека от появления. Что нам нужно сделать, так это трепетать перед каждым этапом технологических изменений. Мифический GPT не может построить машину вашей мечты, но, по крайней мере, изменения произошли.