Efsanevi GPT hayalinizdeki arabayı yapamaz

ChatGPT'nin patlamasının ardından AI modeli, birçok teknoloji şirketi tarafından takip edilen bir sıcak nokta haline geldi. Sohbet konuşmalarından görüntü oluşturmaya ve masaüstü ofise kadar yapay zekanın her şeyi bir gecede alt üst edecek doğaüstü gücü var gibi görünüyor.

Çılgınlık otomotiv endüstrisine sıçradı ve uygulayıcılar şunu düşünmeye başladı: GPT'nin araba yapmasına izin vermek mümkün mü?

Bazı otomobil firmaları büyük ölçekli model teknolojisini uygulayacaklarını açıklarken, diğerleri üçüncü parti büyük modellere ulaşacaklarını söylemiş ve bazı otomobil firmaları GPT kelimesi ile otomatik sürüş sistemini piyasaya sürmek için aceleye gelmişti.

Bazı uygulayıcılar Shentu'ya akıllı kokpit ve otomatik sürüşün büyük modellerin ilk uygulama senaryoları olabileceğini söyledi. Bunlar arasında otonom sürüş en çok beklenendir.

Otonom sürüş son derece zor bir parkur. Google ve Baidu gibi teknoloji devlerinin yanı sıra çok sayıda yetenekli girişimci de kendilerini buna adamış ve milyarlarca doları yakmış ancak şu ana kadar tatmin edici sonuçlar elde edememiştir.

AI büyük model otomatik sürüşe geçiyor, bu sefer farklı olacak mı?

GPT ve arabalar arasındaki ilişki ne kadar?

GPT'nin yüzeydeki arabalarla doğrudan bir ilişkisi yoktur, ancak aslında derin bir ilişkisi vardır. Hikaye altı yıl önce başlamalı.

Haziran 2017'de Tesla'nın patronu Musk, OpenAI'den bir Slovak araştırmacıyı kaçırdı. Adam, daha sonra Tesla'nın AI direktörü olan Andrej Karpathy idi.

O dönemde yapay zekaya büyük ilgi gösteren Musk, OpenAI'nin de kurucularındandı. Musk, Andrej Karpathy'yi işe aldıktan kısa bir süre sonra OpenAI yönetim kurulundan ayrıldı.Hem Tesla'nın hem de OpenAI'nin yapay zekayı araştırdığına ve gelecekte çıkar çatışmaları olabileceğine inanıyordu.

Daha sonra Andrej Karpathy, Tesla'daki otopilot algoritmasını yeniden yazdı ve Tesla otopilotunu yeni bir aşamaya taşıyan BEV saf görsel algı teknolojisini geliştirdi. Ve eski sahibi OpenAI, tüm fişlerini genel yapay zekaya yatırdı ve sonunda GPT'yi geliştirdi.

Ürün açısından bakıldığında, OpenAI'nin GPT'si ve Tesla'nın BEV'si tamamen farklı türlerdir. Ancak altta yatan teknoloji açısından bakıldığında, hepsi yapay zeka teknolojisine, özellikle Google Transformer modelinin uygulamasına güveniyor.

Transformer, 2017'de 8 Google AI bilim adamı tarafından önerilen bir derin öğrenme sinir ağı mimarisidir. Bu, yapay zeka endüstrisinde son derece önemli bir buluş.Günümüzün popüler ChatGPT'sindeki "T", Transformer modelini ifade eder.

Geleneksel sinir ağı RNN ve CNN'den farklı olarak Transformer, dizideki farklı öğelerin bağlantısını ve korelasyonunu araştırmak için bir öz-dikkat mekanizması kullanır ve zaman serisi verilerini işleme konusunda iyi bir yeteneğe sahiptir. Bu, makine çevirisi, metin özetleme ve soru yanıtlama sistemleri gibi görevlerde olağanüstü performans göstermesini sağlar.

Bu nedenle, Transformer ilk olarak insan metnini ve dilini anlamak için NLP (gelişmiş doğal dil işleme) alanında kullanıldı.

Sürekli ince ayar ve yinelemenin ardından Transformer modelinde ön eğitim olan OpenAI, GPT-1, GPT-2, GPT-3 ve GPT-4 gibi büyük dil eğitimi modellerini başarıyla başlattı. ChatGPT, GPT-3 modelinde ince ayar yapıldıktan sonra OpenAI tarafından geliştirilen bir diyalog robotudur. Sohbet şeklinde etkileşime girebildiği için sıradan insanların kullanımı kolaydır ve geçmişteki sohbet robotlarından daha "akıllı" olduğundan parlar.

Temel olarak, ChatGPT'nin GPT modeli, Google'ın LaMDA modeli ve Baidu'nun Wenxin modelinin tümü aynı kaynağı paylaşır.

Transformer modelinin doğal dil için kullanılması ChatGPT gibi sohbet uygulamalarını doğurmuş, bilgisayarla görü alanında kullanılması da şaşırtıcı sonuçlar elde etmiştir.Bu konuda öncü Tesla'dır.

Andrej Karpathy, Tesla'nın AI direktörü olarak görev yaptığı süre boyunca otonom sürüş için bilgisayarla görme ekibine liderlik etmekten sorumluydu.Tesla, Transformer modelini birleştirerek BEV teknolojisini başarıyla geliştirdi.

BEV'in tam adı kuş bakışı olan Bird's Eye View'dur. Kamera tarafından yakalanan 2D görüntüleri birleştirerek 3D görüntülere dönüştürebilir ve bunları işlenmek üzere tekdüze bir şekilde bakış açısına dönüştürerek bir "Tanrı'nın perspektifi" oluşturabilir. Bunun nedeni, araba sürmenin üç boyutlu bir uzayda gerçekleşmesi ve insanların gördüğü şeyin 2 boyutlu bir görüntü değil, üç boyutlu bir dünya olmasıdır.

Bu yepyeni algı çözümü, Ağustos 2021'de Tesla AI DAY'de Andrej Karpathy tarafından gösterilecek. Bu nedenle Tesla, otopilot algoritmasını yeniden yazmaktan çekinmemiş ve derin sinir ağlarını eğitmek için altyapıyı yeniden oluşturmuştur.

Bu, büyük model teknolojisinin otonom sürüş endüstrisine ilk kez uygulanışıdır.

Bugün geriye dönüp baktığımızda, GPT şu anda ağırlıklı olarak doğal dil işleme alanında kullanılıyor olsa da, GPT'nin araba kullanmasına izin veremeyiz, ancak arkasındaki AI büyük model teknolojisi, özellikle Transformer mimarisi, aslında otonom sürüş yapıyor. uygulanan alan

Doğal dil işlemeden bilgisayar görüşüne kadar iki alan, Transformer mimarisine dayalı modelleme yapısını birleştirerek ortak modellemeyi kolaylaştırdı.

Yapay zeka anlayışı derinleştikçe, araba şirketleri giderek daha çok yapay zeka şirketlerine benziyor. Tesla'ya ek olarak, Li Auto da şirket vizyonunu bu yılın başlarında açıklayarak 2030 yılına kadar bir yapay zeka şirketi olmayı iddia etti. Şehir içi NOA navigasyon destekli sürüş sistemini bu yıl piyasaya sürecek olup, teknik desteği BEV algısı ve Transformer modelidir.

Yapay zekanın insanlarla konuşmasına izin vermekle, yapay zekanın araba kullanmasına izin vermek arasında, ikisinin iniş senaryolarının farklı olması dışında hiçbir fark yok gibi görünüyor. Altta yatan teknolojiyi belirli ürünlere uygulamak söz konusu olduğunda, insanlar her zaman hayal gücüyle doludur.

GPT, otomatik sürüşle ilgili bu şeyleri öğretir

Bu yılın başından beri, GPT'nin gösterdiği güçlü yetenekler dış dünyayı şok etti. Genel yapay zeka artık havada bir kale değil. Otonom sürüş endüstrisindeki insanlar, üretken yapay zekanın dil modellerine uygulanmasının otonom sürüşe taşınabileceğini düşünmeye başladı.

Temel olarak, bir dil modeli, insan dilinin matematiksel bir modelidir. Bilgisayar hala doğal dili anlamıyor, ancak dil problemlerini matematiksel modelleme yoluyla matematiksel problemlere dönüştürüyor. Doğal dil, dolaylı olarak, belirli bir metnin tarihi boyunca ortaya çıkan bir sonraki kelimenin olasılığını tahmin ederek anlaşılır.

Mevcut trafik ortamı, bir navigasyon haritası ve bir sürücünün sürüş davranışı geçmişi göz önüne alındığında, sürüş sahnesine geçiş yapıldığında, büyük model bir sonraki sürüş eylemini tahmin edebilir mi?

Horizon'un kurucusu Yu Kai, bu yıl Nisan ayında düzenlenen 100 Elektrikli Araç Forumu'nda ChatGPT'nin kendisine çok ilham verdiğini belirterek, "Büyük veriyi, daha büyük verileri, daha büyük modelleri ve denetimsiz öğrenmeyi kullanmaya devam edeceğiz. tıpkı büyük miktarda denetimsiz ve etiketlenmemiş doğal metinden öğrendiğiniz gibi." Her sürücünün sürüş kontrollerinin sıralamasının bizim doğal dil metinlerimiz gibi olduğunu savunuyor. Ardından, otonom sürüşe geri dönen geniş bir dil modeli oluşturmak istiyor.

Teorik olarak, bu fikir uygulanabilir. AI zaten öğrenme yeteneğine sahiptir. Uyarlanabilir dil modeline göre makine, kullanıcının geri bildirimlerine göre yinelemeli olarak optimize etmeye, kullanıcının alışkanlıklarını öğrenmeye ve ardından modeli iyileştirmeye devam edecek. Mevcut ChatGPT bu teknolojiyi kullanır. Ardından, makinenin sürücünün sürüş alışkanlıklarını öğrenmesi zor değil.

Tesla'nın gölge modu, gerçek sürücülerin sürüş verilerini makine öğrenimine beslemektir. Algoritmayı eğitmenin amacı, insan sürücülerin davranışlarını karşılaştırarak elde edilir.

GPT yeni bir yapay zeka patlaması turu başlattıktan sonra, sektör üzerindeki kognitif etki, modelin parametre ölçeğini artırarak veri miktarının katlanarak artmasıdır, bu da büyük model olarak adlandırılır. Belirli bir kritik noktaya ulaştıktan sonra , Modeller aniden akıllı olabilir.

Eskiden modelin eğitim aşamasında ihtiyaç duyduğu veriler manuel olarak etiketleniyordu. Otonom sürüşü örnek olarak ele alan veri etiketleyici, makineye neyin kedi, neyin köpek olduğunu ve kaç tür kedi ve köpek olduğunu etiketlemek ve anlatmak için çok sayıda resim kullanır. Açıklama yapan, makinenin öğretmeni gibidir, ona dünyayı anlamayı tekrar tekrar öğretir.

Sorun şu ki, öğretmenin öğretmediğini makine hala öğretemiyor. Tipik bir örnek, Tesla'nın birçok kez otopilot kazası geçirmesi ve aracın büyük bir kamyona çarpması ve makinenin onu tanıyamadığı için devrilmesidir.

Hegao Capital'in kurucu ortağı He Yuhua, Shentu'ya şöyle bir örnek verdi: Guangzhou'da yazın sık sık yağmurlu günler yaşanıyor ve loş ışıklı bazı sahnelerde havada çok sayıda uçan böcek olacak. Bir araba geçtiğinde, ışıklar çarpıyor ve arabanın önüne çarpan binlerce uçan böcek olabilir. Bu durumda arabanın otonom sürüş algılama sistemi onu duvar zannedebilir.

Otomatik sürüş sistemi, geliştirilmesinde büyük bir zorluk oluşturan tüm köşe durumlarını (aşırı senaryolar) tüketemez.

ChatGPT'nin yakaladığı şey, tüm ağın işaretlenmemiş verileridir. Kendi kendine denetimli öğrenmede, insan tarafından etiketlenmiş etiketlere dayanmak yerine, verinin kendisi bir denetim sinyali olarak kullanılır. Bir gün insanlar, bu verileri sindirme sürecinde, büyük modelin aniden bir örnekten diğer durumları çıkarsama yeteneğine sahip olduğunu keşfetti.

Öyleyse, büyük otonom sürüş modeli, bir "öğretmenin" öğretmesine gerek kalmadan, denetimsiz olarak insan sürüş davranışını da öğrenebiliyorsa, bu, sistemin aniden "eski bir sürücüye" dönüştüğü anlamına mı geliyor?

GPT "sürüş", güvenilir değil

Hayaller güzeldir ve onları gerçekleştirmenin yolu her zaman çok zayıftır.

ChatGPT benzeri bir AI modelinin otonom sürüş alanında gücünü gösterebilmesi için şu anda en azından aşağıdaki sorunların çözülmesi gerekiyor.

Birincisi veri kaynağı.

ChatGPT'nin veri kaynakları, Wikipedia, kitaplar, haber makaleleri, bilimsel dergiler vb. dahil olmak üzere çok zengindir ve bu, beslenmesi olarak tüm ağın genel verilerine eşdeğerdir.

Otonom sürüş farklıdır. Sürücünün sürüş verileri ve araç sürüş verileri ifşa edilmez ve bunların çoğu mahremiyet içerir. Otomobil üreticileri ve sürücüsüz şirketler birbirinden bağımsız çalışıyor ve veriler kapalı ve dolaşımda değil, bu da veri elde etmeyi zorlaştırıyor. Veri olmadan otonom sürüş, kaynağı olmayan sudur.

Lenovo Venture Capital'in başkanı He Zhiqiang, Shentu'ya otonom sürüşün özünün verilere sahip olmak olduğunu ve verilerin eğitim modelleri için çok önemli olduğunu söyledi. BYD gibi OEM'lerin verileri var, ancak algoritmalarının hala iyileştirilmesi gerekiyor "Wei Xiaoli" gibi yeni araba üreticileri algoritmalarda iyidir, ancak araba satışları yeterli değildir. Hem veriye hem de algoritmaya sahip şirketler, büyük modellerden tam olarak yararlanabilir.

İkincisi, sistemin bilgi işlem dağıtım yönteminin sınırlı olmasıdır.

Yu Kai, OpenAI ve ChatGPT'nin yeterli enerji kaynağına, güç kaynağına ve çok iyi bir sisteme sahip bulutta bilgi işlem yaptığına inanıyor. Ancak, araba aküye ve arabanın ısı dağılımına güveniyorsa, o zaman bu zorluk harika, bu da otomatik sürüşün bu kadar büyük bir modeli ve bu kadar büyük bir hesaplamayı kullanamayacağı anlamına gelir.

Büyük modellerin bilgi işlem gücünün tüketimi, bulut bilgi işlem üreticilerinin bu yapay zeka patlaması dalgasında temettülerden yararlanan ilk oyuncu grubu haline gelmesine neden oldu. Büyük şirketlerin bulut bilişim geliştirmesi de büyük modellerin önünü açıyor. Ancak araba tarafında bu bir çelişki olacaktır.

Daha büyük bir sorun, büyük modellerin güvenilirliğinin doğrulanmamış olmasıdır.

ChatGPT'yi kullanmış olan kişiler, ChatGPT'nin bazen saçma sapan, bazen doğru bazen de yanlış konuştuğunu bilirler. Bu, endüstride halüsinasyon eğilimi, hiçbir kaynağı olmayan gerçek dışı içerik üretme eğilimi olarak bilinir. Büyük modeller, doğruluğunu ve doğruluğunu umursamadan bir şeyler uydurur.

Sohbet etmek saçma olabilir ama otomatik sürüş olamaz. Herhangi bir yanlış çıktının sonucu ölümcül olabilir.

Yu Kai, "ChatGPT büyük ilerleme kaydetti, ancak otomatik sürüş henüz gelmedi, çünkü otomatik sürüş, özellikle insansız sürüş, sıfır hata tolerans oranına sahip olabilir ki bu bir insan hayatı meselesidir." dedi Yu Kai.

Bir zamanlar Silikon Vadisi'ndeki bir yapay zeka şirketinin COO'su olarak görev yapan Long Zhiyong, büyük modellerin ticarileştirilmesine yönelik en büyük tehditlerin kontrol edilemez, öngörülemez ve güvenilmez olduğuna inanıyor. Tipik bir tezahür, büyük modelin halüsinasyon eğilimi göstermesidir.

Artık otomatik sürüş sisteminin seçmeyi ve ayırt etmeyi öğrenmesi ve optimal çözümü kararlı bir şekilde çıkarması gerçekçi değil.

Bir yapay zeka şirketinin içinden bir kaynak, Shentu'ya şunları söyledi: "Görsel algıda algoritma düzeyinde gerçekten çok sayıda atılım var. Ancak araba sahnesi çok talepkar. Kişisel olarak kısa vadede büyük bir atılım olacağını düşünmüyorum. .Sla'nın özel hareketlerine dikkat edebilirsiniz."

Bununla birlikte, son zamanlarda teknoloji çemberinde büyük ve küçük şirketlerin GPT'nin sıcak noktalarına bir göz atmak istedikleri bir eğilim var. Bazı araba üreticileri, GPT benzeri bir teknolojiyi uygulamak üzere olduklarını açıkladılar ve bir dizi harika konsept, insanların kafasını karıştırıyor.

Örneğin, geleneksel bir otomobil şirketine bağlı bir otonom sürüş şirketi, otonom sürüşü eğitmek için bu modeli kullanmak üzere "sektörde ilk" olarak adlandırılan, otonom sürüş için büyük bir üretken model yayınladı.

Akıllı araba parkuruna uzun süredir dikkat eden bir yatırımcı, bir sektör liderine model hakkında ne düşündüğünü sorduğunda, karşı taraf dört kelimeyle yanıt verdi: "TM saçmalığı."

"Bu sadece bir halkla ilişkiler eylemi." Yatırımcı, Shentu hakkında yorum yaptı.

Otonom sürüş, devrilip yeniden mi başlayacak?

Tesla tarafından yönlendirilen ve bu yıl ortaya çıkan AI dalgasıyla birleşen otonom sürüş endüstrisi, yavaş yavaş büyük modellerin, büyük bilgi işlem gücünün ve büyük verilerin yönüne yaklaşıyor.

Büyük modellerin otonom sürüş üzerindeki etkisi henüz yeterince şiddetli değil, ancak keskin bir koku alma duyusuna sahip insanlar bir kararsızlık gösterdi.

Tıpkı Tesla'nın çok kameralı verileri görüntü alanından BEV alanına dönüştürmek için Transformer'ı kullandığında olduğu gibi, orijinal mimariyi yıkmaktan ve algoritmayı yeniden yazmaktan çekinmedi. Artık büyük modellerin uygulanması, orijinal otomatik sürüş algoritmasının devrileceği ve yeniden başlatılacağı anlamına da gelebilir.

He Zhiqiang, büyük modellerin otonom sürüş üzerinde büyük bir etkisi olacağına inanıyor. Geçmişte otonom sürüş için pek çok küçük model kullanılırken, artık büyük bir model haline geldi ve her şeyi yeniden yapmak gerekebilir. Otonom sürüş endüstrisi yeniden şekillenecek.

Bir AI çip şirketinde otonom sürüş direktörü Zhao Dongxiang, Shentu'ya uçtan uca genel değişikliğin her şeyi yeniden yapmakla eşdeğer olduğunu söyledi.

Karışıklık, yeni girenler için bir fırsat ve liderler için bir tehdittir. Bir virajda sollama hikayesi genellikle hızlı bir teknolojik değişim döneminde gerçekleşir. Hızlı teknoloji çağında, eski rotaya ne kadar çok yatırım yapılırsa, batık maliyet o kadar yüksek olabilir ve geri dönüş o kadar zor olabilir. OEM'ler veya otonom sürüş şirketleri için yeni bir teknolojiyi benimsemek için sadece etki değil, aynı zamanda maliyet de dikkate alınmalıdır.

Zhao Dongxiang, mevcut aşama söz konusu olduğunda, otomatik sürüşün teknik rotasını değiştirmenin anlamsız olduğunu söyledi: "Artık endüstrinin teknik yetenekleri fena değil. Herkes çok para harcadı ve bunu çok uzun süredir yaptı. önemli bir gelişme yok, değişmek için bir motivasyon yok."

Geçen yılın sonunda AI DAY'de Tesla, BEV'yi bir doluluk ağına (doluluk ağı) yükseltti ve genelleme yeteneği daha da geliştirildi. Ağı işgal ederek, Tesla'nın otopilot algılama sistemi, gördüğü nesneyi bilmeden ondan kaçınması gerekip gerekmediğine karar verebilir, böylece daha uzun kuyruklu sorunları çözebilir.

Nasıl bir teknik rota olursa olsun, artık hızlı değişimler ve iterasyonlar yaşıyor. Geçmişteki küçük modellerin yerini büyük modeller alabilir ve bugünün büyük modellerinin yerini gelecekte bazı yeni türler alabilir.

Ancak her halükarda, sıcak noktaları ovma ve numara yapma pratiği teknolojik ilerlemeye elverişli değildir. Zhao Dongxiang, "Sıcaklığı takip etmek kötü bir alışkanlıktır ve ürünleri gerçekçi bir şekilde yapmak faydalıdır." Dedi.

Otonom sürüşün gerçek "kral bombası" gelmekten çok uzak. Yapmamız gereken, teknolojik değişimin her aşamasına hayranlıkla bakmaktır. Efsanevi GPT hayalinizdeki arabayı yapamaz ama en azından değişiklikler oldu.

View Original
The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
  • Pin