GPT huyền thoại không thể chế tạo chiếc xe mơ ước của bạn

Sau sự bùng nổ của ChatGPT, mô hình AI trở thành điểm nóng được nhiều hãng công nghệ theo đuổi. Từ các cuộc trò chuyện trò chuyện, tạo hình ảnh, đến văn phòng trên máy tính để bàn, dường như AI có sức mạnh siêu nhiên để lật đổ mọi thứ chỉ sau một đêm.

Cơn sốt lan sang ngành công nghiệp ô tô và các học viên bắt đầu suy nghĩ: Liệu có khả thi để GPT sản xuất ô tô không?

Một số hãng ô tô tuyên bố sẽ áp dụng công nghệ mô hình lớn, trong khi một số khác cho biết họ sẽ tiếp cận các mô hình lớn của bên thứ ba, và một số hãng ô tô đã vội vã tung ra hệ thống lái xe tự động có chữ GPT.

Một số học viên nói với Shentu rằng buồng lái thông minh và lái xe tự động có thể là kịch bản ứng dụng đầu tiên của các mẫu xe lớn. Trong số đó, lái xe tự động được mong đợi nhất.

Lái xe tự hành là một ca khúc cực kỳ khó khăn. Ngoài những gã khổng lồ công nghệ như Google và Baidu, một số lượng lớn các doanh nhân tài năng đã cống hiến hết mình và đốt hàng tỷ đô la, nhưng cho đến nay họ vẫn chưa đạt được kết quả khả quan.

Mô hình lớn AI tham gia lái xe tự động, lần này sẽ khác?

Mối quan hệ giữa GPT và ô tô là bao nhiêu?

Bề ngoài, GPT không có mối quan hệ trực tiếp với ô tô, nhưng trên thực tế nó có mối quan hệ sâu sắc. Câu chuyện phải bắt đầu từ sáu năm trước.

Vào tháng 6 năm 2017, Musk, ông chủ của Tesla, đã chiêu mộ một nhà nghiên cứu người Slovakia từ OpenAI. Người đàn ông đó là Andrej Karpathy, người sau này trở thành giám đốc AI của Tesla.

Khi đó, Musk tỏ ra rất hứng thú với trí tuệ nhân tạo và ông cũng là một trong những người sáng lập ra OpenAI. Ngay sau khi tuyển dụng Andrej Karpathy, Musk đã rời khỏi ban giám đốc OpenAI, ông tin rằng cả Tesla và OpenAI đều đang nghiên cứu về AI và có thể xảy ra xung đột lợi ích trong tương lai.

Sau đó, Andrej Karpathy đã viết lại thuật toán lái tự động trong Tesla và phát triển công nghệ nhận thức trực quan thuần túy BEV, đưa chế độ lái tự động của Tesla sang một giai đoạn mới. Và chủ sở hữu cũ của nó, OpenAI, đã đặt cược tất cả vào trí tuệ nhân tạo nói chung và cuối cùng đã phát triển GPT.

Từ góc độ sản phẩm, GPT của OpenAI và BEV của Tesla là hai loài hoàn toàn khác nhau. Nhưng từ góc độ công nghệ nền tảng, tất cả đều dựa vào công nghệ trí tuệ nhân tạo, đặc biệt là việc áp dụng mô hình Google Transformer.

Transformer là một kiến trúc mạng thần kinh học sâu được đề xuất bởi 8 nhà khoa học AI của Google vào năm 2017. Đây là một phát minh cực kỳ quan trọng trong ngành trí tuệ nhân tạo Chữ "T" trong ChatGPT phổ biến hiện nay ám chỉ mẫu Transformer.

Khác với mạng thần kinh RNN và CNN truyền thống, Transformer sử dụng cơ chế tự chú ý để khai thác kết nối và mối tương quan của các phần tử khác nhau trong chuỗi và có khả năng xử lý dữ liệu chuỗi thời gian tốt. Điều này cho phép nó thể hiện hiệu suất vượt trội trong các tác vụ như dịch máy, tóm tắt văn bản và hệ thống trả lời câu hỏi.

Do đó, Transformer lần đầu tiên được sử dụng trong lĩnh vực NLP (xử lý ngôn ngữ tự nhiên nâng cao) để hiểu văn bản và ngôn ngữ của con người.

Đào tạo trước trên mô hình Transformer, sau khi tinh chỉnh và lặp đi lặp lại liên tục, OpenAI đã liên tiếp ra mắt các mô hình đào tạo ngôn ngữ lớn như GPT-1, GPT-2, GPT-3 và GPT-4. ChatGPT là robot đối thoại do OpenAI phát triển sau khi tinh chỉnh mô hình GPT-3. Bởi vì nó có thể tương tác theo cách đàm thoại, người bình thường dễ sử dụng và nó "thông minh" hơn so với chatbot trong quá khứ, vì vậy nó đã tỏa sáng.

Về cơ bản, mô hình GPT của ChatGPT, mô hình LaMDA của Google và mô hình Wenxin của Baidu đều có chung nguồn gốc.

Sử dụng mô hình Transformer cho ngôn ngữ tự nhiên đã cho ra đời các ứng dụng trò chuyện như ChatGPT, sử dụng nó trong thị giác máy tính cũng đạt được những kết quả đáng kinh ngạc, tiên phong trong lĩnh vực này là Tesla.

Andrej Karpathy chịu trách nhiệm lãnh đạo nhóm thị giác máy tính cho lái xe tự động trong nhiệm kỳ của ông với tư cách là giám đốc AI của Tesla. Bằng cách kết hợp mô hình Transformer, Tesla đã phát triển thành công công nghệ BEV.

Tên đầy đủ của BEV là Bird's Eye View, là góc nhìn từ trên cao của một chú chim. Nó có thể chuyển đổi hình ảnh 2D do máy ảnh chụp thành hình ảnh 3D bằng cách ghép nối và chuyển đổi đồng nhất chúng thành góc nhìn để xử lý, tạo thành "góc nhìn của Chúa". Lý do cho điều này là việc lái xe được thực hiện trong không gian ba chiều và những gì mọi người nhìn thấy là thế giới ba chiều chứ không phải hình ảnh 2D.

Giải pháp nhận thức hoàn toàn mới này sẽ được trình diễn bởi Andrej Karpathy vào NGÀY AI của Tesla vào tháng 8 năm 2021. Vì lý do này, Tesla đã không ngần ngại viết lại thuật toán lái tự động và xây dựng lại cơ sở hạ tầng để đào tạo mạng lưới thần kinh sâu.

Đây là lần đầu tiên công nghệ mô hình lớn được áp dụng cho ngành công nghiệp lái xe tự hành.

Ngày nay nhìn lại, mặc dù GPT hiện chủ yếu được sử dụng trong lĩnh vực xử lý ngôn ngữ tự nhiên, chúng ta không thể để GPT lái ô tô, nhưng công nghệ mô hình lớn AI đằng sau nó, đặc biệt là kiến trúc Transformer, đã thực sự lái xe tự động. lĩnh vực được áp dụng.

Từ xử lý ngôn ngữ tự nhiên đến thị giác máy tính, hai lĩnh vực đã thống nhất cấu trúc mô hình hóa dựa trên kiến trúc Transformer, giúp việc lập mô hình chung trở nên dễ dàng hơn.

Và khi sự hiểu biết về AI ngày càng sâu sắc, các công ty xe hơi ngày càng trở nên giống các công ty trí tuệ nhân tạo. Ngoài Tesla, Li Auto đã công bố tầm nhìn của công ty vào đầu năm nay, tuyên bố sẽ trở thành công ty trí tuệ nhân tạo vào năm 2030. Nó sẽ ra mắt hệ thống lái xe hỗ trợ điều hướng NOA đô thị trong năm nay và hỗ trợ kỹ thuật là nhận thức BEV và mô hình Transformer.

Dường như không có sự khác biệt giữa việc để AI nói chuyện với con người và để AI lái ô tô, ngoại trừ kịch bản hạ cánh của cả hai là khác nhau. Con người luôn tràn đầy trí tưởng tượng khi áp dụng công nghệ cơ bản vào các sản phẩm cụ thể.

GPT dạy những điều đó về lái xe số tự động

Kể từ đầu năm nay, những khả năng mạnh mẽ mà GPT thể hiện đã gây chấn động thế giới bên ngoài. Trí tuệ nhân tạo nói chung không còn là một lâu đài trên không. Những người trong ngành công nghiệp lái xe tự hành bắt đầu nghĩ rằng có thể ứng dụng AI tổng quát trên các mô hình ngôn ngữ có thể được chuyển sang lái xe tự động.

Về cơ bản, một mô hình ngôn ngữ là một mô hình toán học của ngôn ngữ con người. Máy tính vẫn chưa hiểu ngôn ngữ tự nhiên, nhưng nó biến các vấn đề ngôn ngữ thành các vấn đề toán học thông qua mô hình toán học. Ngôn ngữ tự nhiên được hiểu một cách gián tiếp bằng cách dự đoán xác suất xuất hiện của từ tiếp theo trong lịch sử của một văn bản nhất định.

Chuyển sang cảnh lái xe, với môi trường giao thông hiện tại, bản đồ điều hướng và lịch sử hành vi lái xe của người lái xe, liệu mô hình lớn có thể dự đoán hành động lái xe tiếp theo không?

Yu Kai, người sáng lập Horizon, cho biết tại Diễn đàn 100 Xe điện được tổ chức vào tháng 4 năm nay rằng ChatGPT đã truyền cảm hứng cho anh ấy rất nhiều, "Chúng tôi sẽ tiếp tục sử dụng dữ liệu lớn, dữ liệu lớn hơn, mô hình lớn hơn và học tập không giám sát. Con người sẽ cố gắng lái xe, giống như bạn học từ một lượng lớn văn bản tự nhiên không được giám sát và không được gắn nhãn." Ông lập luận rằng trình tự điều khiển lái xe của mỗi người lái xe giống như các văn bản ngôn ngữ tự nhiên của chúng ta. Tiếp theo, anh ấy muốn xây dựng một mô hình ngôn ngữ lớn quay trở lại chế độ lái tự động.

Về lý thuyết, ý tưởng này là khả thi. AI đã có khả năng học hỏi. Theo mô hình ngôn ngữ thích ứng, máy sẽ tiếp tục tối ưu hóa lặp đi lặp lại theo phản hồi của người dùng, tìm hiểu thói quen của người dùng và sau đó cải thiện mô hình. ChatGPT hiện tại sử dụng công nghệ này. Sau đó, không khó để cỗ máy học thói quen lái xe của tài xế.

Chế độ bóng tối của Tesla là cung cấp dữ liệu lái xe của những người lái xe thực cho máy học. Mục đích của việc đào tạo thuật toán đạt được bằng cách so sánh hành vi của người lái xe.

Sau khi GPT bắt đầu một đợt bùng nổ AI mới, một tác động nhận thức đối với ngành là bằng cách tăng quy mô tham số của mô hình, lượng dữ liệu sẽ tăng theo cấp số nhân, được gọi là mô hình lớn. , Người mẫu có thể đột nhiên trở nên thông minh.

Trước đây, dữ liệu mà mô hình yêu cầu trong giai đoạn đào tạo được gắn nhãn thủ công. Lấy ví dụ về lái xe tự hành, trình dán nhãn dữ liệu sử dụng một số lượng lớn hình ảnh để dán nhãn và cho máy biết đâu là mèo, đâu là chó và có bao nhiêu loại mèo và chó. Người chú thích giống như người thầy của cỗ máy, dạy nó hiểu thế giới hết lần này đến lần khác.

Vấn đề là cái thầy không dạy thì cái máy vẫn không dạy được. Ví dụ điển hình là Tesla đã nhiều lần gặp tai nạn lái tự động, xe đâm vào xe tải lớn bị lật do máy không nhận diện được.

He Yuhua, đối tác sáng lập của Hegao Capital, đã đưa ra một ví dụ như vậy cho Shentu: Quảng Châu có những ngày mưa mùa hè thường xuyên và trong một số cảnh có ánh sáng mờ, sẽ có một số lượng lớn côn trùng bay trong không khí. Khi một chiếc ô tô chạy ngang qua, đèn chiếu vào và có thể có hàng ngàn con côn trùng bay đập vào phía trước ô tô. Trong trường hợp này, hệ thống nhận thức lái xe tự động của ô tô có thể nhầm nó với một bức tường.

Hệ thống lái xe tự động không thể xử lý hết các trường hợp góc cua (các tình huống cực đoan), đây là một khó khăn lớn trong quá trình phát triển của nó.

Những gì ChatGPT lấy là dữ liệu chưa được đánh dấu của toàn bộ mạng. Trong học tự giám sát, bản thân dữ liệu được sử dụng làm tín hiệu giám sát, thay vì dựa vào các nhãn do con người dán nhãn. Một ngày nọ, mọi người phát hiện ra rằng trong quá trình xử lý những dữ liệu này, mô hình lớn đột nhiên có khả năng suy ra các trường hợp khác từ một trường hợp.

Vì vậy, nếu những mẫu xe tự lái phân khối lớn cũng có thể học hành vi lái xe của con người mà không cần giám sát, không cần “thầy” dạy thì phải chăng hệ thống đã đột ngột chuyển thành “lái già”?

GPT "lái xe", không đáng tin cậy

Ước mơ thì đẹp đẽ, và con đường thực hiện chúng thì luôn rất chông gai.

Để một mô hình AI tương tự như ChatGPT phát huy sức mạnh của mình trong lĩnh vực lái xe tự hành, hiện tại ít nhất cần phải giải quyết các vấn đề sau.

Đầu tiên là nguồn dữ liệu.

Nguồn dữ liệu của ChatGPT rất phong phú, bao gồm Wikipedia, sách, tin bài, tạp chí khoa học, v.v., tương đương với nguồn dữ liệu công khai của toàn mạng làm nguồn nuôi dưỡng nó.

Lái xe tự động là khác nhau. Dữ liệu lái xe của người lái xe và dữ liệu điều khiển phương tiện không được tiết lộ và nhiều dữ liệu trong số đó liên quan đến quyền riêng tư. Các nhà sản xuất ô tô và công ty xe tự lái hoạt động độc lập, dữ liệu đóng và không lưu thông nên rất khó lấy dữ liệu. Không có dữ liệu, lái xe tự động là nước không có nguồn.

He Zhiqiang, chủ tịch của Lenovo Venture Capital, nói với Shentu rằng cốt lõi của lái xe tự hành là phải có dữ liệu và dữ liệu rất quan trọng đối với các mô hình đào tạo. Các OEM như BYD có dữ liệu, nhưng thuật toán của họ vẫn cần được tinh chỉnh, các nhà sản xuất ô tô mới như "Wei Xiaoli" giỏi thuật toán nhưng doanh số bán ô tô của họ không đủ. Các công ty có cả dữ liệu và thuật toán có thể tận dụng tối đa các mô hình lớn.

Thứ hai là phương pháp triển khai điện toán của hệ thống bị hạn chế.

Yu Kai tin rằng OpenAI và ChatGPT là điện toán đám mây, có đủ nguồn cung cấp năng lượng, cung cấp năng lượng và hệ thống rất tốt, nhưng nếu ô tô dựa vào pin và khả năng tản nhiệt của ô tô thì đây là thách thức rất lớn , có nghĩa là lái xe số tự động không thể sử dụng một mô hình lớn và tính toán lớn như vậy.

Việc tiêu thụ sức mạnh tính toán của các mô hình lớn đã khiến các nhà sản xuất điện toán đám mây trở thành nhóm người chơi đầu tiên được hưởng cổ tức trong làn sóng bùng nổ AI này. Việc các công ty lớn phát triển điện toán đám mây cũng mở đường cho các mô hình lớn. Nhưng về phần cuối của ô tô, đây sẽ là một mâu thuẫn.

Một vấn đề lớn hơn là độ tin cậy của các mô hình lớn chưa được kiểm chứng.

Những ai đã từng sử dụng ChatGPT đều biết rằng ChatGPT có lúc nói nhảm, có lúc đúng, có lúc sai. Điều này được biết đến trong ngành là xu hướng ảo giác, xu hướng tạo ra nội dung không có thật hoàn toàn không có nguồn gốc. Các mô hình lớn bịa đặt mà không quan tâm đến tính trung thực và chính xác của nó.

Trò chuyện có thể vô nghĩa, nhưng lái xe số tự động thì không. Kết quả của bất kỳ đầu ra sai có thể gây tử vong.

"ChatGPT đã đạt được tiến bộ lớn, nhưng lái xe tự động vẫn chưa đến, bởi vì lái xe tự động, đặc biệt là lái xe không người lái, có thể có tỷ lệ chịu lỗi bằng 0, đó là vấn đề của cuộc sống con người." Yu Kai nói.

Long Zhiyong, người từng là COO của một công ty khởi nghiệp AI ở Thung lũng Silicon, tin rằng không thể kiểm soát, không thể đoán trước và không đáng tin cậy là những mối đe dọa lớn nhất đối với việc thương mại hóa các mô hình lớn. Một biểu hiện điển hình là mô hình lớn có xu hướng ảo giác.

Giờ đây, việc hệ thống lái xe tự động học cách lựa chọn và phân biệt cũng như đưa ra giải pháp tối ưu một cách ổn định là không thực tế.

Người trong cuộc của một công ty trí tuệ nhân tạo nói với Shentu: "Thực sự có nhiều đột phá về nhận thức trực quan ở cấp độ thuật toán. Nhưng cảnh xe quá khắt khe. Cá nhân tôi không nghĩ sẽ có đột phá lớn trong thời gian ngắn .Bạn có thể chú ý đến chuyển động của Sla đặc biệt."

Tuy nhiên, gần đây trong giới công nghệ có một xu hướng là các công ty lớn nhỏ đều muốn xem xét các điểm nóng của GPT. Một số nhà sản xuất ô tô tuyên bố sắp áp dụng công nghệ giống GPT, cùng loạt concept hay ho khiến dân tình hoang mang.

Ví dụ: một công ty lái xe tự động trực thuộc một công ty ô tô truyền thống đã phát hành một mô hình lái xe tự động có sức sản xuất lớn, được gọi là "công ty đầu tiên trong ngành" sử dụng mô hình này để đào tạo lái xe tự động.

Một nhà đầu tư đã chú ý đến đường đua ô tô thông minh trong một thời gian dài đã hỏi một nhà lãnh đạo trong ngành rằng anh ta nghĩ gì về mô hình này, và bên kia trả lời bằng bốn từ: "TM vô nghĩa."

“Đó chỉ là một hành động PR.” Nhà đầu tư nhận xét về Shentu.

Lái xe tự hành, nó sẽ bị lật đổ và khởi động lại?

Được dẫn dắt bởi Tesla, cộng với làn sóng AI nổi lên trong năm nay, ngành công nghiệp xe tự lái đang dần tiến tới hướng mô hình lớn, sức mạnh tính toán lớn và dữ liệu lớn.

Tác động của các mẫu xe lớn đối với việc lái xe tự động vẫn chưa đủ mạnh, nhưng những người có khứu giác nhạy bén đã cho thấy sự mâu thuẫn.

Giống như khi Tesla sử dụng Transformer để chuyển đổi dữ liệu nhiều camera từ không gian hình ảnh sang không gian BEV, nó đã không ngần ngại lật đổ kiến trúc ban đầu và viết lại thuật toán. Việc áp dụng các mô hình lớn bây giờ cũng có thể có nghĩa là thuật toán lái xe tự động ban đầu sẽ bị lật đổ và khởi động lại.

He Zhiqiang tin rằng những mẫu xe cỡ lớn sẽ có tác động rất lớn đến việc lái xe tự hành. Trước đây, nhiều mẫu xe nhỏ được sử dụng để lái tự động, nhưng bây giờ nó đã trở thành một mẫu xe lớn và có thể cần phải làm lại từ đầu. Ngành công nghiệp lái xe tự hành sẽ được cải tổ lại.

Zhao Dongxiang, giám đốc lái xe tự động tại một công ty chip AI, nói với Shentu rằng sự thay đổi tổng thể từ đầu đến cuối tương đương với việc làm lại từ đầu.

Xáo trộn là cơ hội cho những người mới tham gia và là mối đe dọa cho các nhà lãnh đạo. Chuyện vượt ẩu ở khúc cua thường xảy ra trong thời kỳ công nghệ thay đổi chóng mặt. Trong thời đại công nghệ phát triển nhanh chóng, càng đầu tư nhiều vào lộ trình cũ, chi phí chìm có thể càng lớn và càng khó quay vòng. Đối với các OEM hoặc các công ty xe tự hành, để nắm bắt một công nghệ mới, không chỉ phải xem xét hiệu quả mà còn cả chi phí.

Zhao Dongxiang cho biết, đối với giai đoạn hiện tại, việc thay đổi lộ trình kỹ thuật của lái xe số tự động là vô nghĩa: "Bây giờ năng lực kỹ thuật của ngành không tệ. Mọi người đã bỏ ra rất nhiều tiền và làm việc đó trong thời gian dài. Nếu có không có cải thiện đáng kể, không có động lực để thay đổi."

Vào AI DAY vào cuối năm ngoái, Tesla đã nâng cấp BEV thành mạng chiếm chỗ (mạng chiếm dụng) và khả năng khái quát hóa được cải thiện hơn nữa. Bằng cách chiếm lĩnh mạng lưới, hệ thống nhận thức lái tự động của Tesla có thể phán đoán liệu nó có cần tránh hay không mà không cần biết đối tượng mà nó nhìn thấy là gì, do đó giải quyết được nhiều vấn đề dài hạn hơn.

Bất kể loại tuyến đường kỹ thuật nào, nó hiện đang trải qua những thay đổi và lặp đi lặp lại nhanh chóng. Các mô hình nhỏ trong quá khứ có thể được thay thế bằng các mô hình lớn và các mô hình lớn ngày nay cũng có thể được thay thế bằng một số loài mới trong tương lai.

Nhưng trong mọi trường hợp, việc xoa dịu các điểm nóng và làm mánh lới quảng cáo không có lợi cho tiến bộ công nghệ. "Chạy theo nhiệt là một thói quen xấu, và thật hữu ích khi tạo ra các sản phẩm theo cách thực tế." Zhao Dongxiang nói.

"Quả bom vua" thực sự của lái xe tự trị còn lâu mới xuất hiện. Những gì chúng ta cần làm là luôn kính sợ trước mọi vòng thay đổi của công nghệ. GPT huyền thoại không thể chế tạo chiếc xe mơ ước của bạn, nhưng ít nhất, những thay đổi đã diễn ra.

Xem bản gốc
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate.io
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)