Bên cạnh AI Agents, robot hiện thân đang là một kịch bản ứng dụng trọng điểm trong thời đại AI. Báo cáo của Morgan Stanley dự đoán thị trường robot hình người toàn cầu có thể vượt 5.000 tỷ USD vào năm 2050.
Với sự phát triển của AI, robot ngày càng được chuyển đổi từ cánh tay máy trong nhà xưởng sang vai trò bạn đồng hành trong cuộc sống hằng ngày, nhờ khả năng cảm nhận và phân tích bằng trí tuệ nhân tạo, thậm chí có thể tự ra quyết định. Trở ngại lớn hiện nay là robot thiếu chuẩn giao tiếp: mỗi nhà sản xuất lại dùng ngôn ngữ và logic riêng, phần mềm không tương thích, trí tuệ không thể chia sẻ. Khó khăn này có thể hình dung như bạn có xe của hai hãng khác nhau, ví dụ một xe thường và một xe Tesla, nhưng chúng không thể cùng đánh giá điều kiện đường xá hay phối hợp thực hiện công việc chung.
OpenMind đặt mục tiêu khắc phục tình trạng phân mảnh đó. Họ không sản xuất robot mà xây dựng một hệ thống hợp tác, nơi các robot dùng chung ngôn ngữ, tuân thủ quy tắc phổ quát và cùng thực hiện nhiệm vụ. Tương tự như iOS và Android thúc đẩy bùng nổ ứng dụng di động, Ethereum mở nền tảng chung cho ngành tiền mã hóa, OpenMind hướng tới kiến tạo một “hệ điều hành” và “mạng lưới hợp tác” thống nhất cho robot toàn cầu.
Tóm lại, OpenMind đang xây dựng hệ điều hành phổ quát cho robot, giúp chúng không chỉ nhận biết và hành động mà còn phối hợp an toàn, quy mô lớn trong mọi môi trường thông qua cơ chế điều phối phi tập trung.
OpenMind đã huy động được 20 triệu USD từ vòng seed và Series A do Pantera Capital dẫn đầu. Đáng chú ý, sự đa dạng và tính bổ trợ của nguồn vốn này đã tập hợp gần đủ các mắt xích quan trọng trong lĩnh vực: một bên là dòng lực dài hạn từ hệ sinh thái công nghệ, tài chính phương Tây—Ribbit, Coinbase Ventures, DCG, Lightspeed Faction, Anagram, Pi Network Ventures, Topology, Primitive Ventures—hiểu rõ sự chuyển dịch mô hình trong lĩnh vực crypto và hạ tầng AI, đồng thời cung cấp chuyên môn về mô hình, mạng lưới và tuân thủ cho “nền kinh tế agent + internet máy móc”; bên còn lại là động lực công nghiệp phương Đông—nổi bật với chuỗi cung ứng và sản xuất của Sequoia China—am hiểu sâu sắc những ngưỡng kỹ thuật và chi phí để chuyển mẫu thử thành sản phẩm đại trà. Sự phối hợp này mang lại cho OpenMind không chỉ nguồn vốn mà cả lộ trình và nguồn lực “từ phòng thí nghiệm tới dây chuyền sản xuất, từ phần mềm đến công đoạn chế tạo phần cứng.”
Lộ trình này cũng đồng bộ với thị trường vốn truyền thống. Tháng 6/2025, khi KraneShares ra mắt ETF Chỉ số Robot Hình người & Trí tuệ Hiện thân Toàn cầu (KOID), họ đã chọn Iris—robot hình người do OpenMind và RoboStore hợp tác tùy chỉnh—thực hiện nghi thức rung chuông khai mạc trên NASDAQ, trở thành “khách mời robot” đầu tiên thực hiện nghi lễ này trong lịch sử sàn giao dịch. Đây vừa là sự kiện chứng minh tính đồng bộ giữa công nghệ và tài chính, vừa là tín hiệu thị trường về “cách thức định giá và thanh toán tài sản máy móc.”
Ông Nihal Maunder, đối tác của Pantera Capital, chia sẻ:
“Nếu muốn máy thông minh hoạt động trong môi trường mở, cần có mạng lưới trí tuệ mở. OpenMind đang làm với robot điều Linux từng làm với phần mềm và Ethereum với blockchain.”
Nhà sáng lập OpenMind, Jan Liphardt, là Phó Giáo sư Đại học Stanford, nguyên giảng viên Berkeley, chuyên gia nghiên cứu dữ liệu và hệ thống phân tán, có nền tảng vững vàng cả về học thuật lẫn kỹ thuật. Ông cổ vũ việc sử dụng mã nguồn mở, thay thế hệ thống độc quyền bằng các cơ chế kiểm toán và truy xuất, và phối hợp đa ngành giữa AI, robot và mật mã học.
Đội ngũ cốt lõi của OpenMind đến từ OKX Ventures, Viện Robot Oxford, Palantir, Databricks và Perplexity, bao quát các mảng chủ chốt như điều khiển robot, nhận thức và điều hướng, điều phối đa mô hình và LLM, hệ phân tán và giao thức on-chain. Ngoài ra, nhóm cố vấn gồm các chuyên gia học thuật và công nghiệp danh tiếng (gồm trưởng nhóm robot Stanford Steve Cousins, Giám đốc Trung tâm Blockchain Oxford Bill Roscoe, Giáo sư AI bảo mật của Imperial College Alessio Lomuscio) đảm bảo robot đạt chuẩn “an toàn, tuân thủ và đáng tin cậy.”
OpenMind đã xây dựng hạ tầng có thể tái sử dụng, giúp robot phối hợp và truyền thông xuyên thiết bị, nhà sản xuất thậm chí quốc gia:
Thiết bị: Trang bị hệ điều hành AI-native OM1 cho robot vật lý, kết nối toàn bộ chu trình từ nhận thức đến hành động, giúp các loại máy hiểu môi trường và hoàn thành nhiệm vụ;
Mạng lưới: Xây dựng mạng phi tập trung FABRIC, cung cấp cơ chế nhận diện, phân bổ nhiệm vụ và giao tiếp, đảm bảo robot nhận biết lẫn nhau, chia việc và chia sẻ trạng thái khi phối hợp.
Sự kết hợp “hệ điều hành + lớp mạng” này cho phép robot không chỉ vận hành độc lập mà còn phối hợp, đồng bộ quy trình và giải quyết các nhiệm vụ phức tạp trong một mạng lưới hợp tác chung.
Như điện thoại thông minh cần iOS hay Android để chạy ứng dụng, robot cũng cần hệ điều hành để vận hành mô hình AI, xử lý dữ liệu cảm biến, đưa ra quyết định và thực hiện hành động.
OM1 là hệ điều hành AI-native dành cho robot thực, giúp chúng cảm nhận, hiểu, lập kế hoạch và hoàn thành nhiệm vụ ở nhiều môi trường. Khác với hệ điều hành robot truyền thống đóng kín, OM1 mã nguồn mở, mô-đun hóa, không phụ thuộc phần cứng, có thể triển khai đa dạng từ robot hình người, robot bốn chân, bánh xe đến cánh tay robot.
OM1 chuẩn hóa trí tuệ robot thành bốn bước phổ quát: Nhận thức → Ghi nhớ → Lập kế hoạch → Hành động. Quá trình này được OM1 mô-đun hóa hoàn toàn, kết nối bằng ngôn ngữ dữ liệu thống nhất, tạo khả năng lắp ghép, thay thế, kiểm tra trí tuệ.
Kiến trúc OM1
Chi tiết, kiến trúc 7 lớp của OM1 gồm:
Lớp cảm biến: thu thập thông tin từ camera, LIDAR, micro, pin, GPS và các nguồn cảm nhận đa mô hình.
Lớp AI + Mô tả thế giới: chuyển đổi dữ liệu sang mô tả ngôn ngữ tự nhiên bằng mô hình đa mô hình (ví dụ: “Bạn thấy một người vẫy tay”).
Bus Dữ liệu Ngôn ngữ Tự nhiên (NLDB): truyền tải các đoạn thông tin gắn thời gian giữa các module.
Bộ hợp nhất dữ liệu: tổng hợp dữ liệu đa nguồn tạo bối cảnh hoàn chỉnh phục vụ quyết định.
Lớp hoạch định/quyết định đa AI: nhiều LLM cùng đọc bối cảnh, tạo kế hoạch hành động tích hợp quy tắc on-chain.
Kênh NLDB đầu ra: chuyển kết quả quyết định về hệ thống phần cứng qua lớp ngôn ngữ trung gian.
Lớp trừu tượng hóa phần cứng: chuyển hóa hướng dẫn ngôn ngữ thành lệnh kiểm soát phần cứng (di chuyển, phát âm, giao dịch…).
Để biến “ý tưởng” thành “tác vụ robot có thể thực hiện” một cách nhanh chóng, OM1 xây dựng quy trình phát triển sẵn sàng sử dụng: lập trình viên có thể xác định mục tiêu và giới hạn trực tiếp bằng ngôn ngữ tự nhiên với mô hình lớn, tạo bộ kỹ năng tái sử dụng chỉ sau vài giờ thay vì mất hàng tháng viết code; pipeline đa mô hình kết nối sẵn LiDAR, camera, micro, loại bỏ việc viết mã hợp nhất cảm biến; tích hợp các mô hình như GPT-4o, DeepSeek, VLMs giúp nhập xuất giọng nói tức thì; toàn hệ thống tương thích ROS2, Cyclone DDS, tích hợp liền mạch với Unitree G1, Go2, Turtlebot, đa dạng cánh tay robot qua lớp trừu tượng hóa phần cứng; kết nối trực tiếp với FABRIC về nhận diện, điều phối nhiệm vụ, thanh toán on-chain, giúp robot hoạt động độc lập hoặc gia nhập mạng toàn cầu với cơ chế trả phí dùng và kiểm toán.
OM1 đã được chứng thực ở nhiều kịch bản thực tế: nền tảng bốn chân Frenchie (Unitree Go2) hoàn thành nhiệm vụ phức tạp tại Triển lãm Công nghệ Quốc phòng USS Hornet 2024; nền tảng hình người Iris (Unitree G1) dẫn dắt tương tác người-máy tại gian hàng Coinbase tại EthDenver 2025; thông qua giáo án của RoboStore (nhà phân phối lớn của Unitree tại Mỹ), OM1 được triển khai vào giáo trình đại học Mỹ, mở rộng mô hình này đến các cơ sở giáo dục, nghiên cứu thực tiễn.
Dù sở hữu trí tuệ độc lập mạnh mẽ, robot vẫn sẽ cô lập nếu thiếu nền tảng hợp tác tin cậy. Sự phân mảnh thực tế xuất phát từ ba vấn đề: danh tính và vị trí chưa chuẩn hóa xác thực nên bên ngoài khó tin “tôi là ai, ở đâu, làm gì”; kỹ năng và dữ liệu thiếu quy trình cấp quyền kiểm soát để chia sẻ/gọi chung giữa nhiều chủ thể; quyền kiểm soát, ranh giới trách nhiệm mơ hồ, các thông số, phạm vi phân quyền và cơ chế xác thực khó thống nhất trước hoặc truy xuất sau. FABRIC xử lý triệt để các điểm nghẽn này: dùng giao thức phi tập trung tạo danh tính on-chain xác thực cho robot, vận hành viên; cung cấp hạ tầng tích hợp đăng tải/match nhiệm vụ, giao tiếp mã hóa đầu-cuối, ghi nhận thực thi và tự động thanh toán quanh danh tính này, biến hợp tác từ “kết nối ngắn hạn” thành “thể chế có hồ sơ lưu trữ.”
Trong vận hành, FABRIC đóng vai trò lớp mạng tích hợp “định vị, kết nối, điều phối”: danh tính, vị trí luôn được ký xác thực, node thiết lập quan hệ ngang hàng minh bạch, tin cậy; kênh point-to-point như tunnel mã hóa tùy nhu cầu, điều khiển giám sát từ xa không cần IP công cộng hay cấu hình mạng phức tạp; toàn bộ quy trình từ đăng tải nhiệm vụ đến nhận, thực hiện, xác minh được chuẩn hóa, ghi nhận, hỗ trợ chia lợi nhuận/tái hoàn tự động khi thanh toán, đồng thời xác minh “ai làm gì, khi nào, ở đâu” cho các trường hợp kiểm toán, bảo hiểm. Nhiều ứng dụng nảy sinh: doanh nghiệp duy trì thiết bị từ xa, thành phố vận hành dịch vụ vệ sinh, kiểm tra, giao nhận quy mô Robot-as-a-Service, đội xe thông báo tình trạng đường xá, vật cản theo thời gian thực tạo bản đồ chia sẻ; khi cần có thể điều động robot gần nhất quét 3D, khảo sát công trình, thu thập chứng cứ bảo hiểm.
Khi danh tính, nhiệm vụ, thanh toán quản lý trên cùng mạng, ranh giới hợp tác rõ ngay từ đầu, sự kiện thực thi xác minh sau, chi phí/lợi ích gọi kỹ năng đo được. Về lâu dài, FABRIC sẽ phát triển thành “lớp phân phối ứng dụng” cho trí tuệ máy: kỹ năng lưu chuyển toàn cầu theo điều khoản cấp quyền lập trình, dữ liệu phát sinh từ gọi kỹ năng phản hồi về mô hình, chiến lược, giúp toàn bộ mạng hợp tác tự nâng cấp liên tục trong khuôn khổ minh bạch, đáng tin.
Ngành robot đang nhanh chóng hội tụ về các nền tảng lớn, phần cứng, thuật toán, mạng lưới đều bị khóa trong các tầng đóng kín. Phi tập trung có giá trị ở việc cho phép robot mọi thương hiệu, vùng miền hợp tác, trao đổi kỹ năng, giải quyết thanh toán trên cùng một mạng mở mà không phụ thuộc nhà cung cấp duy nhất. OpenMind hiện thực hóa trật tự này qua hạ tầng on-chain: mỗi robot, vận hành viên sở hữu danh tính on-chain độc nhất (ERC-7777, chuẩn nhận diện), kèm vân tay phần cứng và quyền hạn xác thực; nhiệm vụ được đăng tải, đấu giá, match theo quy tắc công khai, sinh bằng chứng mã hóa on-chain gắn mốc thời gian, vị trí khi thực thi; hợp đồng tự động thanh toán lợi nhuận, bảo hiểm, tiền cọc sau khi hoàn tất nhiệm vụ, kết quả xác thực thời gian thực; kỹ năng mới thiết lập số lượt gọi và thiết bị tương thích qua hợp đồng, vừa lưu chuyển toàn cầu vừa bảo vệ sở hữu trí tuệ. Nhờ đó, kinh tế robot vốn mang “gen” chống độc quyền, lắp ghép và kiểm toán ngay từ đầu, với tính mở được viết vào giao thức nền tảng của xã hội máy móc.
Robot đang chuyển từ sân khấu triển lãm vào đời sống thường nhật: giám sát phòng bệnh, học kỹ năng mới tại trường, kiểm tra và đo đạc đô thị. Thách thức cốt lõi không phải động cơ mạnh hơn mà là làm sao để máy móc nguồn gốc khác nhau tin tưởng hợp tác, trao đổi thông tin và phối hợp; ngoài công nghệ, phân phối và cung ứng còn quan trọng với khả năng mở rộng quy mô.
OpenMind triển khai với trọng tâm kênh phân phối thay vì tích lũy tham số. Hợp tác cùng RoboStore—một trong các nhà phân phối lớn nhất của Unitree tại Mỹ—họ đưa OM1 thành chuẩn giáo trình, bộ thí nghiệm, đồng bộ cung ứng phần cứng, phần mềm cho hàng nghìn trường đại học Mỹ. Giáo dục là bên cầu ổn định nhất, trực tiếp tích hợp OM1 vào pipeline phát triển lập trình viên, ứng dụng cho nhiều năm tới.
Với nhu cầu xã hội rộng hơn, OpenMind tận dụng hệ sinh thái nhà đầu tư tạo kênh “xuất khẩu phần mềm trên nền tảng.” Các hệ sinh thái crypto như Pi thúc đẩy mô hình này phát triển, hình thành hệ sinh thái nhà phát triển, người dùng, khách hàng trả phí. Nhờ kênh giáo dục duy trì cung ứng ổn định, kênh nền tảng mở rộng quy mô, OM1 cùng lớp ứng dụng phía trên có quỹ đạo mở rộng nhân bản.
Kỷ nguyên Web2, robot thường bị khóa bởi các stack đóng của từng hãng, chức năng, dữ liệu không thể lưu chuyển qua nền tảng; khi kết nối chuẩn giáo trình theo luồng phân phối, OpenMind lấy mở làm mặc định: một hệ thống duy nhất vào trường, chuyển đổi sang công nghiệp, lan tỏa liên tục qua mạng lưới nền tảng, giúp mở trở thành điểm xuất phát tiêu chuẩn cho triển khai quy mô.