التخزين، وليس السيليكون، سيؤدي إلى الاختراق التالي في الذكاء الاصطناعي

النقاش حول قوة معالجة الرسوميات هو أخبار قديمة. أولئك الذين سينجحون في المستقبل هم الذين يتقنون مكان وجود البيانات. مع استمرار انفجار إنشاء البيانات العالمية، ستبقى الشركات المتأخرة مغلقة عن المرحلة التالية من الابتكار.

ملخص

  • أحجام البيانات تتزايد بشكل هائل، مع توقع أن يتجاوز الإنتاج العالمي 200 زيتابايت بحلول نهاية 2025، وهو أكثر من جميع المخرجات البشرية السابقة مجتمعة.
  • التخزين السحابي المركزي هو عنق الزجاجة للذكاء الاصطناعي، مما يزيد التكاليف بنسبة تصل إلى 80% مع رسوم الخروج ويبطئ نقل البيانات على نطاق واسع إلى أيام.
  • توفر الشبكات التخزينية اللامركزية حلاً، حيث تقوم بتقسيم البيانات عبر العقد المستقلة وتضمين الأدلة التشفيرية لامتثال سجلات التدقيق الجاهزة.
  • تنظيم مثل قانون الذكاء الاصطناعي في الاتحاد الأوروبي يزيد من المخاطر، مما يجبر على إثبات مصدر البيانات—مما يجعل التخزين أولوية استراتيجية، وليس مجرد أداة خلفية.

من المتوقع أن يصل حجم إنشاء البيانات إلى 200 زيتابايت في جميع أنحاء العالم بحلول نهاية عام 2025؛ وهذا يكفي لبث كل فيلم تم إنتاجه على الإطلاق أكثر من 100 مليار مرة. تتضمن هذه التقديرات كمية أكبر من المواد الرقمية مما أنتجته البشرية في كل السنوات السابقة مجتمعة.

بالتزامن مع هذه الزيادة، كشفت فرق البحث عن أول نموذج لغوي يحتوي على تريليون معلمة تم إصداره للجمهور. هذا النموذج الضخم، الذي كانت مجموعة بيانات تدريبه وحدها ستملأ أرشيفات وطنية كاملة قبل عشر سنوات، هو مثال على مثل هذا الوحش الذي يستهلك بيتابايت في الساعة.

بدون أنابيب تخزين يمكنها استيعاب البيانات وتجهيزها وبثها بهذه المقاييس الجديدة، حتى أسرع المعالجات ستعاني من إحباط في حالة الخمول.

السحب المركزية هي عنق الزجاجة الجديد

لا تزال معظم المنظمات تعتمد على مجموعة صغيرة من خزانات التخزين الضخمة المصممة لتطبيقات الويب، وليس للعلوم المتقدمة. إن العبء المالي قاسٍ.

أظهر تدقيق صناعي نُشر في أبريل أن الرسوم الخفية للخروج والاسترجاع يمكن أن تزيد من تكاليف التخزين الحقيقية بنسبة تصل إلى 80%، مما يجعل إعادة تدريب النماذج الروتينية مشروعًا يكسر الميزانية. والأسوأ من ذلك، أن نقل عشرات البيتابايت عبر المناطق يمكن أن يستغرق أيامًا؛ وهو زمن طويل عندما يتم قياس الميزة التنافسية في دورات التكرار.

تقوم المركزية، وبالتالي، بأكثر من مجرد تضخيم الفواتير؛ إنها تغرس عدم المساواة مباشرة في اقتصاد الذكاء الاصطناعي، مما يمنح الشركات القائمة ذات الجيوب الأعمق ميزة تلقائية على جميع الآخرين. استجابة لهذا الواقع، يكتسب مخطط مختلف زخمًا حيث تمهد الشبكات التخزينية اللامركزية التي تقسم البيانات عبر آلاف العقد المستقلة الطريق لمستقبل مبني على قدم المساواة.

من الضروري بنفس القدر الحاجة إلى مسارات تدقيق شفافة تلبي المتطلبات المتزايدة للإفصاح عن كيفية جمع بيانات التداول وتنظيمها وإدارتها. في النهاية، سيكون التنظيم هو العامل الحاسم في ما إذا كانت نماذج الغد سترى النور أو تواجه الدعاوى القضائية.

اختبار الضغط الجديد للتخزين

الذكاء الاصطناعي في الوقت الفعلي الآن يمتد بعيدًا عن جدار مركز البيانات، حيث يدفع النماذج إلى أرضيات المصانع، والمستشفيات، والمركبات المستقلة. في هذه الحواف، يمكن أن يؤدي تأخير مللي ثانية واحد بسبب إدخال/إخراج بطيء إلى حدوث خطأ في الإنتاج أو خطر على السلامة.

أحدث معايير MLPerf Storage v2.0 تثبت الضغط: أخذ نقاط التحقق لعمل عبء عمل من فئة GPT عبر 10,000 مسرع يستغرق الآن 37 ثانية، وحتى مجموعة السوبر المكونة من 100,000 GPU لا تزال تتعطل لمدة 4.4 ثانية أثناء انتظار الأقراص بدلاً من إجراء العمليات الرياضية.

ما لم تتمكن خطوط الأنابيب من توصيل البيتابايتات في دفعات ثم تكرار نفس البيانات إلى الآلاف من المواقع الدقيقة، ستبقى "الذكاء الاصطناعي على الحافة" أكثر من كونها واقعًا. المحللون يكررون بالفعل التحذير من أن سعة التخزين، وليس الذاكرة أو الشبكات، ستكون عنق الزجاجة رقم واحد الذي يعيق مجموعات الجيل التالي.

تضيف الأنظمة طبقة أخرى من الإلحاح، مثل قانون الذكاء الاصطناعي للاتحاد الأوروبي، الذي دخل في موجته الثانية من التنفيذ في 2 أغسطس — مما يجبر مقدمي النماذج العامة على توثيق كل جزء من بيانات التدريب... أو المخاطرة بالغرامات التي تصل إلى 7% من إجمالي العائدات العالمية.

تواجه الصوامع المركزية صعوبة في تلبية هذا المطلب. تBlur النسخ المكررة أصل المصدر، وتجعل سجلات الخروج غير الشفافة مسارات التدقيق كابوسًا للمحاسبين. بالمقابل، تدمج الشبكات اللامركزية أدلة تشفيرية على النسخ في نسيجها، مما يحول الالتزام إلى منتج ثانوي بدلاً من كونه إضافة مكلفة.

تجاهل التخزين على حساب الخطر

مع قياس زمن الاستجابة في الميكروثانية والعقوبات القانونية المقاسة بالمليارات، لم تعد التخزين مجرد خدمة خلفية؛ إنه الركيزة الوحيدة التي يمكن أن تعمل عليها الذكاء الاصطناعي في الغد قانونياً وفعلياً. الشركات التي لا تزال تعالج السعة كعنصر خطي للسلع تخاطر بالديون التقنية والصدمات التنظيمية على حد سواء.

ستظل ابتكارات الحوسبة تسرق العناوين، ولكن دون إعادة تفكير جذرية متساوية حول مكان ( وكيف) توجد البيانات، ستبقى أكثر السيليكون تقدماً بلا استخدام حيث تتصاعد التكاليف ومخاطر الامتثال.

سباق الهيمنة على الذكاء الاصطناعي قد بدأ، وسيتم الفوز به من قبل أولئك الذين يرفعون التخزين إلى أولوية استراتيجية من الدرجة الأولى، يحتضنون اللامركزية، ويبنون خطوط أنابيب جاهزة للتدقيق تتوسع من النواة إلى الحافة. سيت发现 الجميع أن أي كمية من قوة GPU لا يمكن أن تتجاوز عنق الزجاجة المدمج في أسس بنيتهم.

! كاي واورزينك

كاي واورزينك

كاي وافرزينك هو أحد مؤسسي Impossible Cloud وImpossible Cloud Network. هو رائد أعمال ذو خبرة وحاصل على درجة الدكتوراه في القانون وله سجل حافل في بناء المشاريع الناجحة. إدراكًا للحاجة إلى حلول على مستوى المؤسسات في مجال الويب 3، أسس كاي Impossible Cloud Network (ICN)، وهي منصة سحابية لا مركزية تهدف إلى إنشاء بديل لا مركزي لـ AWS. قبل ICN، أسس كاي Goodgame Studios، وهي شركة ألعاب عبر الإنترنت، ونما بالشركة لتصل إلى أكثر من 1,000 موظف وحقق أكثر من مليار يورو في الإيرادات، وقام بإدراجها في Nasdaq في عام 2018 من خلال اندماج عكسي.

NOT-6.36%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت