7 أبريل 2026 بقلم كاران سينغ
نشرت تسلا مؤخرًا براءة اختراع مفصلة للغاية توضح كيفية عمل شبكة الإشغال المعتمدة على الرؤية. تحمل البراءة عنوان "تقنيات نمذجة الذكاء الاصطناعي لتحديد الإشغال المعتمد على الرؤية" وتم نشرها رسميًا في 12 مارس 2026.
تُعزى البراءة إلى فريق من المهندسين يتضمن آشووك إيلوسوامي، وتقدم نظرة عميقة حول كيفية استخدام تسلا للذكاء الاصطناعي لفهم العالم المادي دون الاعتماد على الرادار أو الليدار.
فهم شبكة الفوكسل
تدور شبكة الإشغال الخاصة بتسلا حول الفوكسلات. الفوكسل هو في الأساس بكسل ثلاثي الأبعاد يمثل نقطة محددة داخل شبكة حجمية تحيط بالمركبة. لبناء هذه الشبكة، يقوم نموذج الذكاء الاصطناعي بتحميل بيانات الصور من الكاميرات الخارجية الثمانية للمركبة. بعد ذلك، ينفذ النظام النموذج للتنبؤ بما إذا كانت كل فوكسل مشغولة بجسم له كتلة. نظرًا لأن تصنيف ملايين النقاط البيانية ثلاثية الأبعاد يدويًا سيكون مستهلكًا للوقت بشكل مستحيل، تشير البراءة إلى أن تسلا تعتمد بشكل كبير على طرق التدريب غير الخاضع للإشراف لتدريب هذه النماذج على نطاق واسع.
الدقة المتغيرة والفوكسلات الفرعية
واحدة من التفاصيل الأكثر إثارة للاهتمام التي تم الكشف عنها في البراءة هي كيفية إدارة تسلا لقوة الحوسبة من خلال ضبط حجم هذه الفوكسلات ديناميكيًا. الحجم الافتراضي للفوكسل هو 33 سنتيمترًا عند كل رأس. يعتبر هذا الحجم مقبولًا بشكل عام للأجسام الموجودة بعيدًا أو خارج سطح القيادة المباشر. ومع ذلك، يمكن لنظام القيادة الذاتية تقليل حجم الفوكسل إلى 10 سنتيمترات للمناطق المشغولة والتي تقع ضمن مسافة معينة من المركبة. يسمح ذلك بدقة أعلى بكثير حيث يكون الأمر مهمًا. يمكن للشبكات العصبية أيضًا التنبؤ بالإشغال الجزئي من خلال تقسيم المساحات المشغولة إلى فوكسلات فرعية أصغر.
هذا يمكّن نظام القيادة الذاتية من تحديد الشكل الدقيق لجسم منحني بدقة. يمكن أيضًا للخادم التحليلي استخدام الاستيفاء الثلاثي الخطوط لتقدير حالة الإشغال لأي نقطة محددة داخل الفوكسل.
الدمج الزمني والدلالات الثلاثية الأبعاد
لا يركز الذكاء الاصطناعي لدى تسلا فقط على الإطارات الثابتة بشكل منفصل. يستخدم نموذج الذكاء الاصطناعي محولًا لجمع بيانات الصور ثنائية الأبعاد في تمثيل ثلاثي الأبعاد موحد. ثم يدمج هذا الفضاء الثلاثي الأبعاد الحالي مع تمثيلات من الطوابع الزمنية السابقة. يتيح هذا الجمع بين البيانات المكانية والزمنية للشبكة حساب تدفق الإشغال. يشير تدفق الإشغال إلى السرعة الدقيقة للفوكسلات المتحركة. أخيرًا، يطبق نظام القيادة الذاتية بيانات دلالية ثلاثية الأبعاد لتحديد ما هو الجسم فعليًا. يمكنه التمييز بين ما إذا كانت مجموعة من الفوكسلات المشغولة تمثل سيارة متحركة، أو مبنى ثابت، أو رصيف شارع. تم تصميم النظام لإعطاء الأولوية لأشكال دلالية معينة. على سبيل المثال، سيتم تحليل مركبة متحركة بالقرب من المركبة ذاتية القيادة بشكل أكثر شمولاً من مبنى ثابت يقع بعيدًا عن الطريق.
تغذية المركبات وأوبتيموس
تُجمع كل هذه البيانات باستمرار في مجموعة بيانات يمكن الاستعلام عنها. يمكن لنظام القيادة الذاتية الاستعلام عن هذه المجموعة بشكل مستمر للحصول على حالات الإشغال واتخاذ قرارات تنقل في الوقت الحقيقي. بالإضافة إلى ذلك، تُستخدم نفس مجموعة البيانات هذه لإنشاء خريطة بيئية ثلاثية الأبعاد تُعرض على واجهة المستخدم داخل المركبة. بينما تركز البراءة بشكل كبير على المركبات ذاتية القيادة، فإنها تؤكد أن التكنولوجيا الأساسية قابلة للتكيف بشكل كبير. تشير الوثيقة بشكل خاص إلى أن هذه الشبكة المعتمدة على الرؤية يمكن استخدامها من قبل روبوت إنساني ثنائي القدمين لأغراض عامة للتنقل عبر تضاريس متنوعة.
إذا استمتعت بهذا المقال، نوصي بقراءة سلسلتنا الكاملة حول براءات اختراع تسلا المتعلقة بالقيادة الذاتية:
كيف تعمل القيادة الذاتية الجزء 1 كيف تعمل القيادة الذاتية الجزء 2 كيف تعمل القيادة الذاتية الجزء 3 كيف تعمل القيادة الذاتية الجزء 4 كيف تعمل القيادة الذاتية الجزء 5 (هذا المقال) شبكة الإشغال لدى تسلا مترجم الذكاء الاصطناعي العالمي لتسلا كيف تحسن تسلا من نظام القيادة الذاتية كيف ستقوم تسلا بتصنيف البيانات باستخدام الذكاء الاصطناعي
اشترك
اشترك في نشرتنا الإخبارية لتبقى على اطلاع بأحدث أخبار تسلا، والميزات القادمة، وتحديثات البرمجيات.

