كيف تبني تسلا نظام القيادة الذاتية الكامل عالمًا ثلاثي الأبعاد من البيكسلات (الجزء الثالث)

29 مارس 2026 بقلم كاران سينغ في الأجزاء السابقة من سلسلة "كيف يعمل نظام القيادة الذاتية" ، استعرضنا العناصر الأساسية لنهج تسلا في القيادة الذاتية وكيف يفهم نظام القيادة الذاتية بيئته. الآن، نحن نغوص بشكل أعمق في كيفية تحويل نظام القيادة الذاتية للصور الثنائية الأبعاد المسطحة من كاميراته إلى عالم ثلاثي الأبعاد غني وديناميكي يعمل فيه. تقدم طلبات براءة الاختراع الأخيرة لتسلا بعض الإيضاحات حول هذا الموضوع، حيث تغطي تحديد الشغور القائم على الرؤية وتحديد السطح القائم على الرؤية. معًا، تكشف كيف يهدف نظام القيادة الذاتية إلى إدراك كل شيء من المركبات الأخرى إلى قوام سطح الطريق باستخدام الرؤية فقط. نوصي بقراءة بعض أجزاء سلسلتنا الأخرى للحصول على خلفية جيدة قبل أن تغوص في هذا المقال الفني. كيف يعمل نظام القيادة الذاتية الجزء 1 كيف يعمل نظام القيادة الذاتية الجزء 2 كيف يعمل نظام القيادة الذاتية الجزء 3 (هذا المقال) مترجم الذكاء الاصطناعي العالمي من تسلا كيف تحسن تسلا نظام القيادة الذاتية كيف ستقوم تسلا بتوسيم البيانات باستخدام الذكاء الاصطناعي إنشاء عالم ثلاثي الأبعاد من صور ثنائية الأبعاد التحدي الأساسي لأي نظام يعمل بالرؤية هو إدراك عالم ثلاثي الأبعاد بدقة من صور الكاميرا الثنائية الأبعاد. على عكس الأنظمة التي تعتمد على تقنية LiDAR لقياس المسافة والعمق مباشرة، يتطلب نهج تسلا المعتمد على الرؤية فقط من نظام القيادة الذاتية استنتاج العمق والشكل والحركة والسياق من أنماط البكسل والإضاءة والحركة النسبية للأشياء عبر عدة مشاهد كاميرا. جمع كل ذلك معًا هو المفتاح لبناء البيئة ثلاثية الأبعاد التي يعيش فيها نظام القيادة الذاتية. الجزء 1: تحديد الشغور القائم على الرؤية تتناول براءة اختراع تسلا "تقنيات نمذجة الذكاء الاصطناعي لتحديد الشغور القائم على الرؤية" كيفية تحديد نظام القيادة الذاتية للأشياء الموجودة في محيط السيارة والمساحة التي تشغلها. بينما كانت تسلا تستخدم سابقًا صناديق محيطة لتحديد الأشكال العامة التي تشغلها الأشياء، فقد تطورت هذه الطريقة بشكل كبير في الإصدارات الأحدث من نظام القيادة الذاتية. هذا يتجاوز بكثير رسم صناديق ثنائية الأبعاد بسيطة حول الأشياء؛ إنه يتعلق بإنشاء فهم حقيقي ثلاثي الأبعاد. خط أنابيب نظام القيادة الذاتية: من البكسلات إلى الأشياء توضح البراءة وجود خط أنابيب ذكاء اصطناعي متطور لتحقيق ذلك: إدخال الصورة: تبدأ العملية برمتها ببيانات الصورة الخام من كاميرات سيارتك، التي تلتقط زوايا مختلفة حول السيارة في نقطة زمنية معينة. معالجة الصورة: بيانات البكسل الخام وحدها ليست مفيدة جدًا. تستخدم تسلا شبكات عصبية متخصصة، والتي تسميها "مميزات"، لمعالجة هذه الصور واستخراج التفاصيل البصرية ذات الصلة. يمكن أن تتضمن هذه الأنماط والقوام والحواف - أي شيء يمكن أن يساعد في فهم المشهد. التحويل المكاني: الخطوة الحاسمة هنا - يستخدم نظام القيادة الذاتية نموذج تحويل، وهو نوع من الشبكات العصبية التي تتميز بفهم السياق والعلاقات. يأخذ هذا النموذج الميزات الثنائية الأبعاد من جميع مشاهد الكاميرا، وباستخدام ما تسميه تسلا "آلية الانتباه المكاني"، يقوم بدمجها في تمثيل ثلاثي الأبعاد موحد للبيئة. تشير تسلا داخليًا إلى هذا باسم الفضاء المتجه الذي يعمل فيه مخطط مسار نظام القيادة الذاتية. المحاذاة الزمنية: العالم ليس ثابتًا، لذا يقوم النظام بعد ذلك بدمج تلك التمثيلات ثلاثية الأبعاد من نقاط زمنية متتالية. هذا يجعل الميزات مكان-زمان، مما يعني أن نظام القيادة الذاتية لا يلتقط فقط "كيف" تبدو الأشياء في لحظة معينة، بل كيف تتحرك عبر الزمن. فك التشفير: بعد المعالجة، يستخدم نظام القيادة الذاتية عملية فك التشفير، وهي عملية رياضية لتحويل البيانات المدمجة مرة أخرى إلى توقعات متميزة لكل فوكسل* في الشبكة ثلاثية الأبعاد. * اعتبر الفوكسل كبيكسل ثلاثي الأبعاد - مكعب صغير حجمي يمثل نقطة واحدة في الفضاء ثلاثي الأبعاد حول السيارة. يقسم نظام القيادة الذاتية البيئة بالكامل إلى شبكة كثيفة من هذه الفوكسيات. باستخدام البيانات المفككة، يتنبأ نظام القيادة الذاتية بعدة مخرجات رئيسية، بما في ذلك الشغور - هل هذا الفوكسل مشغول، أم هو مساحة فارغة؟ إذا كان مشغولًا، ما هو متجه السرعة؟ ثم، باستخدام البيانات المستنتجة من وقت سابق، يمكن لنظام القيادة الذاتية تجميع عدة فوكسيات لبناء فهم أكثر تفصيلاً للمساحة من حوله. هذا يساعد نظام القيادة الذاتية في معرفة ما إذا كان الفوكسل مشغولًا - سواء كان ذلك جسمًا ثابتًا أو متحركًا، مثل مبنى أو مركبة أخرى. المخرجات يتم تجميع كل هذه المعلومات في خريطة شغور. هذا يعني أن نظام تخطيط المسار في نظام القيادة الذاتية، والذي يختلف عن نظام الشغور المذكور أعلاه، يمكنه طرح أسئلة محددة حول البيئة لتحديد خطواته التالية. قد يتضمن ذلك تحديد ما إذا كانت المساحة خالية، وما إذا كان هناك جسم في فوكسل معين يتحرك، وما هو، وما إذا كان ذا صلة. ثم يستخدم مخطط المسار الإجابات من هذا النموذج ثلاثي الأبعاد لاتخاذ قراراته. بكلمات أبسط، يعني ذلك أن نظام القيادة الذاتية يبني نسخة ثلاثية الأبعاد حية تتحدث عن العالم من حوله، حيث يمتلك كل عنصر مهم خصائص مثل الموقع والحركة والنوع. هذه النسخة الرقمية المفصلة من الواقع هي ما يستخدمه وحدة تخطيط القيادة في نظام القيادة الذاتية لاتخاذ قرارات القيادة، لحظة بلحظة. الجزء 2: تحديد السطح القائم على الرؤية معرفة مكان الأشياء ليست سوى نصف المعركة. تحتاج السيارة ذاتية القيادة أيضًا إلى فهم مفصل للغاية للسطح الذي تسير عليه والتضاريس من حولها. تتناول براءة اختراع تسلا WO2024237939A2، "تقنيات نمذجة الذكاء الاصطناعي لتحديد السطح القائم على الرؤية"، هذا الموضوع بالضبط. فهم السطح يحتاج نظام القيادة الذاتية إلى معرفة أكثر من مجرد "هناك طريق هنا". يحتاج إلى فهم هندسة الطريق (هل هو مسطح، أو منحدر، أو مائل؟)، مادته (أسفلت، تراب، حصى؟)، موقع الأرصفة، علامات المسار، المطبات، الحفر، وما إذا كان السطح قابلًا للملاحة. توضح هذه البراءة كيف تهدف تسلا لتحقيق هذا الفهم الدقيق باستخدام مدخلات الكاميرا فقط، وهو خطوة حاسمة نحو التنقل في البيئات المعقدة دون الاعتماد على خرائط عالية الدقة موجودة مسبقًا. نعم، بالنسبة للمراقبين ذوي العيون الثاقبة، يعني ذلك أن نظام القيادة الذاتية يحاول بالفعل البحث عن الحفر - ولكن ما إذا كانت هذه تأخذ في الاعتبار من قبل مخطط المسار لا يزال غير مؤكد. في عام 2020، أكد إيلون أن هذا هو الحال. نعم! نحن نضع علامات على المطبات والحفر، حتى تتمكن السيارة من التباطؤ أو الانحراف حولها عندما يكون ذلك آمنًا. — إيلون ماسك (@elonmusk) كما قالت تسلا إنها تعمل على تعديل أنظمة التعليق الهوائية والتكيفية بناءً على خريطة خشونة الطريق. يمكن أن يتم إنشاء هذه الخرائط الخشنة من خلال مزيج من تحديد السطح القائم على الرؤية، جنبًا إلى جنب مع تقنيات جديدة مثل أجهزة استشعار مداس الإطارات الذكية التي تجهز بها تسلا الآن بعض المركبات الرائدة. توقع خصائص السطح من الرؤية مشابهة للجزء الأول، تستخدم هذه النصف من النظام نموذج ذكاء اصطناعي آخر لتحليل صور الكاميرا، ولكن بدلاً من توقع شغور الأشياء، تحاول تحديد وتوقع مجموعة من خصائص السطح للمساحة من حول السيارة. تشمل هذه الخصائص تحديد الارتفاع، وما إذا كان السطح قابلًا للملاحة وآمنًا للقيادة عليه، وما هي مادة السطح، وأخيرًا، الميزات. تشمل تلك الميزات عناصر مثل خطوط المسار، العلامات، الأرصفة، المطبات، الحفر، قمم التلال، والانحناءات المائلة أو المسطحة. بناء شبكة السطح ثلاثية الأبعاد يجمع كل تلك المعلومات الحيوية ويجمعها يسمح لنظام القيادة الذاتية ببناء شبكة ثلاثية الأبعاد تمثل البيئة من حوله، مأخوذة من صور ثنائية الأبعاد. هذه الشبكة هي مجموعة من النقاط، حيث تحتوي كل نقطة على إحداثيات X و Y و Z ويتم وضع علامة عليها بالخصائص المذكورة أعلاه. يساعد ذلك في بناء تلك البيئة ثلاثية الأبعاد العامة التي يتنقل فيها نظام القيادة الذاتية. تدريب على التعرف على السطح عملية التدريب لهذا الذكاء الاصطناعي موصوفة في البراءة، وهي معقدة للغاية. تسحب تسلا المعلومات من أجهزة الاستشعار مثل LiDAR التي تستخدمها أثناء اختبارات وتوليد البيانات، أو من خلال تقنيات مثل التصوير الضوئي. ثم يتم ربط هذه البيانات بصور الكاميرا من سيارات حقيقية، مما يساعد في تدريب النظام على المسافة والأسطح. الشغور + الأسطح = نموذج عالمي موحد بشكل حاسم، فإن هذين النظامين المسجلين ببراءة اختراع - تحديد الشغور وتحديد السطح - مصممان للعمل معًا. تصف براءة تحديد السطح بشكل صريح كيف يمكن دمج طرقها مع نموذج الكشف عن الشغور. تخيل سيناريو حيث يكتشف نظام الشغور جسمًا (مثل مخروط مروري). في نفس الوقت، يفهم نظام تحديد السطح أن الطريق أمامه هو منحدر شديد. من خلال دمج هذه المعلومات، يمكن لنظام القيادة الذاتية تحديد مكان مخروط المرور بدقة على منحدر التل في نموذج العالم ثلاثي الأبعاد الخاص به. هذا الفصل البسيط بين اكتشاف الأشياء وفهم الأسطح التي توجد عليها يمكّن من إدراك أكثر دقة وموثوقية، خاصة في البيئات المعقدة ذات الارتفاعات المتنوعة. يمكن أن يوسع ذلك حتى النطاق العمودي الذي يمكن تحديد الأشياء بدقة فيه وتحديد مواقعها. هذا يعني أن نظام القيادة الذاتية لا يرى فقط مجموعة من الأشياء وسطحًا مسطحًا؛ بل يبني فهمًا حقيقيًا ثلاثي الأبعاد وغنيًا دلاليًا لما يحيط بالسيارة والخصائص البيئية التي يتواجد فيها. ما الذي يغذي قرارات نظام القيادة الذاتية هذا النموذج ثلاثي الأبعاد المفصل واللحظي، المبني من بيانات الشغور والسطح، يمثل المدخل الأساسي لجميع مراحل نظام القيادة الذاتية التالية: التنبؤ (ماذا سيفعل مستخدمو الطريق الآخرون؟)، تخطيط المسار (ما هو الطريق الأكثر أمانًا وكفاءة؟)، والتحكم (كيف يتم تنفيذ هذا المسار بسلاسة). يمكنك قراءة كيف تعالج تسلا ذلك في الجزء الأول من السلسلة. بينما تستمر الرحلة نحو القيادة الذاتية الكاملة وتواجه تحديات هائلة، تمثل هذه الطرق لتحديد الشغور والسطح لبنات بناء حاسمة. إنها ضرورية لإنشاء ذكاء اصطناعي لا يكتفي بالكشف عن الأنماط بل يدرك حقًا ويفهم البيئات الديناميكية والمعقدة التي تتنقل فيها مركباتنا كل يوم. مع استمرار تسلا في تحسين هذه الأنظمة، ستستمر تفاصيل ودقة نموذج العالم الخاص بنظام القيادة الذاتية في النمو، مما يمهد الطريق لأنظمة ذاتية القيادة أكثر قدرة. اشترك اشترك في نشرتنا الإخبارية لتبقى على اطلاع بأحدث أخبار تسلا والميزات القادمة وتحديثات البرمجيات.

التسوق عبر موقع تسلا الرسمي