نظرة أولية

الرؤية الحاسوبية هي قدرة الآلة على رؤية الأجسام أو الصور وفهم محتواها، وهي القدرة التي تمكنك من فتح هاتفك الآيفون بالنظر إليه، لكنها تشترط أن تشاهد المعلومات مسبقًا قبل أن تتعرف عليها في كل مرة.

ومؤخرًا في مختبر علم الحاسوب والذكاء الاصطناعي التابع لمعهد ماساتشوستس للتقنية، طور الباحثون نظام رؤية حاسوبية يتعرف على الأجسام التي لم يرها من قبل، وهي خطة مهمة نحو جعل الروبوتات تفكر وتتحرك كالبشر.

نشر الباحثون بحثهم يوم الاثنين، ويخططون لتقديمه خلال مؤتمر روبوت ليرنينج في مدينة زيورخ السويسرية خلال شهر أكتوبر/تشرين أول.

منظور فريد

أطلق فريق المعهد على نظامهم اسم «شبكات الجسم الكثيف – دون» ويكتسب دون القدرة على «الرؤية» لأنه ينظر إلى الأجسام كمجموعة نقاط يعالجها الروبوت لتشكيل «خريطة طريق بصرية» ثلاثية الأبعاد. لذلك لا حاجة أن يعرض العلماء مجموعات ضخمة من البيانات ليطلقوا تسمية على كل جسم منها مثلما يحدث في باقي أنظمة الرؤية الحاسوبية.

مألوف لكن غير متطابق

عندما يرى دون جسمًا شبيهًا بجسم آخر مألوف له، فإنه يستطيع أن يتعرف على مختلف أجزاء هذا الجسم الجديد، فبعد أن عرض الباحثون على النظام حذاءً وعلموه كيف يحمله من لسانه، نجح النظام في حمل الأحذية الأخرى من ألسنتها على الرغم من أنه لم ير تلك الأحذية مسبقًا أو لم تكن في موقعها الأصلي.

وصرح الباحث لوكاس مانويلي في بيان صحافي «لا يمكن لكثير من الخوارزميات أن تتعرف على أجزاء محددة للجسم في ظل الاتجاهات الكثيرة التي تستقر وفقها، فعلى سبيل المثال، لن تتمكن الخورازميات الحالية من إمساك كأس من مقبضه إن اختلفت اتجاهات الكأس عن تلك المدخلة إلى النظام، كأن يكون مستلقيًا أو مائلًا.»

روبوتات الغد

قد تحقق هذه الرؤية الحاسوبية المتقدمة إنجازات تستعصي على الروبوتات حاليًا، وإذا حُمّلت إلى الروبوتات في منشآت إعادة التدوير، ستغدو حينها قادرة على ترتيب الأشياء أثناء سيرها على حزام ناقل دون الحاجة لتدريبها على كم هائل من البيانات. وربما يأتي يوم نعرض فيه على الروبوتات «ذاتية-الإشراف» صورة لمهمة شاقة كي تؤديها عنا.

وهذا البحث ليس إلا خطوة أخرى نحو تصنيع آلات بقدرات بشرية، وعلينا أن نستمر في البحث والتطوير إلى أن نرى القدرات النهائية لهذه الآلات.