أهمية اللعب الجماعي

تمكَّن فريق من العلماء في مختبر الذكاء الاصطناعي التابع لشركة أوبر من اجتياز أحد أكبر التحديات في أبحاث الذكاء الاصطناعي، إذ جعلوا نظامهم الذكي يفعل شيئًا معقدًا وصعبًا إلى درجة أن بعضهم شَكّ في قدرة الأنظمة الذكية على تحقيقه.

وذكرت مجلة إم آي تي تكنولوجي ريفيو أن الفريق صَمَّم خوارزمية ماهرة جدًّا في لعب لعبتَيِ الفيديو الكلاسيكيتَيْن: بِتفول، ومونتيزوماز ريفنج. ومع أن الخوارزمية نالت في اللعب بعض المساعدة البشرية -بحسب ما جاء في تدوينة أوبر عن الورقة البحثية التي ستنشرها قريبًا-، فإنها تعلمت أن تحرز من النقاط عددًا لم يحرزه بشري قط.

نعم، حقًّا!

عندما يتعلم ذكاء اصطناعي كيف يلعب لعبة فيديوية حتى يتقنها، يكون اعتماده على «التعلم المُعزَّز،» وهو نوع من الخوارزميات يَتعلم البحث عن الأشياء التي بُرمِجت لتكون بمنزلة المكافأة، كازدياد النقاط المحرَزة؛ وكلما زادت النقاط، زادت حماسة الذكاء الاصطناعي المعتمِد على التعلم المُعزَّز؛ لكن المشكلة أن النقاط في لعبة بِتفول ومونتيزوماز ريفنج وما شابههما لا تزداد زيادة فورية غالبًا.

ففي لعبة سوبر ماريو برذرز الكلاسيكية مثلًا وما شابهها -وهي لعبة برعت فيها أنظمة الذكاء الاصطناعي- يَسهُل أن يرفع اللاعب عدد نقاطه شيئًا فشيئًا، إذ ينال مكافآت فورية من جمْع العُملات فيها والقفز فوق كائنات الجومبا.

لكن حتى خوارزميات التعلم المُعزَّز التي وُجِّهت توجيهًا مباشرًا إلى استكشاف أكبر عدد ممكن من الأفكار العشوائية وتجريبها في اللعبة، تعثرت وهي تحاول تعلُّم الخطوات التسلسلية العديدة اللازمة لزيادة النقاط في اللعبتين.

الحفظ

أما خوارزمية أوبر الجديدة فتستطيع تذكر المحاولات السابقة، وتستطيع بذلك التعلُّم من أخطائها، متفوقةً على كل الذكاءات الاصطناعية التي حاولتْ فَكّ مغاليق اللعبتيْن من قبل. ومع هذا احتاجت الخوارزمية إلى دَفعة بشرية من المشرِفين الذين شجعوها على إعادة النظر في الأماكن والاستراتيجيات الواعدة التي قد تكون أغفلتها.

فليُجفِّف محترِفو الألعاب الفيديوية عَرَقهم إذن، فهم في مأمن من الأتْمتة في الوقت الراهن؛ وهذا البحث يشير إلى أن إحراز عدد النقاط العالي (وحل المشكلات المعقدة الأخرى) سيكون زمامه في أيدي البشر والذكاء الاصطناعي معًا، لا الذكاء الاصطناعي وحده.