باختصار
تستمر شركة «أوبن إيه آي» في تعزيز خوارزميات التعلم بوتيرة جيدة لمنح الذكاء الاصطناعي قدرة على التدرب. وتتيح أحدث منصة أطلقتها الشركة في أواخر شهر فبراير/شباط لأجهزة الذكاء الاصطناعي إمكانية التعلم من أخطائها من خلال النظر إلى هذه الأخطاء باعتبارها أهدافًا بدلًا من كونها إخفاقات يجب تجنبها.

ذكاء اصطناعي يتعلم من أخطائه السابقة

ركز الباحثون في شركة «أوبن إيه آي» خلال الأشهر الماضية على تطوير ذكاء اصطناعي بوسعه التعلم بطرائق أفضل. وتمكنت خوارزميات تعلم الآلة في الشركة من تعليم ذاتها بفضل تعزيز طرائق التعلم التي أتاحتها منصة «أوبن إيه آي بيسلاينز.» وطورت الشركة مؤخرًا خوارزمية جديدة تتيح للذكاء الاصطناعي القدرة على التعلم من أخطائها، بالطريقة التي يتعلم بها البشر.

وتقدم خوارزمية جديدة مفتوحة المصدر أطلق عليها اسم «هيندسايت إكسبيرينس ريبليه» (إعادة النظر بالتجربة السابقة) أو اختصارًا «إتش إيه آر» برامج التطوير اللازمة. وهي منصة أطلقها الباحثون في شركة «أوبن إيه آي» في وقت سابق هذا الأسبوع، تهدف إلى مساعدة الذكاء الاصطناعي على إعادة النظر بأخطائه وإدراكها وهو في طور إتمام المهام وإنجازها. ووفقًا لمدونة الشركة، فإن الذكاء الاصطناعي يعيد النظر في الإخفاقات ويعدها خطوات لتحقيق النجاح.

وكتب الباحثون موضحين، «إن التصور الرئيس الذي ترسمه منصة إتش إي آر هو ما يفعله البشر بصورة بديهية؛ فعند إخفاقنا في تحقيق هدف محدد، نباشر بمحاولة تحقيق هدف آخر مختلف. فلماذا لا نتظاهر بأن هذا الأخير هو ما أردنا تحقيقه منذ البداية، بدلًا من الهدف الأول الذي خططنا له أساسًا؟» أي ببساطة أكثر، تعد كل محاولة فاشلة للذكاء الاصطناعي خلال مسعاه لتحقيق هدف معين، بمثابة هدف افتراضي جديد غير مخطط له.

حاول أن تتذكر محاولاتك الأولى لتعلم ركوب الدراجة الهوائية، لا ريب في أنك أخفقت خلال محاولاتك الأولى في تحقيق التوازن بصورة صحيحة. لكن هذه المحاولات الفاشلة هي التي ساعدتك في محاولاتك اللاحقة على عدم تكرار الأخطاء ومعرفة ما يتحتم عليك تجنبه للتوازن على الدراجة الهوائية. أي أن كل محاولة فاشلة تقربك أكثر من تحقيق هدفك لأن هذه هي الكيفية التي يتعلم بها البشر.

مكافأة عند كل فشل

تهدف شركة «أوبن إيه آي» من إنشاء منصة «إتش إي آر» إلى تعليم أجهزة الذكاء الاصطناعي الطريقة ذاتها لتعمل محل نظام المكافآت المعتاد المرتبط بتعزيز نماذج التعلم. ولتحفيز الذكاء الاصطناعي على التعلم الذاتي لا بد أن يعمل ضمن نظام مكافآت؛ فلن يحصل الذكاء الاصطناعي على خوارزمية «كوكي» التي تعرف باسم ملف تعريف الارتباط، ما لم يعمل على تحقيق هدفه. ويوجد نموذج آخر أيضًا يعطي ملفات «كوكيز» بناء على مدى اقتراب الذكاء الاصطناعي من تحقيق هدفه.

لكن لا يمكن أن نعد أيًا من هاتين الطريقتين مثالية في التعلم؛ فالطريقة الأولى تحد من التعليم وتتسبب في توقفه سواء بعد نجاح الذكاء الاصطناعي في تحقيق هدفه أو إخفاقه في ذلك بعد عدة محاولات. أما الطريقة الثانية، فقد تكون معقدة تمامًا عند تطبيقها. لكن عند التعامل مع كل محاولة فاشلة باعتبارها تحقيقًا لهدف، ومكافأة الذكاء الاصطناعي على الرغم من فشله في تحقيق مهمة محددة، فإن هذا من شأنه أن يساعد الذكاء الاصطناعي على التعلم بسرعة أكبر وبجودة أعلى.

ووفقًا لمدونة شركة «أوبن إيه آي،» «تتيح هذه الطريقة البديلة إمكانية حصول خوارزمية تعزيز التعلم على إشارة تقر بإنجازها لبعض المهام وتحقيقها لأهداف معينة؛ حتى وإن كانت أهدافًا مختلفة عن تلك التي من المفترض أن يحققها في الأساس. إن أعدت هذه العملية مرارًا وتكرارًا ستتعلم كيفية تحقيق أهداف عشوائية أو اعتباطية قد تشمل الأهداف التي رسمتها لنفسك منذ البداية.»

لا تعني هذه الطريقة أن منصة «إتش إي آر» سهلت على الذكاء الاصطناعي تعلم إنجاز مهام محددة، إذ قال «ماتياس بلابيرت» من شركة «أوين إيه آي،» «ما زال تعلم الروبوتات بالاعتماد على منصة إتش إي آر صعبًا، لكونه يتطلب عددًا محددًا من النماذج.»

وبجميع الأحوال، يمكن أن تكون منصة «إتش إي آر» مفيدة جدًّا في تشجيع أجهزة الذكاء الاصطناعي على التعلم حتى من أخطائها، تمامًا كما يفعل جميع البشر، بفارق أن الأجهزة المزودة بتقنية الذكاء الاصطناعي لن تصاب بالإحباط عند اقترافها لأخطاء متعددة وإخفاقها في تحقيق أهدافها، كما يفعل كثير من البشر.