على الرغم من أن بناء الأنظمة الاصطناعية لا يتطلب تقليد الطبيعة، فالطائرة تحلق في الهواء دون أن ترفرف بجناحيها كالطيور، لكن تاريخ الذكاء الاصطناعي وتعلم الآلة يُظهر أن استيحاء الأفكار من العلوم العصبية وعلم النفس قد يؤدي إلى تطور بارز، ولعل الشبكات العصبية العميقة وتعزيز التعلم أبرز الأمثلة عليها.

استخدم فريق أبحاث شركة «آي بي إم» مؤخرًا تقنيات تعلم الآلة لتطوير نماذج حاسوبية للانتباه والذاكرة. ويُعد بناء أنظمة ذكاء اصطناعي دائمة قادرة على التكيف مع البيئات المحيطة مع الاحتفاظ بخبراتها السابقة الهدف الأمثل. ويمكن تجزئة هذا التحدي إلى فترات تكيف قصيرة الأمد يغير فيها النظام ويدرب على الانتباه إلى الأشياء المهمة خلال وقت قصير، بالإضافة إلى فترات تكيف طويلة الأمد مستوحاة من آلية تشكيل الدماغ البشري للذاكرة والطريقة التي تؤثر فيها المرونة العصبية على تلك العملية.

طور الفريق ابتكارين مهمين يتيحان للأنظمة التكيف قصير الأمد وطويل الأمد نتيجةَ لتفعيل تقنيات انتباه الشبكات ومرونتها، وسيُطرح الابتكاران للمناقشة في ورقتين بحثيتين خلال المؤتمر العالمي للذكاء الاصطناعي الأسبوع المقبل.

تكيف سريع مع انتباه تحركه المكافأة

يُعرف الانتباه بالقدرة على اختيار أهم المعلومات سريعًا من بين سيل هائل من الإشارات الحسية لمعالجتها. ولأن شبكية العين البشرية توفر حقل نظر ضيق، فإننا نحتاج دائمًا إلى تحديد ما نركز عليه في نظرنا لاتخاذ القرارات سريعًا. ونضطر يوميًا إلى اختيار مجموعة صغيرة من المزايا المهمة للتركيز عليها من أصل عدد لا متناه من الاحتمالات، فمثلًا على الظبي أن يتخذ قرارًا بالهروب خلال أجزاء من الثانية عندما يظهر له أسد بين الشجيرات فجأةً، وقد يضطر الطبيب إلى طرح أسئلة كثيرة قبل أن يصف الدواء لمريضه.

طور الفريق في ورقته الأولى باسم «لص الانتباه السياقي: لص سياقي بسياق محدود» خوارزميةً للحالتين المذكورتين سابقًا، تعلمت التركيز سريعًا على المدخلات الصحيحة بالاعتماد على المكافأة (التلقيم من البيئة) المكتسبة أثناء المهمة. وكلما كبرت المكافأة زاد تركيز الخوارزمية على جزء معين من المدخلات. ففي حالة الظبي والأسد، يتعلم الظبي النظر إلى الأماكن المهمة في البيئة المحيطة وحين يحس بحركة غريبة بين الشجيرات، فإن المكافأة هي النجاة عندما يتخذ قرار الهروب بعيدًا عن المفترس. وفي مثال الطبيب، يحتاج الطبيب إلى معرفة الأدوية الأكثر فعالية، لأن عدد الاختبارات المحتملة وتجارب وصف الأدوية كبير جدًا، وبالتدريب والتجربة يتعلم الطبيب -كما يفعل الذكاء الاصطناعي- أن يختار تركيبة الاختبارات والعلاجات الأكثر فعالية لزيادة المكافأة المتوقعة.

يكمن إبداع الخوارزميات في قدرتها على تعلم التركيز على مدخلات محددة بطريقة فعّالة، فمجموعة البيانات ليست ثابتة ودائمة التغير، لكنها تحصل على مكافآت لاتخاذها قرارات تعتمد على مدخلات جزئية. والطريقة الفعالة تعني أن النظام يتعلم أثناء تنفيذه للمهمات، ما يعني أنه شديد التقبل للتغيرات. اختُبِرَت الخوارزميات لتنفيذ مهمات تصنيف فعالة باستخدام بيانات متاحة للعموم، وتتضمن الخطوات التالية تطبيق المقاربة على عدد أكبر من مجموعات بيانات واقعية ومشكلات في بيئات أكثر تعقيدًا.

تعلم عصبي وراثي

تعتمد التقنية الأخرى التي طورها الفريق على «المرونة العصبية،» التي شرحها الفريق في الورقة الثانية «تَعَلُّم القاموس المستوحى من التشكل العصبي: تكيف نموذجي فعال في عالم متغير.» تتيح هذه المقاربة تمكين التعلم طويل الأمد، وهي مستوحاة من عملية التشكل العصبي لدى البالغين التي تحدث في منطقة الحُصَين في الدماغ المسؤولة عن تشكيل الذكريات.

على الرغم من أن المرونة التشابكية مثل تغير قوة الاتصالات العصبية أثناء التعلم تُعد المقاربة الاعتيادية لتدريب الشبكات العصبية، لكن أنواعًا أخرى من المرونة مثل التشكل العصبي قد تلهم العلماء للوصول إلى طرائق تعلم مبتكرة، تتكيف فيها هندسة الشبكات دومًا استجابةً للبيئات المتغيرة أثناء التعلم الدائم. وطَرَحَ الفريق في ورقته خوارزميةً توسع وتضغط طبقات خفية من الشبكة، لتشبه ولادة خلايا عصبية جديدة وموتها. ويُظهر الفريق أن خوارزميته لا تتكيف مع البيئات الجديدة فحسب، بل تحتفظ بالذكريات السابقة أيضًا لتخطو خطوةً نحو إنشاء أنظمة ذكاء اصطناعي للتعلم مدى الحياة.

ويُلاحظ أن مقاربتنا التكيفية في بعض العمليات مثل التعرف على الصور والمعالجة الفطرية للغة توسع طبقتها الخفية وتهدمها كالدماغ البشري تقريبًا، لتتفوق على الذكاء الأساسي غير التكيفي بصورة ملحوظة. وتستمر الطبيعة والعلوم العصبية في إلهام الأبحاث العلمية وتطوير أنظمة تعلم تكيفية دائمة قادرة على تعزيز قدرات الدماغ البشري وتوسيعها.