فشل كارثي

استخدام الحواسيب في تصحيح الاختبارات القياسية ليس شيئًا جديدًا، إذ تستخدم غالبية الجامعات تقنيات آلية لتصحيح أسئلة الاختيارات المتعددة.

لكن موقع مذربورد وجد أن 21 ولاية أمريكية بدأت باستخدام أنظمة تعتمد على الذكاء الاصطناعي لتصحيح الأسئلة التي تطلب كتابة مقالات في الاختبارات القياسية، ويبدو أن أداءها سيئ جدًا.

أخطاء غير مقبولة

لاستخدام الذكاء الاصطناعي في تصحيح الأسئلة المقالية مشكلتان أساسيتان، وفقًا لمذربورد.

تكمن المشكلة الأولى في تحيز هذه الأنظمة الآلية، وهي مشكلة التحيز ذاتها التي نجدها في مختلف أنظمة الذكاء الاصطناعي عادةً، فإن كان البشر الذين يصححون الاختبارات المستخدمة لتدريب هذه الأنظمة يعطون درجات أعلى أو أقل للطلاب من فئة معينة، سيفعل الذكاء الاصطناعي الشيء ذاته. وتكمن المشكلة الثانية في أن الذكاء الاصطناعي يصحح الأسئلة المقالية بناءً على مقاييس معينة مثل طول الجملة والمفردات المستخدمة والإملاء، حتى إن كانت هذه الجمل دون معنى.

مجرد هراء

أثبت موقع مذربورد المشكلة الثانية باستخدام الأداة الإلكترونية المستخدمة عادةً في تقييم الأسئلة المقالية، واختبرها في تقييم مقالة أنتجتها خوارزمية متخصصة في كتابة مقالات غير مترابطة وخالية من المعنى. وكان السطر الأول منها «إن اختراع المناطق، لم ولن يكون غير قابل للإنكار في المدى الذي نتفحص فيه المؤنب،» وحصلت هذه المقالة على 4 درجات من أصل 6.

وقال نوربرت إليوت، رئيس تحرير مجلة جورنال أوف رايتينج آناليتيكس لمذربورد «أسلوب الكتابة جانب واحد فحسب لقدرة الطالب على الكتابة، وعندما يكتب الطالب أجوبة تظهر براعته ونظرته الثاقبة، سيقدر المصحح البشري قيمتها، أما الآلات فلن تعطيه حقه.»