رئيس التحرير
عصام كامل

تقرير رسمي يكشف تطبيق تجربة «امتحانات التفكير الناقد» منذ 9 سنوات.. طارق شوقي يرصد 120 مليون دولار لـ«التطبيق الجديد» ويتعاون مع شركة دولية لتنفيذه.. والتقرير: سبق تجربته بإمكانيات

الدكتور طارق شوقى
الدكتور طارق شوقى وزير التربية والتعليم

«إصلاح نظام الامتحانات وتقييم الطلاب».. يعتبر المكون الثالث من مكونات مشروع التعليم الجديد المقرر تنفيذه بدءًا من العام الدراسي المقبل، ويهدف إلى إصلاح نظام التقييم الشامل من أجل تحسين التحصيل العلمي للطلاب عن طريق وضع نظام جديد للامتحانات وتقييم الطلاب يتسم بالعدالة والسلامة والموثوقية.


وبحسب المعلومات المتاحة.. يخصص لهذا الجزء من المشروع 120 مليون دولار، وذلك من أجل دعم نظام التعليم وإعادة الطلاب إلى المدارس بهدف تقليص اللجوء إلى الدروس الخصوصية وثقافة الاعتماد عليها، ونظام الامتحانات الجديد وفقًا لما أعلنه مسئولون بوزارة التربية والتعليم سيكون الهدف منه هو قياس التفكير الناقد للطلاب، وسيتم عن طريق وضع بنوك أسئلة لاختيار صور امتحانية مختلفة لقياس قدرات الطلاب وعن طريق استخدام أدوات تكنولوجية.

شركة دولية
وتستعين الوزارة لتحقيق المكون الثالث هذا بشركة بيرسون الدولية من أجل إعداد ووضع الامتحانات، وتحويل المركز القومي للامتحانات إلى مركز وطني للامتحانات والاختبارات بتدريبات يتلقاها خبراء المركز من الشركة الأجنبية، غير أن المفاجأة التي يفجرها تقرير – حصلت "فيتو" على نسخة منه- تتمثل في أن وزارة التربية والتعليم بالتعاون مع المركز القومي للامتحانات نفذت تجربة شبيهة بما هو مطروح لتنفيذه في العام الدراسي 2009/ 2010 عن طريق خبراء مصريين ودون تدخل أجنبي وبتكلفة محدودة للغاية تكاد لا تذكر قياسًا بالمبالغ المرصودة للمشروع المطروح من قبل وزير التربية والتعليم والتعليم الفني الدكتور طارق شوقي، وقد اعتمدت تلك التجربة على أحدث نظريات القياس في العالم.

وأكد تقرير الدراسة الخاص بالتجربة المذكورة أن الدراسة انتهجت خطوات إجرائية مقننة في بناء أدوات التقويم وضبط الموقف الاختباري، وكذلك تقدير الدرجات وتحليلها وتفسير نتائجها، فقد بدأت الدراسة بتحديد المستويات المعيارية للمواد الدراسية في (اللغة العربية والرياضيات والعلوم) للصف الرابع الابتدائي والثاني الإعدادي، وذلك من خلال تحليل محتوى المقررات الدراسية ومدى تطابقها مع المستويات المعيارية في المعايير القومية لعامي 2003 و2008، ليكون ذلك محك ثابت يتم في ضوئه تقويم تحصيل الطلاب، ثم أعد فريق البحث جدول مواصفات للاختبار تم في ضوئه إعداد المفردات الاختبارية (جزئيات الامتحان) لإنشاء بنك الأسئلة ثم تم تجريب المفردات الاختبارية على عينة استطلاعية لتحديد الخصائص السيكومترية (النفسية) للمفردات وكذلك اختيار المفردات التي توافرت بها القدرة على التمييز بين الطلاب بحسب إتقانهم للهدف المقاس.

الصور الاختبارية
وحسبما جاء في التقرير، فقد تم إعداد الصور الاختبارية متكافئة ومتعادلة القياس في ضوء نظرية القياس الحديثة (الاستجابة للمفردة IRT) وكانت عبارة عن 4 صور اختبارية لمادة العلوم، و6 صور اختبارية لكل من (اللغة العربية والرياضيات) لكل صف دراسي وكان وصف الاختبارات كالتالي: اختبار العلوم للصف الرابع الابتدائي تكون من 35 مفردة يقابلها الدرجة الكلية 40 درجة منها 32 مفردة اختيار من متعدد يقابلها 33 درجة، وسؤالان "مزاوجة" يقابلهما 6 درجات، وسؤال واحد ترتيب يقابله درجة واحدة، وتضمن الاختبار مجالات الأحياء 10 درجات، والفيزياء 3 درجات، وعلوم الأرض 17 درجة، والكيمياء 10 درجات، وتم تمثيل المستويات المعرفية على النحو التالي (12 درجة للتذكر، و20 درجة للفهم والتطبيق، و8 درجات لمستوى التفكير الناقد وحل المشكلات)، وكان زمن الاختبار 90 دقيقة.

أما اختبار الرياضيات للصف الرابع الابتدائي فتكون من 38 مفردة يقابلها الدرجة الكلية 40 درجة منها 35 مفردة اختيار من متعدد يقابلها 35 درجة، وسؤالين مزاوجة يقابلها 4 درجات وسؤال واحد ترتيب يقابله درجة واحدة، وتضمن الاختبار مجالات الأعداد ولها 21 درجة، والجبر 3 درجات، والهندسة 5 درجات، والقياس 6 درجات، والإحصاء 5 درجات، وتم تمثيل المستويات المعرفية على النحول التالي (11 درجة للتذكر، و18 درجة للفهم والتطبيق، و11 درجة لمستوى التفكير الناقد وحل المشكلات)، وكان زمن الاختبار 90 دقيقة.

اللغة العربية
وفيما يتعلق باختبار اللغة العربية للصف الرابع الابتدائي فتكون من 35 مفردة يقابلها الدرجة الكلية 44 درجة، منها 28 مفردة للاختيار من متعدد يقابلها 28 درجة، و6 مفردات مقال قصير يقابلها 12 درجة، وسؤال واحد مقال طويل يقابله 4 درجات، وتضمن الاختبار مجالات الاستعداد للقراءة 16 درجة، والقراءة 10 درجات، والتراكيب اللغوية 8 درجات، والكتابة 10 درجات، وتم تمثيل المستويات المعرفية (تذكر، وفهم وتطبيق، ومستوى التفكير الناقد وحل المشكلات) وكان زمن الاختبار 90 دقيقة.

أما اختبار العلوم للصف الثاني الإعدادي فتكون من 39 مفردة يقابلها الدرجة الكلية 45 درجة منها 33 مفردة اختيار من متعدد يقابلها 33 درجة، وثلاثة أسئلة مزاوجة يقابلها 9 درجات، وثلاثة أسئلة ترتيب يقابلها 3 درجات.. وتضمن الاختبار مجالات (علوم الحياة 14 درجة، الكيمياء 14 درجة، الفيزياء 13 درجة، وعلوم الأرض 4 درجات)، وتم تمثيل المستويات المعرفية. وكان زمن الاختبار 100 دقيقة.

الرياضيات
وبالنسبة لاختبار الرياضيات للصف الثاني الإعدادي، فقد تكون من 42 مفردة يقابلها الدرجة الكلية 45 درجة، منها 39 مفردة اختيار من متعدد يقابلها 39 درجة، وسؤالين مزاوجة يقابلها 5 درجات، وسؤال واحد ترتيب يقابله درجة واحدة، وتضمن الاختبار مجالات (الأعداد 11 درجة، والجبر 13 درجة، والهندسة 17 درجة، والإحصاء 4 درجات، وتم تمثيل المستويات المعرفية على النحو التالي: "تذكر 8 درجات، وفهم وتطبيق 25 درجة، ومستوى التفكير الناقد وحل المشكلات 12 درجة"، وزمن الاختبار كان 100 دقيقة.

أما اختبار مادة اللغة العربية للصف الثاني الإعدادي فقد تكون من 35 مفردة، يقابلها 44 درجة، منها 28 مفردة اختيار من متعدد يقابلها 28 درجة، و6 مفردات مقال قصير تقابلها 12 درجة، وسؤال واحد مقال طويل يقابله 4 درجات، وتضمن الاختبار مجالات القراءة 20 درجة والتراكيب اللغوية 16 درجة، والكتابة 8 درجات، وتم تمثيل المستويات المعرفية (تذكر درجة واحدة، وفهم وتطبيق 18 درجة، ومستوى التفكير الناقد وحل المشكلات 25 درجة)، وكان زمن الاختبار 100 دقيقة.

وتم تحديد عينة الدراسة من جميع المحافظات عشوائيًا لتمثيل جميع فئات الشعب، حيث بلغ العدد النهائي للصف الرابع الابتدائي في مادة العلوم 26 ألفًا و382 طالبًا وطالبة، وفي مادة الرياضيات بلغت العينة 18 ألفًا و510 طلاب، وفي اللغة العربية بلغت العينة 22 ألفًا و265 طالبًا وطالبة، وللصف الثاني الإعدادي بلغ إجمالي العينة في مادة العلوم 21 ألفًا و166 طالبًا وطالبة، وفي مادة الرياضيات 21 ألفًا و950 طالبًا وطالبة، وفي مادة اللغة العربية بلغت العينة 19 ألفًا و535 طالبًا وطالبة، وتم ضبط الموقف الاختباري للتطبيق النهائي، وذلك لتكافؤ جميع ظروف التطبيق في جميع المحافظات.

كما تم إعداد مقياس متدرج لتقدير درجات (Rubrics) إجابات الطلاب للأسئلة المفتوحة، وذلك لضمان موضوعية التصحيح للاستجابات وتم تصحيحها على شاشات الكمبيوتر ضمن برنامج متخصص للقارئ الضوئي، إلى جانب استخدام القارئ الضوئي في تصحيح الأسئلة الموضوعية ورصد درجاتها، وتم عمل إعادة تقدير للدرجات للأسئلة المفتوحة بواسطة مصحح آخر وذلك لحساب معامل ثبات المصححين، وفي إطار ذلك تم وضع مواصفات مستويات الأداء لكل صف دراسي وذلك من خلال ورش عمل بمشاركة جميع المعنيين تم الاتفاق على مستويات مسمياتها: "متعثر Falling Down ويعني طالب يمكنه تذكر بعض المعلومات الأولية ويعجز عن حل المشكلات البسيطة، وهو يحتاج إلى مجهود وتحسين كبير جدًّا".

والمستوى الثاني نام Growing وهو يظهر فهمًا جزئيًا للمحتوى يمكنه من حل المشكلات النمطية البسيطة، وهو يحتاج إلى تحسين مستوى، أما المستوى الثالث مرضي Satisfactory وهو يظهر فهمًا جيدًا للمحتوى يتمثل في حل مشكلات مركبة.. وهو يمثل الحد الأدنى المطلوب تحقيقه K والمستوى الرابع متقدم Advanced وهو المستوى المطلوب تحقيقه وهو أعلى من المستوى المرضي، حيث يقدم أدلة وبراهين تؤيد آراء علمية متنوعة ومختلفة ويتعامل مع مواقف علمية غير مألوفة، ويظهر فهمًا شاملًا ومتعمقًا وناقدًا للمحتوى، ويعطي حلولًا متنوعة للمشكلات غير النمطية، ويحل مشكلات مألوفة بطرق غير مألوفة، ويظهر مهارات تواصل فعالة وفهم متعمق يمكنه من ابتكار أفكار وحلول غير تقليدية لمدى واسع من الموضوعات، ويحل أكبر قدر من المشكلات في وقت قصير بأقل قدر من الأخطاء مع إبداء الرأي في كل حل.

وفي ضوء هذا التوصيف العام حددت مجموعات العمل المواصفات القياسية للأداء الخاصة بكل مادة في الصفوف الرابع والثامن من خلال العمل فرديًا ثم المناقشة الجماعية، وحسب المواصفات القياسية للأداء تم تحديد درجة القطع Cut score لتحديد أعداد الطلاب في كل مستوى وذلك على ثلاث جولات باستخدام طريقة أنجوف المعدلة لحساب درجات القطع للاختبار، وتوصلت إلى تحديد درجات القطع لمستويات الأداء الأربعة.

وقد تميزت جميع مراحل وخطوات الدراسة بالدقة العلمية والمنهجية كما أنها استعانت بمجموعات من الخبراء والمحكمين "معلمي المواد الدراسية، موجهين، متخصصين في المناهج وطرق التدريس، وخبراء في القياس والتقويم التربوي إضافة إلى خبراء ومصممي برامج الكمبيوتر"، وذلك بهدف التحقق من توافر المعايير القياسية لكل مراحل الدراسة.

"نقلا عن العدد الورقي..."
الجريدة الرسمية