الملخص:
تُعد اختبارات تنمية التفكير أدوات جوهرية في مجالي التربية وعلم النفس، إذ تسهم في الكشف عن القدرات العقلية العليا، وتدعم تشخيص نواحي القوة والقصور لدى الأفراد، كما تُمكّن من تصميم برامج تعليمية علاجية وإثرائية. تتنوع هذه الأدوات بين الاختبارات المقننة (الجاهزة) التي طورتها مؤسسات علمية متخصصة وفق أسس سيكومترية صارمة، والاختبارات التي يعدها الباحثون خصيصاً لتلبية أهداف أو سياقات بحثية محددة. يهدف هذا المقال إلى تحليل نقدي لهذين النوعين، من خلال استعراض مفاهيمهما، خصائصهما، خطوات إعدادهما، المزايا والعيوب، ثم إجراء مقارنة تحليلية مدعومة بأمثلة ودراسات حالة. كما يناقش المقال الاتجاهات المستقبلية في تقييم التفكير، خاصة التقييم الدينامي والتقنيات الرقمية والذكاء الاصطناعي. خلُص المقال إلى أن التكامل بين الأدوات المقننة والمطورة من الباحثين يمثل المسار الأمثل لضمان دقة القياس وملاءمته للسياقات المتنوعة.
الكلمات المفتاحية: تنمية التفكير، الاختبارات المقننة، الاختبارات المعدة، الصدق والثبات، التقييم الدينامي، الذكاء الاصطناعي.
المقدمة:
يشكّل التفكير حجر الأساس في عمليات التعلم وحل المشكلات واتخاذ القرارات. ومع تصاعد الاهتمام العالمي بمهارات القرن الحادي والعشرين، أصبحت الحاجة إلى أدوات علمية دقيقة لقياس التفكير وتنميته ضرورة حتمية في المجالات التربوية والنفسية.
وتبرز هنا معضلة أساسية: هل يعتمد الباحث أو الممارس التربوي على اختبارات مقننة جاهزة تتمتع بمعايير سيكومترية عالية، أم يُفضل بناء أدوات جديدة تراعي الخصوصيات الثقافية والسياقية للبيئة المحلية؟
من هذه المشكلة تنبثق أهداف هذا المقال، وهي:
- تقديم إطار مفاهيمي ونظري لاختبارات التفكير.
- تحليل خصائص الاختبارات المقننة والمعدة من الباحثين.
- إجراء مقارنة تحليلية بين النوعين.
- عرض دراسات حالة واقعية توضح نقاط القوة والتحدي.
- استشراف الاتجاهات المستقبلية في مجال قياس التفكير.
أهمية قياس التفكير في السياقين التربوي والنفسي
تعريف التفكير وتصنيفاته
يُعد التفكير من العمليات العقلية العليا التي تُميز الإنسان عن غيره من الكائنات، إذ يشكّل الأداة الأساسية للتكيف مع البيئة وفهمها والسيطرة عليها. ويُعرَّف التفكير بأنه “عملية عقلية واعية ومعقدة، يسعى الفرد من خلالها إلى معالجة المعلومات، وتحليل الخبرات، وبناء المعاني، وصولًا إلى اتخاذ القرارات وحل المشكلات” (أبو جابر، 2018). ويؤكد أوزبيل (Ausubel, 1968) أن التفكير ليس مجرد استرجاع ميكانيكي للمعلومات، بل هو عملية منهجية تهدف إلى توظيف المعارف والمهارات في مواقف جديدة.
يتأثر التفكير بالسياقات الاجتماعية والثقافية والتربوية المحيطة، إذ يرى فيجوتسكي (Vygotsky, 1978) أن نمو التفكير يتحدد في إطار “منطقة النمو القريبة” حيث يكتسب الفرد مهارات جديدة من خلال التفاعل مع الآخرين. ومن ثمّ فإن التفكير لا يُفهم كعملية فردية منعزلة، بل كبناء اجتماعي معرفي يتطور عبر الخبرة والتفاعل.
لقد حاول العديد من الباحثين تصنيف أنماط التفكير لتسهيل فهمها وتطبيقها في الممارسات التربوية والنفسية، ومن أبرز هذه التصنيفات:
- التفكير النقدي: يُعتبر من أهم أشكال التفكير العليا، ويُعرَّف بأنه القدرة على تحليل المعلومات والأفكار بصورة موضوعية، وتقييم الأدلة، واستخلاص استنتاجات منطقية مبنية على معايير عقلانية (Ennis, 2011). ويُستخدم التفكير النقدي في التربية لتشجيع الطلبة على مواجهة المعتقدات السائدة والتفكير المستقل، بينما يُوظف في علم النفس للكشف عن أنماط التحيز المعرفي وتعديلها.
- التفكير الإبداعي: يُعرف بأنه القدرة على توليد أفكار أصيلة ومتنوعة، والبحث عن حلول جديدة وغير مألوفة للمشكلات (Torrance, 1974). ويمتاز هذا النوع بالمرونة والقدرة على الربط بين أفكار متباعدة، ويُعدّ مؤشرًا أساسيًا على الابتكار في التعليم والعمل. في السياق التربوي، يُقاس التفكير الإبداعي عبر اختبارات مثل اختبار تورانس، أما في السياق النفسي فيُوظف لفهم القدرات الابتكارية والتنبؤ بالنجاح في المهن الإبداعية.
- التفكير المنظومي: يُركز على إدراك الظواهر والمواقف باعتبارها أنظمة مترابطة، حيث يُحلل الفرد العلاقات الدائرية والتفاعلات المتبادلة بين عناصر النظام (Senge, 1990). يُعتبر هذا النوع مهمًا بشكل خاص في مجالات التخطيط الاستراتيجي وحل المشكلات المعقدة التي لا تُعالج بالطرق الخطية التقليدية.
- أنماط التفكير الأخرى: تشمل أنماطًا متعددة مثل:
- التفكير التركيبي: الذي يجمع بين عناصر متفرقة لتشكيل حلول جديدة.
- التفكير المثالي: الذي يوجه الانتباه نحو المستقبل والقيم العليا.
- التفكير العملي: الذي يهتم بالتطبيق المباشر والخطوات التدريجية لحل المشكلات.
- التفكير التحليلي: الذي يُركز على دراسة التفاصيل، واستخدام المنطق، وبناء استراتيجيات ممنهجة للوصول إلى حلول دقيقة.
- مهارات التفكير العلمي: وهي مجموعة من المهارات الإجرائية التي تُعتبر حجر الأساس في البحث العلمي، مثل الملاحظة الدقيقة، والتصنيف وفق السمات أو الوظائف، والقياس باستخدام أدوات معيارية، بالإضافة إلى الاستنتاج، والتنبؤ، والتواصل الفعال (أبو جابر، 2018). وتُعد هذه المهارات جزءًا لا يتجزأ من التعليم القائم على الاستقصاء العلمي.
تعريف اختبارات التفكير
مع تطور علم النفس التربوي والقياس النفسي، ظهرت الحاجة إلى أدوات دقيقة لقياس التفكير بمختلف أنماطه. وقد عرف أوزبيل (Ausubel, 1968) اختبارات التفكير بأنها “أدوات منهجية تهدف إلى قياس القدرة على استخدام مهارات عقلية عليا في المواقف التعليمية”. أما جيلفورد (Guilford, 1981) فقد وسّع هذا التعريف معتبرًا أن هذه الاختبارات هي “وسائل إجرائية للكشف عن الأبعاد المتعددة للتفكير مثل الطلاقة، المرونة، الأصالة، والتفاصيل”.
تُبرز هذه التعريفات بعدين أساسيين في اختبارات التفكير:
- البعد الكمي: قياس الأداء العقلي من حيث الدرجات والمعايير.
- البعد الكيفي: الكشف عن أنماط التفكير وجودة الاستجابات، لا مجرد كميتها.
مبررات قياس مهارات التفكير
يُعد قياس التفكير أحد الأهداف الأساسية للتربية والبحث العلمي. تهدف أدوات القياس إلى تقديم تعبير كمي عن خاصية معينة، من خلال مقارنة سلوك الفرد أو قدرته بوحدات قياسية مقننة ومعلومة. تكمن الأهمية العملية للقياس في تحقيق عدة أغراض أساسية:
- المسح والتنبؤ: يوفر القياس صورة شاملة عن الإمكانيات الحالية للفرد، مثل الذكاء والتحصيل، مما يسمح بالتنبؤ بمستواه المتوقع في المستقبل.
- التشخيص والعلاج: يساعد القياس في تبيان نواحي القوة والضعف والقصور في قدرات الفرد، مما يمكن من وضع خطط علاجية أو برامج دعم مخصصة.
- دعم القرار: تُستخدم أدوات القياس لتزويد صانعي القرار في المؤسسات التعليمية بالمعلومات اللازمة لاتخاذ قرارات مستنيرة، مثل تطوير المناهج أو تعديلها.
بيان المشكلة وأهداف التقرير
تتمحور المشكلة الرئيسية التي يواجهها الباحثون في مجال قياس التفكير حول الاختيار بين أداتين رئيسيتين: الاختبارات المقننة الجاهزة، والتي تُعد نتيجة لجهد بحثي كبير، والاختبارات التي يصممها الباحثون بأنفسهم. هذا التقرير يسعى إلى تحليل كل خيار بشكل نقدي، مع توضيح مزاياه وعيوبه، وتوفير إرشادات عملية للباحثين لاتخاذ قرار مستنير. يهدف التقرير إلى تقديم فهم شامل للأسس المنهجية التي يقوم عليها كل نوع، والاتجاهات المستقبلية التي قد تغير هذا المشهد بشكل جذري.
الإطار النظري والمنهجي للقياس النفسي والتربوي
الخصائص السيكومترية لأدوات القياس (الأسس العلمية)
تُعد الخصائص السيكومترية لأدوات القياس النفسية والتربوية الركيزة الأساسية التي تضمن مصداقية النتائج وموثوقيتها، حيث تعتمد جودة أي أداة على مدى التزامها بالمعايير العلمية في البناء والتقنين والتطبيق (أبو جابر، 2018). وتشمل هذه الخصائص ما يلي:
أ. التقنين (Standardization)
يشير التقنين إلى عملية وضع الاختبار في إطار موحد يحدد بدقة كيفية تطبيقه وتصحيحه، بحيث تُطبق جميع الفقرات والشروط على جميع المفحوصين بطريقة متسقة (Tavakol & Dennick, 2011). يتضمن ذلك:
- اختيار عينة ممثلة للمجتمع المستهدف.
- تحديد إجراءات واضحة للتطبيق والتصحيح.
- تطوير معايير مرجعية تمكن من تفسير النتائج ومقارنتها بين أفراد ومجموعات مختلفة.
يضمن التقنين أن تكون نتائج الاختبار مستقلة عن ظروف التطبيق أو تحيزات المصححين، مما يعزز موضوعيتها ويجعلها قابلة للتعميم على سياقات متعددة.
ب. الصدق (Validity)
يعكس الصدق مدى قدرة الأداة على قياس ما وُضعت لقياسه فعليًا. ويُعد الصدق شرطًا أساسيًا لأي قياس، إذ لا يكفي أن تكون الأداة دقيقة أو متسقة إذا لم تقِس السمة الصحيحة. وتنقسم أنواع الصدق إلى:
- صدق المحتوى (Content Validity): يعكس مدى تمثيل عناصر الاختبار للمجالات النظرية أو المهارات المراد قياسها.
- الصدق التنبؤي (Predictive Validity): يقيس قدرة الاختبار على التنبؤ بأداء الفرد في مواقف مستقبلية مرتبطة بالمهارة المقاسة.
- الصدق التلازمي (Concurrent Validity): يُحدد بمقارنة نتائج الاختبار مع أداة قياس أخرى تطبق في نفس الوقت على نفس العينة.
- صدق البنية (Construct Validity): يشير إلى مدى تطابق نتائج الاختبار مع الفرضيات النظرية التي بُني عليها، مثل الطلاقة أو المرونة في التفكير الإبداعي.
ج. الثبات (Reliability)
يعكس الثبات اتساق واستقرار نتائج الاختبار عند تطبيقه على نفس الأفراد في ظروف متشابهة، وهو مؤشّر على دقة القياس وقلة تأثره بالأخطاء العشوائية. تتراوح قيم الثبات عادة بين 0 و1، وكلما اقتربت القيمة من 1 دل ذلك على جودة الأداة (Torrance, 1974). تجدر الإشارة إلى أن الصدق يشتمل على الثبات كشرط ضروري، إلا أن الثبات وحده لا يضمن صدق الأداة، إذ يمكن أن يكون الاختبار ثابتًا لكنه يقيس شيئًا غير المقصود.
نظريات التطور المعرفي وتأثيرها على القياس
أ. نظرية بياجيه في التطور المعرفي
حدد جان بياجيه أربع مراحل رئيسية للنمو المعرفي: المرحلة الحسية الحركية، مرحلة ما قبل العمليات، مرحلة العمليات المحسوسة، ومرحلة العمليات المجردة (Piaget, 1972). وتشير هذه النظرية إلى أن التفكير يتطور تدريجيًا وفق مراحل عمرية محددة، مما يستلزم توافق أدوات القياس مع مرحلة نمو المفحوص. على سبيل المثال، لا يُمكن تطبيق اختبارات التفكير المجرد على الأطفال في المرحلة الحسية الحركية دون المساس بصلاحية الأداة، إذ ستكون النتائج غير موثوقة. ويشكل هذا التوافق حجر الزاوية لضمان صدق البنية (Construct Validity) للاختبارات التعليمية والنفسية.
ب. نظرية فيجوتسكي والتقييم الدينامي
على عكس بياجيه، ركّز فيجوتسكي (Vygotsky, 1978) على الدور الاجتماعي في تطوير التفكير، مؤكدًا على مفهوم “منطقة النمو القريبة” (Zone of Proximal Development). يوضح هذا المفهوم الفرق بين ما يستطيع الفرد تحقيقه بمفرده وما يمكن تحقيقه بدعم من شخص أكثر خبرة.
ينتج عن هذا المفهوم منهجية تقييمية حديثة تُعرف بـ التقييم الدينامي (Dynamic Assessment)، والتي تركز على عملية التعلم وإمكانات النمو بدلاً من النتائج النهائية فقط. يمثل هذا التحول فلسفة جديدة للقياس، إذ يتحول من مجرد أداة تقييم إلى أداة تشخيصية وعلاجية، تساعد على تحديد نقاط القوة والضعف وتصميم التدخلات التعليمية المناسبة.
ج. النظريات الداعمة للتقييم
- نظرية بياجيه: تؤكد أن التفكير يتطور وفق مراحل عمرية ونمائية، ما يستدعي توافق أدوات القياس مع هذه المراحل لضمان الصدق البنائي.
- نظرية فيجوتسكي: تبرز أهمية التفاعل الاجتماعي ومنطقة النمو القريبة، مؤدية إلى منهجيات التقييم الدينامي.
- نظرية جيلفورد للقدرات العقلية: ترى أن التفكير يتكون من أبعاد مستقلة قابلة للقياس (Guilford, 1981)، مثل الطلاقة، الأصالة، والمرونة.
- النموذج البنائي للتعلم: يرى أن التفكير ينمو عبر التعلم النشط وحل المشكلات، ما يدعم تصميم اختبارات قياس التفكير بطريقة عملية ومرنة تتوافق مع التعلم الواقعي.
الاختبارات المقننة (الجاهزة)
مفهومها وخصائصها
تُعرف الاختبارات المقننة (Standardized Tests) بأنها أدوات قياس وضعتها خبراء ومختصون في مجال القياس النفسي والتربوي، وتم تصميمها وفق شروط علمية دقيقة، خضعت لتطبيق على عينات كبيرة ممثلة للمجتمع الأصلي المستهدف (Anastasi & Urbina, 1997).
تتميز هذه الاختبارات بما يلي:
- صدق وثبات مرتفعان: نتيجة لتقنينها الدقيق وتجريبها على عينات كبيرة، ما يضمن دقة النتائج واستقرارها.
- معايير مرجعية واضحة: توفر إطارًا لمقارنة نتائج الأفراد والمجموعات، مما يسهل تفسير النتائج.
- قابلية التعميم والتطبيق الواسع: يمكن استخدامها في مختلف البيئات التعليمية والنفسية، وحتى في المقارنات الدولية.
أمثلة رئيسية للاختبارات المقننة
- اختبار مهارات التفكير (TSA – Thinking Skills Assessment):
يُستخدم في جامعات مرموقة مثل كامبريدج وأكسفورد ضمن إجراءات القبول، ويقيس مهارات حل المشكلات والتفكير النقدي، ويضم أسئلة اختيار من متعدد بالإضافة إلى قسم كتابي في بعض النسخ. - اختبارات تورانس للتفكير الإبداعي (TTCT – Torrance Tests of Creative Thinking):
تُصمَّم لقياس القدرات الإبداعية عبر أقسام لفظية وشكلية، وتقيس مهارات مثل الطلاقة، والمرونة، والأصالة. - اختبار واتسون–جلاسر للتفكير النقدي (Watson–Glaser™ Critical Thinking Appraisal):
يُستخدم على نطاق عالمي في التوظيف والقبول الجامعي، ويقيس القدرة على تحليل المعلومات والاستدلال وتقييم قوة الحجج المنطقية.
المزايا والعيوب
المزايا:
- الموثوقية العالية: تتميز بدقة وموضوعية عالية نظرًا للتقنين الصارم الذي خضعت له.
- قابلية التعميم والمقارنة: تسمح بإجراء مقارنات بين مجموعات مختلفة أو حتى بين مجتمعات دولية.
- الكفاءة في التطبيق: توفير الوقت والجهد على الباحث، إذ يمكن شراء الأداة وتطبيقها مباشرة دون الحاجة للبناء من الصفر.
العيوب:
- التبعية الثقافية: قد لا تكون مناسبة للبيئات المحلية، ما يتطلب إعادة تقنين مكلفة لضمان صلاحيتها (مثال: تقنين اختبارات وودكوك جونسون في الأردن).
- عدم المرونة: صعوبة تعديلها لتتناسب مع أهداف بحثية جديدة أو قياس متغيرات إضافية.
- التكلفة المادية العالية: تشمل تكاليف تطوير الاختبارات وشرائها، ما قد يثقل كاهل الباحث.
الاختبارات المعدة من قبل الباحثين
مفهومها ومبررات إعدادها
تشير الاختبارات المعدة من قبل الباحثين إلى أدوات قياس يتم تصميمها خصيصًا لدراسة ظاهرة معينة أو قياس متغير لم تتناوله الاختبارات المقننة. يلجأ الباحثون إلى هذه الطريقة في حال عدم وجود اختبار مقنن مناسب أو لتجنب مشاكل التبعية الثقافية للأدوات الأجنبية (Fraenkel et al., 2012).
المنهجية العلمية للبناء
تتبع عملية بناء أداة قياس منهجية علمية دقيقة لضمان جودتها، وتشمل المراحل التالية:
- تحديد الظاهرة: تعريف السمة أو القدرة المراد قياسها بدقة.
- تحديد الأبعاد النظرية: تحديد المجالات أو المحاور التي يتكون منها المفهوم.
- صياغة الفقرات: وضع أسئلة واضحة، مختصرة، ومفهومة، مع مراعاة استخدام صياغة إيجابية قدر الإمكان.
- اختيار بدائل الإجابة: اعتماد نظام تصحيح مناسب، مثل مقياس ليكرت الخماسي.
- إعداد التعليمات: كتابة تعليمات واضحة لضمان التزام المفحوصين بظروف التطبيق.
- التجربة الاستطلاعية: تطبيق الأداة على عينة صغيرة لتقييم الصدق والثبات.
- تحليل الفقرات إحصائيًا: حذف الفقرات غير المتوافقة مع المؤشرات السيكومترية المطلوبة.
- التطبيق الأساسي: تطبيق الأداة على عينة الدراسة الرئيسية بعد التأكد من جودتها.
أمثلة على دراسات بناء أدوات قياس
- مقياس جمال للتفكير التفاعلي (مصر):
قامت دراسة جمال (2018) بتطوير مقياس يتكون من 50 فقرة يهدف إلى قياس مهارات التفكير التفاعلي لدى طلاب التعليم قبل الجامعي. أظهرت نتائج الدراسة أن المقياس يتمتع بمؤشرات عالية من الصدق والثبات، مما يؤكد صلاحيته لقياس ما وُضع من أجله. وقد تم الاعتماد في تصميم المقياس على المعايير السيكومترية المعتمدة لضمان دقة النتائج (Gamal, 2018). - مقياس مهارات التفكير العلمي (جامعة دمشق):
في سياق مشابه، طوّرت دراسة أخرى أداة قياس لقياس مهارات التفكير العلمي لدى طلاب المرحلة الثانوية في جامعة دمشق. ركّزت الدراسة على مراعاة الخصائص السيكومترية للأداة بما يتلاءم مع البيئة المحلية، وأسفرت النتائج عن مؤشرات موثوقة من حيث الثبات والصدق، ما يجعل الأداة مناسبة للبحوث التربوية المحلية (Al-Saleh, 2019).
المزايا والتحديات
المزايا:
- الملاءمة السياقية: تصميم الأدوات بما يتوافق مع الثقافة والمجتمع المستهدف.
- قياس متغيرات جديدة: إمكانية استكشاف ظواهر لم تتناولها الأدوات المقننة.
التحديات:
- الجهد والوقت: عملية البناء طويلة وتتطلب تخطيطًا دقيقًا.
- الحاجة للخبرة: تتطلب مهارات متقدمة في القياس النفسي والإحصاء.
- تحقيق المؤشرات السيكومترية: صعوبة الوصول إلى مستويات عالية من الصدق والثبات، مما قد يؤثر على موثوقية النتائج.
مقارنة تحليلية ونقدية
جدول مقارنة شاملة
| البعد | الاختبارات المقننة (الجاهزة) | الاختبارات المعدة من الباحثين |
| الهدف | قياس عام وقابل للتعميم، مناسب للمقارنات بين الدراسات أو المجتمعات المختلفة. | قياس ظاهرة محددة في سياق معين، مناسب لدراسات محلية أو متغيرات جديدة. |
| الصدق والثبات | مؤشرات عالية وموثقة، نتيجة عملية تقنين منهجية صارمة. | متغير ومرتبط بجودة منهجية البناء، يحتاج إلى تجربة استطلاعية وتحليل سيكومتري لضمانه. |
| قابلية التعميم | عالية، يمكن استخدام الاختبار عبر عينات مختلفة أو دراسات دولية. | محدودة، غالباً صالحة للسياق المحلي أو العينة المستهدفة فقط. |
| التكلفة والوقت | تكلفة مرتفعة لشراء الأداة، لكن وقت التطبيق قصير. | تكلفة مادية منخفضة، لكن تتطلب وقتاً وجهداً كبيرين لبناء الأداة وتجربتها. |
| المرونة | محدودة، لا يمكن تعديل الفقرات أو الأهداف بسهولة. | عالية، يمكن تصميم الأداة لتناسب أهداف البحث والسياق المحلي. |
| الملائمة الثقافية | قد تحتاج إلى إعادة تقنين لضمان الصلاحية في بيئات مختلفة. | مصممة لتكون ملائمة ثقافياً وبيئياً للمجتمع المستهدف. |
تحليل نقدي للجدول والنتائج
يوضح الجدول أن الاختيار بين الاختبارات المقننة والمعدة من الباحثين ليس مجرد تفضيل، بل هو قرار استراتيجي يعتمد على أهداف البحث، والظاهرة المدروسة، والموارد المتاحة. المعيار الحقيقي للحكم على جودة الأداة هو خصائصها السيكومترية، فوجود درجة عالية من الصدق والثبات هو ما يضفي على النتائج مصداقية، بغض النظر عن الجهة التي قامت بتطوير الأداة.
يُمكن ملاحظة وجود علاقة متبادلة بين التكلفة الزمنية والمادية وجودة الأداة. فالاختبارات المقننة تُكلّف مالاً لأنها استثمرت بالفعل جهداً ووقتاً كبيراً في مرحلة التقنين المنهجي. بالتالي، يدفع الباحث المال مقابل توفير الوقت والجهد، ويحصل على أداة مضمونة الجودة. في المقابل، يختار الباحث الذي يقرر بناء أداته الخاصة تجنب التكلفة المادية لشراء أداة جاهزة، لكنه يدفع الثمن في المقابل بوقته وجهده اللازمين لإجراء عملية بناء وتقنين مصغرة. هذا يفسر لماذا تكون الأدوات المعدة من قبل الباحثين أحياناً أقل جودة، إذا لم تُمنح عملية بنائها وتقنينها الوقت والخبرة الكافيين.
إرشادات عملية:
- استخدام الاختبار المقنن: يُفضل هذا الخيار عندما يكون هناك اختبار مقنن يتمتع بصدق وثبات مقبول في البيئة المحلية، وعندما يكون الهدف هو المقارنة بين نتائج الدراسة ونتائج دراسات عالمية أو إقليمية أخرى.
- إعداد أداة جديدة: يُفضل هذا الخيار عندما يكون الهدف البحثي فريداً ولا توجد أداة مناسبة، أو عندما يكون السياق الثقافي والعوامل البيئية مختلفة بشكل جوهري عن تلك التي وُضع لها الاختبار المقنن الأصلي.
اتجاهات مستقبلية في قياس التفكير
التقييم الدينامي (Dynamic Assessment)
يُعد التقييم الدينامي منهجية حديثة تتجاوز الاختبارات التقليدية، سواء كانت جاهزة أو معدة، حيث يركز على عملية التعلم وإمكانات النمو بدلاً من الاكتفاء بالنتيجة النهائية. يرتكز هذا المنهج على نظريات مثل نظرية فيجوتسكي، التي تؤكد أن التعلم يحدث في “منطقة النمو القريبة” بمساعدة شخص أكثر خبرة (Vygotsky, 1978).
يُحول التقييم الدينامي نموذج القياس من التركيز على المنتج (“ماذا تعلمت؟”) إلى التركيز على العملية (“كيف تتعلم؟”)، مما يجعله أداة تشخيصية وعلاجية في آن واحد. على سبيل المثال، بدلاً من مجرد إجراء اختبار رياضيات، يعمل المعلم مع الطالب لتقييم قدرته على حل المشكلات الرياضية وتقديم الدعم اللازم، مما يتيح قياس إمكانات التعلم بدقة (Lidz, 1991).
الذكاء الاصطناعي والتعلم الآلي في القياس
يشكل الذكاء الاصطناعي تحولاً جوهرياً في أدوات القياس النفسي والتربوي، حيث يمكنه:
- تحليل البيانات الضخمة: تتيح خوارزميات التعلم الآلي تحليل كميات هائلة من البيانات، مما يمكن الباحثين من اكتشاف أنماط جديدة في السلوك المعرفي (Baker & Inventado, 2014).
- تطوير أدوات قياس جديدة: تساعد هذه التقنيات في بناء اختبارات نفسية مبتكرة، مثل تصنيف الشخصيات أو القدرات المعرفية من بيانات الاستطلاع (Pechenizkiy et al., 2008).
- التقييم الآلي: أتمتة تصحيح الاختبارات المفتوحة، وتحليل مقابلات الفيديو لتقييم مهارات مثل الانفتاح والمرونة الاجتماعية (Zhou et al., 2020).
يساهم الذكاء الاصطناعي في “طمس الحدود” بين الاختبارات الجاهزة والمعدة من الباحثين، حيث يمكن للباحث تدريب خوارزميات على بيانات محلية لتحقيق تقييم دقيق يجمع بين دقة الأدوات المقننة ومرونة الأدوات المعدة (Chen et al., 2022).
الاتجاهات المستقبلية
- الاختبارات الرقمية التكيفية (Adaptive Testing): تتيح تعديل مستوى الأسئلة وفق أداء الفرد الفعلي (Weiss, 2011).
- الذكاء الاصطناعي في تصميم الفقرات: توليد أسئلة ذكية تراعي مستوى المعرفة والقدرات (Van der Linden & Glas, 2010).
- التقييم القائم على الأداء (Performance-based Assessment): التركيز على مهارات تطبيقية وحل المشكلات الواقعية (Gulikers et al., 2004).
- دمج الأبعاد الثقافية: تصميم أدوات تقيس التفكير مع مراعاة الخصائص الثقافية والاجتماعية للمجتمع المحلي (Geisinger, 1994).
الخلاصة والتوصيات
ملخص النتائج الرئيسية
يبين التحليل أن الاختيار بين الاختبارات المقننة والمعدة من الباحثين يعتمد على أهداف البحث، السياق الثقافي، والموارد المتاحة. تتميز الاختبارات المقننة بالموثوقية وقابلية التعميم، بينما توفر الاختبارات المعدة مرونة وملاءمة للسياق المحلي. المعيار الأهم هو قدرة الأداة على تحقيق مؤشرات الصدق والثبات، إذ بدونها تفقد الاختبارات قيمتها العلمية (Nunnally & Bernstein, 1994).
توصيات للباحثين والمؤسسات الأكاديمية
- تعميق الفهم المنهجي: ضرورة فهم الباحثين للأسس السيكومترية (الصدق والثبات) كأساس لأي دراسة تعتمد على القياس (Anastasi & Urbina, 1997).
- تشجيع التقنين المحلي: إعادة تقنين الاختبارات الأجنبية لتلائم البيئة العربية مع الحفاظ على جودتها العالمية (Geisinger, 1994).
- استكشاف المنهجيات الحديثة: اعتماد التقييم الدينامي (Lidz, 1991)، وتوظيف الذكاء الاصطناعي والتعلم الآلي (Baker & Inventado, 2014) في تطوير أدوات قياس جديدة لتعزيز الدقة والكفاءة.
- دمج النهج التكاملي: الجمع بين الاختبارات المقننة والمعدة لتقديم أدوات قياس دقيقة ومرنة في الوقت ذاته.
- استثمار التحول الرقمي: تبني الاختبارات الرقمية التكيفية والتقييم القائم على الأداء لتعزيز تجربة التعلم والقياس (Weiss, 2011; Gulikers et al., 2004).
جدول (2): أمثلة على دراسات استخدمت أدوات قياس مختلفة
| اسم الدراسة | نوع الأداة المستخدمة | الظاهرة المقاسة | أهم النتائج المنهجية |
| دراسة تقنين اختبارات وودكوك جونسون | مقننة (Woodcock-Johnson) | الذكاء والتحصيل الأكاديمي | تم التحقق من صدق وثبات النسخة العربية. |
| دراسة بناء مقياس جمال | معدة من الباحثين (Gamal Scale) | مهارات التفكير التفاعلي | قيم معامل الثبات تراوحت بين 0.72 و 0.93، وبلغ الصدق الذاتي 0.90. |
| دراسة جامعة دمشق | معدة من الباحثين | مهارات التفكير العلمي | سعت إلى تطوير مقياس يتمتع بدلالات صدق وثبات مناسبة للطلاب. |
| دراسة أثر برنامج إثرائي | مقننة (Watson-Glaser) | التفكير النقدي | أكدت النتائج فعالية البرنامج في تنمية التفكير النقدي لدى الطالبات. |
جدول (3): أمثلة على أنواع التفكير ومهاراتها الفرعية
| نوع التفكير | المهارات الفرعية |
| التفكير النقدي | التحليل، التقييم، التفسير، الاستدلال، التفكير المنفتح. |
| التفكير الإبداعي | الطلاقة (توليد الأفكار)، المرونة (التنوع)، الأصالة (الجدة)، التوسع (التفاصيل). |
| التفكير المنظومي | مهارة قراءة الشكل المنظومي، تحليل الشكل وإدراك العلاقات، تكملة العلاقات في الشكل. |
| التفكير العملي | التحقق من الخبرة الشخصية، حرية التجريب، إيجاد طرق جديدة لعمل الأشياء. |
| التفكير التحليلي | جمع المعلومات، تعريف المشكلة بدقة، البحث عن حلول بديلة، التخطيط بحرص. |
| مهارات التفكير العلمي | الملاحظة، التصنيف، القياس، الاستنتاج، التنبؤ، التواصل. |
المراجع:
أبو جابر، س. (2018). علم نفس التفكير والتطور المعرفي. عمان: دار المسيرة.
جمال، م. (2018). تطوير مقياس جمال للتفكير التفاعلي [رسالة ماجستير غير منشورة]. جامعة القاهرة، مصر.
Anastasi, A., & Urbina, S. (1997). Psychological testing (7th ed.). Upper Saddle River, NJ: Prentice Hall.
Baker, R. S., & Inventado, P. S. (2014). Educational data mining and learning analytics. In Learning analytics (pp. 61–75). Springer. https://doi.org/10.1007/978-3-319-11208-0_4
Chen, X., Zhang, L., & Liu, Y. (2022). Artificial intelligence in educational assessment: Trends and applications. Computers & Education, 185, 104533. https://doi.org/10.1016/j.compedu.2022.104533
Ennis, R. H. (2011). Critical thinking: Reflection and perspective—Part I. Inquiry: Critical Thinking Across the Disciplines, 26(1), 4–18. https://doi.org/10.5840/inquiryct20112611
Fraenkel, J. R., Wallen, N. E., & Hyun, H. H. (2012). How to design and evaluate research in education (8th ed.). New York, NY: McGraw-Hill.
Geisinger, K. F. (1994). Cross-cultural normative assessment: Translation and adaptation issues influencing the normative interpretation of assessment instruments. Psychological Assessment, 6(4), 304–312. https://doi.org/10.1037/1040-3590.6.4.304
Guilford, J. P. (1981). The nature of human intelligence. New York, NY: McGraw-Hill.
Gulikers, J. T., Bastiaens, T. J., & Kirschner, P. A. (2004). A five-dimensional framework for authentic assessment. Educational Technology Research and Development, 52, 67–86. https://doi.org/10.1007/BF02504676
Lidz, C. S. (1991). Practitioner’s guide to dynamic assessment. New York, NY: Guilford Press.
Nunnally, J. C., & Bernstein, I. H. (1994). Psychometric theory (3rd ed.). New York, NY: McGraw-Hill.
Piaget, J. (1972). The psychology of the child. New York, NY: Basic Books.
Senge, P. (1990). The fifth discipline: The art & practice of the learning organization. New York, NY: Doubleday.
Torrance, E. P. (1974). Torrance tests of creative thinking: Norms-technical manual. Princeton, NJ: Personnel Press.
Tavakol, M., & Dennick, R. (2011). Making sense of Cronbach’s alpha. International Journal of Medical Education, 2, 53–55. https://doi.org/10.5116/ijme.4dfb.8dfd
Van der Linden, W. J., & Glas, C. A. W. (2010). Elements of adaptive testing. New York, NY: Springer.
Vygotsky, L. S. (1978). Mind in society: The development of higher psychological processes. Cambridge, MA: Harvard University Press.
Weiss, D. J. (2011). Better data from better measurements using computerized adaptive testing. Journal of Methods and Measurement in the Social Sciences, 2(1), 1–27.
Zhou, M., Chen, L., & Xie, H. (2020). Artificial intelligence in education: Automated assessment and feedback. Computers & Education, 149, 103805. https://doi.org/10.1016/j.compedu.2020.103805
تعليم جديد أخبار و أفكار تقنيات التعليم
