Zamen | زامن
جدد معلوماتك عن الدلالة الإحصائية
آمي غالو – هارفارد بزنس ريفيو: لا بدّ أنّك ترغب حين تقوم بإجراء تجربة أو تحليل بعض البيانات في معرفة ما إذا كانت نتائجك ذات “دلالة”. ولكن لعلّك تدرك كذلك أنّ الأهميّة العمليّة التطبيقيّة لا تعني بالضرورة امتلاك الثقة بأنّ النتيجة التي حصلت عليها لم تكن مجرّد صدفة (وهذا ما نقصده بمعرفة الدلالة الإحصائيّة). وهذا التمييز مهمّ، ومن المؤسف أن نجدَ أنّ مفهوم الدلالة الإحصائية يُساء فهمه وتطبيقه في مؤسسات الأعمال اليوم. ولأنّ عدداً متزايداً من الشركات تعتمد على البيانات من أجل اتخاذ قرارات مهمّة في العمل فإنّه من الضروريّ أن يمتلك المدراء فهماً واضحاً وصحيحاً لهذا المفهوم. ومن أجل فهم الدلالة الإحصائية بشكل أفضل وأدقّ أجريت هذا الحوار مع توم ريدمان، صاحب كتاب: “الاعتماد على البيانات: كيف تستفيد من أهمّ عناصر العمل”، كما أنّه يقدّم استشارات متخصصة لعدد من مؤسسات الأعمال بخصوص برامج البيانات وجودتها. ما المقصود بالدلالة الإحصائية؟ يساعدنا مفهوم الدلالة الإحصائية على تحديد ما إذا كانت نتيجة ما عائدة إلى مجرّد الصدفة أم أنّ عاملاً ما يقف وراءها. حين تكون النتيجة ذات دلالة وأهمّية، فإنّ هذا يعني أنّك تمتلك الثقة بأنّها حقيقية، وأنّ الأمر ليس متعلقا بكونك محظوظاً (أو غير محظوظ) في اختيار العينة. فحين تقوم بتجربة ما أو استبيان أو تصويت أو تعمل على تحليل مجموعة من البيانات فإنّك تأخذ عيّنة من مجتمع الدراسة، ولا تستطيع أن تأخذ بالاعتبار جميع البيانات من كافّة أفراد مجتمع الدراسة. ولنأخذ مثالاً على حملة تسويق. لنفترض أنّك طوّرت مفهوماً جديداً وتريد أن تعرف إن كانت نتائج هذا المفهوم بالتسويق أفضل من الذي تمتلكه حالياً. من الطبيعيّ أنّك لن تكون قادراً على تطبيق هذا المفهوم الجديد مع جميع عملائك المستهدفين، ولذا فإنّك ستختار عيّنة منهم. وحين تعرض النتائج ترى أنّ الذين تعرفوا على الحملة الجديدة أنفقوا 10،17 دولار بالمتوسّط، وهذا أكثر من 8،41 دولار وهو معدّل إنفاق من لم يتعرفوا إلى الحملة الجديدة. وفي حين قد نعتبر أنّ هذه الزيادة التي كانت بمقدار 1،76 زيادة كبيرة وربّما مهمّة، إلا أنّ الحظّ كذلك قد لا يكون حالفك لأنّك اخترت عيّنة لا تمثّل مجتمع الدراسة، ولذا فقد لا يكون هنالك فرق بين الحملتين وأثرهما على توجّهات الشراء لدى العملاء. وتُدعى هذه الحالة “خطأ اختيار العيّنة”، ولا بدّ أن تتنبّه لهذا الخطأ في كل اختبار تقوم به كي لا يكون يمثّل مجتمع الدراسة بشكل كاف. كما يلاحظ ريدمان وجود عاملَين يساهمان في الوقوع في هذا الخطأ: حجم العيّنة، والاختلافات القائمة في مجتمع الدراسة. من الوضوح بمكان أنّ حجم العيّنة يؤثر في النتيجة. فكّر مثلاً في قطعة النقد إن رميتها خمس مرّات أو خمسئة مرّة، ستجدّ أنّه كلما ازداد عدد المرات التي تلقيها بها ستنخفض معها احتماليّة أن تظهر لك الصورة في معظم المرات. وكذا الأمر في الدلالة الإحصائية، فحين تزداد عينة الدراسة حجماً ستقّل احتماليّة أن تكون النتائج التي حصلت عليها وليدة الصدفة وحسب. وعليه فإنّك ستشعر بثقة أكبر بنتيجة الدراسة المتعلقة بحملة التسويق سابقة الذكر لو قمت بتجربتها مع ألف من الناس بدل الاكتفاء بخمس وعشرين. لا شكّ أنّ تجربة الفكرة الجديدة مع عدد أكبر من النّاس سيكلفك المزيد من الوقت والمال، ويجدر بك لذلك أن توازن بين الحاجة لعيّنة أكبر والميزانيّة المتوفّرة لديك. أمّا التباين في مجتمع الدراسة فأمر قد يصعب فهمه، ولكنّ تطوير القدرة على التعرف إليه أمر في غاية الأهمية لجميع المدراء الذين يضطرون للتعامل مع البيانات. انظر إلى الصور في الأسفل. كل واحدة من هذه الصور تعبّر عن توزيع محتمل ومختلف لمشتريات العميل وفق الحملة “أ”. يظهر في الرسم البياني على اليسار (التباين فيه أقل) أنّ معظم الناس أنفقوا قدراً متساوياً تقريباً من المال، باختلاف بسيط جداً، ولذا فإنّه في حال اختيار عميل بشكل عشوائي، فإنّ احتماليّة أن ينفق بقدرٍ قريب من المعدّل عالية جداً. وعليه فإنّك ستتجنّب اختيار عيّنة تختلف بشكل كبير عن مجتمع الدراسة، وهذا يزيد في ثقتك بالنتائج التي تحصل عليها. قارن هذا بالرسم البياني على اليمين (الذي فيه مستوى أكبر من التباين) ستجد أنّ الفرق في نمط الإنفاق بين الناس هنا أكبر بكثير، ورغم أنّ المعدّل لا يختلف، إلا أنّ عدداً أقل من الناس يتشابهون في نمط إنفاقهم. ولو قمت في هذه الحالة باختيار عميل بشكل عشوائي، فإنّ احتمالية أن يكون بعيداً عن المعدّل ستكون أعلى، وعليه فإنّ اختيار عيّنة متباينة أكثر من مجتمع الدراسة سيحدّ من ثقتك بالنتائج التي تحصل عليها. وفي المحصّلة نرى أنّ ما يحسن بنا إدراكه هو أنّه كلما ازداد التباين في مجتمع الدراسة ازدادت احتمالية الوقوع في خطأ اختيار العيّنة. ويقترح ريدمان أن تقوم بتخطيط بياناتك وإنشاء رسوم بيانية كهذه من أجل تحليل البيانات بشكل أفضل، إذ ستساعدك الرسوم البيانية على تحديد مستوى التباين والكشف عن الخطأ في العينة إن وجد، والنتيجة هي زيادة الدلالة الإحصائية لدراستك. ولا تختلف عملية تقييم الدلالة الإحصائية باختلاف الدراسة التي تقوم بها، فالإجراءات واحدة. ابدأ بتحديد فرضية العدم (null hypothesis) التي تحاول إبطالها من خلال الدراسة. ففي التجربة السابقة بخصوص حملة التسويق، قد تكون فرضية العدم هي: “العملاء لا يفضّلون حملتنا الجديدة مقارنة بالحملة القديمة.” وقبل أن تبدأ عليك كذلك أن تضع فرضية بديلة، مثل: “في المعدّل، العملاء يفضّلون الحملة الجديدة” وأن تضع كذلك مستوى الدلالة المستهدفة. مستوى الدلالة هو تعبيرٌ عن مستوى ندرة نتائجك إن افترضنا أنّ فرضيّة العدم صحيحة. وعادة ما يتمّ الإشارة إليها بالقيمة P، فكلما قلّت القيمة P قلت احتمالية أن تكون النتيجة نابعة من مجرد الصدفة وحسب. إن وضع الهدف وتفسير القيم الاحتمالية (قيم P) قد تكون أمراً بالغ التعقيد. ويقول ريدمان إنّ هذا يعتمد بشكل كبير على ما تقوم بتحليله. فإن كنت تدرس الجزيء الأوليّ (بوزون هيغز)، فأنت تحتاج إلى قيمة احتمالية منخفضة جداً، قد تصل إلى 0،00001. أما إن كنت تريد معرفة إن كانت إستراتيجية تسويق أفضل من أخرى أو أنّ ريشة المثقب الجديدة التي صممها المهندس في الشركة أسرع من الريش القديمة، فإنه يمكن أن تكون القيمة الاحتمالية أعلى وأن تصل مثلاً إلى 0،25. قد تلاحظ أنّ المدراء في الكثير من هذه الاختبارات يسقطون هاتين الخطوتين من حساباتهم ولا يكترثون بالدلالة الإحصائية حتى يحصلوا على النتائج النهائية، ولكنّ الإجراء العلميّ الأفضل يشترط القيام بهاتين الخطوتين قبل المضيّ في التجربة. بعد ذلك تقوم بجمع البيانات وإعداد رسوم بيانية بالنتائج وتجري الإحصاءات وحساب القيمة P والتي تأخذ مقدار التباين وحجم العيّنة بعين الاعتبار. فإن كانت القيمة P أقل من القيمة المستهدفة فيمكنك حينها طرح فرضية العدم وتأخذ بالفرضية المقابلة، لأنّ هذا يعني أنّ احتمالية أن تكون النتائج التي توصلت إليها معللة بالصدفة قليلة. كيف يتم حساب ذلك؟ إن كنت مديراً فإنّك على الأغلب لن تقوم بحساب الدلالة الإحصائية بنفسك. يقول ريدمان إنّ هنالك العديد من البرامج الإحصائية التي تساعدك على معرفة الدلالة الإحصائية عند الحصول على النتائج. كما أنّ هنالك صيغة في مايكروسوفت إكسل وعدد من البرمجيات الأخرى التي تساعدك على حساب الدلالة الإحصائية. إلا أنّه من المفيد على أيّة حال أن تكون لديك معرفة بالعملية التي وصفناها فيما سبق وذلك لتتمكّن من فهم وتفسير النتائج. يقول ريدمان إنّ على المدراء أن لا يثقوا بأي نموذج إن كانوا لا يفهمون طريقة عمله. كيف تستفيد الشركات من معرفة الدلالة الإحصائية؟ تستخدم الشركات الدلالة الإحصائية لفهم مدى تأثير النتائج على التجربة أو الاستبيان أو الاستطلاع الذي يقومون به وكيف تنعكس على القرارات التي يقومون بها. فعلى سبيل المثال، إن كان المدير يقوم بدراسة تتعلق بالتسعير ليحدد أفضل سعر لمنتجه الجديد، فإنّه سيقوم بحساب الدلالة الإحصائية، بمساعدة محلل إحصائي مختص على الأغلب، كي يرى إن كانت النتائج ستؤثر على قراره في تحديد السعر النهائي. لاحظ أنّ حملة التسويق الجديدة التي تحدثنا عنها هنا قد حققت ارتفاعاً في معدل المبيعات بمقدار 1،67 دولار (أكثر من 20%) وهذه دلالة عملية مهمّة بلا شك. فإن كانت القيمة P 0.03 فإن النتيجة ذات دلالة إحصائية أيضاً، ويجب عليك حينها أن تعتمد الحملة الجديدة. ولكن إن كانت القيمة P 0.2 فإنّ النتيجة ليست ذات دلالة إحصائية، ومع ذلك فيمكنك المضي قدماً في اعتماد الإستراتيجية الجديدة باعتبار الدلالة العمليّة المتعلقة بارتفاع معدل المبيعات، ولكن مع بذل مزيد من الحرص والدقّة. ولكن ماذا لو كان الفرق الحاصل في المبيعات لا يتجاوز بضعة سنتات؟ إن كانت القيمة P 0.2 فإنك قد تختار الإبقاء على الإستراتيجية القديمة أو تفكر في اعتماد إستراتيجية جديدة. ولكن حتى لو كانت قيمة الدلالة 0.03 والنتيجة ذات دلالة إحصائية مهمّة رغم صغرها، فإن قرارك في هذه الحالة سيعتمد على عوامل أخرى، مثل النظر في تكلفة تطبيق الإستراتيجية الجديدة. هنالك مفهوم آخر مرتبط بمفهوم الدلالة الإحصائية يعرف باسم مجال الثقة (confidence interval). ولنأخذ مثالاً على استطلاع آراء في مجال السياسة. فلنفترض وجود مرشحين اثنين، المرشح أ والمرشّح ب. تقوم المؤسسة المختصة باستطلاع آراء 1000 من المنتخبين المحتملين. يقول 49% من المشاركين في الاستطلاع أنّهم سيصوتون للمرشح أ، أمّا بقية أفراد العينة فسيصوتون للمرشح ب. وتشير الشركة التي أجرت الاستطلاع إنّ هامش الخطأ يبلغ +/- 3 بالمئة. حسب ريدمان، فإنّه نسبة 49% +/- 3% تشير إلى مجال من الثقة يصل إلى 95% من حجم المنتخبين الذين سيصوتون للمرشح أ. ولكن العجيب هو أنّ معظم الناس يفسرون هذا بأنّ هنالك فرصة تبلغ 95% بأنّ النسبة التي سيحصل عليها المرشح أ من الأصوات هي بين 46% و 52%، ولكنّ هذا ليس صحيحاً. فالمعنى الذي نخرج به من هذه النسبة هو أنّ المؤسسة لو أجرت الاستطلاع أكثر من مرّة، فإنّ هنالك فرصة تبلغ 95% بالحصول على نفس النتائج. إن أصابتك هذه الجملة الأخيرة بدوارٌ في رأسك، فلا تقلق، فلست وحدك. يقول ريدمان إنّ تفسير هذا الأمر “دقيق حدّ الجنون، حتّى أنّ أكثر المدراء بل والباحثين المختصين يستصعبون تحديده.” ولكنّه يرى أنّ التفسير الأكثر عملية لهذه النسبة هو أن لا نتسرع في الحكم ونقول إن فوز المرشّح ب أمر مضمون، أو أنّ المرشح ب متقدّم بالضرورة على المرشح أ، ذلك لأن هذه النسبة ليست ذات دلالة إحصائية. سيختلف التفسير العملي بطبيعة الحال لو كانت هنالك نسبة 70% من المشاركين في الاستطلاع قالوا إنّهم سيصوّتون للمرشح ب وسيكون هامش الخطأ هنا 3%. إنّ السبب الذي يجعل المدراء يهتمون بالدلالة الإحصائية هو رغبتهم في معرفة ما يجب عليهم القيام به على أرض الواقع في ضوء النتائج التي يخرجون منها من العمليات الإحصائية. ولكن ما يراه ريدمان هو أنّ مفاهيم مجال الثقة واختبار الفرضيّات قد صمّمت لتستخدم في مجالات العلوم، وذلك لمعرفة إن كانت نظريّة ما ستصمد خلال الزمن. ولكن حتى لو كانت الدلالة الإحصائية في تجربة ما غير مهمة، فإنّه من الممكن أن تبقى ذات أثر وأهمّية بالنسبة لك ولشركتك. من جهة أخرى، إن كنت تعمل مع مجموعات ضخمة من البيانات، فإنّه من الممكن أن تحصل على نتائج ذات دلالة إحصائية ولكنّها في الوقت ذاته ليست مهمّة من الناحية العملية، كأن نقول إن مجموعة من العملاء سيكون لديها ميل بمقدار 0.000001% للحملة أ مقارنة بالحملة ب. ولذا فإنّه لا يجدر بك أن تهتم بدقة نتائجك حدّ الهوس، وإنّما عليك أن تفكر بأبعاد هذه النتائج على القرار الذي تسعى لاتخاذه، وأن ترى إن كان اختلاف النتائج سيجعلك تغيّر قرارتك. ما الأخطاء التي يقوم بها الناس عند التعامل مع الدلالة الإحصائية؟ يحذّرنا ريدمان من كون الدلالة الإحصائية مفهوماً قد يكون عسيرا على الفهم وأن الناس كثيراً ما يسيئون فهمه. ويقول: “لم أواجه الكثير من المواقف التي كان يتوجب على المدراء أن يفهموا بها الدلالة الإحصائية بشكل معمق، ولكنّ عليهم مع ذلك أن يعرفوا كيفية تجنب إساءة استخدام هذا المفهوم”. لا شك أنّ مختصي تحليل البيانات لا يحتكرون فهم كلمة “الدلالة ” بل عادة ما نستخدم هذا المصطلح في مجال الأعمال للإشارة إلى أن النتيجة ذات أهمية من الناحية الإستراتيجية. ولا شك في أن اعتماد مصطلحات دقيقة هو من أهم الممارسات الواجب اتباعها عند الحديث عن نتائج تحليل البيانات. وإن كنت ترغب في مناقشة ما إذا كانت لنتيجة ما آثار معينة على إستراتيجيتك أو قراراتك، فلا بأس من استخدام كلمة “دلالة”، ولكن إن كنت تريد أن تعرف ما إذا كان أمر ما ذات دلالة إحصائية (وعليك عادة أن تعرف هذا) فإن عليك أن تكون دقيقاً في اللغة التي تستخدمها. ففي المرة التالية التي تنظر فيها إلى نتائج استبيان أو تجربة ما، فإن عليك أن تسأل عن الدلالة الإحصائية إن كان المختص بإجراء التحليل لم يأت على ذكرها في التقرير. تذكر أنّ اختبارات الدلالة الإحصائية تساعدك على تجنب الوقوع في أخطاء العينة، كما أنّها قد تساعدك في رأي ريدمان على تجنب ما هو أسوأ من ذلك، وهو الخطأ خارج العينة (non-sampling error) أي الأخطاء التي تشتمل على انحرافات حصلت على البروتوكولات التجريبية و/أو الإجرائية، كأن يقدّم المشاركون في الاستبيان معلومات كاذبة، أو أن تضيع البيانات، أو أن يتم ارتكاب بعض الأخطاء أثناء عمليات التحليل، وهذه الحالات كما يرى ريدمان هي التي تضع بين أيدينا نتائج مشوشة. يقول ريدمان: هنالك الكثير مما يمكن أن يحدث بين وقت التخطيط للاستبيان أو التجربة حتى حين حصولك على النتائج. إنني أحرص على أن تكون البيانات الخام التي جمعتها موثوقة أكثر من حرصي على معرفة عدد الأشخاص الذين شملتهم الدراسة.” إن البيانات الصحيحة والتحليل الدقيق لها أكثر أهمّية من الدلالة الإحصائية. عليك أن تذكر دائماً التطبيق العملي للنتائج التي تحصل عليها وعليك أن لا تلح كثيراً على وضع مجال صارم للثقة. يقول ريدمان إن التقليد العلمي ينطوي على تحيز حين يقرر إن النتائج لا تكون قابلة للنشر إلا إذا كانت القيمة P 0.05 أو أقل . ولكن العديد من القرارات، كتحديد إستراتيجية التسويق في الشركة مثلاً، لن تكون بحاجة للحصول على هذا المستوى المنخفض من مجال الثقة. ففي عالم الأعمال كما يرى ريدمان هنالك معايير أخرى أكثر أهمّية من الدلالة الإحصائية. والسؤال المهم الذي علينا أن نطرحه هو: “هل النتيجة التي حصلنا عليها تشكل فرقاً في السوق، ولو لفترة قصيرة من الوقت؟” إن النتائج تعطيك قدراً ضخماً من المعلومات حسب ريدمان ولكنه يقول أيضاً: “إنني أشجع على استخدام الإحصاءات، ولكن عليك أن تستخدم معها دوماً الحكم الصحيح.”
See this content immediately after install