اشتُقّ مصطلح الإحصاء باللغة الإنجليزية (Statistics) من الكلمة الإيطالية (Statista)، والكلمة الألمانية (Statistik)، والكلمة اللاتينية (Status)، والتي هي عبارة عن مصطلحات تُعنى بمعلومات الدولة (بالإنجليزية: Political state)، حيث كانت بداية استخدام هذا المصطلح لجمع البيانات التي تخص أفراد الدولة، لغاية إنشاء قاعدة بيانات يتم من خلالها فرض الضرائب لتحسين الوضع المادي للدولة.
كما تم تعريف الإحصاء على أنه العلم الذي يهتمّ بجمع البيانات الرقمية، ومن ثم تنظيمها، وترتيبها، وتحليلها، بهدف الوصول إلى نتائج معينة لتوضيح ظاهرة أو حالة ما، أو بأنه العلم الذي يهتم بالطريقة التي يتم من خلالها جمع البيانات والمعلومات وتحويلها إلى صورة عددية، حيث تُجمَع البيانات من خلاله بشكل منتظم، وفيما يخص استخدامات علم الإحصاء فهي كثيرة؛ كاستخدامه في العلوم الطبية، وعلم الاجتماع، والاقتصاد، والصناعة، والكيمياء، والرياضة، والإدارة، وغيرها العديد من المجالات.
مبادئ الإحصاء في الرياضيات
يوجد عدد من المبادئ الأساسية في علم الإحصاء، وكذلك يوجد أساسيات لتعلّم الإحصاء وطرق العمل به والتعامل معه، ولكن من أهمّ مبادئ الإحصاء في الرياضيات طرق جمع البيانات والمعلومات وتحليلها وتوزيعها وعرضها، وتختلف هذه الطرق عن بعضها بشكل كبير ومن بين هذه الطرق:
طرق جدولية
وهي عبارة عن تنظيم المعلومات والبيانات عن طريق جدول خاص بحيث تكون كل المعلومات واضحة ومعرّفة ضمن الجدول، ويتمّ ضمنه تنسيق المعلومات وتحليلها على حسب طبيعة المعلومات والبيانات، وتُعدّ الطرق الجدولية من أسهل مبادئ الإحصاء في الرياضيات وأكثرها وضوحًا وذلك بسبب وضوح المعلومات وسهول اختيارها والتعامل معها.
طرق رسومية
تعتمد الطرق الرسومية على وصف البيانات والمقارنة بينها بشكل سريع، عن طريق خاصية الرسم البياني الشريطي، وهي أداة رسم لتصوير المعلومات والقيم التي يتمّ استنتاجها وأخذها من توزيع الترددات، حيث يتمّ إنشاء شريط للمعلومات ويرتفع كل شريط مع عدد قيم المعلومات المطلوبة والمسجلة، ويعدّ الرسم البياني الإحصائي الأكثر شيوعًا واستخدامًا في رسم المخططات الإحصائية.
التدابير العددية
وهي عدد من القوانين الأساسية التي يتمّ الاعتماد عليها في حساب وتلخيص الإحصائيات المطلوبة، ومن بين هذه القوانين وأهمّها المتوسط الحسابي والمدى والانحراف المعياري والمنوال والوسيط، وغيرها من القواعد الرئيسية في علم الإحصاء، حيث إنّه لا يمكن عمل إحصاء بياني ووصفي دون استخدام هذه القوانين.
أنواع الإحصاء
يُقسم الإحصاء إلى قسمين رئيسيين؛ الإحصاء الوصفي، والإحصاء الاستنتاجي والاستدلالي، إذ تساعد أنواع الإحصاء على جمع البيانات حول عدد معين من العناصر والوصول للاستنتاجات وتمثيلها، وفيما يأتي توضيح لأنواع الإحصاء:
الإحصاء الوصفي
يُعرف الإحصاء الوصفي بأنه العلم القائم على النزعة المركزية والتشتت والتوزيع لبيانات عينة محددة، كما ويوضح الاختلافات في خصائص العينة الواحدة، ويهدف لوصف أو تلخيص مجموعة بيانات، مثل متوسط الانحراف المعياري أو التباين لاختبار الفرضيات وعمل التنبؤات.
مقاييس النزعة المركزية
وفيما يأتي أبرز مقاييس النزعة المركزية الخاصة بالإحصاء الوصفي:
- الوسط الحسابي: (بالإنجليزية: Mean) وهو معدل البيانات المتوفرة، والذي يُحتسب من مجموع عناصر البيانات مقسومة على عددها، فعلى فرض أن فئة تتكون من العناصر (ع1، ع2، ع3، ع4، ……..)، فإن:
الوسط الحسابي = (ع1+ ع2+ ع3+ ع4+ ……) / عدد العناصر
- الوسيط: (بالإنجليزية: Median) وهو العدد أو العنصر الذي يتوسط البيانات في حال ترتيبها تصاعديًا أو تنازليًا، فعلى فرض أن هناك مجموعة بيانات كالآتي: (ع1، ع2، ع3، ع4، ع5) مرتبًة تصاعديًا، فإن الوسيط:
- إذا كان عدد البيانات فرديًا: هو العدد الذي يتوسط البيانات بعد ترتيبها أي (ع3).
- إذا كان عدد البيانات زوجيًا: فإن الوسيط = مجموع العنصرين الوسطيين /2.
- المنوال: (بالإنجليزية: Mode) وهو العنصر الأكثر تكرارًا في مجموعة من البيانات، فعلى فرض أن لدينا البيانات الآتية: (ع1، ع2، ع3، ع1، ع2، ع1،ع5)، فإن:
المنوال هو العنصر الأكثر تكرارًا وهو (ع1).
مقاييس التشتت
وفيما يأتي مقاييس التشتت الخاصة بالإحصاء الوصفي:
- المدى: (بالإنجليزية: Range) وهو الفرق بين أعلى قيمة من البيانات المتوفرة وأصغر قيمة، وقيمته تعطي مؤشرًا على مدى تقارب أو تباعد البيانات، ويعطى المدى بالعلاقة الآتية:
المدى = القيمة الأعلى – القيمة الأصغر
- الانحراف المعياري (σ): (بالإنجليزية:Standard Deviation) مقياس يوضح مدى تقارب أو تباعد البيانات عن متوسطها الحسابي، وهو يساوي الجذر التربيعي لمربع مجموع الفرق بين كل عنصر في البيانات والمتوسط الحسابي لها مقسومًا على عدد العناصر في المجموعة،[٥] وعلى فرض أن البيانات تمثلت كالآتي، (ع1، ع2، ع3)، وأن الوسط الحسابي (م)، فإن:
- الانحراف المعياري للعينة= (((ع1- م)2+ (ع2- م)2+ (ع3- م)2) / عدد العناصر)(2/1)
- الانحراف المعياري للمجتمع الإحصائي= (((ع1- م)2+ (ع2- م)2+ (ع3- م)2) / (عدد العناصر -1))(2/1).
- التباين (σ2): (بالإنجليزية: Variance) وهو مربع الانحراف المعياري.
- معامل التشتت: (بالإنجليزية: Dispersion Coefficient) هو الفرق بين أكبر قيمة من بين البيانات وأصغر قيمة مقسومةً على مجموع كلا القيمتين، ويعطى معامل التشتت بالعلاقة الآتية:
معامل التشتت= (القيمة الأكبر-القيمة الأصغر)/ (القيمة الأكبر+القيمة الأصغر)
يُعرف الإحصاء الوصفي بأنه العلم القائم على النزعة المركزية والتشتت والتوزيع لبيانات عينة محددة، وتقسم مقاييس النزعة المركزية إلى؛ الوسط، والوسيط، والمنوال، أما مقاييس التشتت فهي؛ المدى، والانحراف المعياري، والتباين، ومعامل التشتت، ولكل منها قانون خاص وفائدة معينة في مجال الإحصاء.
الإحصاء الاستدلالي
يُعرف الإحصاء الاستدلالي بأنه الأدوات التي تُستخدم لاستخلاص استنتاجات حول العينات كبيرة العدد، وذلك بالاعتماد على خصائص هذه العينات وربط المتغيرات في مجموعة البيانات مع بعضها البعض مثل؛ تقدير القيمة الواحدة، واختبار الفرضية، والتنبؤ، وتقدير الفاصل الزمني، وإصدار النتائج والاستنتاجات الصحيحة اعتمادًا على الاحتماليات المتوقعة، إذ يوفر الصورة الدقيقة للمخرجات الإحصائية النهائية، مثل تقدير متوسط الطلب على منتج معين من خلال مسح عينات من عادات الشراء لدى المستهلكين. وفيما يأتي تفصيل لأبرز مبادئه:
تقدير القيمة الواحدة
وهو إيجاد قيمة واحدة تقريبية لمجموعة بيانات وذلك باستخدام أحد أساليب الإحصاء الوصفي كالوسط الحسابي، إذ تزداد مقدار دقتها في حال زيادة عدد العناصر في العينة الواحدة.
تقدير الفاصل الزمني
وهو تقدير الفترة أو الفاصل الزمني الذي تقع فيه مجموعة من البيانات في عينة عشوائية معينة، ويُطلق عليها فاصل الثقة.
اختبار الفرضية
وهو اختبار قائم على التحقق من صحة فرضية مسبقة من خلال التحليل لعينة إحصائية.
التنبؤ
استخلاص النتائج والتنبؤ بها بناءً على مقاييس وصف البيانات وجمعها وتحليلها.
يُعرف الإحصاء الاستدلالي بأنه الأدوات التي تُستخدم لاستخلاص استنتاجات حول العينات كبيرة العدد، وله عدة مبادئ هي، تقدير القيمة الواحدة، وتقدير الفاصل الزمني، بالإضافة إلى اختبار الفرضيات والتنبؤ.