مقدمة في الإحصاء الرياضي. المفاهيم الأساسية للإحصاء الرياضي حسب الإحصاء الرياضي

مقدمة

2. المفاهيم الأساسية للإحصاء الرياضي

2.1 المفاهيم الأساسية لأخذ العينات

2.2 أخذ العينات

2.3 دالة التوزيع التجريبية ، الرسم البياني

خاتمة

فهرس

مقدمة

الإحصاء الرياضي هو علم الأساليب الرياضية للتنظيم واستخدام البيانات الإحصائية للاستنتاجات العلمية والعملية. في العديد من فروعها ، تعتمد الإحصائيات الرياضية على نظرية الاحتمالية ، مما يجعل من الممكن تقييم موثوقية ودقة الاستنتاجات المستخلصة من المواد الإحصائية المحدودة (على سبيل المثال ، لتقدير حجم العينة المطلوب للحصول على نتائج الدقة المطلوبة في مسح عينة).

في نظرية الاحتمالات ، يتم النظر في المتغيرات العشوائية ذات التوزيع المعطى أو التجارب العشوائية ، والتي تكون خصائصها معروفة تمامًا. موضوع نظرية الاحتمالات هو خصائص وعلاقات هذه الكميات (التوزيعات).

لكن غالبًا ما تكون التجربة عبارة عن صندوق أسود ، يعطي بعض النتائج فقط ، والتي بموجبها يلزم استخلاص استنتاج حول خصائص التجربة نفسها. المراقب لديه مجموعة من النتائج العددية (أو يمكن جعلها رقمية) التي تم الحصول عليها من خلال تكرار نفس التجربة العشوائية تحت نفس الظروف.

في هذه الحالة ، على سبيل المثال ، تبرز الأسئلة التالية: إذا لاحظنا متغيرًا عشوائيًا واحدًا ، كيف يمكننا استخلاص النتيجة الأكثر دقة حول توزيعه من مجموعة قيمه في عدة تجارب؟

مثال على هذه السلسلة من التجارب هو المسح الاجتماعي ، أو مجموعة من المؤشرات الاقتصادية ، أو ، أخيرًا ، سلسلة من معاطف الأسلحة وذيول أثناء رمي عملة معدنية بألف ضعف.

كل العوامل المذكورة أعلاه تؤدي إلى ملاءمةوأهمية موضوع العمل في المرحلة الحالية بهدف دراسة عميقة وشاملة للمفاهيم الأساسية للإحصاء الرياضي.

في هذا الصدد ، الغرض من هذا العمل هو تنظيم وتجميع وتوحيد المعرفة حول مفاهيم الإحصاء الرياضي.

1. موضوع وطرق الإحصاء الرياضي

الإحصاء الرياضي هو علم الأساليب الرياضية لتحليل البيانات التي تم الحصول عليها خلال الملاحظات الجماعية (القياسات والتجارب). اعتمادًا على الطبيعة الرياضية للنتائج المحددة للملاحظات ، يتم تقسيم الإحصائيات الرياضية إلى إحصائيات الأرقام والتحليل الإحصائي متعدد المتغيرات وتحليل الوظائف (العمليات) والسلاسل الزمنية وإحصاءات الكائنات غير العددية. يعتمد جزء كبير من الإحصاء الرياضي على النماذج الاحتمالية. تخصيص المهام المشتركة لوصف البيانات وتقدير واختبار الفرضيات. كما أنهم يفكرون في مهام أكثر تحديدًا تتعلق بإجراء استطلاعات العينة ، واستعادة التبعيات ، وبناء واستخدام التصنيفات (الأنماط) ، وما إلى ذلك.

لوصف البيانات ، تم إنشاء الجداول والمخططات والتمثيلات المرئية الأخرى ، على سبيل المثال ، حقول الارتباط. عادة لا يتم استخدام النماذج الاحتمالية. تعتمد بعض طرق وصف البيانات على النظرية المتقدمة وإمكانيات أجهزة الكمبيوتر الحديثة. وتشمل هذه ، على وجه الخصوص ، تحليل الكتلة ، الذي يهدف إلى تحديد مجموعات الكائنات المتشابهة مع بعضها البعض ، والقياس متعدد الأبعاد ، مما يجعل من الممكن تصور الكائنات على مستوى ، وتشويه المسافات بينها إلى أدنى درجة.

تعتمد طرق التقدير واختبار الفرضيات على نماذج توليد البيانات الاحتمالية. تنقسم هذه النماذج إلى حدودي وغير حدودي. في النماذج البارامترية ، يُفترض أن الكائنات قيد الدراسة موصوفة من خلال وظائف التوزيع التي تعتمد على عدد صغير (1-4) من المعلمات العددية. في النماذج اللامعلمية ، يفترض أن تكون وظائف التوزيع عشوائية مستمرة. في الإحصاء الرياضي ، معلمات وخصائص التوزيع (التوقع الرياضي ، الوسيط ، التباين ، الكميات ، إلخ) ، الكثافات ووظائف التوزيع ، التبعيات بين المتغيرات (بناءً على معاملات الارتباط الخطية وغير البارامترية ، وكذلك معاملات الارتباط البارامترية أو غير يتم تقييم التقديرات البارامترية للوظائف التي تعبر عن التبعيات) إلخ. استخدم تقديرات النقطة والفاصل (مع إعطاء حدود للقيم الحقيقية).

في الإحصاء الرياضي ، توجد نظرية عامة لاختبار الفرضيات وعدد كبير من الطرق المخصصة لاختبار فرضيات معينة. يتم أخذ الفرضيات في الاعتبار حول قيم المعلمات والخصائص ، حول التحقق من التجانس (أي حول تطابق الخصائص أو وظائف التوزيع في عينتين) ، حول توافق دالة التوزيع التجريبية مع دالة توزيع معينة أو مع معلمة عائلة هذه الوظائف ، حول تناظر التوزيع ، إلخ.

من الأهمية بمكان قسم الإحصاء الرياضي المرتبط بإجراء مسوحات العينة ، مع خصائص المخططات المختلفة لتنظيم العينات وإنشاء طرق مناسبة لتقدير واختبار الفرضيات.

تمت دراسة مشاكل استعادة التبعية بنشاط لأكثر من 200 عام ، منذ تطوير طريقة المربعات الصغرى بواسطة K.Gauss في 1794. حاليًا ، تعد طرق البحث عن مجموعة فرعية إعلامية من المتغيرات والطرق غير المعلمية هي الأكثر صلة.

بدأ تطوير طرق لتقريب البيانات وتقليل أبعاد الوصف منذ أكثر من 100 عام ، عندما أنشأ K. Pearson طريقة المكون الرئيسي. في وقت لاحق ، تم تطوير تحليل العوامل والعديد من التعميمات غير الخطية.

تسمى أيضًا الطرق المختلفة لبناء (تحليل الكتلة) والتحليل والاستخدام (التحليل التمييزي) للتصنيفات (الأنماط) طرق التعرف على الأنماط (مع أو بدون مدرس) ، والتصنيف التلقائي ، إلخ.

تعتمد الطرق الرياضية في الإحصاء إما على استخدام المجاميع (بناءً على نظرية الحدود المركزية لنظرية الاحتمالات) أو مؤشرات الفرق (المسافات ، المقاييس) ، كما هو الحال في إحصائيات الكائنات غير العددية. عادة فقط يتم إثبات النتائج المقاربة بصرامة. تلعب أجهزة الكمبيوتر في الوقت الحاضر دورًا كبيرًا في الإحصاء الرياضي. يتم استخدامها لكل من الحسابات ونمذجة المحاكاة (على وجه الخصوص ، في طرق أخذ العينات ودراسة مدى ملاءمة النتائج المقاربة).

المفاهيم الأساسية للإحصاء الرياضي

2.1 المفاهيم الأساسية لطريقة أخذ العينات

اسمحوا أن يكون متغير عشوائي لوحظ في تجربة عشوائية. من المفترض أن يتم إعطاء مساحة الاحتمال (ولن تهمنا).

سنفترض أنه بعد إجراء هذه التجربة مرة واحدة في نفس الظروف ، حصلنا على الأرقام ، ، - قيم هذا المتغير العشوائي في الأول والثاني ، إلخ. التجارب. المتغير العشوائي له بعض التوزيع ، وهو أمر غير معروف لنا جزئيًا أو كليًا.

دعنا نلقي نظرة فاحصة على مجموعة تسمى العينة.

في سلسلة من التجارب التي تم إجراؤها بالفعل ، تكون العينة عبارة عن مجموعة من الأرقام. ولكن إذا تكررت هذه السلسلة من التجارب مرة أخرى ، فبدلاً من هذه المجموعة ، سنحصل على مجموعة جديدة من الأرقام. بدلاً من الرقم ، سيظهر رقم آخر - إحدى قيم المتغير العشوائي. وهذا يعني أن (و ، و ، وما إلى ذلك) متغير يمكن أن يأخذ نفس قيم المتغير العشوائي ، وكذلك في كثير من الأحيان (بنفس الاحتمالات). لذلك ، قبل التجربة - متغير عشوائي موزع بالتساوي مع وبعد التجربة - الرقم الذي نلاحظه في هذه التجربة الأولى ، أي إحدى القيم الممكنة للمتغير العشوائي.

عينة الحجم هي مجموعة من المتغيرات العشوائية المستقلة والمتشابهة الموزعة ("نسخ") التي لها توزيع.

ماذا يعني "استخلاص استنتاج حول التوزيع من عينة"؟ يتميز التوزيع بدالة التوزيع ، الكثافة أو الجدول ، مجموعة من الخصائص العددية - ، إلخ. بناءً على العينة ، يجب أن يكون المرء قادرًا على بناء تقديرات تقريبية لجميع هذه الخصائص.

.2 أخذ العينات

ضع في اعتبارك تنفيذ العينة على نتيجة أولية واحدة - مجموعة من الأرقام , , . في مساحة احتمالية مناسبة ، نقدم متغيرًا عشوائيًا يأخذ القيم ، مع الاحتمالات في (إذا تزامنت بعض القيم ، نضيف الاحتمالات عدد المرات المقابلة). يبدو جدول توزيع الاحتمالات ودالة التوزيع المتغير العشوائي كما يلي:

يسمى توزيع الكمية بالتوزيع التجريبي أو توزيع العينة. دعونا نحسب التوقع الرياضي والتباين للكمية ونقدم تدوين هذه الكميات:

بنفس الطريقة نحسب لحظة النظام

في الحالة العامة ، نشير إلى الكمية

إذا ، عند بناء جميع الخصائص التي قدمناها ، إذا أخذنا في الاعتبار العينة ، كمجموعة من المتغيرات العشوائية ، فإن هذه الخصائص نفسها - ، ، ، ، - ستصبح متغيرات عشوائية. تُستخدم خصائص توزيع العينة لتقدير (تقريبي) الخصائص المجهولة المقابلة للتوزيع الحقيقي.

السبب في استخدام خصائص التوزيع لتقدير خصائص التوزيع الحقيقي (أو) هو قرب هذه التوزيعات بشكل كبير.

ضع في اعتبارك ، على سبيل المثال ، رمي نرد منتظم. اسمحوا ان - عدد النقاط التي سقطت على رمية -th ،. لنفترض أن واحدًا في العينة سيحدث مرة واحدة ، واثنان - مرة ، وهكذا. ثم يأخذ المتغير العشوائي القيم 1 , , 6 مع الاحتمالات ، على التوالي. لكن هذه النسب تقترب من النمو وفقًا لقانون الأعداد الكبيرة. بمعنى أن توزيع الحجم يقترب من التوزيع الحقيقي لعدد النقاط التي تسقط عند رمي القالب الصحيح.

لن نحدد المقصود بقرب العينة والتوزيعات الصحيحة. في الفقرات التالية ، سوف نلقي نظرة فاحصة على كل من الخصائص المذكورة أعلاه ونفحص خصائصها ، بما في ذلك سلوكها مع زيادة حجم العينة.

.3 دالة التوزيع التجريبية ، المدرج التكراري

نظرًا لأنه يمكن وصف التوزيع غير المعروف ، على سبيل المثال ، من خلال وظيفة التوزيع الخاصة به ، فسنقوم ببناء "تقدير" لهذه الوظيفة من العينة.

التعريف 1.

تسمى دالة التوزيع التجريبية المبنية على عينة من الحجم وظيفة عشوائية لكل منها يساوي

تذكير:وظيفة عشوائية

يسمى مؤشر الحدث. لكل منها ، هذا متغير عشوائي له توزيع برنولي مع معلمة. لماذا ا؟

بمعنى آخر ، لأي قيمة تساوي الاحتمال الحقيقي للمتغير العشوائي أقل من نسبة عناصر العينة الأقل من المقدرة.

إذا تم فرز عناصر العينة بترتيب تصاعدي (في كل نتيجة أولية) ، فسيتم الحصول على مجموعة جديدة من المتغيرات العشوائية ، تسمى سلسلة التباين:

يسمى العنصر بالعضو العاشر في السلسلة المتغيرة أو إحصاء الترتيب رقم.

مثال 1

عينة:

سلسلة الاختلاف:

أرز. واحد.مثال 1

تحتوي دالة التوزيع التجريبية على قفزات عند نقاط العينة ، وقيمة الانتقال عند هذه النقطة هي ، حيث يوجد عدد عناصر العينة التي تتطابق معها.

من الممكن إنشاء دالة توزيع تجريبية للسلسلة المتغيرة:

من الخصائص الأخرى للتوزيع الجدول (للتوزيعات المنفصلة) أو الكثافة (للتوزيعات المستمرة تمامًا). التناظرية التجريبية أو الانتقائية للجدول أو الكثافة هي ما يسمى الرسم البياني.

يعتمد المدرج التكراري على بيانات مجمعة. يتم تقسيم النطاق التقديري لقيم المتغير العشوائي (أو نطاق بيانات العينة) ، بغض النظر عن العينة ، إلى عدد معين من الفواصل الزمنية (ليست بالضرورة نفسها). اسمح ، أن تكون فترات على الخط ، تسمى فترات التجميع. دعنا نشير إلى عدد عناصر العينة التي تقع في الفاصل الزمني:

(1)

في كل فترة من الفواصل الزمنية ، يتم بناء مستطيل ، تتناسب مساحته مع. يجب أن تكون المساحة الإجمالية لجميع المستطيلات مساوية لواحد. اسمحوا ان يكون طول الفترة. ارتفاع المستطيل أعلاه

الشكل الناتج يسمى الرسم البياني.

مثال 2

هناك سلسلة متنوعة (انظر المثال 1):

هنا هو اللوغاريتم العشري ، أي عند مضاعفة العينة ، يزيد عدد فترات التجميع بمقدار 1. لاحظ أنه كلما زادت فترات التجميع ، كان ذلك أفضل. ولكن ، إذا أخذنا عدد الفواصل الزمنية ، على سبيل المثال ، بترتيب ، فعندئذٍ مع النمو لن يقترب المدرج التكراري من الكثافة.

البيان التالي هو الصحيح:

إذا كانت كثافة توزيع عناصر العينة دالة مستمرة ، إذن لذلك ، هناك تقارب نقطي في احتمالية الرسم البياني للكثافة.

لذا فإن اختيار اللوغاريتم معقول ، لكنه ليس الخيار الوحيد الممكن.

خاتمة

يعتمد الإحصاء الرياضي (أو النظري) على أساليب ومفاهيم نظرية الاحتمالات ، ولكنه بمعنى ما يحل المشكلات العكسية.

إذا لاحظنا المظهر المتزامن لعلامتين (أو أكثر) ، أي لدينا مجموعة من القيم لعدة متغيرات عشوائية - ماذا يمكن أن يقال عن اعتمادها؟ هل هي هناك أم لا؟ وإذا كان الأمر كذلك ، فما هو هذا الاعتماد؟

من الممكن غالبًا وضع بعض الافتراضات حول التوزيع المخفي في "الصندوق الأسود" أو حول خصائصه. في هذه الحالة ، وفقًا للبيانات التجريبية ، يلزم تأكيد أو دحض هذه الافتراضات ("الفرضيات"). في الوقت نفسه ، يجب أن نتذكر أنه لا يمكن إعطاء الإجابة بـ "نعم" أو "لا" إلا بدرجة معينة من اليقين ، وكلما طالت مدة استمرار التجربة ، زادت دقة الاستنتاجات. الموقف الأكثر ملاءمة للبحث هو عندما يمكن للمرء أن يؤكد بثقة بعض خصائص التجربة المرصودة - على سبيل المثال ، حول وجود اعتماد وظيفي بين الكميات المرصودة ، حول الحالة الطبيعية للتوزيع ، حول تناسقه ، حول وجود الكثافة في التوزيع أو حول طبيعتها المنفصلة ، إلخ.

لذلك ، من المنطقي أن نتذكر الإحصائيات (الرياضية) إذا

هناك تجربة عشوائية ، خصائصها غير معروفة كليًا أو جزئيًا ،

نحن قادرون على إعادة إنتاج هذه التجربة تحت نفس الظروف لبعض (أو أفضل ، أي عدد) من المرات.

فهرس

1. بومول دبليو النظرية الاقتصادية وعمليات البحث. - م ؛ العلوم ، 1999.

2. Bolshev L.N.، Smirnov N.V. جداول الإحصاء الرياضي. موسكو: Nauka ، 1995.

3 - بوروفكوف أ. إحصائيات الرياضيات. موسكو: Nauka ، 1994.

4. كورن جي ، كورن ت. كتيب الرياضيات للعلماء والمهندسين. - سان بطرسبرج: دار نشر لان ، 2003.

5. Korshunov D.A.، Chernova N.I. مجموعة من المهام والتمارين في الإحصاء الرياضي. نوفوسيبيرسك: دار النشر التابعة لمعهد الرياضيات. S.L. Sobolev SB RAS ، 2001.

6. Peheletsky I.D. الرياضيات: كتاب مدرسي للطلاب. - م: الأكاديمية ، 2003.

7. Sukhodolsky V.G. محاضرات في الرياضيات العليا للعلوم الانسانية. - دار نشر سانت بطرسبرغ التابعة لجامعة ولاية سانت بطرسبرغ. 2003

8. Feller V. مقدمة لنظرية الاحتمال وتطبيقاتها. - م: مير ، ت 2 ، 1984.

9. هارمان ج. ، التحليل العاملي الحديث. - م: الإحصاء ، 1972.


هارمان جي ، تحليل العوامل الحديثة. - م: الإحصاء ، 1972.

كل تحقيق في مجال الظواهر العشوائية متجذر دائمًا في التجربة ، في البيانات التجريبية. يتم استدعاء البيانات الرقمية التي يتم جمعها عند دراسة أي سمة من سمات كائن ما إحصائية. البيانات الإحصائية هي المادة الأولية للدراسة. ولكي تكون ذات قيمة علمية أو عملية ، يجب معالجتها بأساليب الإحصاء الرياضي.

إحصائيات الرياضياتهو تخصص علمي ، موضوعه هو تطوير طرق تسجيل ووصف وتحليل البيانات التجريبية الإحصائية التي تم الحصول عليها نتيجة ملاحظات الظواهر العشوائية الهائلة.

المهام الرئيسية للإحصاء الرياضي هي:

    تحديد قانون توزيع المتغير العشوائي أو نظام المتغيرات العشوائية ؛

    اختبار معقولية الفرضيات ؛

    تحديد معلمات التوزيع غير المعروفة.

تعتمد جميع طرق الإحصاء الرياضي على نظرية الاحتمال. ومع ذلك ، نظرًا لخصوصية المشكلات التي يتم حلها ، يتم فصل الإحصاء الرياضي عن نظرية الاحتمال إلى مجال مستقل. إذا تم النظر في نموذج معين لظاهرة ما في نظرية الاحتمالات وتم حساب المسار الحقيقي المحتمل لهذه الظاهرة (الشكل 1) ، فسيتم اختيار نموذج احتمالي مناسب في الإحصاء الرياضي بناءً على البيانات الإحصائية (الشكل 2).

رسم بياني 1. مشكلة عامة في نظرية الاحتمالات

الصورة 2. مشكلة عامة في الإحصاء الرياضي

كتخصص علمي ، تم تطوير الإحصاء الرياضي جنبًا إلى جنب مع نظرية الاحتمال. تم بناء الجهاز الرياضي لهذا العلم في النصف الثاني من القرن التاسع عشر.

2. السكان والعينة العامة.

لدراسة الأساليب الإحصائية ، يتم تقديم مفاهيم عامة وعينة السكان. بشكل عام ، تحت عامه السكانيُفهم على أنه متغير عشوائي X مع دالة التوزيع
. مجموعة عينة أو عينة من الحجم n لمتغير عشوائي معين X هي مجموعة
ملاحظات مستقلة عن هذه الكمية ، أين يسمى قيمة العينة أو تنفيذ المتغير العشوائي X. هكذا، يمكن اعتبارها أرقامًا (إذا أجريت التجربة وأخذت العينة) وكمتغيرات عشوائية (قبل التجربة) ، لأنها تختلف من عينة إلى أخرى.

مثال 1. لتحديد مدى اعتماد سمك جذع الشجرة على ارتفاعها ، تم اختيار 200 شجرة. في هذه الحالة ، يكون حجم العينة n = 200.

مثال 2نتيجة لنشر ألواح الجسيمات على منشار دائري ، تم الحصول على 15 قيمة لأعمال القطع المحددة. في هذه الحالة ، n = 15.

د
من أجل الحكم بثقة على سمة عامة السكان التي نهتم بها وفقًا لبيانات العينة ، يجب أن تمثلها كائنات العينة بشكل صحيح ، أي يجب أن تكون العينة وكيل(وكيل). عادة ما يتم تحقيق تمثيل العينة عن طريق الاختيار العشوائي للأشياء: يتم تزويد كل كائن من عامة السكان باحتمالية متساوية في أن يتم تضمينها في العينة مع جميع الكائنات الأخرى.

تين. 3. إظهار تمثيل العينة

إحصائيات الرياضيات

الموضوع والطرق

الإحصاء الرياضي هو فرع من فروع الرياضيات يطور طرقًا لتسجيل ووصف وتحليل البيانات الملاحظة والتجريبية من أجل بناء نماذج احتمالية لظواهر عشوائية جماعية. اعتمادًا على الطبيعة الرياضية للنتائج المحددة للملاحظات ، يتم تقسيم الإحصائيات الرياضية إلى إحصائيات الأرقام والتحليل الإحصائي متعدد المتغيرات وتحليل الوظائف (العمليات) والسلاسل الزمنية وإحصاءات الكائنات غير العددية.

تلعب أجهزة الكمبيوتر في الوقت الحاضر دورًا كبيرًا في الإحصاء الرياضي. يتم استخدامها لكل من الحسابات ونمذجة المحاكاة (على وجه الخصوص ، في طرق أخذ العينات ودراسة مدى ملاءمة النتائج المقاربة).

ملاحظات

المؤلفات

  • الاحتمالات والإحصاء الرياضي. موسوعة / الفصل. إد. يو في بروخوروف. - م: دار النشر "الموسوعة الروسية الكبيرة" 1999.
  • والد أ. تحليل متسق ، العابرة. من الإنجليزية - M: Fizmatgiz، 1960.
  • Shiryaev A. N. التحليل الإحصائي المتسلسل. قواعد التوقف المثلى - م: نوكا ، 1976

أنظر أيضا

الروابط


مؤسسة ويكيميديا. 2010.

  • الجبر الخطي
  • الفيزياء الرياضية

شاهد ما هو "الإحصاء الرياضي" في القواميس الأخرى:

    إحصائيات الرياضيات الموسوعة الحديثة

    إحصائيات الرياضيات- علم الأساليب الرياضية في التنظيم واستخدام البيانات الإحصائية للاستنتاجات العلمية والعملية. في العديد من أقسامها ، تستند الإحصائيات الرياضية إلى نظرية الاحتمال ، والتي تسمح للفرد بتقييم الموثوقية والدقة ... قاموس موسوعي كبير

    إحصائيات الرياضيات- الإحصاء الرياضي ، علم الأساليب الرياضية للتنظيم واستخدام البيانات الإحصائية للاستنتاجات العلمية والعملية. يمكن العثور على أصول الإحصاء الرياضي في أعمال العلماء في أواخر القرن السابع عشر وأوائل القرن التاسع عشر. في كثير… … قاموس موسوعي مصور

    إحصائيات الرياضيات- علم يتعامل مع وصف وتحليل نتائج ملاحظات الظواهر الجماعية باستخدام أساليب نظرية الاحتمالات. المهام النموذجية من M. مع. تحديد أنواع توزيعات المتغير العشوائي ، واختبار الفرضيات الإحصائية ، وتقدير المعلمات ، إلخ ... الموسوعة الجيولوجية

    إحصائيات الرياضيات- (من حالة خط العرض - حالة). يتعلق بمنهجية تدريس اللغات ، وعلم الأساليب الرياضية للتنظيم واستخدام البيانات الإحصائية لاستنتاجات علمية وعملية. قوانين M. مع. تستخدم على نطاق واسع في المنظمة ... ... قاموس جديد للمصطلحات والمفاهيم المنهجية (نظرية وممارسة تدريس اللغات)

    إحصائيات الرياضيات- فرع من الرياضيات مخصص لأساليب وقواعد معالجة البيانات الإحصائية وتحليلها (أي معلومات حول عدد الأشياء التي لها خصائص معينة ، في أي مجموعة أكثر أو أقل شمولاً). أنفسهم ... ... القاموس الاقتصادي والرياضي

    إحصائيات الرياضيات- قسم من الرياضيات مخصص لطرق وقواعد معالجة وتحليل البيانات الإحصائية (أي معلومات حول عدد الأشياء التي لها خصائص معينة ، في أي مجموعة أكثر أو أقل شمولاً). الأساليب والقواعد نفسها مبنية ... ... دليل المترجم الفني

    إحصائيات الرياضيات- قسم الرياضيات مخصص للطرق الرياضية لتنظيم ومعالجة واستخدام البيانات الإحصائية لاستنتاجات علمية وعملية. في الوقت نفسه ، تشير البيانات الإحصائية إلى معلومات حول عدد الكائنات في أي ... ... الموسوعة السوفيتية العظمى

    إحصائيات الرياضيات- علم الأساليب الرياضية في التنظيم واستخدام البيانات الإحصائية للاستنتاجات العلمية والعملية. في العديد من أقسامها ، تستند الإحصائيات الرياضية إلى نظرية الاحتمال ، والتي تسمح للفرد بتقييم الموثوقية والدقة ... قاموس موسوعي

"يعتقد بعض الناس أنهم على حق دائمًا. لا يمكن لمثل هؤلاء الأشخاص أن يكونوا علماء جيدين ولا أي اهتمام بالإحصاءات ... تم إحضار القضية من السماء إلى الأرض ، حيث أصبحت جزءًا من عالم العلم. " (ديمند س.)

"الفرصة ليست سوى مقياس لجهلنا. الظواهر العشوائية ، إذا حددناها ، ستكون تلك التي لا نعرف قوانينها. (A. Poincare "العلم والفرضية")

”المجد لهذه المناسبة. أليس كذلك
دائما على قدم المساواة مع غير القابل للتغيير ...
غالبًا ما يحكم الحظ الحدث ،
يولد الفرح والألم.
والحياة تضع مهمة أمامنا:
كيفية فهم دور الصدفة "
(من كتاب B.A. Kordemsky "الرياضيات تدرس العشوائية")

العالم نفسه منطقي - هذه هي الطريقة التي نفكر بها في كثير من الأحيان وندرس قوانين الفيزياء والكيمياء وما إلى ذلك ، ومع ذلك لا يحدث شيء دون تدخل الصدفة ، الذي ينشأ تحت تأثير العلاقات السببية الجانبية غير المتسقة التي تغير مسار الظاهرة أو التجربة عند تكرارها. يتم إنشاء "التأثير العشوائي" مع الانتظام المتأصل في "القدر الخفي" ، أي فرصة لها حاجة للحصول على نتيجة منتظمة.

ينظر علماء الرياضيات إلى الأحداث العشوائية فقط في معضلة "أن تكون أو لا تكون" - تأتي أو لا تأتي.

تعريف.يسمى فرع الرياضيات التطبيقية الذي يدرس الخصائص الكمية للأحداث أو الظواهر العشوائية الجماعية الإحصاء الرياضي.

تعريف.يسمى الجمع بين عناصر نظرية الاحتمالات والإحصاء الرياضي العشوائية.

تعريف. العشوائية- هذا هو فرع الرياضيات الذي نشأ ويتطور بشكل وثيق مع الأنشطة العملية للإنسان. اليوم ، يتم تضمين عناصر الاستوكاستك في الرياضيات للجميع ، لتصبح جانبًا جديدًا ومهمًا في التربية الرياضية والعامة.

تعريف. إحصائيات الرياضيات- علم الأساليب الرياضية لتنظيم ومعالجة واستخدام البيانات الإحصائية للاستنتاجات العلمية والعملية.

دعنا نتحدث عن هذا بمزيد من التفصيل.

يتم قبول وجهة النظر حول الإحصاء الرياضي كعلم للطرق العامة لمعالجة نتائج التجربة بشكل عام. في حل هذه المشكلات ، ما الذي يجب أن تحتويه التجربة حتى تكون الأحكام الصادرة على أساسها صحيحة. أصبحت الإحصائيات الرياضية جزئيًا علم التصميم التجريبي.

لقد خضع معنى كلمة "إحصاء" على مدى القرنين الماضيين لتغييرات كبيرة ، كما كتب العلماء المعاصرون المشهورون هودجز وليمان ، فكلمة "إحصاء" لها نفس جذر كلمة "حالة" (حالة) وتعني في الأصل فن وعلم الإدارة: يُطلق اليوم على أول معلمي الإحصاء الجامعي في ألمانيا في القرن الثامن عشر اسم علماء الاجتماع. لأن القرارات الحكومية تعتمد إلى حد ما على بيانات عن السكان والصناعة وما إلى ذلك. أصبح الإحصائيون بالطبع مهتمين بمثل هذه البيانات ، وبدأت كلمة "إحصاءات" تدريجيًا تعني جمع البيانات عن السكان ، والدولة ، ثم بشكل عام جمع البيانات ومعالجتها. لا جدوى من استخراج البيانات إذا لم تكن هناك فائدة يمكن استخلاصها منها ، ومن الطبيعي أن يشارك الإحصائيون في تفسير البيانات.

يدرس الإحصائي الحديث الأساليب التي يمكن من خلالها إجراء استنتاجات حول السكان من البيانات التي يتم الحصول عليها عادةً من عينة من "السكان".

تعريف. إحصائي- الشخص الذي يتعامل مع علم الأساليب الرياضية لتنظيم ومعالجة واستخدام البيانات الإحصائية لاستنتاجات علمية وعملية.

نشأت الإحصاءات الرياضية في القرن السابع عشر وتطورت بالتوازي مع نظرية الاحتمالات. يرجع التطور الإضافي للإحصاءات الرياضية (النصف الثاني من القرن التاسع عشر وأوائل القرن العشرين) في المقام الأول إلى P.L. تشيبيشيف ، أ. ماركوف ، أ. Lyapunov ، K. Gauss ، A. Quetelet ، F. Galton ، K Pearson ، وآخرون.في القرن العشرين ، قدم A.N. كولموغوروف ، ف. رومانوفسكي ، إي. سلوتسكي ، نيفادا سميرنوف ، ب. Gnedenko ، وكذلك طالب اللغة الإنجليزية R. Fisher و E. Purson والعلماء الأمريكيون (Yu. Neumann ، A Wald).

مشاكل الإحصاء الرياضي ومعنى الخطأ في عالم العلوم

يعتمد إنشاء الأنماط التي تخضع لها الظواهر العشوائية الجماعية على دراسة البيانات الإحصائية لنتائج الملاحظة بواسطة طرق نظرية الاحتمالات.

تتمثل المهمة الأولى للإحصاء الرياضي في الإشارة إلى طرق جمع وتجميع المعلومات الإحصائية التي تم الحصول عليها نتيجة للملاحظات أو نتيجة لتجارب مصممة خصيصًا.

المهمة الثانية للإحصاء الرياضي هي تطوير طرق لتحليل البيانات الإحصائية اعتمادًا على أهداف الدراسة.

تعمل الإحصائيات الرياضية الحديثة على تطوير طرق لتحديد عدد الاختبارات المطلوبة قبل بدء الدراسة (تخطيط التجربة) ، أثناء الدراسة (التحليل المتسلسل). يمكن تعريفه على أنه علم اتخاذ القرار في ظل عدم اليقين.

باختصار ، يمكننا القول أن مهمة الإحصاء الرياضي هي إنشاء طرق لجمع البيانات الإحصائية ومعالجتها.

عند دراسة ظاهرة عشوائية جماعية ، يُفترض إجراء جميع الاختبارات في نفس الظروف ، أي مجموعة العوامل الرئيسية التي يمكن أخذها في الاعتبار (قياسها) ولها تأثير كبير على نتيجة الاختبار ، تحتفظ بنفس القيم قدر الإمكان.

العوامل العشوائية تشوه النتيجة التي كان من الممكن الحصول عليها في حالة وجود العوامل الرئيسية فقط ، مما يجعلها عشوائية. يسمى انحراف نتيجة كل اختبار عن الاختبار الصحيح خطأ الملاحظة ، وهو متغير عشوائي. من الضروري التمييز بين الأخطاء المنهجية والعشوائية.

تجربة علمية لا يمكن تصورها بدون خطأ ، مثل المحيط بدون ملح. أي تيار من الحقائق التي تضيف إلى معرفتنا يؤدي إلى نوع من الخطأ. وبحسب مقولة معروفة في حياة معظم الناس ، لا شيء مؤكد إلا الموت والضرائب ، ويضيف العالم: "وأخطاء التجربة".

الإحصائي هو "كلب صيد" يبحث عن حشرة. أداة إحصائية لاكتشاف الأخطاء.

كلمة "خطأ" لا تعني ببساطة "سوء تقدير". تعتبر عواقب سوء التقدير مصدرًا صغيرًا وغير مهم نسبيًا للخطأ التجريبي.

في الواقع ، أدواتنا تنكسر ؛ يمكن لأعيننا وآذاننا أن تخدعنا. قياساتنا ليست دقيقة تمامًا أبدًا ، وأحيانًا تكون حساباتنا الحسابية خاطئة. الخطأ التجريبي هو شيء أكثر أهمية من شريط القياس غير الدقيق أو الوهم البصري. ونظرًا لأن أهم وظيفة للإحصاء هي مساعدة العلماء على تحليل الخطأ التجريبي ، يجب أن نحاول فهم ماهية الخطأ حقًا.

مهما كانت المشكلة التي يعمل عليها العالم ، فمن المؤكد أنها ستكون أكثر تعقيدًا مما يريد. لنفترض أنه يقيس التساقط الإشعاعي عند خطوط العرض المختلفة. ستعتمد النتائج على ارتفاع الأماكن التي تم فيها جمع العينات ، وكمية هطول الأمطار المحلية والأعاصير على ارتفاعات عالية فوق منطقة أوسع.

يعد الخطأ التجريبي جزءًا لا يتجزأ من أي تجربة علمية حقًا.

يمكن أن تكون النتيجة نفسها خطأ ومعلومات حسب المشكلة ووجهة النظر. إذا رغب عالم أحياء في التحقيق في كيفية تأثير التغيير في النظام الغذائي على النمو ، فإن وجود دستور مرتبط به يكون مصدرًا للخطأ ؛ إذا درس العلاقة بين الوراثة والنمو ، فسيكون مصدر الخطأ هو الاختلافات في التغذية. إذا أراد الفيزيائي التحقيق في العلاقة بين التوصيل الكهربائي ودرجة الحرارة ، فإن الاختلافات في كثافة المادة الموصلة تعتبر مصدرًا للخطأ ؛ إذا درس العلاقة بين هذه الكثافة والتوصيل الكهربائي ، فستكون التغيرات في درجات الحرارة مصدرًا للخطأ.

قد يبدو هذا الاستخدام لخطأ الكلمة مشكوكًا فيه ، وربما يكون من الأفضل القول إن التأثيرات الناتجة مشوهة بتأثيرات "غير مقصودة" أو "غير مرغوب فيها". نحن نخطط لتجربة لدراسة التأثيرات المعروفة ، لكن العوامل العشوائية التي لا نستطيع توقعها أو تحليلها تشوه النتائج بإضافة آثارها الخاصة إليها.

الفرق بين التأثيرات المخطط لها والآثار الناتجة عن أسباب عرضية هو مثل الاختلاف بين تحركات السفينة في البحر والإبحار على طول مسار معين والسفينة التي تنجرف بلا هدف بناءً على الرياح والتيارات المتغيرة. يمكن تسمية حركة السفينة الثانية بالحركة العشوائية. من الممكن أن تصل هذه السفينة إلى أي ميناء ، ولكن من الأرجح أنها لن تصل إلى أي مكان معين.

يستخدم الإحصائيون كلمة "عشوائي" للإشارة إلى ظاهرة يكون من المستحيل تمامًا التنبؤ بنتائجها في وقت لاحق.

الخطأ الناتج عن التأثيرات المتوخاة في التجربة يكون في بعض الأحيان أكثر منهجية من العشوائية.

الخطأ المنهجي أكثر تضليلًا من الخطأ العشوائي. يمكن أن يؤدي التداخل من محطة راديو أخرى إلى إنشاء مرافقة موسيقية منتظمة يمكنك أحيانًا التنبؤ بها إذا كنت تعرف اللحن. لكن هذه "المصاحبة" يمكن أن تجعلنا نصدر حكمًا خاطئًا حول الكلمات أو موسيقى البرنامج التي نحاول سماعها.

ومع ذلك ، غالبًا ما يقودنا اكتشاف خطأ منهجي إلى مسار اكتشاف جديد. تساعدنا معرفة كيفية حدوث الأخطاء العشوائية في اكتشاف الأخطاء المنهجية وبالتالي التخلص منها.

نفس طبيعة التفكير أمر شائع في شؤوننا الدنيوية. كم مرة نلاحظ: "هذه ليست مصادفة!". كلما أمكننا قول ذلك ، فإننا نسير على طريق الاكتشاف.

على سبيل المثال ، A.L. Chizhevsky ، تحليل العمليات التاريخية: زيادة معدل الوفيات ، والأوبئة ، واندلاع الحروب ، والهجرات الكبيرة للشعوب ، والتغيرات المناخية المفاجئة ، إلخ. اكتشف العلاقة بين هذه العمليات غير ذات الصلة وفترات النشاط الشمسي ، والتي لها دورات: 11 سنة ، 33 سنة.

تعريف. تحت خطأ منهجييُفهم على أنه خطأ يتكرر ونفس الشيء بالنسبة لجميع الاختبارات. عادة ما يرتبط بالسلوك الخاطئ للتجربة.

تعريف. تحت أخطاء عشوائيةيشير إلى الأخطاء التي تنشأ تحت تأثير العوامل العشوائية وتتغير عشوائيًا من تجربة إلى أخرى.

عادةً ما يكون توزيع الأخطاء العشوائية متماثلًا حول الصفر ، مما يؤدي إلى نتيجة مهمة: في حالة عدم وجود أخطاء منهجية ، تكون نتيجة الاختبار الحقيقية هي التوقع الرياضي لمتغير عشوائي ، يتم تحديد قيمته المحددة في كل اختبار.

يمكن أن تكون كائنات الدراسة في الإحصاء الرياضي سمات نوعية أو كمية للظاهرة أو العملية قيد الدراسة.

في حالة السمة النوعية ، يتم حساب عدد تكرارات هذه السمة في سلسلة التجارب المعتبرة ؛ هذا الرقم هو المتغير العشوائي (المنفصل) قيد الدراسة. ومن أمثلة سمات الجودة العيوب الموجودة في الجزء النهائي والتركيبة السكانية وما إلى ذلك. إذا كانت العلامة كمية ، فيتم إجراء قياس مباشر أو غير مباشر في التجربة بالمقارنة مع معيار معين - وحدة قياس - باستخدام أدوات قياس مختلفة. على سبيل المثال ، إذا كانت هناك مجموعة من الأجزاء ، فيمكن أن يكون معيار الجزء بمثابة علامة نوعية ، ويمكن أن يكون الحجم المتحكم فيه للجزء بمثابة علامة كمية.

التعاريف الأساسية

يرتبط جزء كبير من الإحصاء الرياضي بالحاجة إلى وصف مجموعة كبيرة من الكائنات.

تعريف.تسمى المجموعة الكاملة من الأشياء المراد دراستها عامة السكان.

يمكن أن يكون إجمالي عدد السكان هو إجمالي عدد سكان الدولة ، والإنتاج الشهري للمصنع ، وعدد الأسماك التي تعيش في خزان معين ، وما إلى ذلك.

لكن عامة السكان ليسوا مجرد مجموعة. إذا كانت مجموعة الأشياء التي تهمنا كثيرة جدًا ، أو كان من الصعب الوصول إلى الأشياء ، أو كانت هناك أسباب أخرى لا تسمح بدراسة جميع الكائنات ، فإنهم يلجأون إلى دراسة جزء من الأشياء.

تعريف.يسمى هذا الجزء من الأشياء التي يجب فحصها ودراستها وما إلى ذلك عينة من السكانأو ببساطة عينة.

تعريف.يسمى عدد العناصر في عموم السكان والعينة بهم أحجام.

كيفية التأكد من أن العينة تمثل الكل بشكل أفضل ، أي سيكون ممثل؟

إذا كان عدد صحيح ، أي إذا كان عامة السكان قليلًا أو غير معروفين تمامًا بالنسبة لنا ، فلا شيء أفضل من الاختيار العشوائي البحت. يسمح لك الوعي الأكبر بالتصرف بشكل أفضل ، ولكن لا يزال الجهل في مرحلة ما يندرج ضمن الاختيار العشوائي ، ونتيجة لذلك.

ولكن كيف يتم اختيار عشوائي بحت؟ كقاعدة عامة ، يعتمد الاختيار على سمات يمكن ملاحظتها بسهولة ، لدراسة البحث الذي يتم إجراؤه.

أدى انتهاك مبادئ الاختيار العشوائي إلى أخطاء جسيمة. اشتهر بفشل استطلاع أجرته المجلة الأمريكية Literaturnoye Obozrenie حول نتائج الانتخابات الرئاسية عام 1936. المرشحون في هذه الانتخابات هم ف.د. روزفلت وأ. على الأرض.

من ربح؟

بشكل عام ، استخدم المحررون دفاتر الهاتف. بعد اختيار 4 ملايين عنوان بشكل عشوائي ، أرسلت بطاقات بريدية بأسئلة حول الموقف تجاه المرشحين للرئاسة في جميع أنحاء البلاد. بعد إنفاق مبلغ كبير على إرسال البطاقات البريدية ومعالجتها ، أعلنت المجلة أن لاندون سيفوز في الانتخابات الرئاسية المقبلة بأغلبية ساحقة. تبين أن نتيجة الانتخابات جاءت عكس هذه التوقعات.

كان هناك خطأان هنا. أولاً ، لا تقدم دفاتر الهاتف عينة تمثيلية لسكان الولايات المتحدة - معظمهم من أرباب الأسر الأثرياء. ثانيًا ، لم يرسل جميع الأشخاص إجابات ، ولكن جزءًا مهمًا من ممثلي عالم الأعمال ، الذين دعموا لاندون.

في الوقت نفسه ، تنبأ عالما الاجتماع ج.غالان وإي.وارنر بشكل صحيح بانتصار ف.د. روزفلت ، بناءً على أربعة آلاف استبيان فقط. لم يكن سبب هذا النجاح الاختيار الصحيح للعينة فقط. لقد أخذوا في الاعتبار أن المجتمع ينقسم إلى مجموعات اجتماعية أكثر تجانسا بالنسبة لمرشحي الرئاسة. لذلك ، يمكن أن تكون العينة من الطبقة صغيرة نسبيًا بنفس نتيجة الدقة. في النهاية ، فاز روزفلت ، الذي كان مؤيدًا للإصلاحات لشرائح السكان الأقل ثراءً.

بعد الحصول على نتائج المسح حسب الطبقات ، من الممكن وصف المجتمع ككل.

ما هي العينات؟

هذه صفوف من الأرقام.

دعونا نتناول المزيد من التفاصيل حول المفاهيم الأساسية التي تميز سلسلة العينات.

تم أخذ عينة من الحجم n من عامة السكان > n 1 ، حيث n 1 هو عدد المرات التي لوحظ فيها ظهور x 1 ، n 2 - x 2 ، إلخ.

تسمى القيم المرصودة لـ x i خيارات ، ويسمى تسلسل الخيارات المكتوبة بترتيب تصاعدي سلسلة التباين. يُطلق على عدد المشاهدات n i الترددات و n i / n - الترددات النسبية (أو الترددات).

تعريف.يتم استدعاء القيم المختلفة للمتغير العشوائي والخيارات.

تعريف. سلسلة الاختلافتسمى سلسلة مرتبة بترتيب تصاعدي (أو تنازلي) للخيارات مع الترددات المقابلة لها (الترددات).

عند دراسة السلاسل المتغيرة ، جنبًا إلى جنب مع مفاهيم التردد ، يتم استخدام مفهوم التردد المتراكم. تم العثور على الترددات المتراكمة (الترددات) لكل فاصل من خلال الجمع المتتالي لترددات جميع الفترات السابقة.

تعريف.يسمى تراكم الترددات أو الترددات تراكم. يمكنك تجميع خيارات التردد والفترات الزمنية.

يمكن أن تكون خصائص السلسلة كمية ونوعية.

الخصائص الكمية (المتغيرة)هي الخصائص التي يمكن التعبير عنها بالأرقام. وهي مقسمة إلى منفصلة ومستمرة.

الخصائص النوعية (السمة)هي الخصائص التي لا يتم التعبير عنها بالأرقام.

المتغيرات المستمرةهي المتغيرات التي يتم التعبير عنها كأرقام حقيقية.

المتغيرات المنفصلةهي المتغيرات التي يتم التعبير عنها فقط كأعداد صحيحة.

تتميز العينات الاتجاهات المركزية: متوسط ​​، وضع ومتوسط. القيمة المتوسطة للعينة هي المتوسط ​​الحسابي لجميع قيمها. وضع العينة هو القيم التي تحدث بشكل متكرر. وسيط العينة هو الرقم الذي "يقسم" إلى نصف المجموعة المرتبة لجميع القيم في العينة.

يمكن أن تكون سلسلة التباين منفصلة أو مستمرة.

مهمة

العينة المعطاة: 1.3 ؛ 1.8 ؛ 1.2 ؛ 3.0 ؛ 2.1 ؛ 5 ؛ 2.4 ؛ 1.2 ؛ 3.2 ؛ 1.2 ؛ 4 ؛ 2.4

إنها مجموعة من الخيارات. بترتيب هذه الخيارات بترتيب تصاعدي ، نحصل على سلسلة متباينة: 1.2 ؛ 1.2 ؛ 1.2 ؛ 1.3 ؛ 1.8 ؛ 2.1 ؛ 2.4 ؛ 2.4 ؛ 3.0 ؛ 3.2 ؛ 4 ؛ 5.

متوسط ​​قيمة هذه السلسلة هو 2.4.

متوسط ​​السلسلة 2.25.

وضع السلسلة هو -1،2.

دعونا نحدد هذه المفاهيم.

تعريف. وسيط سلسلة التباينتسمى قيمة المتغير العشوائي ، والتي تقع في منتصف السلسلة المتغيرة (Me).

وسيط سلسلة أرقام مرتبة مع عدد فردي من الأعضاء هو الرقم المكتوب في المنتصف ، والوسيط لسلسلة أرقام مرتبة مع عدد زوجي من الأعضاء هو المتوسط ​​الحسابي للرقمين المكتوبين في المنتصف. إن وسيط سلسلة عشوائية من الأرقام هو متوسط ​​السلسلة المرتبة المقابلة.

تعريف. سلسلة فوغقم بتسمية المتغير (قيمة المتغير العشوائي) ، والذي يتوافق مع أعلى تردد (Mo) ، أي وهو أكثر شيوعًا من غيره.

تعريف. المتوسط ​​الحسابي لسلسلة التبايناتيتم استدعاء نتيجة قسمة مجموع قيم المتغير الإحصائي على عدد هذه القيم ، أي بعدد المصطلحات.

قاعدة إيجاد المتوسط ​​الحسابي للعينة:

  1. اضرب كل خيار بتردده (تعدده) ؛
  2. اجمع كل الأعمال الناتجة ؛
  3. قسّم المجموع الذي تم العثور عليه على مجموع كل الترددات.

تعريف. صف الاجتياحهو الفرق بين R = x max -x min ، أي أكبر وأصغر قيم هذه الخيارات.

دعنا نتحقق مما إذا كنا قد وجدنا القيمة المتوسطة لهذه السلسلة والوسيط والوضع بشكل صحيح ، بناءً على التعريفات.

قمنا بحساب عدد الأعضاء ، هناك 12 منهم - عدد زوجي من الأعضاء ، لذلك تحتاج إلى إيجاد المتوسط ​​الحسابي للعددين المكتوبين في المنتصف ، أي الخياران السادس والسابع. (2.1 + 2.4) \ u003d 2.25 - متوسط.

موضة. المود هو 1.2 لأن فقط هذا الرقم يحدث 3 مرات ، والباقي يحدث أقل من 3 مرات.

نجد المتوسط ​​الحسابي كالتالي:

(1,2*3+1,3+1,8+2,1+2,4*2+3,0+3,2 +4+5)\12=2,4

دعونا نصنع طاولة

تسمى هذه الجداول جداول التردد. في نفوسهم ، أرقام السطر الثاني هي الترددات ؛ أنها تظهر عدد المرات التي تحدث فيها واحدة أو أخرى من قيمها في العينة.

تعريف. التردد النسبيقيم العينة هي نسبة ترددها إلى عدد جميع قيم العينة.

تسمى الترددات النسبية الترددات. الترددات والترددات تسمى أوزان. أوجد مدى السلسلة: R = 5-1.2 = 3.8 ؛ نطاق السلسلة 3.8.

معلومات للفكر

المتوسط ​​الحسابي هو قيمة شرطية. إنه غير موجود حقًا. في الواقع ، هناك مجموع. لذلك ، فإن الوسيلة الحسابية ليست خاصية لملاحظة واحدة ؛ يميز المسلسل ككل.

تعنييمكن تفسيره على أنه مركز تشتت قيم السمة المرصودة ، أي القيمة ، التي تتقلب حولها جميع القيم المرصودة ، ويكون مجموع الانحرافات الجبرية عن المتوسط ​​دائمًا يساوي صفرًا ، أي مجموع الانحرافات عن المتوسط ​​لأعلى أو لأسفل يساوي بعضها البعض.

متوسطهي كمية مجردة (معممة). حتى عند تحديد سلسلة من الأعداد الطبيعية فقط ، يمكن التعبير عن متوسط ​​القيمة كرقم كسري. مثال: متوسط ​​درجات الاختبار هو 3.81.

تعنيتم العثور عليه ليس فقط للكميات المتجانسة. متوسط ​​غلة الحبوب في جميع أنحاء البلاد (الذرة - 50-60 سنتًا لكل هكتار والحنطة السوداء - 5-6 سنتات لكل هكتار ، والجاودار ، والقمح ، وما إلى ذلك) ، ومتوسط ​​استهلاك الغذاء ، ومتوسط ​​الدخل القومي للفرد ، ومتوسط ​​المعروض من المساكن ، والمتوسط ​​المرجح للإسكان التكلفة ، ومتوسط ​​كثافة العمالة في تشييد المباني ، إلخ. - هذه هي خصائص الدولة كنظام اقتصادي وطني واحد ، وهذه هي ما يسمى بمتوسطات النظام.

في الإحصاء ، يتم استخدام هذه الخصائص على نطاق واسع مثل الوضع والوسيط. يطلق عليهم المتوسطات الهيكلية ، لأن يتم تحديد قيم هذه الخصائص من خلال الهيكل العام لسلسلة البيانات.

في بعض الأحيان قد يكون للصف وضعان ، وأحيانًا قد لا يحتوي الصف على وضع.

موضةهو المؤشر الأكثر قبولًا في تحديد تغليف بعض المنتجات ، والذي يفضله المشترون ؛ أسعار سلع من هذا النوع شائعة في السوق ؛ مثل مقاس الحذاء ، الملابس ، الأكثر طلبًا ؛ رياضة يفضلها غالبية سكان البلد أو المدينة أو قرية المدرسة ، إلخ.

في البناء ، هناك 8 خيارات للألواح في العرض ، و 3 أنواع تستخدم غالبًا: 1 ​​متر 1.2 متر و 1.5 متر.هناك 33 خيارًا للبلاطة في الطول ، ولكن غالبًا ما تستخدم الألواح الطويلة 4.8 متر ؛ 5.7 م و 6.0 م ، فإن نمط الألواح هو الأكثر شيوعًا بين هذه الأحجام الثلاثة. يمكن قول الشيء نفسه عن العلامات التجارية للنوافذ.

يتم العثور على وضع سلسلة من البيانات عندما يريدون تحديد بعض المؤشرات النموذجية.

يمكن التعبير عن الوضع بالأرقام والكلمات ، من حيث الإحصائيات ، فإن الوضع هو التردد الأقصى.

الوسيطيسمح لك بأخذ المعلومات المتعلقة بسلسلة من البيانات بعين الاعتبار ، مما يعطي المتوسط ​​الحسابي والعكس صحيح.

الإحصاء الرياضي هو فرع من فروع الرياضيات مكرس للطرق الرياضية لتنظيم ومعالجة واستخدام البيانات الإحصائية للأغراض العلمية والعملية..

تشير البيانات الإحصائية إلى معلومات حول عدد وطبيعة الكائنات في أي مجموعة أكثر أو أقل شمولاً لها خصائص معينة.

يُطلق على طريقة البحث ، القائمة على اعتبار البيانات الإحصائية من مجموعات معينة من الكائنات ، اسم إحصائي.

الجانب الرياضي الرسمي لأساليب البحث الإحصائي غير مكترث بطبيعة الأشياء قيد الدراسة وهو موضوع الإحصاء الرياضي.

تتمثل المهمة الرئيسية للإحصاء الرياضي في استخلاص استنتاجات حول الظواهر والعمليات الجماعية من الملاحظات أو التجارب.

الإحصاء هو علم يسمح لك برؤية الأنماط في فوضى البيانات العشوائية ، وتسليط الضوء على الاتصالات القائمة فيها وتحديد أفعالنا من أجل زيادة حصة القرارات المتخذة بشكل صحيح.

تم الحصول على العديد من التبعيات المعروفة حاليًا بين مختلف جوانب العالم من حولنا من خلال تحليل البيانات التي جمعتها البشرية. بعد الاكتشاف الإحصائي للتبعيات ، يجد الشخص بالفعل تفسيرًا منطقيًا أو آخر للأنماط المكتشفة.

لتقديم التعريفات الأولية للإحصاءات ، ننتقل إلى مثال.

مثال. لنفترض أنه من الضروري تقدير درجة التغيير في معدل الذكاء لمدة 3 سنوات من الدراسة لـ 100 طالب. كمؤشر ، ضع في اعتبارك نسبة المعامل الحالي إلى المعامل الذي تم قياسه مسبقًا (قبل ثلاث سنوات) ، مضروبًا في 100٪.

نحصل على سلسلة من 100 متغير عشوائي: 97.8 ؛ 97.0 ؛ 101.7 ؛ 132.5 142 ؛ … ؛ 122. دلالة عليه من خلال X.

التعريف 1. يُطلق على تسلسل المتغيرات العشوائية X التي تمت ملاحظتها نتيجة الدراسة في الإحصاء ميزة.

التعريف 2.تسمى القيم المميزة المختلفة المتغيرات.

من الصعب الحصول على بعض المعلومات حول ديناميكيات التغييرات في معدل الذكاء في عملية التعلم من القيم المعطاة للمتغير. دعونا نفرز هذا التسلسل بترتيب تصاعدي: 94 ؛ 97.0 ؛ 97.8 ؛ … 142. يمكن بالفعل استخراج بعض المعلومات المفيدة من التسلسل الناتج - على سبيل المثال ، من السهل تحديد الحد الأدنى والحد الأقصى لقيم الميزة. لكن ليس من الواضح كيف يتم توزيع السمة بين جميع السكان من الطلاب الذين شملهم الاستطلاع. دعنا نقسم الخيارات إلى فترات. وفقًا لصيغة Sturges ، العدد الموصى به للفترات الزمنية

م= 1 + 3.32 لتر ز (ن)≈ 7.6 ، وقيمة الفترة.

ترد نطاقات الفترات التي تم الحصول عليها في العمود 1 من الجدول.


دعنا نحسب عدد قيم السمة التي وقعت في كل فترة زمنية ، ونكتبها في العمود 3.

التعريف 3.يُطلق على الرقم الذي يوضح عدد الخيارات التي وقعت في الفاصل الزمني i المعطى التردد ويُشار إليه بالرمز n i.

التعريف 4.تسمى نسبة التردد إلى العدد الإجمالي للملاحظات التردد النسبي (w i) أو الوزن.

التعريف 5.السلسلة المتغيرة هي سلسلة من المتغيرات مرتبة بترتيب تصاعدي أو تنازلي مع الأوزان المقابلة لها.

بالنسبة لهذا المثال ، فإن الخيارات هي نقاط المنتصف للفترات الزمنية.

التعريف 6.التردد المتراكم( )يسمى الرقم متغيرًا بقيمة ميزة أقل من x (хОR).

اقرأ أيضا: