شبكة بحوث وتقارير ومعلومات
تجربة هيدر2
اليوم: السبت 27 ابريل 2024 , الساعة: 2:46 م


اخر المشاهدات
الأكثر قراءة
اعلانات

مرحبا بكم في شبكة بحوث وتقارير ومعلومات


عزيزي زائر شبكة بحوث وتقارير ومعلومات.. تم إعداد وإختيار هذا الموضوع [ تعرٌف على ] انحدار خطي # اخر تحديث اليوم 2024-04-27 فإن كان لديك ملاحظة او توجيه يمكنك مراسلتنا من خلال الخيارات الموجودة بالموضوع.. وكذلك يمكنك زيارة القسم , وهنا نبذه عنها وتصفح المواضيع المتنوعه... آخر تحديث للمعلومات بتاريخ اليوم 10/11/2023

اعلانات

[ تعرٌف على ] انحدار خطي # اخر تحديث اليوم 2024-04-27

آخر تحديث منذ 5 شهر و 18 يوم
1 مشاهدة

تم النشر اليوم 2024-04-27 | انحدار خطي

مفاهيم الانحدار والارتباط والسببية



المقالات الرئيسة: ارتباط (إحصاء) وسببية (علم اجتماع)
الانحدار الخطي وتحليل الارتباط، رغم اشتراكهما في نفس القاعدة الإحصائية، إلا أنهما يختلفان على مستوى أدوار المتغيرات. إذا كان تحليل الارتباط يتعامل مع المتغيرين Y
{\displaystyle Y} و {\displaystyle X} على قدم المساواة، أي بصورة تماثلية، فتحليل الانحدار يجب أن يعتمد على تقعيد نظري قبلي يؤسس لحد أدنى من التراتبية السببية بين المتغيرات. على سبيل المثال في النظرية الاقتصادية: تفسير ظاهرة الاستهلاك بدلالة الدخل (مع ثبات العوامل الأخرى) انطلاقا من أن استهلاك الفرد مرتبط بالدخل. وهو ما يعطي للباحث شرعية لوضع علاقة بين المتغيرات الاقتصادية على شكل دالة: Y
=
f
(
)
{\displaystyle Y=f(X)} ، مع Y
{\displaystyle Y} المتغير التابع (الاستهلاك) و {\displaystyle X} المتغير المستقل (الدخل). غالبا ما تكون الخبرة المعرفية في مجال الدراسة هي منطلق وضع النموذج، بأهداف استكشافية أو تأكيدية أو تحكيمية: استكشافية: لاستكشاف وجاهة متغير ما في تفسير ظاهرة معينة (مثلا العمر كمفسر لارتفاع الضغط الدموي).
تأكيدية: كما في حالة صيغة دوبري المؤكدة لخاصية ارتباط ضغط غاز الزئبق ( P
P ) مع درجة الحرارة ( T
{\displaystyle T} ): P
= α 1 T
α 2 e
α 3 / T
{\displaystyle P=\alpha _{1}T^{\alpha _{2}}e^{\alpha _{3}/T}} والتي يمكن تأكيدها إحصائيا عبر نموذج انحدار خطي يطبق على التحويل اللوغاريتمي للمعادلة.
تحكيمية: في سياق التعلم المراقب حيث يمكن النموذج من الفصل والتحكيم بين مجموعة من المتغيرات المفسرة حسب قوتها التفسيرية.

تاريخ


انحدار خطي بسيط مطبق على بيانات فرانسيس غالتون.
1755: يوسيب بوسكوفيتش هو أول رياضياتي يقوم بحساب معاملات نموذج انحدار خطي خلال أعماله في مجال الجغرافيا.
1866: أول ظهور لمصطلح انحدار (بالإنجليزية: Regression)‏ في أعمال فرانسيس غالتون، حيث طبق نموذج الانحدار الخطي البسيط في نمذجة قامات الأطفال المولودين لآباء ذوي قامات غير اعتيادية (فارعة أو قصيرة الطول) مبينا بأن قامات الأطفال تؤول نحو المتوسط الحسابي لقامة الساكنة.

طرق تقدير معلمات النموذج


من أبرز الطرق المستعملة في تقدير معلمات النموذج طريقة المربعات الصغرى، وتنحصر خصائص المعلمات المقدرة في خمس افتراضات: الخطية.
انعدام القيمة المتوقعة للعنصر العشوائي.
تجانس تباينات الأخطاء العشوائية
عدم ارتباط ذاتي بين الأخطاء العشوائية.
عدم ارتباط ذاتي بين المتغيرات المستقلة والأخطاء العشوائية.
تتمثل طريقة المربعات الصغرى في تقدير والتي تقلل الفرق بين القيم الفعلية والنظرية أو المقدرة والتي تحقق النهاية الصغرى للكمية.

تقعيد نظري


يشار للعينة الإحصائية ب Ω
{\displaystyle \Omega } تضم n
n فردا إحصائيا ببياناتهم وفق صنفين من المتغيرات: Y
{\displaystyle Y} : المتغير التابع.
{\displaystyle X} (أو مجموعة متغيرات

j
{\displaystyle X_{j}} ، مع j
=
1
,
.
.
.
,
p
{\displaystyle j=1,...,p} ): المتغيرات المستقلة أو المفسرة.
في حالة وجود متغير مستقل وحيد، نكون في حالة الانحدار الخطي البسيط وفي حالة الانحدار الخطي المتعدد إذا كانت p

2
{\displaystyle p\geq 2} . أشكال الكتابة
توجد ثلاثة أشكال لكتابة نماذج الانحدار الخطي: الكتابة العادية (أو القياسية) والكتابة المتجهية والكتابة المصفوفاتية. الكتابة القياسية
لكل فرد إحصائي i
i ، تكتب نمذجة القيمة المتحققة
y i
{\displaystyle y_{i}} بدلالة قيم المتغيرات المفسرة
x i
,
j
{\displaystyle x_{i,j}} والخطأ الإحصائي
ε i
{\displaystyle \varepsilon _{i}} :
y i
= β 0
+ β 1 x i
,
1
+
.
.
.
+ β p x i
,
p
+ ε i
{\displaystyle y_{i}=\beta _{0}+\beta _{1}x_{i,1}+...+\beta _{p}x_{i,p}+\varepsilon _{i}} الكتابة المتجهية
يشار لمتجهة المعاملات β
=
( β 0
, β 1
,
.
.
.
, β p
)
{\displaystyle \beta =(\beta _{0},\beta _{1},...,\beta _{p})} ولمنقولة متجهة القيم المتحققة
x i
,
j
{\displaystyle x_{i,j}} ب
x i ′ =
(
1
, x i
,
1
,
.
.
.
, x i
,
p
)
{\displaystyle x_{i}'=(1,x_{i,1},...,x_{i,p})} وتكتب النمذجة:
y i
= x i ′ β
+ ε i
{\displaystyle y_{i}=x_{i}'\beta +\varepsilon _{i}} الكتابة المصفوفاتية
أحيانا، تستعمل الكتابة المصفوفاتية للتعبير عن النموذج بشكل شامل، وأيضا لتسهيل البرهنة على الخصائص الاستدلالية المرتبطة بالنموذج: Y
=
β
+
ε
{\displaystyle Y=X\beta +\varepsilon } بحيث: Y
=
(
y 1 y 2
⋮ y n )
, =
(
x 1 ′
x 2 ′ ⋮ x n ′
)
=
( 1 x 11
⋯ x 1
p
1 x 21
⋯ x 2
p




1 x n
1
⋯ x n
p )
, β
=
(
β 0 β 1
⋮ β p )
, ε
=
(
ε 1 ε 2
⋮ ε n )
.
{\displaystyle Y={\begin{pmatrix}y_{1}\\y_{2}\\\vdots \\y_{n}\end{pmatrix}},\quad X={\begin{pmatrix}x'_{1}\\x'_{2}\\\vdots \\x'_{n}\end{pmatrix}}={\begin{pmatrix}1&x_{11}&\cdots &x_{1p}\\1&x_{21}&\cdots &x_{2p}\\\vdots &\vdots &\ddots &\vdots \\1&x_{n1}&\cdots &x_{np}\end{pmatrix}},\quad \beta ={\begin{pmatrix}\beta _{0}\\\beta _{1}\\\vdots \\\beta _{p}\end{pmatrix}},\quad \varepsilon ={\begin{pmatrix}\varepsilon _{1}\\\varepsilon _{2}\\\vdots \\\varepsilon _{n}\end{pmatrix}}.} تقدير النموذج
تقدير النموذج يعني بالأساس تقدير القيم المقدرة للمعاملات β
{\displaystyle \beta } (والتي تعتبر معالم النموذج)، إضافة إلى التصديق الإحصائي على نجاعة النموذج وقابلية تطبيقه واستغلاله عمليا، خصوصا في توقع قيم مستقبلية (أو جديدة) ل Y
{\displaystyle Y} بمعرفة قيم {\displaystyle X} . توجد أربع طرق لتقدير نموذج الانحدار الخطي: طريقة التقدير حسب القيمة العليا لدالة الإمكان.
طريقة التقدير حسب طريقة المربعات الدنيا.
طريقة العزوم.
الطرق البايزية.
أكثر الطرق استعمالا، وأكثرها نجاعة، هي طريقة المربعات الدنيا: حسب مبرهنة كاوس ماركوف، وفي حالة تحقق الفرضيات المنصوص عليها في المبرهنة، فمقدر المربعات الدنيا يكون أفضل مقدر خطي بدون تحيز (بالإنجليزية: Best Linear Unbiased Estimator) ويشار إليه اختصارا ب BLUE.

طريقة المربعات الدنيا


قبل تطبيق طريقة المربعات الدنيا لتقدير المعالم الإحصائية لنموذج الانحدار، يجب التأكد من تحقق مجموعة من الفرضيات، وخصوصا فرضيات مبرهنة غاوس ماركوف (المتعلقة بالخصائص الإحصائية لأخطاء النموذج الخطي الإحصائية). تنقسم الفرضيات إلى صنفين: فرضيات بنوية (Systemic) يجب التأكد منها قبل تطبيق النموذج وفرضيات تصادفية (Stochastic) يتم التأكد منها بعد كل تكرار لتطبيق النموذج إلى غاية بلوغ صيغة مستقرة وقابلة للتطبيق. الفرضيات البنوية
الفرضية
H 1
{\displaystyle H_{1}} : عدم وجود أخطاء إحصائية في ملاحظة Y
{\displaystyle Y} و {\displaystyle X} (مفهوم الخطأ هنا يشمل الأخطاء القياسية والتحيزات التي يمكن أن تكون ناتجة عن أخطاء منهجية في الاستعيان مثلا).
الفرضية
H 2
{\displaystyle H_{2}} : Y
{\displaystyle Y} و {\displaystyle X} موزعة طبيعيا، Y

N
( μ Y
, σ Y
2
)
{\displaystyle Y\backsim {\mathcal {N}}(\mu _{Y},\sigma _{Y}^{2})} ولكل

j
{\displaystyle X_{j}} ،

j

N
( μ

j
, σ

j
2
)
{\displaystyle X_{j}\backsim {\mathcal {N}}(\mu _{X_{j}},\sigma _{X_{j}}^{2})} .
الفرضية
H 3
{\displaystyle H_{3}} : وجود علاقة خطية بين Y
{\displaystyle Y} و {\displaystyle X} (في حالة الانحدار الخطي البسيط) وعدم وجود تداخل خطي بين المتغيرات

j
{\displaystyle X_{j}} (في حالة الانحدار الخطي المتعدد).
الفرضية
H 4
{\displaystyle H_{4}} : حجم عينة البيانات أكبر بكثير من عدد المعالم الإحصائية اللازم تقديرها، أي n

p
{\displaystyle n\gg p} .
الفرضيات التصادفية
الفرضية
H 5
{\displaystyle H_{5}} : القيمة المتوقعة للأخطاء الإحصائية منعدمة، E
( ε i
)
=
0
{\displaystyle E(\varepsilon _{i})=0} ، بالنسبة لكل ملاحظة i
i .
الفرضية
H 6
{\displaystyle H_{6}} : الارتباط الذاتي للأخطاء منعدم، لكل زوج (
i
,
k
)

[
1
,
.
.
.
,
n ] 2
{\displaystyle (i,k)\in [1,...,n]^{2}} بحيث i

k
{\displaystyle i\neq k} ، E
( ε i
, ε k
)
=
0
{\displaystyle E(\varepsilon _{i},\varepsilon _{k})=0} .
الفرضية
H 7
{\displaystyle H_{7}} : تجانس تباين الأخطاء الإحصائية E
( ε i
, ε k
)
= σ ε
2
{\displaystyle E(\varepsilon _{i},\varepsilon _{k})=\sigma _{\varepsilon }^{2}} .
الفرضية
H 8
{\displaystyle H_{8}} : الأخطاء موزعة وفق نفس التوزيع الطبيعي
ε i

N
(
0
, σ ε
2
)
{\displaystyle \varepsilon _{i}\backsim {\mathcal {N}}(0,\sigma _{\varepsilon }^{2})} .
طرق التأكد من الفرضيات
عمليا، يتم التأكد من الفرضيات، في الغالب، عبر اختبارات إحصائية، وغالبا ما تكون العملية تكرارية ويمكن أن تستلزم القيام بتطبيق دوال تحويلية على المتغيرات، أو استثناء عناصر إحصائية من العينة، حتى تقترب العينة المدروسة من البنية المثلى الموافقة للفرضيات. عمليا، من الصعب تحقق كل الفرضيات بصورة كاملة، ولذلك يجب مرافقة الدراسة بمقاربة تحكيمية تحقق التوافق بين الهدف من النمذجة وجودة البيانات المتوفرة وإمكانية الوصولية إلى بيانات أخرى.
أمثلة لطرق التأكد من الفرضيات البنيوية والتصادفية لنمذجة الانحدار الخطي
الفرضية طرق التأكد استراتيجيات بديلة H 1
{\displaystyle H_{1}} التصديق على منهجية الاستعيان H 2
{\displaystyle H_{2}} تطبيق الاختبارات الإحصائية للتوزيع الطبيعي، مثلا:
اختبار شابيرو ويلك (ملائم للعينات الصغيرة)
اختبار جارك بيرا (ملائم للعينات الكبيرة) في حالة فشل الاختبار، ينصح بتطبيق تحويلات على المتغيرات (التابعة والمستقلة) لإنتاج متغيرات جديدة تؤول تقاربيا إلى حالة التوزيع الطبيعي، مثلا:
تطبيق التحويل المعياري: Y
→ Y
− μ Y
σ Y
{\displaystyle Y\rightarrow {\frac {Y-\mu _{Y}}{\sigma _{Y}}}} عبر توسيط المتغير (طرح المتوسط) واختزاله (عبر قسمة الناتج على الانحراف المعياري)
تطبيق تحويلة بوكس كوكس عبر إيجاد أمثل λ
{\displaystyle \lambda } يحقق مآلا تقاربيا للمتغير B
(
x
,
λ
)
=
{ x λ

1 λ , λ

0
log

(
x
) , λ
=
0
{\displaystyle B(x,\lambda )={\begin{cases}{\frac {x^{\lambda }-1}{\lambda }}&{\text{, }}\lambda \neq 0\\\log(x)&{\text{, }}\lambda =0\end{cases}}} نحو التوزيع الطبيعي. H 3
{\displaystyle H_{3}} في حالة الانحدار البسيط:
معاينة بصرية لمنحنى Y
{\displaystyle Y} بدلالة {\displaystyle X} .
حساب معامل الارتباط الخطي والتأكد من مغزاه الإحصائي (عبر اختبار برافي بيرسون مثلا)
في حالة الانحدار المتعدد، التأكد من عدم وجود التداخل الخطي يمر عبر تطبيق الاختبارات التالية: جرد المتغيرات المشتبه بها عبر قاعدة كلاين.
حساب عوامل تضخم التباين لكل التغيرات المفسرة.
.اختبار تجانس الإشارات.
اختبار فارار وغلاوبر العام لاختبار فرضية استقلالية المتغيرات المفسرة. في حالة الانحدار البسيط:
تطبيق تحويلات رياضية (لوغاريتمية، تحويلة بوكس كوكس...) تقترب من الحالة الخطية.
في حالة الانحدار المتعدد: تطبيق خوارزميات تكرارية عبر إدخال وإخراج المتغيرات المستقلة إلى غاية بلوغ نموذج مستقر وفق معيار إحصائي (مثلا معيار أكايكي للمعلومة).

التحليل الوصفي


أشكال الدالة
يمكن أن تأخذ الدالة أشكالا مختلفة قد تكون خطية، لوغارتمية، أو أسية... الخ، ويمكن تحويل أي نموذج إلى النموذج الخطي، سنركز على الانحدار الخطي البسيط في قياس العلاقة بين المتغيرات: i=1,..,n
حيث أن هي معلمات النموذج وعنصر الخطأ العشوائي، تم إضافته مراعاة للصفة الاحتمالية للنموذج ويمثل الفرق بين القيم الفعلية والقيم النظرية، وبالتالي قد تكون قيمته موجبة أو سالبة وتشترط أن تكون القيمة المتوقعة تساوي صفر.

شرح مبسط


تعديل - تعديل مصدري - تعديل ويكي بيانات
شاركنا رأيك

 
التعليقات

لم يعلق احد حتى الآن .. كن اول من يعلق بالضغط هنا

أقسام شبكة بحوث وتقارير ومعلومات عملت لخدمة الزائر ليسهل عليه تصفح الموقع بسلاسة وأخذ المعلومات تصفح هذا الموضوع [ تعرٌف على ] انحدار خطي # اخر تحديث اليوم 2024-04-27 ويمكنك مراسلتنا في حال الملاحظات او التعديل او الإضافة او طلب حذف الموضوع ...آخر تعديل اليوم 10/11/2023


اعلانات العرب الآن