Regression Analysis in Myanmar language 51 pages.pdf

NayAung2 26 views 51 slides May 10, 2025
Slide 1
Slide 1 of 51
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31
Slide 32
32
Slide 33
33
Slide 34
34
Slide 35
35
Slide 36
36
Slide 37
37
Slide 38
38
Slide 39
39
Slide 40
40
Slide 41
41
Slide 42
42
Slide 43
43
Slide 44
44
Slide 45
45
Slide 46
46
Slide 47
47
Slide 48
48
Slide 49
49
Slide 50
50
Slide 51
51

About This Presentation

Regression Analysis (pages 51)


Slide Content

Regression Analysis က ိုအရ ိုိုးရှင်ိုးဆ ိုိုးန ိုးလည်ကကည ်မယ်
Variable ၂ ခိုရ ဆက်စပ်ပ ိုက ိုလလ လ မယ်ဆ ိုရင် ပထမဆ ိုိုး လေတ လက က်ခ ပပ ိုးရင် Scatter plot
လပေါ်မှ လနရ ချကကည ်ပါတယ်။ ေ လ ို Scatter plot လပေါ်မှ လနရ ချကကည ်ခခင်ိုးအ ိုးခြင ် ေ Variable ၂
လ ိုိုးရ ဆက်စပ်ပ ိုက ို သ ရှ န ိုင်ပါတယ်။ ေ လ ိုဆက်စပ်ရ မှ Positive Linear Relationship လ ိုး၊
Negative Linear Relationship လ ိုး၊ Curvilinear Relationship လ ိုး၊ No Relationship လ ိုး
စသည်ခြင ် သ ရှ န ိုင်ပါတယ်။ ေ လ ို Scatter plot ဆ ပပ ိုး Linear Relationship ဆ ိုတယ်ဆ ိုတ က ို
သ ရင် ေ Relationship ရ Correlation Coeffiecient က ိုတ က်ချက်ပပ ိုး ေ Coefficient ဟ
Significant ခြစ်၊ မခြစ်က ို ထပ်မ တ က်ချက်ကကပါတယ်။ (ေါလတ အ ိုးလ ိုိုးဟ Correlation
တ က်တ က ို လခပ လနတ ခြစ်ပါတယ်)
တကယ်လ ို Correlation Coefficient ဟ Significant ခြစ်တယ်ဆ ိုရင် လန က်တစ်ဆင ်အလနန
Regression Line က ို စဥ်ိုးစ ိုးရမှ ခြစ်ပါတယ်။ Regression ဆ ိုတ Statistical analysis tool
တစ်ခိုခြစ်ပပ ိုး Variable လတ က ို တစ်ခိုအလပေါ်တစ်ခို သက်လရ က်မှုဘယ်လလ က်ရှ တ လ က ို
ခန ်မှန်ိုးတ ခြစ်ပါတယ်။
ခမင်သ လအ င်လခပ ရရင် X န Y ဆ ိုတ Variable ၂ လ ိုိုးရှ တယ်ဆ ိုပါစ ို ....Regression analysis ဟ X
ရ လခပ င်ိုးလ မှုဟ Y အလပေါ်က ို ဘယ်လလ က်သက်လရ က်တယ်ဆ ိုတ က ို
တ က်ချက်တ ခြစ်ပါတယ်။ X က ို စ ကကည ်ချ န်လ ို သတ်မှတ်ရင် Y က ို စ လမိုးပ အမှတ်လ ို
သတ်မှတ်ထ ိုးပပ ိုး စ ကကည ်ချ န်ဘယ်လလ က်တ ိုိုးရင် (X ဘယ်လလ က်တ ိုိုးရင်) စ လမိုးပ အမှတ်
ဘယ်လလ က်တ ိုိုးမယ် (Y ဘယ်လလ က်တ ိုိုးတယ်) ဆ ိုတ က ို တ က်ချက်န ိုင်မှ ခြစ်ပါတယ်။
လက်လတ ွေ့လိုပ်ငန်ိုးဥပမ တစ်ခိုအလနန ဆ ို သင ်အလနန မ ိုးကတ်တင်ိုးဘတ်ဂျက်ဘယ်လလ က်သ ိုိုးရင်
အလရ င်ိုးဘယ်လလ က်တက်မယ်ဆ ိုတ က ို Regression Analysis န ခန ်မှန်ိုးန ိုင်မှ ခြစ်ပါတယ်။
Variables ပါဝင်မှု/ အမျ ိုးအစ ိုး အလပေါ်မူတည်ပပ ိုး Regression လအ က်ပါအတ ိုင်ိုး
ခ ခခ ိုးန ိုင်ပါတယ်။
- Linear Regression န
- Logistic Regression ဆ ိုပပ ိုးခ န ိုင်သလ ို

- Bivariate (1 Independent Variable, 1 Dependent Variable)
- Multivariate (two or more Independent Variables, 1 Dependent Variable) ဆ ိုပပ ိုးခ ပါတယ်။
သခ္ျ နည်ိုးခြင ် Regression က ို လအ က်ပါပ ိုလသနည်ိုးန လြ ်ခပန ိုင်ပါတယ်။
Y = a + bX (general equation)
Written by Ko Kaung Satt Paing
- - - - - - - - - - - - - - - - - - - - - - -
What is regression Analysis?
=======================
Regression analysis ဆ ိုတ ဟ သိုလတသန လိုပ်လဆ င်ရ မှ အမျ ိုးဆ ိုိုး အသ ိုိုးခပ လလ ရှ တ
tools လတ ထ က တစ်ခိုပါ။
Regression analysis က ို independent န dependent variables ကက ိုးက relationship က ို
လလ လ ဆန်ိုးစစ်ရ မှ အသ ိုိုးခပ လလ ရှ ပါတယ်။
Purposes of regression analysis
==========================
Regression analysis က ို အဓ က အ ိုးခြင ် ရည်ရ ယ်ချက် လလိုးခို န အသ ိုိုးခပ ကကပါတယ်။
Description
Regression Analysis ကလနတဆင ် dependent န independent variables ကက ိုးက
relationship က ိုလြ ်ခပခခင်ိုး
estimation
Independent variables လတ ရ observed values က ို အသ ိုိုးခပ ပပ ိုး dependent variable ရ
တန်ြ ိုိုးက ို ခန ်မှန်ိုးရန်
prediction
independent န dependent variables လတ ရ relationship လပေါ်မူတည် ပပ ိုး dependent
variables လတ ရ လခပ င်ိုးလ မှုန outcomes က ို ခန ်မှန်ိုးရန်
control

independent variables တစ်ခိုထက် မက ပ ိုပါတ အခါမှ independent variable တစ်ခို န
dependent variable တစ်ခိုစ ရ ကက ိုးထ relationship က ို လလ လ ချင်တ အခါ ကျန်ရှ တ
independent variables တချ ွေ့က ို ထ န်ိုးချ ပ် လလ လ န ိုင်ရန်
.....စတ ရည်ရ ယ်ချက်လတ န Regression analysis က ို အသ ိုိုးခပ ကကပါတယ်။
Types of regression analyses
========================
Regression analysis အမျ ိုးအစ ိုးမျ ိုးစ ရှ တ ထ က ေ လန လတ အမျ ိုးအစ ိုး သ ိုိုးမျ ိုးအလကက င်ိုးက ို
လခပ ခပချင်ပါတယ်။
Linear Regression
Logistic Regression
Multiple regression.
----------------------------------
Linear Regression
Independent variable တစ်ခိုန dependent variable က Continuous data
အမျ ိုးအစ ိုးခြစ်လနတ အခါ သူတ ို ကက ိုးက relationship က ို စစ်လဆိုးရန်
Example
Linear Regression
Examining the relationship between hours
of training and levels of patient self-care
and predict how long training should last
for every unit increase in self-care levels.
Logistic Regression
Independent variable လပေါ်မူတည်ပပ ိုး binary outcome အမျ ိုးအစ ိုးခြစ်တ dependent
variable ရ ရလေ် ခြစ်န ိုင်လချက ို model လရိုးဆ လလ လ ရန်
Logistic Regression
Estimating the likelihood of development

of pressure ulcers (dichotomous outcome:
yes or no) due to longer hospital stay,
number of times of positioning, BMI (Body
Mass Index) and age.
Multiple Linear Regression
တစ်ခို သ ို တစ်ခို ထက်ပ ိုလသ independent variables န dependent variables လတ ကက ိုးက
relationship က ို တပပ င်တည်ိုး စစ်လဆိုးရန်
Multiple regression
Examining the relationship between hours
of training and patient self-care levels
while controlling for other variables (eg,
family support, duration of disease) that
may affect the relationship
Factors affecting regression analysis
sample size, missing data န လက က်ယူထ ိုးတ sample ရ သလဘ သဘ ဝ လတ ဟ Linear
and multiple regression analysesလတ လပေါ်
သက်လရ က်မှု ရှ န ိုင်ပါတယ်။
► sample size နည်ိုးလနမယ်ဆ ိုရင် strong relationship ရှ တ variables လတ ကက ိုးက
relationship က ိုပ လြ ်ခပန ိုင်ပါတယ်။
► data set ထ မှ missing values လတ မျ ိုးလနခခင်ိုးဟ လ sample size အလပေါ်
သက်လရ က်န ိုင်ပါတယ်။
► larger sample လတ ရ sample အခ လတ (subsamples) လတ က independent န dependent
variablesကက ိုးက actual effect က ို မလြ ်ခပန် ိုင်တ မျ ိုးရှ တတ်ပါတယ်။ subsamples လတ က ို
ကက တင် သတ်မှတ်ထ ိုးမယ်ဆ ိုရင် လ တ regression တန်ြ ိုိုးကလန true relationships က ို

သ ရှ န ိုင်ပါတယ်။ အ လ ို မဟိုတ်ရင်လတ whole sample တစ်ခိုလ ိုိုးမှ regression analysis
ခပ လိုပ်သင ်ပါတယ်။
အခခ ိုး Regression analysis အမျ ိုးအစ ိုး န သူတ ို ရ အသ ိုိုးခပ ပ ိုလတ က ိုလ
လလ လ ကကည ်လ ို ရပါလသိုးတယ်။
With Love,
Tr.Emily
- - - - - - - - - - - - - - - - - - - - - -
Regression Analysis ဆ ိုသည်မှ
Regression Analysis ဆ ိုသည်မှ ကက တင်စိုလဆ င်ိုးထ ိုးသည် အချက်အလက်မျ ိုးက ို အလခခခ ၍
ရလေ်နှင် အချက်အလက်မျ ိုး၏ လယဘူယျ ဆက်သ ယ်ချက်က ို ရှ လြ ခခင်ိုး ခြစ်သည်။ ထ ို လန က်
အဆ ိုပါ လယဘူယျ ဆက်သ ယ်ချက်က ို အသ ိုိုးခပ ၍ အချက်အလက် အသစ် အတ က် ရလေ်က ို
ခန် မှန်ိုးခခင်ိုး ခြစ်သည်။ Regression Analysis က ို လလ လ ရ တ င် သ ထ ိုးသင် သည် အသ ိုိုးအနှုန်ိုး
(၅) ခိုနှင် စတင် မ တ်ဆက် လပိုးလ ို ပါသည်။
(က) Training data ဆ ိုသည်မှ ကက တင် စိုလဆ င်ိုးထ ိုးသည် အချက်အလက်မျ ိုးက ို ဆ ိုလ ိုသည်။
Training data တခိုချင်ိုးစ တ င် ရလေ်နှင် အဆ ိုပါ ရလေ်က ို သက်လရ က် လစန ိုင်သည်
အချက်အလက်မျ ိုး ပါ၀င်ရမည်။
(ခ) Target variable ဆ ိုသည်မှ ရလေ်က ို ရည်ညွှန်ိုးခခင်ိုး ခြစ်သည်။ ဥပမ — အ မ်လစျိုး ခန် မှန်ိုး
သည် ပိုစဆ တခိုအတ က် အ မ်လစျိုးသည် Target(ရလေ်) ခြစ်ပပ ိုး အဆ ိုပါ လစျိုးနှုန်ိုး သည် တည်လနရ ၊
အကျယ်အ၀န်ိုး၊ စသည် အခခ ိုးအချက်အလက်မျ ိုးအလပေါ်တ င် မူတည် သည်။ သ ို ခြစ်ရ Target
variable က ို dependent Variable (မှ ခ ို က န်ိုးရှင်) အခြစ်လည်ိုး ြလှယ် သ ိုိုးစ လလ ရှ သည်။
(ဂ) Independent Variables ဆ ိုသည်မှ အထက်ပါ ရလေ်က ို အကျ ိုး သက်လရ က် လစန ိုင်သည်
အချက်အလက်မျ ိုးက ို ရည်ညွှန်ိုးသည်။ အထက်ပါ အ မ်လစျိုး ခန် မှန်ိုးသည် ပိုစဆ တ င် တည်လနရ ၊
အ မ်၏ အကျယ်အ၀န်ိုး၊ အ ပ်ခန်ိုး အလရအတ က် စသည် အချက်အလက်မျ ိုးသည် Independent
Variable မျ ိုး ခြစ်ကကသည်။ သတ ခပ ရန်မှ ရလေ် (ဥပမ -အ မ်လစျိုး) သည် ၁ ခို ထက်မကသည်
အချက်အလက်မျ ိုးအလပေါ်တ င် မူတည်သည်။

(ဃ) Parameters ဆ ိုသည်မှ ရလေ်နှင် အချက်အလက်မျ ိုး၏ လယဘူယျ ဆက်သ ယ်ချက်က ို
လြ ်ခပန ိုင်သည် က န်ိုးလသမျ ိုးက ို ရည်ည

န်ိုးသည်။ ဥပမ ရန်ကိုန်တ င် တ ိုက်ခန်ိုး လရ င်ိုးချရ ၌
အ မ်အကျယ်အ၀န်ိုး ၁ လပပတ်လည်က ို ၁ သ န်ိုး/၁ သ န်ိုးခ စသည်ခြင် သတ်မှတ် လရ င်ိုးချသည်က ို
ကက ြူိုးကကပါလ မ် မည်။ အဆ ိုပါ ဆက်သ ယ်ချက်က ို သခ္ျ ည မျခခင်ိုးခြင် လြ ်ခပမည်ဆ ိုပါက
အ မ်လစျိုး = က န်ိုးလသ x အ မ်အကျယ်အ၀န်ိုး လြ ်ခပန ိုင်ပပ ိုး အဆ ိုပါ က န်ိုးလသက ို Parameters ဟို
လခေါ်ဆ ိုခခင်ိုး ခြစ်သည်။
(င) Residuals ဆ ိုသည်မှ machine learning method မှ ခန် မှန်ိုးလ ိုက်လသ ရလေ်နှင် မူလ
ရလေ်၏ ခခ ိုးန ိုးချက် ခြစ်သည်။

Regression analysis ဆ ိုတ
Regression analysis ဆ ိုတ Statistical model မှ သ ိုိုးပါတယ်။ Dataset လတ ရ သဘ ဝက ို
လလ လ ပပ ိုး ခန် မှန်ိုးချက်လတ ထိုတ်လပိုးြ ို Regression models လတ အလကက င်ိုး သလဘ လပါက်
ထ ိုးရပါတယ်။ Regression models လတ အမျ ိုးမျ ိုး ရှ တ ထ က အလခခခ အကျဆ ိုိုး ခြစ်တ Simple
Linear Regression အလကက င်ိုးက ို လဆ ိုးလန ိုးသ ိုးမှ ပါ။

Linear Regression ဆ ိုတ Dataset မှ Dependent န Independent Variables လတ ပါလနပပ ိုး
သူတ ို ရ နှ ိုးနွှယ်ချက်ကလန ခန် မှန်ိုးတ က်ချက်မှုလတ ခပ လိုပ်ချင်တယ် ဆ ိုရင် အသ ိုိုးခပ တ Statistics
method တစ်ခိုပ ခြစ်ပါတယ်။ Dataset တစ်ခိုမှ တချ ွေ့ Variable လတ က မှ ခ ို dependent
ခြစ်ပါတယ်။ ဥပမ ရ ိုိုးတစ်ရ ိုိုးမှ လိုပ်သက်န လစ ဆ ိုတ Variable ၂ ခိုမှ ဆ ိုရင် လိုပ်သက်က
independent ခြစ်ပါတယ်။
လစ ကလတ လိုပ်သက်လပေါ်မှ မူတည်ပပ ိုး အလခပ င်ိုးအလ ရှ န ိုင်တ မ ို dependent variable
ခြစ်ပါတယ်။ Multivariate Linear Regression ရှ န ိုင်သလ ို ေ လနရ မှ လတ Independent
Variable က တစ်လ ိုိုးတည်ိုး ( လိုပ်သက် ) ပ ရှ တ မ ို Simple Linear Regression က ို
အသ ိုိုးခပ မှ ပါ။

က�န်လတ ်တ ို က ေ မှ dependent variable က ို ခန် မှန်ိုးချင်တယ်။ လိုပ်သက် ဘယ်လလ က်ဆ ိုရင်
လစ ဘယ်လလ က်ရမလ သ ချင်တယ် ဆ ိုပါစ ို ။ က�န်လတ ်တ ို ခန် မှန်ိုးရပါလတ မယ်။
က�န်လတ ်တ ို ရ ခန် မှန်ိုးချက်ဟ ေ data လတ န ဘယ်လလ က် အ ဝင်ခ င်ကျ ခြစ်မလ ၊ တစ်နည်ိုး
ဘယ်လလ က် မှန်ကန်န ိုင်မယ် ဆ ိုတ တ ိုင်ိုးတ ြ ို metric တစ်ခို ရှ ပါတယ်။ အ ေါက ို SSE - Sum of
Square Errors လ ို လခေါ်ပါတယ်။ လက်ရှ မှ လတ ခန် မှန်ိုးတန်ြ ိုိုး y_bar အလနန average က ိုပ
ယူခ တ အတ က် 5226.19 ရလနပါတယ်။ ေ error တန်ြ ိုိုးဟ နည်ိုးန ိုင်သမ� နည်ိုးလလ ခြစ်ရပါမယ်။

က�န်လတ ်တ ို ဟ လိုပ်သက်န လစ ဆ ိုတ Variable ၂ ခိုက ို scatterplot န လေတ သရိုပ်
လြ ်လ ိုက်ပါမယ်။ အ ေ အခါ အခိုလ ို ထ က်ပါတယ်။ အ ေ ပ ိုပါ Data point လတ ကက ိုး အသင်
လတ ်ဆ ိုိုး အ ဝင်ခ င်ကျ ခြစ်မယ် slope တစ်ခိုက ို လြ ်ထိုတ်ကကရမှ ပါ။ အ ေ slope လပေါ်မှ
ခန် မှန်ိုးတန်ြ ိုိုး y_bar လတ ရှ လနမှ ပါ။ ခန် မှန်ိုးတန်ြ ိုိုးလတ က တကယ် တန်ြ ိုိုးလတ န အက ကက ိုး
မက ြ ို အလရိုးကက ိုးပါတယ်။ Slope လလိုးက အ ဝင်ခ င်ကျ ခြစ်လနမှ ရပါမယ်။ အ ေ Slope ရ
equation က ိုရရင် က�န်လတ ်တ ို က လိုပ်သက် ဘယ်လလ က်ဆ ိုရင် ခန် မှန်ိုးလစ ဘယ်
လလ က်ရယ်လ ို အ ေ equation က ို သ ိုိုးပပ ိုး ခန် မှန်ိုးန ိုင်ပါပပ ။
y_bar = mx + b
'm' → Slope
'x' → Independent Variables
'b' → Line intercept
'y_bar' → Predicted Values
ေ Slope က ို ရှ ြ ို လလ လလ ဆယ် Ordinary Least Squares - OLS ဆ ိုတ method က ို
အသ ိုိုးခပ သ ိုးမှ ခြစ်ပါတယ်။
Ordinary Least Squares (OLS)

က�န်လတ ်တ ို ရ သက်ဆ ိုင်ရ က န်ိုးအသ ိုးသ ိုးက ို အထက်ပါ ည မ�ခခင်ိုးထ ထည် တ က်လ ိုက်တ အခါ
y_bar = m*x + b ည မ�ခခင်ိုး ပ ိုစ လလိုး ရပါတယ်။
y_bar = 4.7996*x + 9.1809

အ ေ ည မ�ခခင်ိုးန dataset က ို excel မှ ထည် ကကည် လ ိုက်တ အခါ ယခိုလ ို ရပါတယ်။

မျက်ခမင်အရလတ သင် လတ ်ပပ ခြစ်တ မ ို y_bar = 4.7996*x+9.1809 ဆ ိုပပ ိုး ရထ ိုးတ ထ က ို x = 2
လ ို ထည် ကကည် တ အခါ y_bar ~ 18 ရတ မ ို တကယ် တန်ြ ိုိုး 15 န ကက ိုးမ ိုးစ ခခ ိုးန ိုးခခင်ိုး
မရှ တ က ို လတ ွေ့ ခမင်န ိုင်ပါတယ်။

အ ေါ error လကက င် က ဟလနတ ခြစ်လ ို error တန်ြ ိုိုးပါ ခပန်လပါင်ိုးလ ိုက်ရင် အလခြက
တစ်ထပ်တည်ိုး ကျမှ ခြစ်ပါတယ်။
Reference
Prabhu : Linear Regression Simplified - Ordinary Least Square vs Gradient Descent
- - - - - - - - - - - - - -
Essential Error Functions for Regression problems
က�န်လတ ်တ ို မှ ရှ လနတ data လတ ကလန ကက တင်ခန် မှန်ိုး တ က်ချက်တ လတ လိုပ်ချင်တ အခါ
Regression models လတ က ို အသ ိုိုးခပ ရပါတယ်။
က�န်လတ ်တ ို ရ model ကလန ထ က်လ တ ခန် မှန်ိုးတန်ြ ိုိုး predicted values လတ န တကယ်
တန်ြ ိုိုးမှန် actual values လတ ကက ိုး တန်ြ ိုိုး ခခ ိုးန ိုးမှုလတ ရှ န ိုင်ပါတယ်။ အ ေါလတ က ို error လတ လ ို
လခေါ်ပါတယ်။ တကယ် တန်ြ ိုိုးန ခန် မှန်ိုးတန်ြ ိုိုးကက ိုး ခခ ိုးန ိုးချက် ပမ ဏ တစ်နည်ိုးအ ိုးခြင် error
ပမ ဏ နည်ိုးလလ လက င်ိုးလလ ခြစ်ပါတယ်။
MAE - Mean Absolute Error

MAE ဆ ိုတ ခခ ိုးန ိုးချက်ခြစ်တ error ( predicted - actual ) က ို absolute ယူပပ ိုးမှ dataset
တစ်ခိုလ ိုိုးအတ က် mean ရှ လ ိုက်တ ခြစ်ပါတယ်။ absolute ယူတယ်ဆ ိုတ အလပါင်ိုး အနိုတ်
လကခဏ လတ က ို မယူဘ ဂဏန်ိုးတန်ြ ိုိုးသ ိုးသန် ယူတ ပါ။ ခန် မှန်ိုးတန်ြ ိုိုး န တန်ြ ိုိုးအမှန် အတ လပါင်ိုး
n တ စ ခခ ိုးန ိုးချက်လတ က ို လပါင်ိုးပပ ိုး အတ အလရအတ က် n န စ ိုးထ ိုးတ ပါ။ ရ ိုိုးရှင်ိုးပပ ိုး
အသ ိုိုးမျ ိုးတ metric တစ်ခို ခြစ်ပါတယ်။
Error ဟ ခန် မှန်ိုးတန်ြ ိုိုးက တကယ် တန်ြ ိုိုးထက် ကက ိုးတ အလခခအလနမှ အလပါင်ိုးက န်ိုးရ
overprediction လပမ ခန် မှန်ိုးတန်ြ ိုိုးက တကယ် တန်ြ ိုိုးလအ က် ငယ် underprediction ခြစ်လနရင်
အနိုတ်ရပါတယ်။ ေါလပမ MAE မှ absolute ယူထ ိုးတ မ ို မသ န ိုင်လတ ပါ။ လန က်ထပ်
အ ိုးနည်ိုးချက် တစ်ခိုကလတ လေတ ထ မှ အစ န်ိုးလရ က်တန်ြ ိုိုး outliers လတ ပါလနရင်လည်ိုး
MAE က ကက ိုးသ ိုးန ိုင်ပပ ိုး မမှန်န ိုင်လတ ပါဘူိုး။ ဆ ိုိုးခြတ်ရ ခက်ခ လစပါတယ်။ ဥပမ စ လမိုးပ
လေတ စိုမှ လကျ င်ိုးသ ိုးလတ ရ အမှတ်လတ က ၈၀ ပတ်ခခ လည်လပမ လကျ င်ိုးသ ိုး တစ်
လယ က်ကလတ ကျတ မှ ၁၀ မှတ်လအ က်လတ န ချည်ိုး ဆ ိုရင်လတ အ ေ လကျ င်ိုးသ ိုးဟ outlier
ခြစ်လနပါတယ်။ ေါလကက င် MAE တန်ြ ိုိုးဟ ကက ိုးသ ိုးန ိုင်တယ်။ အ ေ အခါ model က အသင် အတင်
လက င်ိုးပါလျက်န ေ လကျ င်ိုးသ ိုးတစ်လယ က် အမှတ်လကက င် န မလက င်ိုးလသိုးဘူိုးဆ ိုပပ ိုး
ဆ ိုိုးခြတ်ချက်ချတ မှ ိုးသ ိုးန ိုင်လစပါတယ်။
MSE - Mean Square Error

MSE ကလတ error က ို ၂ ထပ်တင်ပပ ိုး mean ရှ ထ ိုးတ ပါ။ MAE န တူလပမ error လတ ကက ိုး
လနတ အခါမှ ဘယ်လလ က် လ ိုလသိုးသလ ဆ ိုတ က ို လြ ်ခပတ အခါ ပ ို အသ ိုိုးဝင်ပါတယ်။
RMSE - Root Mean Square Error

RMSE ကလတ MSE က ို square root တင်ထ ိုးတ ပါ။ MAE လရ MSE လရ မှ ပါ မလခြရှင်ိုးန ိုင်တ
outliers လတ ရ ခပသန က ို RMSE သ ိုိုးပပ ိုး လခြရှင်ိုးန ိုင်ပါတယ်။
MAPE - Mean Absolute Peecentage Error

MAPE မှ လတ error က ို % န ခပပါတယ်။ ဥပမ actual value A လတ က [5,10] ခြစ်ပပ ိုး
predicted value F လတ က [10, 2] လတ ဆ ိုပါစ ို MAPE က = ((|5–10|/5) + (|10–2|)/10) / 2 *
100% = 90% ခြစ်ပါတယ်။
MAPE ရ အ ိုးနည်ိုးချက်ကလတ actual values A လတ ထ က တစ်ခိုခိုကသ သိုညဆ ို သိုညန
စ ိုးမရလ ို ( 1/0 is undefined ) အဆင်မလခပပါ။ လန က်ပပ ိုး ဆ ိုပါစ ို actual values A လတ က [
1,100 ] ခြစ်ပပ ိုး predicted values F လတ က [ 2, 101] ဆ ိုရင် တကယ်တမ်ိုး 1 unit စ သ က လပမ
100% န 1% လ ို ခြစ်လနပါတယ်။ ေ လ ို ခပသန လတ လကက င် တကယ်တမ်ိုး အသ ိုိုးခပ မယ်ဆ ို အဆင်မ
လခပပါဘူိုး။

WMAPE - Weighted MAPE

WMAPE မှ လတ ခပန်စ ိုးတ အခါ actual values လတ က ို လပါင်ိုးပပ ိုး ရတ Sum န ခြစ်လ ို တစ်
လနရ မှ သိုည ပါလ ရင်လတ င် ခပသန မရှ လတ ပါဘူိုး။ ပပ ိုးလတ အထက်ကလ ို ခပသန မျ ိုးမှ
WMAPE က ို သ ိုိုးလ ိုက်ပပ ိုး လခြရှင်ိုးလ ိုက်န ိုင်ပါတယ်။
လခပ လကကိုးဆ ို တကယ်တမ်ိုး RMSE န Percentage ထ က်ြ ို ဆ ို WMAPE တ ို က ို
အသ ိုိုးခပ သင် ပါတယ်။ ရှင်ိုးတ ကလတ MAE က အရ ိုိုးရှင်ိုးဆ ိုိုး ခြစ်မှ ပါ။ Dataset ထ မှ outliers
လတ မပါလအ င် လသချ သန် စင်ထ ိုးရင်လတ MAE က သ ိုိုးြ ို အလ ယ်ဆ ိုိုး ခြစ်မှ ပါ။
- - - - - - - - - - - - -
Introduction to Linear Regression with Normal Equation
Machine Learning ဆ ိုတ အလ ယ်လခပ ရရင် စက်က ို လလ လ လစတ ပါပ ။ ကျလန ်တ ို က Feature
လတ န Label လတ ပါတ Dataset တစ်ခို လပိုးလ ိုက်မယ်။ အ ေ မှ စက်က ဘယ် Feature ဆ ို ဘယ်
label ထ ိုိုးထ ိုးတယ် စသခြင် လလ လ လပါ ။ စက်က လလ လ ဆ ိုလတ ဘယ်လ ို လလ လ မလ ။
သခ္ျ နည်ိုးအရ လလ လ ပါတယ်။ အ ေ သခ္ျ နည်ိုးန algorithms လတ ထ မှ ခို လဆ ိုးလန ိုးကကမယ်
linear regression လည်ိုး တစ်ခို အပါအဝင် ခြစ်ပါတယ်။
Linear Regression ဆ ိုတ Dataset မှ Dependent န Independent Variables လတ ပါလနပပ ိုး
သူတ ို ရ နှ ိုးနွှယ်ချက်ကလန ခန် မှန်ိုးတ က်ချက်မှုလတ ခပ လိုပ်ချင်တယ် ဆ ိုရင် အသ ိုိုးခပ တ Statistical
learning method တစ်ခိုပ ခြစ်ပါတယ်။ Dataset တစ်ခိုမှ တချ ွေ့ Variable လတ က မှ ခ ို

dependent ခြစ်ပါတယ်။ ဥပမ ရ ိုိုးတစ်ရ ိုိုးမှ လိုပ်သက်န လစ ဆ ိုတ Variable ၂ရ ခိုမှ ဆ ိုရင်
လိုပ်သက်က မမှ ခ ိုဘူိုး။ independent ခြစ်ပါတယ်။ လစ ကလတ လိုပ်သက်လပေါ်မှ မူတည်ပပ ိုး အ
လခပ င်ိုးအလ ရှ န ိုင်တ မ ို dependent variable ခြစ်ပါတယ်။
သလက္တ သတ်မှတ်ချက်အ ိုးခြင် Independent လတ က ို x လ ို သတ်မှတ်ပါတယ်။ သခ္ျ နည်ိုးအရ
ခန် မှန်ိုးလ ို ရန ိုင်တ dependent Variables လတ က ို y လ ို သတ်မှတ်ပါတယ်။ Machine Learning မှ
လတ x လတ က features လတ ခြစ်ပပ ိုး y က actual တန်ြ ိုိုး ခြစ်ပါတယ်။ feature န
တ လျက်ပါလ တ label လပါ ။ ရလ တ ခန် မှန်ိုးတန်ြ ိုိုး predicted values လတ က ိုလတ y^ /y’hat’/
န ခပပါတယ်။

က�န်လတ ်တ ို X န Y ဆ ိုတ Variable ၂ ခိုက ို scatterplot န လေတ သရိုပ်လြ ်ထ ိုးပါတယ်။
အ ေ အခါ အထက်ကပ ိုလ ို ထ က်ပါတယ်။ အ ေ ပ ိုပါ Datapoints လတ ကက ိုး အသင် လတ ်ဆ ိုိုး
အ ဝင်ခ င်ကျ ခြစ်မယ် slope တစ်ခိုက ို လြ ်ထိုတ်ကကရမှ ပါ။ အ ေ slope လပေါ်မှ ခန် မှန်ိုးတန်ြ ိုိုး y^
လတ ရှ လနမှ ပါ။ ခန် မှန်ိုးတန်ြ ိုိုးလတ က တကယ် တန်ြ ိုိုးလတ န အက ကက ိုး မက ြ ို အ

လရိုးကက ိုးပါတယ်။ Slope လလိုးက အ ဝင်ခ င်ကျ ခြစ်လနမှ ရပါမယ်။ Slope ရ equation ကလတ
လအ က်ပါ အတ ိုင်ိုးပ ခြစ်ပါတယ်။

y^ = mx + b
'm' → Slope
'x' → Features
'b' → Line intercept
'y^' → Predicted Values
ေါဆ ို Linear Regression တစ်ခိုလ ိုိုးက slope equation ရှ ြ ို ပ လပါ ဆ ို ဟိုတ်ပါတယ်။ အ ေ Slope ရ
equation က ိုရရင် က�န်လတ ်တ ို က X တန်ြ ိုိုး ဘယ်လလ က်မှ Y တန်ြ ိုိုး ဘယ်
လလ က်ခြစ်န ိုင်တယ်ရယ်လ ို အ ေ equation က ို သ ိုိုးပပ ိုး ခန် မှန်ိုးန ိုင်ပါပပ ။
Hypothesis Function

အ ေ slope ရ equation က ို အထက်ပါအတ ိုင်ိုး လရိုးတတ်ကကပါတယ်။ hθ(x) ဆ ိုတ Hypothesis
Function ယူဆြန်ရှင် လ ို လခေါ်ပါတယ်။ လ ိုချင်တ တန်ြ ိုိုးလတ န အန ိုးစပ်ဆ ိုိုး တူမယ်လ ို
ခန် မှန်ိုးထ ိုးတ ခန် မှန်ိုးတန်ြ ိုိုးလတ က ို ညွှန်ခပန ိုင်မယ် line of regression အတ က် ည မ�ခခင်ိုး ( slope

ည မ�ခခင်ိုး ) ခြစ်ပါတယ်။ Hypothesis က θ₀ န θ₁ တ ို က ို hyperparameter လတ လ ို လခေါ်ပါတယ်။
အလက င်ိုးဆ ိုိုး regression line ရြ ို သူတ ို က ို အသင် လတ ်ဆ ိုိုး တန်ြ ိုိုးရသည်ထ လခပ င်ိုးလ လပိုးရမှ
ခြစ်ပါတယ်။
က�န်လတ ်တ ို မှ ရှ လနမယ် X တန်ြ ိုိုးလတ န Y တန်ြ ိုိုးလတ ပါတ dataset ကက ိုးထ က data လတ က ို
matrix လတ အလနန လခပ င်ိုးခမင်ကကည် ရလအ င်။ ေါဆ ိုရင် X က (m x n) dimension ရှ ပပ ိုး Y ကလတ
(m × 1) dimension ရှ ပါမယ်။ m က Instances ဘယ်နှခိုရှ သလ ? n က Features
ဘယ်နှခိုရှ သလ ? ဆ ိုတ လတ က ို ခပပါတယ်။

ဥပမ က�န်လတ ်တ ို မှ Area, Item န Price ဆ ိုတ Category လတ ပါတ အ မ်လတ အလကက င်ိုး
dataset ကက ိုးရှ မယ်ဆ ိုရင် ... ။ အ မ် ဘယ်နှလ ိုိုး ဆ ိုတ m ခြစ်ပါတယ်။ အလ ိုိုး ၁၀၀ ဆ ို m = 100
ခြစ်ပါတယ်။ Area န Item ဆ ိုတ Features ၂ ခိုပ ရှ တ လကက င် n = 2 ခြစ်ပါတယ်။

X တန်ြ ိုိုးလတ က ို matrix X လ ို ယူဆသလ ိုပ hyperparameters လတ ခြစ်တ θ₀ န θ₁ လတ က ိုလည်ိုး
matrix θ အခြစ် ယူဆရပါမယ်။ ေ မှ ဆ ိုရင် Feature က ထည် သ င်ိုး စဉိုးစ ိုးစရ ၂ ခို ရှ

လနတ အတ က်လကက င် ...
hθ(x) = θ₀ + θ₁X₁ + θ₂X₂ ခြစ်ပါတယ်။
Features လတ ခြစ်တ X₁ န X₂ တ ို ကတဆင် predicted values လတ ရြ ို လ ိုအပ်လနတ regression
line က ို တ က်ထိုတ်ရမယ်။ best fit အခြစ်ဆ ိုိုး hypothesis အလခခအလန လရ က်တ အထ
hyperparameter လတ ခြစ်တ θ₀, θ₁ န θ₂ တ ို က ို ကစ ိုးသ ိုးလပိုးရမှ ခြစ်ပါတယ်။
ေ လတ matrix θ မှ [ θ₀ θ₁ θ₂ ] လတ ပါဝင်လ ို matrix θ ရ dimension ဟ ( 1 × n+1 )
ခြစ်ပါတယ်။

တကယ်လတ hθ(x) ဆ ိုတ matrix ၂ ခို ခြစ်တ θ န X တ ို dot product လခမ

က်ထ ိုးတ ပ
ခြစ်ပါတယ်။ ေါလပမ dimension အရ θ က (1×n+1) ခြစ်လနတ အတ က်လကက င် လခမ

က်လ ို မရဘူိုး။
အ ေ လတ matrix X ရ လရှွေ့ဆ ိုိုး Column မှ 1 လတ န အစ ိုးထ ိုိုးလ ိုက်ပါတယ်။

ေါလကက င် hypothesis function က hθ(x) = θT.X လ ို လရိုးလ ို ရသ ိုးပါတယ်။
အလပေါ်မှ မကက ခဏ လခပ ခ သလ ို hypothesis function hθ(x) ဟ predicted values လတ က ို
ထိုတ်လပိုးတ ခြစ်ပါတယ်။ ေါလကက င် က�န်လတ ်တ ို ရ Linear regression model ကက ိုး လက င်ိုး/မ
လက င်ိုးဆ ိုတ ခန် မှန်ိုးတန်ြ ိုိုးလတ တကယ် တန်ြ ိုိုးလတ ခြစ်တ Y န ဘယ်လလ က်
ခခ ိုးန ိုးသလ ဆ ိုတ အလပေါ် မူတည်ပါတယ်။ အ ေ ခခ ိုးန ိုးချက်က ို တ က်တ Function က ို Cost
Function J(θ) လ ို လခေါ်ပါတယ်။
Cost Function

Cost Function အခြစ် ေ မှ သ ိုိုးထ ိုးတ Evaluation metric က လတ MSE — Mean Square
Error ခြစ်ပါတယ်။

အ ေ Cost Function J အနည်ိုးဆ ိုိုး ခြစ်တ အမှတ် minimum က ို လရ က်တ အလခခအလနမှ ရှ လနတ
θ တန်ြ ိုိုးလတ ဟ hθ(x) က ို အသင် လတ ်ဆ ိုိုး အလခခအလန လပိုးန ိုင်ပါတယ်။ best fit regression line
ရြ ို matrix θ ထ က တန်ြ ိုိုးလတ ကစ ိုးရပါမယ်။ ဘယ် အလခခအလန ထ လ ဆ ိုရင် minimum
ရတ ထ ပါ။ ပ ိုထ မှ ဆ ိုရင် “အစ မ်ိုးလရ င်” အမှတ်ထ ခြစ်ပါတယ်။
အရင်ဆ ိုိုး Cost Function equation က ို အဆင်လခပလအ င် လခြရှင်ိုးပါမယ်။


ပပ ိုးရင် J(θ) အတ က် θ တန်ြ ိုိုးလတ ကစ ိုးရမှ ခြစ်လ ို ( differential — အလ ိုက်လခပ င်ိုးရမှ ခြစ်လ ို )
First derivative က ို ရှ ပါမယ်။
( Differential Calculus အလခခခ မ တ်ဆက်ထ ိုးတ သလဘ တရ ိုးလလိုးလတ က ို Rate of
Change မှ ြတ်န ိုင်ပါတယ်။ ) yTy လ ိုမျ ိုးက Constant ခြစ်လ ို သိုညခြစ်ပပ ိုး မယူလတ ပါဘူိုး။

လန က်ဆ ိုိုးမှ ရလ တ equation က ို Normal Equation လ ို လခေါ်ပါတယ်။ ေ Normal equation က
လန hypothesis မှ သ ိုိုးြ ို အသင် လတ ်ဆ ိုိုးခြစ်တ hyperparameter လတ က ို ထိုတ်လပိုးမှ
ခြစ်ပါတယ်။

အထက်က ပ ိုလ ို ကစ ိုးသ ိုးပပ ိုးလတ ယခိုလ ို အသင် လတ ်ဆ ိုိုး θ တန်ြ ိုိုးလတ က ို လရ ိုးချယ်သ ိုးတ ပ
ခြစ်ပါတယ်။

Normal Equation ရ အ ိုးနည်ိုးချက်ကလတ Computationally expensive ခြစ်တ ပါ။ O(n³) ဆ ို
လတ ၃ ဆ သ သ ပါတယ်။ Dataset ကက ိုးတ အခါ Gradient Descent ရှ တ နည်ိုးလမ်ိုး က ို
အသ ိုိုးခပ တ က ပ ိုပပ ိုး သင် လတ ်ပါတယ်။
- - - - - - - - - - -
Regression
Regression ဆ ိုတ က က�န်လတ ်တ ို Machine Learning ဘက်ပ ိုင်ိုးမှ ဆ ိုရင် Supervised
Learning ရ အခ တစ်ခိုခြစ်ပပ ိုး လန က်ခြစ်လ မယ ် value က ိုခန ်မှန်ိုးတ လနရ မှ သ ိုိုးပါတယ်။
အရင်ဆ ိုိုး Regression Model အလကက င်ိုးမလခပ ခင် Machine Learning ဆ ိုတ တ လက င်က AI
(Artificial Intelligence) ရ subfield တစ်ခိုခြစ်ပပ ိုးလတ သူ က ိုလပိုးလ ိုက်တ training data
က ိုကကည ်ပပ ိုး သင ်လလျ ်တ Algorithm လတ န လူလတ လ ို လလ လ တ ခြစ်ပါတယ်။ ဥပမ
က�န်လတ ်တ ို က ကလလိုးလတ က ို လခ ိုး။ လကက င်။ ကျ ိုး ခ တတ်ြ ို ပ ိုလတ ခနခနခပပပ ိုး မှတ်ခ ိုင်ိုးလ ိုက်ရင်
တခြည်ိုးခြည်ိုး ကလလိုးက ဘယ်ဟ လခ ိုး ဘယ်လက င်ကလတ လကက င်
ဘယ်လက င်ကလတ ကျ ိုးဆ ိုပပ ိုး ခ သလ ိုပ machine learning က လည်ိုး ေ လ ိုသလဘ ပါပ ။
Regression Model ဆ ိုတ က machine learning ရ Supervised Learning
အမျ ိုးအစ ိုးတစ်ခြစ်ပါတယ်။ Supervised Learning ဆ ိုတ လတ ပထမဆ ိုိုး Model က ို Learn
လိုပ်ခ ိုင်ိုးတ Training Data ထ မှ မှန်တ အလခြက ိုလပိုးထ ိုးပပ ိုး သင်ယူခ ိုင်ိုးတ မျ ိုးပါ။ Technical
Term လတ အလနန စက်က ို သင်ယူြ ို အတ က် လပိုးတ data က ို training data လ ို လခါပပ ိုး သူ ရ
ရလေ်လတ က ို စစ်ြ ို အတ က်အသ ိုိုးခပ တ data က ို testing data လ ို လခေါ်ပါတယ်။ output
ထ က်လ ြ ို အတ က်သ ိုိုးြ ို လ ိုတ input variable က ို “feature” လ ို လခေါ်ပါတယ်။ ထ က်လ တ
လက င်က ို “target variable” လ ို လခပ မယ်။ ေ မှ လတ input variable က ို independent
variable “x” အလနန လခပ သ ိုးပါမယ်။ output variable က လပိုးလ ိုက်တ input variable လပေါ်
မှ တည်လနတ ခြစ်လ ို dependent variable “y” လ ို လခပ ပါမယ်။
အ ိုလက ေါဆ ိုက�န်လတ ်တ ို Regression Model အလကက င်ိုးက ိုခပန်ဆက်မယ်။ Regression ဆ ိုတ
value က ိုခန ်မှန်ိုးတ ခြစ်ပါတယ်။ ဥပမ က�န်လတ ်တ ို အ မ်ရ အကျယ်အဝန်ိုး။ အခန်ိုးအလနအထ ိုး

စတ x variable လတ ကလနတဆင ် အ မ်တန်ြ ိုိုးခန ်မှန်ိုးတ မျ ိုး၊ စက်ရ Engine Size က ို သ ိုိုးပပ ိုး CO2
emission က ို ခန ်မှန်ိုးတ မျ ိုးလ ိုလတ ပါ။ ေ Regression ဆ ိုတ Statistical method ခြစ်ပပ ိုးလတ
ေ လက င်က ဘယ်လ ိုအလိုပ်လိုပ်တ လ ဆ ိုရင် dependent variable “y” န independent
variables “x” ရ ကက ိုးက Relationship line ကလနတဆင ် ခန ်မှန်ိုးချင်တ y value က ို
ခန ်မှန်ိုးတ ပါ။ Relationship line က ိုယူတ လနရ မှ လည်ိုး x န y တန်ြ ိုိုးလတ ရ best fit အခြစ်ဆ ိုိုး
line က ိုရှ တ ပါ။ ပထမပ ိုမှ ဆ ိုရင် Engine Size (x) န CO2 emission (y) တန်ြ ိုိုးလတ ရ fit
ခြစ်တ line အန လရ င်က ိုကကည ်ပါ။ အ best fit line ကလနပပ ိုးလတ မှ လန က်ထပ် Engine Size
တန်ြ ိုိုးတစ်ခိုလပိုးရင် အ အတ က် CO2 Emission က ိုခန ်မှန်ိုးန ိုင်မှ ခြစ်ပါတယ်။

ေါလကက င် Linear Regression က က�န်လတ ်တ ို ငယ်ငယ်က သင်ြူိုးတ Slope formula “y = m x
+ c” က ို အလခခခ ပပ ိုး line ထိုတ်လ ို ရလ န ိုင်တ ပါ။ target value “y” က ို လ ိုချင်ရင် m န
independent variable “x” န လခမ

က်ပပ ိုး y-intercept ခြစ်တ c န လပါင်ိုးတ က ို Base ခ ပါတယ်။
parameter “m” န “c” က ို တခခ ိုးလနရ လတ မှ “w” န “b”, “w_0” န “w_1”
အမျ ိုးမျ ိုးခမင်ရပါလ မ ်မယ်။ ခပဿန မဟိုတ်ပါ။ ေ မှ ခပသန ရှ လ တ က relationship line
ထိုတ်ြ ို x ရှ လပမ parameter m န c လ ိုလ ပါတယ်။ Relationship line က ို error အနည်ိုးဆ ိုိုးန
အမှန်ကန်ဆ ိုိုး best fit အခြစ်ဆ ိုိုးထိုတ်လပိုးန ိုင်တ parameters လတ က ို လရ ိုးချယ် ြ ို Optimization
Algorithm လတ က ို သ ိုိုးကကပါတယ်။ Optimization Algorithm လတ ထ က တစ်ခိုခြစ်တ
Gradient Descent အလကက င်ိုးက ို ေ မှ ြတ်ပါ။
https://medium.com/@maungthantthiri/gradient-descent-26a6df5c519f

Relationship line linear ပ ခြစ်တ လ ိုးဆ ိုရင် မဟိုတ်ပါဘူိုး။ Non-linear regression models
လတ လည်ိုးရှ ပါတယ်။ လန က် features variable ခြစ်တ x က တစ်ခိုပ ရှ န ိုင်သလ ို
တစ်ခိုထက်ပ ိုတ လည်ိုး ခြစ်န ိုင်ပါတယ်။ features တစ်ခိုတည်ိုးန y က ို ခန ်မှန်ိုးတ လက င်က ို
“Simple Linear Regression” လ ို လခပ ပပ ိုး features တစ်ခိုထက်ပ ိုပါရင်လတ “Multiple Linear
Regression” လ ို လခပ ပါတယ်။ Simple ခြစ်ခြစ် Multiple ခြစ်ခြစ် Non-Linear
ခြစ်ခြစ်အခိုက�န်လတ ် လခပ တ အလခခခ က ို မူတည်ကကတ ပါပ ။ code မှ model က ို fit
လိုပ်လ ိုက်တ တစ်လကက င်ိုးနှစ်လကက င်ိုးလပမ လန က်က ယ်က Theory က
စ တ်ဝင်စ ိုးြ ို လက င်ိုးပါတယ်။ လလ လ ကကည ်ကကပါ။ …
- - - - - - -
What is logistic regression? What is ordered logistic regression?
logistic regression မှ နှစ်မျ ိုးရှ တယ်လပါ လန ် binary ရယ် ordered ရယ်။ Ordered logit
အတ က် ရှ မလတ ွေ့ရင် binary က ို ရှ ကကည ်ပါလ ိုး။ outcome က dichotomous ဆ ိုရင် binary
logistic regression က ို သ ိုိုးတယ်။ Outcome က more than two categories ဆ ိုရင် ordered
logistic သ ိုိုးတ ဆ ိုလတ သလဘ တရ ိုးချင်ိုးအတူတူပ ။ Binary က ို ရှင်ိုးခပထ ိုးတ လတ မှ
ordered logistic အလကက င်ိုးလတ ပါန ိုင်တယ်။
ordered logit က ို proportional odds model လ ို လည်ိုး လခေါ်လ ို အ ေ န မည်န ရှ ကကည် ရင်လည်ိုး
လတ ွေ့ န ိုင်ပါတယ်။
- - - - - - - - -
Simple Linear Regression က ို အရ ိုိုးရှင်ိုးဆ ိုိုးန ိုးလည်ကကည် မယ်
Simple Linear Regression ဆ ိုတ ဟ Quantitative Variable ၂ လ ိုိုးရ relationship က ို estimate
လိုပ်တ ခြစ်ပါတယ်။ ဘယ်လ ိုအလခခအလနလတ မှ Simple Linear Regression က ိုသ ိုိုးလ ဆ ိုရင် -
1. Variable ၂ လ ိုိုးရ Relationship ဟ ဘယ်လလ က်အ ိုးလက င်ိုးလ ဆ ိုတ သ ချင်ရင်န
2. Independent Variable တန်ြ ိုိုးတစ်ခိုလခပ င်ိုးလ မှုရင် Dependent Variable
ရ တန်ြ ိုိုးက ိုဘယ်လလ က်သက်လရ က်မှုရှ လ သ ချင်ရင် Simple Linear Regression
က ိုအသ ိုိုးခပ ကကပါတယ်။

ဥပမ လခပ ရရင် လူလတ ရ ဝင်လင န လပျ ်ရွှင်မှုကက ိုးက ဆက်န ယ်မှုက ို လလ လ လ ိုတယ်လပါ .... ဝင်လင က ို
တစ်ရက် ၄၈၀၀ ကလန ၁၅,၀၀၀ အထ သတ်မှတ်ထ ိုးမယ် လပျ ်ရွှင်မှုက ို ၁-၁၀၀
စလကိုးတစ်ခိုသတ်မှတ်ထ ိုးပပ ိုး လူဥ ိုးလရ အလယ က် ၄၀၀ က ို ဆ လ ိုးလက က်ကကည် မယ်ဆ ိုပါစ ို ...
က�န်လတ ်တ ို ရ Independent Variable ဝင်လင ဟ Dependent Variable လပျ ်ရွှင်မှုန Linear
Relationship ရှ တယ်ဆ ိုရင် က�န်လတ ်တ ို ဟ Simple Linear Regression Analysis
န တ က်ကကည် လ ို ရပါတယ်။ ေ လနရ မှ Variable ၂ ခိုလ ိုိုးဟ Quantitative ခြစ်လနတ က ို
သတ ချပ်လစလ ို ပါတယ်။
တကယ်လ ို Independent Variable အလရအတ က်ဟ တစ်ခိုထက်ပ ိုမယ်ဆ ိုရင်လတ Multiple Linear
Regression က ိုအသ ိုိုးခပ ရမှ ခြစ်ပါတယ်။
Assumption of Simple Linear Regression
Simple Linear Regression ဟ Parametric Test ခြစ်တ အတ က် Simple Linear Regression
က ိုတ က်မယ်ဆ ိုရင် လအ က်ပါ ယူဆချက် (Assumption) လတ ထ ိုးရှ ရမှ ခြစ်ပါတယ်။
1. Homogeneity of variance ခြစ်ရမယ်။ (Equal variance across the sample ခြစ်တ )
2. Sample လက က်ခ ရ မှ Validate ခြစ်ပပ ိုး hidden relationships လတ မရှ လနရဘူိုး။
(Independence of observations ခြစ်ရမယ်)
3. Normal distribution ခြစ်ရမယ်။
Simple Linear Regression ရ Formula ကလတ
y = B0 + B1 X + error
- Where
- y = the predicted value of the dependent variable
- B0 = intercept
- B1 = regression coefficient
- x = independent variable
- e = error of estimate
Linear Regression မှ ဆ ိုရင် က�န်လတ ်တ ို ဟ Error of estimation
က ိုအနည်ိုးဆ ိုိုးခြစ်ြ ို ရ အတ က် Line of the best fit က ိုအသ ိုိုးခပ ြ ို လ ိုအပ်ပါတယ်။
အထက်ပါအ လက ိုးရှင်ိုးက ိုအသ ိုိုးခပ ပပ ိုး Simple Linear Regression တ က်ချက်န ိုင်သလ ို Variables
မျ ိုးက ို သ ရှ ရ ိုန တင် Tools (MS Excel, R) အစရှ သည်မျ ိုးက ို အသ ိုိုးခပ ပပ ိုးလတ လည်ိုး
လ ယ်ကူစ တ က်ချက်န ိုင်ပါတယ်။
လက်လတ ွေ့မှ လတ Simple Linear Regression က ို Sales Forecasting, Medical Research,
Education, Economics, Real Estate, Sport Analytics, Environment Science, Quality Control
နယ်ပယ်လတ မှ အသ ိုိုးခပ လျက်ရှ ကကပါတယ်။ Written by Ko Kaung Satt Paing

Beginner Statistics For Data Analytics-13
ေ လန Regression Analysis ကဘ လ ဆ ိုတ ရှင်ိုးခပသ ိုးပါမယ်။
Regression Analysis က ို Create မလိုပ်ခင်မှ သ ြ ို လ ိုတ က What is regression analysis
ဆ ိုတ သ ြ ို လ ိုပါတယ်။ အ တ က ိုသ ရင် What correlation is ဆ ိုတ က ိုန ိုးလည်သ ိုးပါလ မ ်မယ်။
အ တ သ ပပ ဆ ိုရင် က�န်လတ ်တ ို Regression Analysis က ို Create လိုပ်လ ို ရပါပပ ။ က�န်လတ ်တ ို
အစကလန စကကည ်ရလအ င်။
What is a regression analysis?
Regression Analysis က ို က�န်လတ ်တ ို Data ထ က Linear Tends
လတ က ိုရှ လြ ြ ို အတ က်အသ ိုိုးခပ တ အလရိုးကက ိုးတ အရ တစ်ခိုပါ။ က�န်လတ ်တ ို Linear Tends
အလကက င်ိုးက ိုလခပ တ အခါသူရ Pattern က ိုသ ြ ို လ ိုပါတယ်။ ပ ို(၁) မှ လြ ်ခပထ ိုးပါတယ်။ တစ်ခိုက
Linear straight line (Line ကအလခြ င ်ခြစ်လနမယ်) လန က်တစ်ခိုက Linear မဟိုတ်ပါဘူိုး။
က�န်လတ ်တ ို Data လတ အ ိုးလ ိုိုးက ို Scatter plot ထ ထည ်ကကည ်တ အခါ Data လတ က U
က သ ို ခြစ်လနရင် Up in Flat လ ိုမျ ိုးခြစ်လနရင် အ တ က Regression analysis
အတ က်လက င်ိုးလက င်ိုးအလိုပ်မလိုပ်ပါဘူိုး။ ေါလပမယ ် Advanced regression analyses
မှ လတ အလိုပ်လိုပ်တ လတ ရှ ပါတယ်။ က�န်လတ ်တ ို က Basic ပ ိုင်ိုးဘ စဥ်ိုးစ ိုးကကည ်ရလအ င်။
ဥပမ လလိုးတစ်ခိုန န ိုးလည်လအ င်လိုပ်ကကည ်မယ်။ က�န်လတ ်တ ို လ မည ်လအတ က် Sales Forecast
က ို Predict လိုပ်မယ်ဆ ိုပါစ ို ။ အ ေ မှ Sales ရ Level က ို Impact ခြစ်လစမည ် မတူည တ Factors
လတ အမျ ိုးကက ိုးပါ၀င်လနတယ်။ အ ေ မှ Regression analysis က ဘ လိုပ်လပိုးလ ဆ ိုလတ က�န်လတ ်တ ို
Data ထ က အ ေ Factors လတ က ို Sorting လိုပ်လပိုးတယ်။ ပပ ိုးရင် ဘယ် Factors လတ က Predictive
Model လတ အသ ိုိုးခပ တ အခါ အလရိုးကက ိုးတယ်ဆ ိုတ လခပ လပိုးန ိုင်ပါတယ်။
က�န်လတ ်တ ို မတူည တ Variable အ ိုးလ ိုိုးက ို sort လိုပ်ပပ ိုးပပ ိုး အချ ွေ့က ို ြယ်ထိုတ်မယ်။ အချ ွေ့က ို
လပါင်ိုးထည ်မယ်။ အချ ွေ့က ို ignore လိုပ်မယ် စသခြင ်လန က်ဆ ိုိုးမှ Formula အသ ိုိုးခပ ပပ ိုးလတ
အန ဂတ်အတ က် ကက တင်ခန ်မှန်ိုးမှုမျ ိုးခပ လိုပ်န ိုင်မယ်။ အ တ က တကယ ်က ို Powerful model
တစ်ခိုပါ။
Regression analysis မှ မတူည တ components လတ အမျ ိုးကက ိုးရှ တ ထ မှ အလရိုးကက ိုးတ (၂) ခိုက
Dependent variable န Independent variable ပါဘ ။ Dependent variable က က�န်လတ ်တ ို
Predict လိုပ်ပပ ိုးရယူချင်တ အရ ပါ။ အကယ်လ ို က�န်လတ ် Sales လတ ခန ်မှန်ိုးချင်တယ်။ Inventory
လတ ခန ်မှန်ိုးချင်တယ်။ က�န်လတ ်တ ို Predict လိုပ်ချင်တ အရ လတ ။ အ တ က ို Dependent variable
လ ို လခေါ်ပါတယ်။
Independent variable ကလတ Dependent variable က ို Impact ခြစ်လနတ factors လတ ပါ။ ပ ို (၂)
က ိုကကည ်ပါ။ ဘယ်ဟ က iIndependent variable လ ဘယ်ဟ က Dependent variable
လ ဆ ိုတ န ိုးလည်သ ိုးမယ်ထင်ပါတယ်။ ည ဘက်မှ အလကက င်ိုးအရ လတ ရှ တယ်။ General

economy, Competition, Weather စတ အလကက င်ိုးအရ လတ က Sales လပေါ်က ို Affects
ခြစ်လစတ အချက်လတ ပါ။ အ တ လကက င ် Independent variable ပါ။
ေ လနရ မှ လမိုးခ န်ိုးတစ်ခိုရှ တယ်။ က�န်လတ ်တ ို ေ Independent variable ဟ sales လပေါ်အမှန်တကယ်
Impact ခြစ်လစလ ဆ ိုတ ဘယ်လ ိုသ န ိုင်မလ ။ အ တ က ိုသ ရြ ို အတ က် Regression analysis
က ိုအသ ိုိုးခပ မှ ပါ။ အ ေ အသ ိုိုးခပ တ တစ်လလျ က်လ ိုိုးမှ က�န်လတ ်တ ို
ထပ်ခါထပ်ခါအသ ိုိုးခပ ရမည ်အရ က Correlation နှင ် Scatter plots ပါ။ Scatter plot က
ဘ ကူည ခြစ်လစလ ဆ ိုလတ တစ်ချ ွေ့လသ Variable အမျ ိုးအစ ိုးလတ က Dependent variable လပေါ်
Impact ခြစ်လစတယ်ဆ ိုတ က ို visually ခမင်န ိုင်လအ င် န ိုးလည်န ိုင်လအ င်ကူည လပိုးပါတယ်။ Scatter
plot ကလတ Independent variable နှင ် Dependent variable အကက ိုး interaction ခြစ်တ က ို
သူလ visualize န ထိုတ်လပိုးန ိုင်ပါတယ်။
Regression Analysis န ပက်သက်ပပ ိုးလတ သူ န သက်ဆ ိုင်တ အပ ိုင်ိုးမျ ိုးက ို Post တစ်ခိုချင်ိုးစ
ဆက်တ ိုက်တင်လပိုးသ ိုးပါမည်။

Beginner Statistics For Data Analytics-14
ေ လန မှ scatter plots အလကက င်ိုးလလိုး လလ လ ကကည ်ရလအ င်။ scatter plots က Dataset (၂)
ခိုအကက ိုးမှ ရှ တ Relationship က ိုခပချင်ရင်အသ ိုိုးခပ ပါတယ်။ အ တ က အလရိုးကက ိုးပါတယ်။ Dataset
(၂) ခိုအကက ိုးဘ လန ်။ (၃) ခို (၄) ခိုအကက ိုးမဟိုတ်ပါဘူိုး။ ပ ို မှ လတ ွေ့ န ိုင်ပါတယ်။ Chart ရ Y ၀င်ရ ိုိုးမှ
dependent variable က ိုလတ ွေ့ န ိုင်ပပ ိုး X ၀င်ရ ိုိုးမှ independent variable က ိုလတ ွေ့ န ိုင်ပါမယ်။
က�န်လတ ်တ ို Y axis (သ ို မဟိုတ်) vertical axis လ ို လ လခေါ်တ dependent variable လတ က ို predict
sales လတ လိုပ်မှ ခြစ်ပါတယ်။
လန က်ထပ် horizontal axis မှ independent variable လတ ထ ိုးထ ိုးတယ်။ ေ ရ ဥပမ မှ ဆ ို
ခပင်ပအပူချ န်က Sales လပေါ်သက်လရ က်မှုရှ တယ်လ ို စဥ်ိုးစ ိုးကကည ်မယ်။ horizontal axis မှ ရှ တ
အပူချ န်တက်တ ကျတ က vertical axis မှ ရှ တ Sales က ို Impact ရှ တယ်ဆ ိုပါစ ို ။ အ လတ

ရက်လတ အမျ ိုးကက ိုးရ တစ်ရက်ချင်ိုးစ အချက်အလက်လတ က ို ထည ်ကကည ်လ ိုက်တ အခါ Plots
လတ အမျ ိုးကက ိုးလတ ွေ့ရလ မ ်မယ်။
scatter plots က ိုမရင်ိုးနှ ိုးလသိုးတ သူလတ င်ကကည ်ရင် သတ ခပ မ လ မ ်မယ်။ လရ င်ိုးအ ိုးန
အပူချ န်အကက ိုးမှ ဆက်စပ်မှုအချ ွေ့ ရှ လနလကက င်ိုး သ သ ပါတယ်။ အပူချ န် တ ိုိုးလ တ န အမ�
လရ င်ိုးအ ိုးလတ တ ိုိုးလ တယ်လ ို ခမင်မ လ မ ်မယ်။ ေါလပမယ ် လန က်လမိုးခ န်ိုးတစ်ခိုက၊ အ ေါက ို
ဘယ်လ ိုတ က်ရမလ ။ အ လမိုးခ န်ိုးက what is the correlation? ပါဘ ။
က�န်လတ ်တ ို ဆက်လက်မလဆ ိုးလန ိုးခင် scatter plot တစ်ခိုက ို Create က ိုယ်တ ိုင်လိုက်ကကည ်ရလအ င်။
လအ က်မှ လပိုးထ ိုးတ Link ထ မှ scatter plot File လလိုးက ို Download ဆ လပိုးပါ။
ပပ ိုးရင်အ တ လလိုးက ိုြ င ်လ ိုက်ပါ။ ဥပမ Dataset လလိုးတစ်ခိုပါ။ အ ေ မှ Gold Price ပါတယ်။ ပပ ိုးရင်
လရ င်ိုးချရတ ပမ ဏပါတယ်။ Gold Price က ိုလတ currency gold prices န ဘ လြ ်ခပပါတယ်။
ေါက ိုအကိုန်သ ပပ ိုးသ ိုးဘ လန ်။
အ လတ က�န်လတ ်တ ို သ ချင်တ hypothesis က gold prices က တက်သ ိုးရင် လရ င်ိုးအ ိုးက
တက်မှ လ ိုး ကျမှ လ ိုး ။ ဘ ခြစ်မလ က�န်လတ ်တ ို မသ ဘူိုး။ က�န်လတ ်တ ို ရ အခို Case ရ hypothesis
ပါ။ Gold Price န လရ င်ိုးအ ိုးရ အကက ိုးက Relationship။ အခိုအ တ က ို visually ခမင်န ိုင်လအ င်
scatter plot တစ်ခိုက ို Create လိုပ်ကကည ်ရလအ င်။
https://drive.google.com/.../1z-YUisxGaZhjuv...
လြ ်ခပ Dataset အရဆ ိုရင် C7 ကလနစပပ ိုး Select လိုပ် C7 Down ဆ ပပ ိုးရင် လန က်ထပ် Column
တစ်ခိုခြစ်တ D27 အထ (Column (၂) က က်) လပါ Header Name လတ ပါပါတယ်လန ်။ Selected
လိုပ်ပါ။ ပပ ိုးရင် Insert ထ ကသ ိုးပပ ိုး Chartd Group ထ သ ိုးပပ ိုး scatter plot က ိုရှ လ ိုက်ပါ။ ပပ ိုးရင်
scatter plot က ိုထည ်လ ိုက်ပါ။ အ တ ဆ ိုရင် scatter plot Chart လလိုးရလ ပပ ိုး Gold Price က ို
horizontal axis မှ လတ ွေ့ရမည်ခြစ်ပပ ိုး Number of Sales ကလတ vertical axis မှ ပါ။
အကယ်လ ို အ လ ိုမခြစ်ခ ြူိုးဆ ိုရင် design tab ထ က ိုသ ိုးပပ ိုး switch column လိုပ်လ ို ရတယ်လန ်။
horizontal axis န vertical axis က ို Switch လိုပ်လပိုးလ မ ်မယ်။ ေါလပမယ ်လသချ တယ်
အ လ ိုလိုပ်စရ မလ ိုဘ Perfect ခြစ်တ Chart တစ်ခိုက ိုရမှ ပါ။
က�န်လတ ်တ ို scatter plot က ိုကကည ်တ အခါ Trend တစ်ခိုက ိုသတ ထ ိုးမ လ ိုး ။ သူ ပ ိုစ က
အနည်ိုးငယ်လတ ခပ ိုးပ ိုရတယ်။ ေါလပမယ ် ေ လနရ မှ တစ်ခါတစ်ရ က�န်လတ ်အလနန
နည်ိုးနည်ိုးလ ိုက်စပ်စိုလစချင်တယ်။ ဘ က ိုလ ဆ ိုလတ အခိုက vertical axis မှ 0-70 ထ ိုးထ ိုးတယ်။
အကယ်လ ို 25-65 လ ိုမျ ိုး Min, Max Bounds လတ က ို Adjust လိုပ်ကကည ်ရင် သူခြစ်လ တ Trend
လမ်ိုးလကက င်ိုးသစ်တစ်ချ ွေ့က ိုလလ လ ကကည ်လ ို ရန ိုင်တယ်။ Zoom in, Zoom Out
လိုပ်ကကည ်တယ်လ ို လခေါ်မှ လပါ ။ ေါဆ ိုရင် က�န်လတ ်တ ို relationship က ိုပ ိုခမင်န ိုင်တယ်။ ေ Chart မှ လ
က�န်လတ ်တ ို Gold Price တက်လ သည်နှင ်အမ� Sales ကလည်ိုးတက်လ တ က ိုလတ ွေ့ န ိုင်တယ်။

တစ်ချ ွေ့ Point လတ မှ Gold Price ကလတ တက်လ မယ်။ ေါလပမယ ် Sales က
ထင်သလလ က်မတက်ဘူိုး။
အ တ ဆ ိုရင် scatter plot တစ်ခိုက ို Create လိုပ်ခခင်ိုးခြင ် က�န်လတ ်တ ို မတူည တ variables (၂)
ခိုအကက ိုး correlation နှင ် relationship ခြစ်တ အလခခလနက ို visualize
ခမင်န ိုင်တယ်ဆ ိုတ န ိုးလည်မယ်ထင်ပါတယ်။ အ တ ဆ ိုရင် အခိုလန က်တစ်ခိုက အ ေ
တစ်ခိုန တစ်ခိုအကက ိုးမှ correlation ရှ တယ်ဆ ိုတ က ို ဘယ်လ ို quantify လိုပ်မှ လ ။ အ တ က ို
လန က် Post မှ လလ လ ကကည ်ပါမယ်။

Beginner Statistics For Data Analytics-15
ေ လန Correlation အလကက င်ိုးလခပ ရလအ င်။ က�န်လတ ်ဘ လကက င ် Correlation
က ိုနှစ်သက်တ လ ဆ ိုလတ န ိုးလည်ရလ ယ်လ ို ပါ။ သူက Standard Deviation တ ို Mean
တ ို လ ိုမဟိုတ်ဘူိုး။ Correlation က Fixed Quantity တစ်ခိုခြစ်ပပ ိုး ရလ မည ် ရလ ေ်ကလည်ိုး - 1 န 1
အကက ိုးက က န်ိုးဂဏန်ိုးတစ်ခိုခြစ်ပါမယ်။ အ ေ ဂဏန်ိုးလတ ရ အခပင်ဘက်မှ လ ိုိုး၀မခြစ်န ိုင်ပါဘူိုး။
လရှွေ့ Post က ဥပမ မှ ဆ ိုရင် ခပင်ပအပူချ န်န လန စဉလရ င်ိုးအ ိုး variables (၂) ခိုရ Relationship
က ိုလခပ ခပခ တယ်။ ခပင်ပအပူချ န်တ ိုိုးလ တ န အမ� လန စဉလရ င်ိုးအ ိုးလတ လည်ိုး တ ိုိုးလ သည ်
relationship အမျ ိုးက ိုလလ လ ခ ရတယ်။
ေ လတ Correlation ရှ မရှ လက်လတ ွေ့တ က်န ိုင်ြ ို က အရမ်ိုးလ ယ်တယ်။ လန က် Post မှ Calculation
ပ ိုင်ိုးသ ိုးမယ်။ အခိုလတ ဆက်ပပ ိုးလတ ဘ ရှင်ိုးခပလ ိုက်မယ်။ ေ Case မှ ဆ ိုရင် Correlationက 0.71
ရတယ်။ တစ်နည်ိုးအ ိုးခြင ်အ တ က High relationship ခြစ်တယ်။ ဘ လ ို လ ဆ ိုလတ Correlation

number က 1 သ ို မဟိုတ် -1 နှင ် ပ ိုန ိုးစပ်လလလလ High relationship ခြစ်လလပါ။ အ လတ လခပ ခပရရင်
ခပင်ပအပူချ န်တ ိုိုးလ လလလလ အလရ င်ိုးတ ိုိုးတက်လ န ိုင်လချပ ိုမျ ိုးမျ ိုးလလပါဘ ။
နည်ိုးနည်ိုးန ိုးလည်သ ိုးမယ်ထင်ပါတယ်။ ေါဆ ိုရင် Correlation
က ိုနည်ိုးနည်ိုးပ ိုအလသိုးစ တ်သ ိုးကကည ်မယ်။ သူ မှ မတူည တ အမျ ိုးအစ ိုး (၂) ခိုရှ တယ်။
တစ်ခိုက Positive Relationship ခြစ်ပပ ိုး Number က 0 နှင ် 1 အကက ိုး
က န်ိုးဂဏန်ိုးတစ်ခိုခြစ်လ ပါမည်။ Positive Relationship ဆ ိုသည်မှ X တ ိုိုးလ ခခင်ိုးသည် Y
တ ိုိုးလ မှုက ို ခန ်မှန်ိုးလပိုးခခင်ိုးခြစ်ပါတယ်။ ဥပမ လူလတ က စ ိုးကရက်လသ က်တ မျ ိုးလ တ န အမ�
အဆိုတ်ကင်ဆ လကက င ် လသဆ ိုိုးမှုလတ ပ ိုမျ ိုးလ တ က ို လတ ွေ့ရတယ်။ ေါလပမယ ်သူ Relationship
ကချက်ချင်ိုးလတ မဟိုတ်ဘူိုးလပါ ။ လူတ ိုင်ိုးက အခိုချက်ချင်ိုး စ ိုးကရက်လသ က်ရင်
အဆိုတ်ကင်ဆ ခြစ်မှ မဟိုတ်ဘူိုးဆ ိုတ သ ကကပါတယ်။
လန က်တစ်ခိုက Negative Correlation ပါ။ ၎င်ိုးသည် -1 နှင ် 1 အကက ိုး Number တစ်ခိုခြစ်ပါမယ်။
သူက Positive Relationship ရ ဆန ်ကျင်ဘက်ပါ။ ေါဆ ိုရင် X တ ိုိုးလ တ န အမ� Y က
လလျ ကျလ မယ်။ ဥပမ အရဆ ိုရင် က�န်လတ ်တ ို မှ ယ ဉတစ်စ ိုး၏အလလိုးချ န်ရှ တယ်။
ယ ဉတစ်စ ိုး၏ အလလိုးချ န် တ ိုိုးလ သည်နှင ်အမ� ယ ဉ၏ ဆ စ ိုးသက်သ မှု လလျ နည်ိုးလ သည်။
ေါက Negative Correlation ပါ။
ေါဆ ိုရင် Correlation (၂) မျ ိုးက ိုန ိုးလည်ပပ ိုးထင်ပါတယ်။ Positive ဆ ိုရင် X တ ိုိုးလ ခခင်ိုးသည် Y တ င်
တ ိုိုးလ မည်က ို ဆ ိုလ ိုပပ ိုး Negative သည် X တ ိုိုးလ ပါက Y လလျ နည်ိုးသ ိုးမည်ခြစ်သည်။ ထ ို Number
မျ ိုးသည် အပမ တမ်ိုး -1 နှင ် 1 ကက ိုးရှ မည် Number အချ ွေ့ခြစ်လ မ ်မည်။

Beginner Statistics For Data Analytics-16
က�န်လတ ်တ ို Correlation က ိုတ က်ကကည ်ရလအ င်။ လအ က်မှ လြ ်ခပထ ိုးတ Link ထ မှ Correlation
Excel ြ ိုင်လလိုးရှ ပါတယ်။ အ တ က ပပ ိုးတ Dataset က ိုဘ ယူထ ိုးပါတယ်။ လရွှလစျိုးတ ိုိုးလ ခခင်ိုးနှင ်
လရ င်ိုးချသည ်အလရအတ က်ကက ိုးတ င်ရှ တ Correlation က ိုက�န်လတ ်တ ို တ က်မှ ပါ။ အ ေ Variables
(၂) ခိုအကက ိုးမှ တကယ ်ဆက်စပ်မှုဆ ိုတ ဘ လ ဆ ိုတ က ို အလခြရှ ြ ို ခ ိုင်မ တ Number
တစ်ခိုက ိုရှ မှ ပါ။
https://drive.google.com/drive/folders/1z-YUisxGaZhjuv-
qW9eg6E3E7lHj7ASg?fbclid=IwY2xjawKMeD5leHRuA2FlbQIxMABicmlkETFzV2hpek5ucGJ
Mc0lCWENpAR439GcKGNrkVbdhYLmTeNwi_GgVCnt6NVZp3iy -
2msPv4Umn27MIEbzISMFUw_aem_CRYZd4aGBhJ3_H2C1l8sBw
Dataset ထ က ိုကကည ်ပါ။ Cell G9 မှ variables (၂) ခိုအကက ိုးရ correlation က ိုတ က်ပါမယ်။ ေ လနရ မှ
Formula လရိုးရင်ဘယ် Variable တစ်ခိုက ိုအရင်ထည ်ရမှ လ ဆ ိုတ လခါင်ိုးမရှုပ်ပါန ။ က စစမရှ ပါဘူိုး။

က�န်လတ ်က gold prices က ိုအရင်ထည ်လ ိုက်တယ်။ Formula လရိုးပပ ိုး Enter လခါက်လ ိုက်ရင်
correlation: 0.74 or 74% ရပါမယ်။ ေါလကက င ် ေ variables (၂) ကက ိုးက လရွှလစျိုးန လရ င်ိုးရတ
အလရအတ က်ဟ ဆက်စပ်မှု လတ ်လတ ်လက င်ိုးပ ိုရတယ်။ တစ်နည်ိုးအ ိုးခြင ် positive correlation
ခြစ်တ က ိုသတ ခပ န ိုင်ပါတယ်။ ေါလကက င ် လရွှလ ိုးလတ တ ိုိုးလ တ န အမ� လရ င်ိုးတ
အလရအတ က်လည်ိုး တ ိုိုးလ မယ်လ ို ခန ်မှန်ိုးရပါတယ်။
ေ လနရ မှ က�န်လတ ်တ ို လတ ိုးရမည ် လမိုးခ န်ိုးတစ်ခိုရှ ပါတယ်။ 0.74 ဟ ဆက်စပ်မှုခမင ်မ ိုးတယ်လ ို
ဘယ်လ ိုသ လ ၊ high correlation လတ ခြစ်လနတယ်။ အ တ က လက င်ိုးတ လ ိုး မလက င်ိုးတ လ ိုး
ဘယ်လ ိုသ န ိုင်မလ ။ ေါလကက င ် သင်တ ို က ို စဉိုးစ ိုးလစချင်တယ်။ လရွှလစျိုးက လရ င်ိုးချတ
အလရအတ က်က ို တကယ်လွှမ်ိုးမ ိုိုးတယ်လ ို သင်တကယ်ထင်လ ိုး။ ခြစ်လက င်ိုးခြစ်န ိုင်ပါတယ်။
ေါလပမယ ် တစ်ကယ်ထပ်လိုပ်သင ်တ အရ က အလရ င်ိုးအ၀ယ်စိုစိုလပါင်ိုးအလရအတ က်က ို Influence
ခြစ်လစတ တစ်ခခ ိုးလသ variable လတ က ိုထပ်ရှ ပပ ိုး အ ေ variables လတ က က�န်လတ ်တ ို data ထ က
random fluke လတ မဟိုတ်လ ိုးဆ ိုတ ကကည ်ြ ို လ ိုပါတယ်။

Beginner Statistics For Data Analytics-17

ယခင် Post လတ မှ Correlation ပ ိုင်ိုးက ိုလသချ စ လလ လ ပပ ိုးတ လန က်ပ ိုင်ိုး တစ်ခိုသ ြ ို လ ိုတ က
Strong Correlation ခြစ်မခြစ်ဘယ်လ ိုစဥ်ိုးစ ိုးမှ လ ဆ ိုပါဘ ။ တစ်ချ ွေ့လသ သူလတ လမိုးကကတယ်။
ဘယ်လ ိုမျ ိုးဆ ို Strong Correlation or Strong Relationship ခြစ်လ တ ။ တကယ်လခြရရင် Depand
on ပါဘ ။ Generally အရဆ ိုလြ ်ခပပ ိုမှ ပါ၀င်သည ်အတ ိုင်ိုး ယူဆလ ို ရပါတယ်။ ေါလပမယ ်
တကယ်လသချ သတ်မှတ်န ိုင်ြ ို ဆ ိုရင် က ိုယ်သ ိုိုးသပ်မည ် Field န လ ဆ ိုင်ပါတယ်။ ေ လလ က်ဆ ိုရင်
Correlation ပ ိုင်ိုးလသချ န ိုးလည်သ ိုးမယ်လ ို ယ ိုကကည်ပါတယ်။

Beginner Statistics For Data Analytics-18
ေ လန Regression Analysis ရ Introduction အပ ိုင်ိုးလလိုးသ ိုးရလအ င်။ ပပ ိုးရင် Regression Analysis
က ို Create လိုပ်ကကည ်မယ်။ အ တ လတ မလိုပ်ခင်မှ တစ်ခိုလခပ ခပချင်တ က က�န်လတ ်တ ို single
variable Regression Analysis က ို Excel အသ ိုိုးခပ ပပ ိုးဘ လလ လ ကကည ်မယ်။ Single Variable
Regression က ဘယ်လ ိုအလိုပ်လိုပ်လ ဆ ိုတ က ိုအဓ က လလ လ ကကမယ်။ အကယ်လ ို Single Variable
Regression က ိုလသချ န ိုးလည်ပပ ိုး Create လိုပ်န ိုင်ရင် Multivariable Regression
က ိုလ လက င်ိုးလက င်ိုးအလိုပ်လိုပ်န ိုင်သ ိုးပါလ မ ်မယ်။

Regression Analysis က ို Running မလိုပ်ခင်မှ က�န်လတ ်တ ို Excel Workbook က ို Setup
လိုပ်ြ ို လ ိုပါတယ်။ လိုပ်ပပ ိုးပပ ိုးဆ ိုရင်လတ Excel မှ Regression က ို Run လ ို ရပါပပ ။ လြ ်ခပပ ိုမှ
အတ ိုင်ိုးအဆင ်အလ ိုက် လိုပ်လဆ င်သ ိုးလ ို ရပါတယ်။
Excel workbook ထ က ိုသ ိုးမယ်။ Regression Analysis က ို မ Run ခင်မှ Excel မှ Add in
လိုပ်လပိုးပါ။ Internet connection ရှ စရ မလ ိုပါဘူိုး။ Download လ ဆ စရ မလ ိုပါဘူိုး။ သင်တ ို ရ
Computer ထ မှ ရှ ပပ ိုးသ ိုးပါ။ အ တ က ို Activate လိုပ်လပိုးယ ိုပါဘ ။ Activate လိုပ်ပပ ိုးပပ ိုးဆ ိုရင်လတ
က�န်လတ ်တ ို Data Tab ထ က ို၀င်ပါ။ ပပ ိုးရင် ည ဘက်အခခမ်ိုးနည်ိုးနည်ိုးကကည ်သ ိုးရင် Data Analysis
က ိုလတ ွေ့လ မ ်မယ်။ အ တ ဆ ိုက�န်လတ ်တ ို အသ ိုိုးခပ လ ို ရပါပပ ။ လန က် Post မှ Regression Analysis က ို
စပပ ိုး Create လိုပ်သ ိုးပါမည်။

Beginner Statistics For Data Analytics-19
က�န်လတ ်တ ို Regression Model က ိုစ run ကကည ်ရလအ င်။ လအ က်လြ ်ခပပါ Link ထ က Regression
Model ဆ ိုတ Excel File လလိုးက ို Download လိုပ်လပိုးပါ။
https://drive.google.com/drive/folders/1z-YUisxGaZhjuv-
qW9eg6E3E7lHj7ASg?fbclid=IwY2xjawKMeOZleHRuA2FlbQIxMABicmlkETFzV2hpek5ucGJ
Mc0lCWENpAR7L4NYPmQ4Go1SUk3VTWRhOJ_ -
dxHnFPuzISRQ5ynj8c58MXGZFbUC75qOZow_aem_e_ylHvBD7JF8Np5GkhQbPA
အ ေ Dataset လလိုးန စမ်ိုးကကည ်န ိုင်ပါတယ်။ Regression Model က ို run မယ်ဆ ိုရင် အရင်ဆ ိုိုး Data tab
ထ က ို၀င် Analysis Section ထ မှ Data Analysis ဆ ိုတ ရှ ပါတယ်။ Button က ို Click ပပ ိုး၀င်လ ိုက်ရင်
window box လလိုးကျလ ပပ ိုး Statistics Tools လတ အမျ ိုးကက ိုးလတ ွေ့လ မ ်မယ်။ regression က ို Click
ပါ။ regression Window box လလိုးကျလ လ မ ်မယ်။ အရင်ဆ ိုိုးလတ ွေ့ရမှ က Y Input range ပါ။
မှတ်မ လသိုးလ ိုး Y က dependent variable ပါလန ်။ က�န်လတ ်တ ို Predict လိုပ်ချင်တ Items ပါ။ ေ ရ

case မှ က�န်လတ ်တ ို ခန ်မှန်ိုးမှ က Next August အတ က်ပါ။ အ လတ Data Select လိုပ်မှ က D7
ကလန D27 အထ ဆ ပါမယ်။ အလရိုးကက ိုးတ က header row ပါ၀င်ပါတယ်လန ်။
လန က်တစ်ခိုက X input range ပါ။ သူက independent variable ပါ။ အ တ က ိုဘ Data Select
လိုပ်ပါမယ်။ C7 ကလန C27 အထ control shift down လိုပ်သ ိုးယ ိုပါဘ ။ လ ယ်ပါတယ်။ အကယ်လ ို
ေ လနရ မှ မတူည တ independent variables လတ ရှ ခ ရင်လတ Data ရ multiple
Columns က ို Add လိုပ်လ ိုက်ပါ။
ပပ ိုးရင်လအ က်ဘက်မှ labels box ရှ ပါတယ်။ Labels က ို Select လိုပ်လပိုးပါ။
အ တ က ိုဘ လကက င ်လိုပ်ရလ ဆ ိုတ န ဘ လကက င ်အလရိုးကက ိုးလ ဆ ိုတ လခပ ခပပါမယ်။ default အလနန
confidence interval က 95% ပါ။ အ တ လက င်ိုးပါတယ်။ အလခပ င်ိုးအလ မလိုပ်ချင်ဘူိုး။
လန က်ဆက်လိုပ်ရမှ က output range ပါ။ Predict Model က ထ က်လ တ output range က ို ေ
Sheet ရ တစ်လနရ မှ ချရပါမယ်။ က�န်လတ ် F7 လနရ Select လိုပ်လ ိုက်မယ်။ အ ိုးလ ိုိုးခပည ်စ ိုပပ ိုး OK
လိုပ်လ ိုက်မယ်ဆ ိုရင် regression analysis က ိုရပါပပ ။ တကယ်တမ်ိုးထ က်လ တ regression model
က ိုကကည ်ပပ ိုး ဘ ကက ိုးလတ လ မသ ဘူိုး။ ြတ်ကကည ်တ န ိုးမလည်ဘူိုးလ ို ထင်လနလ မ ်မယ်။ အ တ ေါန
မရင်ိုးနှ ိုးသူအတ က်လတ ပ ိုမှန်ပါဘ ။ က�န်လတ ် ေ Section က ို လန က် Post လတ မှ ရှင်ိုးခပပါမယ်။
အရင်ဆ ိုိုး regression statistics က ိုရှင်ိုးခပပါမယ်။ ပပ ိုးရင် Anova statistics က ိုရှင်ိုးခပပါမယ်။
တစ်ကယ ်က ိုစ တ်၀င်စ ိုးလစမည ်အပ ိုင်ိုးလလိုးလတ ပါ။

Beginner Statistics For Data Analytics-20
က�န်လတ ်တ ို ေ လန Regression ရ Summary Output လလိုးက ိုလလ လ ကကည ်ရလအ င်။
သူ မှ ပါလနတ အချက်လတ အမျ ိုးကက ိုးဘ ။ ေါလပမယ ် အခိုဂရိုစ ိုက်ရမှ က လ လမ္ ်လရ င်န ၀ ိုင်ိုးထ ိုးတ (၃)
ခိုဘ ရှ တယ်။ အ လ ိုလခပ လ ို ကျန်တ သ ြ ို မလ ိုဘူိုးလခပ တ မဟိုတ်ဘူိုးလန ်။
အကိုန်လ ိုိုးသ ရင်လတ လက င်ိုးတ လပါ ။ (၃) ခိုထ ကတစ်ခိုချင်ိုးစ က ို တစ်ရက်စ ရှင်ိုးခပပါမည်။
ပထမအစ တ်ပ ိုင်ိုးကလတ Regression Statistics ပါ။ အ ထ မှ က�န်လတ ်တ ို ဂရိုစ ိုက်ကကည ်စရ (၃)
ခိုရှ ပါတယ်။ multiple R က တစ်ခခ ိုးဘ မှမဟိုတ်ဘူိုး။ သူက Correlation က ိုလြ ်ခပတ ဘ ။
က�န်လတ ်တ ို လခပ ကကတ က “hey, it's correlation multiple R” ေ လ ိုလခပ ကကပါတယ်။
ဘယ်လ ိုလခပ ရမလ Fancy Word လလိုးတစ်ခိုလ ိုမှတ်လ ိုက်ပါ။
လန က်တစ်ခိုက R Square ပါ။ အသ ိုိုးနှုန်ိုးလလိုးက မတူလတ ဘူိုးလန ်။ R Square
က ိုပ ိုပပ ိုးအလရိုးတစ်ကက ိုးသ ြ ို လ ိုပါတယ်။ က�န်လတ ်တ ို R Square Data

က ိုသူဘ လခပ လ လ ို လသချ ြတ်ကကည ်မယ်။ R Square က က�န်လတ ်တ ို Data က Predict Model
မှ ဘယ်လလ က်ထ Fit ခြစ်လကက င ်လခပ တ ပါ။ Correlation က Variables (၂) ခိုအကက ိုးမှ
ဘယ်လလ က် Relationship ခြစ်လကက င်ိုးလခပ တ လနရ မှ R Square က လက်ရှ တည်ရှ လနတ Data က
ဘယ်လလ က်ထ Fit ခြစ်လ ဆ ိုတ ခပတ ပါ။ လြ ်ခပ ပ ိုမှ ဆ ိုရင် R Square က 0.498 ။
တစ်နည်ိုးအ ိုးခြင ် 50% လပါ ။ အ ေ ရ Data က က�န်လတ ်တ ို လတ က်လလျ က်အသ ိုိုးခပ ခ တ
Temperature နှင ် Sales Case ဘ လန ်။ အ တ ကဘ လခပ လ ဆ ိုလတ 50% လသ လခပ င်ိုးလ သ ိုးတ
Sales လတ မှ Temperature က ပါ၀င်ပက်သက်လနတယ်။ ေါတကယ်လတ အရမ်ိုးမျ ိုးတ %
လတ မဟိုတ်ပါဘူိုး။ အကယ်လ ို က�န်လတ ်တ ို 100% ဆ ိုတ မျ ိုးလတ ွေ့ရင်လတ Sales လခပ င်ိုးလ မှု 100%
မှ Temperature ရ ပါ၀င်မှုက 100% လ ို လခပ လ ို ရန ိုင်ပါတယ်။
အခို Adjusted R square အလှည ်ပါ။ အလခခခ အ ိုးခြင ် R Square န အတူတူဘ ။ သူက Multivariable
Regression Analysis လိုပ်တ အခါမျ ိုးမှ ကကည ်ြ ို လ ိုပါတယ်။ အခိုက Single Variable
ဘ လိုပ်ထ ိုးတ ဆ ိုလတ ရလ တ Result က လ အတူတူခြစ်လနတ ပါ။ ဥပမ က�န်လတ ်တ ို
ခပင်ပရ သ ဥတိုအလခခလန ၊ စ ိုးပ ါိုးလရိုးအလခခလန စသည ် Multiple Different Variables လတ က Sales
လပေါ် Predict လိုပ်တ အခါမျ ိုးဆ ိုရင် adjusted R Square ကလ ိုပါတယ်။ လန က် Post မှ R Square
က ိုထ ၀င်လလ လ ကကည ်ရလအ င်။

Beginner Statistics For Data Analytics-21
ေ လန လတ R Square အလကက င်ိုးလလိုး Deeper Dive လခပ ကကရလအ င်။ အရင် Post
မှ က�န်လတ ်တ ို န ိုးလည်ခ ကကတ က R Square ခမင ်လလလလ Model က က�န်လတ ်တ ို Data
န က ိုက်ည လလလလပါဘ ။ R Square က ိုတ က်ရတ က အရမ်ိုးလ ယ်ပါတယ်။
ပပ ိုးလတ စ ိုိုးရ မ်စရ လ မလ ိုပါဘူိုး။ Excel က က�န်လတ ်တ ို အတ က် ထိုတ်လပိုးပပ ိုးသ ိုးပါ။
လအ က်ကစ လလိုးက ိုြတ်ကကည ်ပါ။ ပပ ိုးရင် Second အနည်ိုးငယ်လလ က်စဥ်ိုးစ ိုးကကည ်။
"What factors contribute to your income?"
တကယ်တမ်ိုးအလကက င်ိုးအရ လတ အမျ ိုးကက ိုးလခါင်ိုးထ လပေါ်လ ပါလ မ ်မယ်။ Education (Education
Level ခမင ်ရင်၀င်လင ပ ိုရန ိုင်တယ်), Skills (Skills လက င်ိုးလ ရင်၀င်လင ပ ိုရန ိုင်တယ်), Marital Status
(အ မ်လထ င်ခပ ပပ ိုးရင်၀င်လင ပ ိုရန ိုင်တယ်), Location (Yangon မှ က Mandalay

မှ လနတ ထပ်စ ရင်၀င်လင ပ ိုရန ိုင်တယ်) စသခြင ်ရှ န ိုင်ပါတယ်။ ေါလတ က မတူည တ Variables
လတ ခြစ်ပပ ိုးလတ က�န်လတ ်တ ို ရ Income က ို Contribute လိုပ်လနကကတ ပါ။
အ လတ Model မှ Variables လတ က ိုထပ်တ ိုိုးထည ်သ င်ိုးရင် R Square Number
ကလည်ိုးပ ိုပပ ိုးတ ိုိုးလ မယ်။ အ တ က ဘ က ိုန ိုးလည်လစလ ဆ ိုလတ က�န်လတ ်တ ို Model က
ပ ိုပပ ိုးလတ Accurate ခြစ်လ တယ်။ ပ ို (၂) က ိုကကည ်လပိုးပါ။ Model မှ Education variable လကက င ် R
Square 20% ရှ တယ်။ က�န်လတ ်တ ို Income Predicts အတ က် က�မ်ိုးကျင်မှု (Skills)
က ိုထည ်လပါင်ိုးလ ိုက်တ အခါ R squared က 40% ခြစ်လ ပါတယ်။ က�န်လတ ်တ ို အခခ ိုး meaningful
variable တစ်ခိုခြစ်တ marital status က ိုထည ်လ ိုက်တ အခါ R squared က 60%
အထ တ ိုိုးလ ပါတယ်။ လန က်ဆ ိုိုး Location က ိုထည ်လ ိုက်တ အခါ R square က 80%
အထ တ ိုိုးလ ပါတယ်။
က�န်လတ ်တ ို ရ Regression analysis ၏ ရည်ရ ယ်ချက်မှ က ိုက က�န်လတ ်တ ို Model က ိုပ ိုတ ကျလစြ ို
အမှန်တကယ် အလထ က်အကူခြစ်လစမည ် အဓ ပပါယ်ရှ တ Variable မျ ိုးက ို ပ ိုမ ိုရှ လြ ရန်ခြစ်ပါတယ်။
Variable တစ်ခိုထပ်ပ ိုတ အခါ R squared (သ ို မဟိုတ်) adjusted R squared က ိုကကည ်တ အခါ
က�န်လတ ်တ ို Model ဟ ဘယ်လ ို accurate ခြစ်လကက င်ိုးလခပ န ိုင်ပါတယ်။

Beginner Statistics For Data Analytics-22
ေ လန က�န်လတ ်တ ို P values အလကက င်ိုး Overview လခပ ကကရလအ င်။ က�န်လတ ်တင်တ Statistics
Post လတ လတ က်လလျ က်ြတ်ခ တ သူဆ ိုရင်သ လ မ ်မယ်။ P values က ိုတစ်ခါမှထည ်မလခပ ြူိုးဘူိုး။
mention လ မလိုပ်ခ ဘူိုး ။ က�န်လတ ်တ ို r Square က ိုလခပ တိုန်ိုးက Variable လတ က meaningful
ခြစ်လ ိုး မခြစ်လ ိုး အ တ က က�န်လတ ်တ ို Model မှ Value ခြစ်ရ လ ိုးဆ ိုပပ ိုးလခပ ခ တယ် ။
လက င်ိုးပပ က�န်လတ ်တ ို Model တ င်ရှ တ Variable တစ်ခိုသည် အမှန်တကယ် အဓ ပပါယ်ရှ လသ
အရ တစ်ခိုက ို လပါင်ိုးထည ်ခခင်ိုးရှ ၊ မရှ ဆ ိုိုးခြတ်ြ ို အတ က် ၎င်ိုး၏ P value က ို ကကည ်ြ ို လ ိုအပ်ပါတယ်။
ခိုချ န်မှ နည်ိုးနည်ိုးရှုပ်လထ ိုးလနလ မ ်မယ်။ အ တ လတ မကက ခင်ရှင်ိုးသ ိုးမယ်ဆ ိုတ အ မခ ပါတယ်။
ဆက်ြတ်လပိုးပါ။
P value သည် က�န်လတ ်တ ို ရ Model ရှ Variable သည် Randomly ခြစ်သ ိုးန ိုင်သည်က ို
န ိုးလည်ြ ို ကူည လပိုးပါတယ်။ အကယ်၍ Variable က Random Number ခြစ်လနမယ်ဆ ိုရင်

အ တ က ိုြယ်ြ ို လ ိုပါတယ်။ က�န်လတ ်တ ို Model မှ မထည ်ချင်ဘူိုး။ ေါလကက င ်အ ေါက ို
ရှင်ိုးပစ်ချင်တယ်။ ဥပမ Company တစ်ခိုမှ လိုပ်လနတ Sales Manager ရ ကလလိုးလကျ င်ိုးစ လမိုးပ
Result က က�န်လတ ်တ ို Predict လိုပ်လနတ Sales မှ ဘ မှပက်သက်မှုမရှ ဘူိုးလလ။ အ တ က Zero
Relevance ဘ ။ အ လ ိုမျ ိုးက Random Variable မျ ဘ ခြစ်မှ ဘ လလ။
ထ ို လကက င ် P value က Variable တစ်ခိုသည် Random Number ခြစ်မခြစ် (သ ို မဟိုတ်) Model
အတ က် အမှန်တကယ်အလထ က်အကူခြစ်မခြစ်က ို န ိုးလည်ရန် ကူည လပိုးပါတယ်။
ေါလကက င ်သက်မှတ်ချက်အတ ိုင်ိုးဆ ိုရင် P value က ို 0.05 ထက်နည်ိုးလစလ ိုပါတယ်။ အ တ က
ဘ လ ဆ ိုလတ 95% Confidence Level ရှ ရင် Variable က random မဟိုတ်လတ ဘူိုး။ အကယ်လ ို P
value က 0.05 အထက်ခြစ်ခ မယ်ဆ ိုရင် Variable က Random ခြစ်န ိုင်လချပ ိုမျ ိုးလ မယ်။ အပမ တမ်ိုး
လယဘူယျအ ိုးခြင ် 95% Confidence ဘ လ ိုချင်ကကတ မလ ိုး။ ေါက Gold Standard တစ်ခိုပါဘ ။
ေ လလ က်ဆ ိုရင် P value က ိုဘယ်လလ က်ရှ သင ်လ ဆ ိုတ Point က ိုလသချ ရသ ိုးမယ်ထင်ပါတယ်။