Hướng dẫn sử dụng phần mềm Statgraphics trong xử lý thống kê

LngNguynVn12 0 views 46 slides Oct 14, 2025
Slide 1
Slide 1 of 46
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31
Slide 32
32
Slide 33
33
Slide 34
34
Slide 35
35
Slide 36
36
Slide 37
37
Slide 38
38
Slide 39
39
Slide 40
40
Slide 41
41
Slide 42
42
Slide 43
43
Slide 44
44
Slide 45
45
Slide 46
46

About This Presentation

Statgraphics trong xử lý thống kê


Slide Content

PHẦN MỀM STATGRAPHICS

GIỚI THIỆU PHẦN MỀM STATGRAPHICS Sử dụng phần mềm STATGRAPHICS® Centurion phiên bản 15.2 Statgraphics là một phần mềm chuyên dùng cho thống kê , phân tích dữ liệu , hình ảnh , mô phỏng thống kê , phân tích dự đoán . Statgraphics chứa hơn 230 phương pháp phân tích , thống kê .

Trình đơn File : chứa các lệnh mở , đóng , lưu , in tập tin định dạng StatFolio , Save data file, StatGallery , StatReporter và thoát khỏi chương trình Sử dụng StatLink để lấy dữ liệu từ các nguồn dữ liệu đa dạng như là các bảng số liệu , các cơ sở dữ liệu , thiết bị đo lường hay máy đo vi mô kĩ thuật số thông qua các phần mềm của chúng . Lưu đồ thị (Save Graph) định dạng metafile. Tổ hợp định dạng StatFolio với các định dạng tệp dữ liệu khác . Gửi thư có đính kèm (attach) tập tin của StatGraphic thông qua một trình gửi thư điện tử trên máy (Outlook). GIỚI THIỆU PHẦN MỀM STATGRAPHICS

Trình đơn Edit : chứa các lệnh chỉnh sửa thông dụng như sao chép , cắt dán , dán link và quay lại phiên làm việc trước đó , ngoài ra tại trình đơn edit còn có : Thiết lập chỉnh sửa hệ thống - Preferences ( giống như Settings hay Options của các phần mềm khác ). Thay đổi phông chữ , lặp lại phép phân tích . Chèn thêm hay xoá bỏ một cột số liệu . Thay đổi một cột trong tệp dữ liệu ; đưa ra giá trị của dữ liệu thông qua một toán tử ; chuyển định dạng dữ liệu sang định dạng của SG Centurion; sắp xếp dữ liệu . Khai báo thuộc tính của databook GIỚI THIỆU PHẦN MỀM STATGRAPHICS

Trình đơn Edit : Khai báo thuộc tính của databook Databook là một cửa sổ chứa các tab cho mỗi d atasheets, dán nhãn từ "A" đến "J". Mỗi tab trong số 10 datasheet tương ứng với một nguồn dữ liệu khác nhau. Để dữ liệu được phân tích Statgraphics, trước tiên phải khai báo vào một trong 10 datasheets chứa trong StatLink databook Data source: nguồn dữ liệu tương ứng với số kỹ thuật được chỉ định. GIỚI THIỆU PHẦN MỀM STATGRAPHICS Chọn Read only tương ứng mỗi tab : datasheet có thể không được thay đổi hoặc lưu lại . Chọn Poll : các nguồn dữ liệu sẽ được yêu cầu chạy phân tích lại trong khoảng thời gian chọn trong vùng phân tích liên quan ( Statlink polling)

Trình đơn Edit : Khai báo thuộc tính của databook Open: mở một nguồn tập tin mới cho sheet đang được kiểm tra . STATGRAPHICS data File: trong đó có các phần mở rộng .sf6, .sf3, .sfx , tập tin dữ liệu được tạo ra bởi các chương trình khác. External Data file: mở các file excel ODBC Query: lấy c ác bảng trong cơ sở dữ liệu như Oracle hoặc Microsoft Access Save, Save As: lưu nội dung của bảng đang được kiểm tra . Close: đóng bảng đang được kiểm tra và thiết lập lại . GIỚI THIỆU PHẦN MỀM STATGRAPHICS

GIỚI THIỆU PHẦN MỀM STATGRAPHICS Trình đơn Plot : Giúp người sử dụng có thể sử dụng các phép phân tích cơ bản bằng các loại đồ thị thông dụng. Scatterplots (Đồ thị phân tán): chứa các loại đồ thị phân tán thông dụng cho thấy độ phân tán của tập số liệu. Exploratory Plots (Đồ thị khảo sát): chứa các loại đồ thị có tính khảo sát, rất hữu dụng trong nghiên cứu tính đối xứng, kiểm tra giả thiết phân bố, phát hiện số liệu sai (outlier). Business Charts (Biểu đồ): chứa các loại biểu đồ dùng trong công việc kinh doanh, hữu dụng trong việc giới thiệu và tổng kết số lượng lớn số liệu. Probability Distributions (Phân bố xác suất): chứa 24 dạng đồ thị phân bố rất hữu dụng trong việc phân tích, tính toán xác suất như là hàm phân bố Student’s, Bernouli... Surfaces and Contour Plots... : cho phép đưa số liệu vào các hàm số do người dùng tự thiết lập. Custom Charts: Biểu đồ tùy biến

GIỚI THIỆU PHẦN MỀM STATGRAPHICS Trình đơn Describe : Chứa các phương pháp phân tích dùng trong việc khảo sát và tổng kết số liệu. Numeric Data : chứa các phép phân tích dùng để mô tả và tổng kết các số liệu điều tra, thu thập. Categorical Data: chứa các phép phân tích sử dụng với dữ liệu chứa các số liệu rời rạc. Distributions Fitting: chứa các công cụ cho phép phân tích, kiểm tra xác suất phân bố, giả thiết về phân bố của một tập số liệu. Life Data: phân tích dữ liệu chứa trong toàn bộ thời gian thực hiện cho đến khi kết thúc. Multiplevariate Methods: Phân tích đa biến được thiết kế để cộng hai hoặc nhiều cột của bảng dữ liệu. Phân tích này thường được sử dụng trước khi xây dựng một mô hình hồi quy đa biến. Time series: Phân tích dữ liệu theo một chuỗi thời gian.

GIỚI THIỆU PHẦN MỀM STATGRAPHICS Trình đơn Compare : thực hiện các phép so sánh Two-Sample Comparison: So sánh hai mẫu Multiple-Sample Comparison: So sánh đa mẫu One-Way ANOVA: Phân tích ANOVA một biến Multifactor ANOVA: Phân tích ANOVA đa biến Variance Components: phân tích thành phần phương sai

GIỚI THIỆU PHẦN MỀM STATGRAPHICS Trình đơn Relate: Chứa các phép phân tích mối tương quan giữa các biến độc lập và biến phụ thuộc. Simple Regression: Hồi quy đơn giản Polinomial Regression: Hồi quy tuyến tính Box-Cox Transformations: xác định một chuyển đổi tối ưu cho Y trong một phương trình hồi quy tuyến tính. Nó rất hữu ích khi sự thay đổi của Y là một hàm của X. Multiple Regression: Phân tích mối quan hệ giữa một biến phụ thuộc vào một hay nhiều biến độc lập.

GIỚI THIỆU PHẦN MỀM STATGRAPHICS Trình đơn Forecast: Dự đoán giá trị tương lai của dữ liệu theo chuỗi thời gian. Một chuỗi thời gian bao gồm một tập hợp các dữ liệu số tuần tự lấy ở khoảng cách đều nhau, thường là trong một khoảng thời gian và thời gian. Dự đoán giá trị tương lai bao gồm một chuyển động trung bình, mô hình xu hướng… Thường được sử dụng cho dự đoán thay đổi thời tiết hoặc tính toán lạm phát trong tương lai. Có thể thống kê, so sánh sự phù hợp lên đến 5 mô hình tại một thời điểm .

GIỚI THIỆU PHẦN MỀM STATGRAPHICS Trình đơn SnapStats : nhanh chóng tạo ra một trang duy nhất của đầu ra đã được định dạng sẵn. Đồng thời tích hợp sẵn nhiều phân tích thống kê thường được sử dụng và tự động định dạng thành một trang tóm tắt các vấn đề phân tích dữ liệu thường gặp phải.

GIỚI THIỆU PHẦN MỀM STATGRAPHICS (Tiện ích nhanh) StatAdvisor Giúp giải thích kết quả phân tích và xác định các kết quả có ý nghĩa thống kê. Cảnh báo sai sót có thể có trong quá trình phân tích và các sai sót do dữ liệu đầu vào. Tăng độ tin cậy cho các báo cáo của bạn với những giải thích của chuyên gia in cùng với kết quả StatGallery Cho phép kết hợp lên đến chín văn bản và đồ họa, đồ thị tạo ra từ các phương pháp khác nhau và sắp xếp chúng cạnh nhau trong một cửa sổ để giúp so sánh kết quả. Cho phép lưu trữ lên đến 100 tấm hình và khung văn bản Chỉnh sửa đồ họa hoặc tự động liên kết chúng vào các phân tích StatReporter Cho phép tạo ra các báo cáo với Statgraphics bằng cách sao chép và dán bảng, đồ thị tạo trong cửa sổ phân tích. Có thể chỉnh sửa đầu ra, thêm ý kiến ​​bổ sung, và lưu kết quả là một tập tin RTF. StatFolios Là tài liệu Statgraphics chính ghi lại trạng thái phiên làm việc. Bao gồm một liên kết đến dữ liệu và tất cả các thủ tục và các tùy chọn mà người dùng đã chọn. StatFolios có thể lưu và xuất lại vào một ngày sau đó, hoặc áp dụng cho nhiều bộ dữ liệu. Dễ dàng chạy lại phân tích của bạn về dữ liệu mới hoặc một biến mới giúp bạn tiết kiệm thời gian.

PHÂN TÍCH CÁC ĐẶC TRƯNG CỦA 1 MẪU Một vấn đề thường gặp trong thống kê là phân tích một mẫu với n giá trị quan sát từ một tổng thể. Thường sử dụng cho việc xử lý mẫu sau khi khảo sát số liệu Ví dụ: H àm lượng muối Natri clorua trong nước mắm được chấp nhận trong khoảng 250 – 290 g/l. Người ta tiến hành 20 phép thử để phân tích h àm lượng muối Natri clorua trong nước mắm Phú Quốc và thu được kết quả sau

PHÂN TÍCH CÁC ĐẶC TRƯNG CỦA 1 MẪU Phép phân tích một biến được tiến hành bằng cách: Trong hộp thoại nhập dữ liệu, chọn cột dữ liệu cần phân tích là “Ham luong” Kết quả phân tích sẽ được trình bày trong nhiều cửa sổ theo mục đích cần phân tích:

PHÂN TÍCH CÁC ĐẶC TRƯNG CỦA 1 MẪU Cửa sổ trên cùng bên trái cho biết dung lượng mẫu n = 20, giá trị nằm trong khoảng từ 250 đến 295. Cửa sổ trên cùng bên phải biểu diễn đồ thị phân tán của số liệu với các điểm phân bố ngẫu nhiên theo hướng thẳng đứng. Các điểm số liệu tập trung trong khoảng từ 255 đến 290 và thưa dần ra 2 đầu. Hai cửa sổ bên dưới biểu diễn các số liệu thống kê và đồ thị “box-and-whisker”.

PHÂN TÍCH CÁC ĐẶC TRƯNG CỦA 1 MẪU Ước lượng mẫu: Mục đích của kỹ thuật lấy mẫu là giảm sai số lấy mẫu. Khi cỡ mẫu tăng, sai số lấy mẫu sẽ giảm. Xác định cỡ mẫu cho một loại mẫu như sau Quy trình này xác định cỡ mẫu thích hợp để ước lượng hoặc thử nghiệm các giả thuyết liên quan bất kỳ những điều sau đây: Giá trị trung bình μ của phân phối chuẩn. Độ lệch σ tiêu chuẩn của một phân phối chuẩn. Tỷ lệ thành công θ trong một phân phối nhị thức. Tỷ lệ của các sự kiện λ trong một phân bố Poisson.

PHÂN TÍCH CÁC ĐẶC TRƯNG CỦA 1 MẪU Ước lượng mẫu: Bước 1: Khai báo dữ liệu đầu vào (Data input) Hộp thoại đầu tiên xuất hiện được sử dụng để xác định các vấn đề quan tâm về số liệu cần phân tích. Parameter : tham số được ước tính. M ột mẫu ngẫu nhiên kích thước n sẽ được lấy từ phân phối theo quy định và được sử dụng để ước tính hoặc kiểm tra giá trị của các tham số. Hypothesized Mean : giá trị dự kiến ​​của trung bình μ. Hypothesized Sigma : giá trị dự đoán của độ lệch chuẩn σ. Hypothesized Proportion : giá trị dự đoán của tỷ lệ nhị thức θ. Hypothesized Rate : giá trị dự đoán của tỷ lệ Poisson λ. Ví dụ: mong muốn ước tính trung bình của một phân phối bình thường, được cho là khoảng μ = 10 với độ lệch chuẩn σ = 3.

PHÂN TÍCH CÁC ĐẶC TRƯNG CỦA 1 MẪU Ước lượng mẫu: Bước 2: Khai báo các mục tiêu cần phân tích Control: xác định mục tiêu trong số các lựa chọn sau đây: Absolute error : khoảng tin cậy cho thông số không được xây dựng Relative error : giống hệt với Absolute error với W được thiết lập bằng P lần các thông số cụ thể. Power : một thử nghiệm giả thuyết đã được thực hiện. Hiệu suất của các thử nghiệm 100(1-β)% nên bằng tỷ lệ phần trăm quy định khi giá trị thực của các thông số . Sample Size : các định trước kích thước mẫu n. Đ ược sử dụng để vẽ biểu đồ cho một kích thước mẫu mà không được tính toán bằng các quy trình trên. Confidence Level: Mức độ tin cậy 100(1-α) % được sử dụng khi xây dựng ước lượng khoảng .

PHÂN TÍCH CÁC ĐẶC TRƯNG CỦA 1 MẪU Ví dụ : 1 PTN phân tích được cung cấp 1 mẫu thức ăn gia súc, nội dung đánh giá tiêu chuẩn là hàm lượng Natri lasalocid 85mg/kg. Vậy PTN này cần phải thực hiện bao nhiêu phép thử để kiểm tra hàm lượng Natri lasalocid với mong muốn độ tin cậy của phép thử là 99% có giá trị độ lệch chuẩn sigma ± 4 (tức là hàm lượng dự đoán từ 81 đến 89 mg/kg) và mức độ sai số cho phép của phép thử là 95%.

PHÂN TÍCH CÁC ĐẶC TRƯNG CỦA 1 MẪU Kết quả phân tích cho thấy PTN cần phải thực hiện 21 phép thử để có thể kiểm tra và đánh giá hàm lượng Natri Lasalocid có trong mẫu theo mức độ tin cậy của phép thử là 99%

SO SÁNH HAI MẪU So sánh trung bình 2 mẫu Ví dụ: đo thân nhiệt của 130 người Nam/Nữ bất kỳ theo độ F (sử dụng data “Bodytemp” có sẵn). Thân nhiệt của nam và nữ sẽ được so sánh xem có sự khác biệt đáng kể giữa 2 mẫu hay không. Vào Menu Compare -> Two Samples -> Two-Sample Comparison. “Two Data Columns” được sử dụng khi dữ liệu 2 mẫu được trình bày trên 2 cột khác nhau. “Data and Code Columns” được sử dụng khi 2 mẫu khác nhau được mã hóa trong cùng một cột.

SO SÁNH HAI MẪU So sánh trung bình 2 mẫu Bảng kết quả phân tích gồm 4 cửa sổ:

SO SÁNH HAI MẪU So sánh nhiều giá trị trung bình Ví dụ: So sánh độ bền của sản phẩm được sản xuất từ 4 loại vật liệu khác nhau, người ta tiến hành đo 12 mẫu đối với mỗi loại vật liệu. Sử dụng file “widgets.sf6” Mục đích của thí nghiệm là để xác định xem loại vật liệu nào có độ bền tốt nhất. Có 2 cách nhập số liệu để so sánh: Cách 1: Các mẫu khác nhau được trình bày trên mỗi cột khác nhau Cách 2: Tất cả các kết quả được nhập trên cùng một cột, tạo một cột thứ hai để nhập vào các mã (codes) để xác định xem các số liệu ở cột thứ nhất thuộc mẫu nào

SO SÁNH HAI MẪU So sánh nhiều giá trị trung bình Chọn Menu Compare -> Multiple Sample -> Multiple-Sample Comparison. Hộp thoại đầu tiên xuất hiện để xác định kiểu nhập dữ liệu ban đầu Chọn “Multiple Data Columns” nếu nhập theo cách 1 Chọn “Data and Code Columns” nếu nhập theo cách 2 Hộp thoại thứ hai yêu cầu nhập tên của cột chứa dữ liệu cần so sánh. Trong ví dụ này, kết quả độ bền của 4 loại vật liệu được nhập vào 4 cột A, B, C, D.

SO SÁNH HAI MẪU So sánh nhiều giá trị trung bình Kết quả phân tích gồm 4 cửa sổ. Cửa sổ trên cùng bên trái cung cấp một số đặc trưng về kích thước mẫu (n) và khoảng biến thiên của mẫu (R = x max – x min ). Cửa sổ trên cùng bên phải biểu diễn đồ thị phân bố của mẫu

SO SÁNH HAI MẪU So sánh nhiều giá trị trung bình Bước đầu tiên khi tiến hành so sánh nhiều mẫu là phân tích phương sai Đặt giả thiết: H o : Độ bền của các loại vật liệu không có sự khác biệt về mặt thống kê H 1 : Độ bền của các loại vật liệu có sự khác biệt về mặt thống kê. Bảng phân tích ANOVA được trình bày ở cửa sổ dưới cùng bên trái Giá trị quan trọng nhất trong bảng ANOVA là P-value. Nếu P-value <0,05 thì bác bỏ giả thiết H o hay có thể kết luận độ bền của 4 loại vật liệu là khác nhau. Để biết loại vật liệu nào tốt nhất cần phải tiến hành so sánh các giá trị trung bình

SO SÁNH HAI MẪU So sánh nhiều giá trị trung bình Chọn phím “Tables” trên thanh công cụ phân tích và click chọn “Multiple Range Test” Cột “Difference” là sự khác biệt của từng cặp so sánh Cột “+/- Limits” là khoảng ước lượng độ khác biệt. Cặp so sánh nào có giá trị trong cột “Difference” lớn hơn giá trị trong cột “+/- Limits” sẽ được tô đỏ và đánh dấu * tương ứng trong cột “Sig.” Điều này có nghĩa là cặp nghiệm thức so sánh có sự khác biệt về mặt thống kê ở mức ý nghĩa 5%. Bảng kết quả bên trên sắp xếp các mẫu theo thứ tự tăng dần của các giá trị trung bình.

SO SÁNH HAI MẪU So sánh nhiều giá trị trung bình Các ký hiệu chữ “X” nằm trên cùng một cột thẳng đứng thì không có sự khác biệt, các ký hiệu chữ “X” nằm trên 2 cột khác nhau thì có sự khác biệt. Trong thí nghiệm này, kết quả có thể được trình bày lại như sau: Vật liệu Độ bền A 64,7 a B 61,9 b C 60,8 bc D 59,8 c

PHÂN TÍCH PHƯƠNG SAI - ANOVA ANOVA: dùng để xem xét sự khác biệt giữa các thuộc tính, định tính của các đối tượng nghiên cứu và biến phụ thuộc. Trong nghiên cứu, phân tích phương sai được dùng như là một công cụ để xem xét ảnh hưởng của một hay nhiều yếu tố nguyên nhân dẫn đến một yếu tố kết quả. Có hai kỹ thuật phân tích ANOVA thường dùng đó là: Phân tích ANOVA một yếu tố: Phân tích ảnh hưởng hay so sánh sự khác nhau giữa các nghiệm thức, các kiểu, các loại của một nhân tố (một mã bậc) đối với một biến hệ quả. Phân tích ANOVA đa yếu tố: Phân tích tác động, so sánh sự khác biệt của một hay nhiều yếu tố mã bậc trên cùng một biến hệ quả.

PHÂN TÍCH PHƯƠNG SAI - ANOVA Một số giả định khi phân tích ANOVA: Các nhóm so sánh phải độc lập và được chọn một cách ngẫu nhiên. Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu phải đủ lớn để được xem như tiệm cận phân phối chuẩn. Phương sai của các nhóm so sánh phải đồng nhất. Sau khi phân tích ANOVA nhận được kết quả P-value như sau: P-value > 0.05: chưa đủ điều kiện để khẳng định có sự khác biệt. P-value <=0.05: đủ điều kiện để khẳng định có sự khác biệt. Trong các phép kiểm định thống kê, thường người ta chấp nhận mức ý nghĩa 5% (độ tin cậy tương ứng là 95%), hoặc 1% (độ tin cậy tương ứng là 99%). Quan sát cột P-Value, nếu yếu tố nào có giá trị P-Value nhỏ hơn 0.05 (tức là <5%) thì yếu tố đó mang ý nghĩa thống kê (tức là bắt buộc được giữ lại trong mô hình hồi qui).

PHÂN TÍCH PHƯƠNG SAI ANOVA MỘT YẾU TỐ Ví dụ : Hàm lượng Alcaloid (mg) trong một loại dược liệu được thu hái từ 3 vùng khác nhau, nhập số liệu như bảng bên Phân tích “hàm lượng” theo nhân tố “vùng” bằng chương trình phân tích “One-Way ANOVA” từ trình đơn Compare

PHÂN TÍCH PHƯƠNG SAI ANOVA MỘT YẾU TỐ Giá trị F-Radio là 26,56 (F là thương số giữa trung bình bình phương giữa các nhóm và trung bình bình phương trong từng nhóm) cho nên nguồn số liệu cho phép bác bỏ giả thuyết rằng hàm lượng trung bình ở ba vùng bằng nhau ở mức ý nghĩa 5%. Nghĩa là ở mức độ tin cậy của số liệu thống kê là 95% thì hàm lượng trung bình/vùng ở ba vùng là khác nhau. Tại giá trị F-value ở mức độ tin cậy của số liệu thống kê là 95% thì giá trị P-Value < 0.05, điều này chứng tỏ số liệu thống kê về hàm lượng Alcaloid của dược liệu ở 3 vùng đủ điều kiện để khẳng định có sự khác biệt.

PHÂN TÍCH PHƯƠNG SAI ANOVA MỘT YẾU TỐ Từ sự khác biệt đó, có thể phân tích sâu hơn để tìm ra sự khác biệt như thế nào giữa các nhóm quan sát. Bảng số liệu trên cho thấy hàm lượng Alcanoid trung bình ở vùng 1 cao nhất và bảng số liệu sắp xếp hàm lượng trung bình của từng vùng theo thứ tự tăng dần

PHÂN TÍCH PHƯƠNG SAI ANOVA HAI YẾU TỐ Ví dụ : Chiết suất chất X từ 1 loại dược liệu bằng 3 phương pháp và 5 loại dung môi, ta có kết quả như trong bảng. Hãy xét ảnh hưởng của phương pháp chiết suất và dung môi đến kết quả chiết suất chất X Phương pháp (B) Dung môi (A) b 1 b 2 b 2 a 1 120 60 60 a 2 120 70 50 a 3 130 60 50 a 4 150 70 60 a 5 110 75 54

PHÂN TÍCH PHƯƠNG SAI ANOVA HAI YẾU TỐ Như vậy, đối với A là “Dung môi” có P-Value bằng 0.4094 lớn hơn nhiều so với 0,05 nên không có giá trị thống kê, tức là thay đổi các loại dung môi cũng không ảnh hưởng đến kết quả chiết suất chất X. Còn đối với B là “Phương pháp” có P-Value nhỏ hơn rất nhiều so với 0,05 tức là Phương pháp sẽ ảnh hưởng đến kết quả chiết suất, khi thay đổi phương pháp sẽ thay đổi kết quả chiết suất chất X.

PHÂN TÍCH TƯƠNG QUAN – HỒI QUY Ví dụ: Xác định yếu tố nhiệt độ và/hoặc thời gian có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp như thế nào khi dùng ba mức nhiệt độ gồm 105,120,135 o C kết hợp với ba khoảng thời gian là 15, 30 và 60 phút để thực hiện một phản ứng tổng hợp. Nếu có liên quan tuyến tính với nhau thì ở nhiệt độ 115 o C trong 50 phút sẽ dự đoán được hiệu suất phản ứng là bao nhiêu? Các hiệu suất của phản ứng (%) được nhập liệu như sau

PHÂN TÍCH TƯƠNG QUAN – HỒI QUY Chọn “Relate” -> “One Factor” -> “Simple Regression” để ấn định các giá trị của biến số Y và X. Bước 1: tìm mối liên quan tuyến tính giữa Thời gian và Hiệu suất

PHÂN TÍCH TƯƠNG QUAN – HỒI QUY Bảng kết quả phân tích cho chúng ta phương trình hồi quy: hiệu suất theo thời gian: Y = 2,73 + 0,04X Theo đó, giá trị P-Value = 0,21 > 0,05 nên phương trình hồi quy này không có ý nghĩa thống kê. Yếu tố thời gian không có liên quan tuyến tính với hiệu suất phản ứng.

PHÂN TÍCH TƯƠNG QUAN – HỒI QUY Bước 2: tìm mối liên quan tuyến tính giữa Nhiệt độ và Hiệu suất Bảng kết quả phân tích cho chúng ta phương trình hồi quy: hiệu suất theo nhiệt độ: Y = -11,14 + 0,128X Theo đó, giá trị P-Value = 0,0021 < 0,05 nên phương trình hồi quy có ý nghĩa thống kê. Yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất phản ứng.

PHÂN TÍCH TƯƠNG QUAN – HỒI QUY Trong mục này ta cũng có thể kích chuột phải vào màn hình nền của bảng “Analysis Summary” để hiện bảng “Analysis Options” cho phép chọn các mô hình hồi quy đơn giản khác. Forecas t: Bảng này dự đoán các giá trị Y (hiệu suất) ở những giá trị X (nhiệt độ) cho trước cùng với khoảng giới hạn dự đoán và khoảng giới hạn tin cậy.

PHÂN TÍCH TƯƠNG QUAN – HỒI QUY Forecas t: Nhấp chuột phải vào màn hình nền của bảng “Forecast” đã hiện ra, chọn “Panel Option” để hiển thị hộp thoại cho phép nhập các giá trị X và độ tin cậy để tính Y. Để trả lời cho câu hỏi: khi có liên quan tuyến tính thì ở nhiệt độ 115 o C thì hiệu suất phản ứng là bao nhiêu, chúng ta nhập X là 115 sau đó bảng phân tích Forecast cho kết quả hiệu suất là 3,64 như hình sau:

PHÂN TÍCH TƯƠNG QUAN – HỒI QUY Các lựa chọn đồ hoạ: Nhấn nút “Graphic Options” trên cửa sổ “Simple Regression” để hiển thị hộp thoại cho phép lựa chọn các kiểu đồ thị Trên đồ thị cho thấy: Đường giữa: đường phù hợp 2 đường 2 bên “đường giữa”: khoảng tin cậy 2 đường ngoài cùng: Khoảng dự đoán

PHÂN TÍCH TƯƠNG QUAN – HỒI QUY Các lựa chọn đồ hoạ: Một kiểu đồ thị khác như “Observed versus Predicted”: Cách vẽ này cho biết vị trí của các điểm thực nghiệm so với đường phù hợp, nếu các điểm này nằm càng gần đường phù hợp thì mô hình càng chính xác.

KẾT LUẬN Statgraphics là một trong những phần mềm thống kê chuyên dụng và phổ biến Là phần mềm trực quan mạnh mẽ cho việc phân tích dữ liệu, trực quan dữ liệu, mô hình thống kê và phân tích dự đoán. Là một phần mềm toàn diện với hơn 230 phương pháp từ thống kê , tóm tắt các mô hình cho đến thống kê tiên tiến . Giúp cho người dùng có thể lên kế hoạch thí nghiệm ngay từ khi bắt đầu từ đó giúp cho việc tiết kiệm thời gian, công sức, và chi phí nghiên cứu
Tags