Slide Chuong 1 mon thong ke ung dung trong kinh te va kinh doanh
vanan251106
1 views
48 slides
Oct 08, 2025
Slide 1 of 48
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
About This Presentation
good
Size: 639.51 KB
Language: none
Added: Oct 08, 2025
Slides: 48 pages
Slide Content
THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ VÀ KINH DOANH Anderson Sweeney Williams Slides by John Loucks St. Edward’s University
Chương 1 Dữ liệu và thống kê Dữ liệu Nguồn dữ liệu Thống kê mô tả Suy diễn thống kê Máy tính và phân tích thống kê Khai thác dữ liệu Nguyên tắc đạo đức trong thực hành thống kê Ứng dụng trong kinh tế và kinh doanh Thống kê
Thống kê Thống kê có thể là những con số tính toán từ sự kiện thực tế như trung bình, trung vị, tần suất và chỉ số, sẽ giúp ta hiểu về các tình huống trong kinh tế và kinh tế. Thống kê cũng có thể là nghệ thuật và khoa học của việc thu thập, phân tích, trình bày và diễn giải dữ liệu.
Ứng dụng trong kinh doanh và kinh tế Kế toán Kinh tế học Công ty kiểm toán sử dụng các thủ tục lấy mẫu thống kê khi tiến hành kiểm toán cho khách hàng Các nhà kinh tế thường xuyên đưa ra các dự báo về tương lai của nền kinh tế hoặc về một khía cạnh nào đó của nền kinh tế. Chuyên gia tài chính sử dụng một loạt các thông tin để hướng dẫn khuyến nghị đầu tư. Tài chính
Ứng dụng trong kinh doanh và kinh tế Một loạt các kiểm soát chất lượng là ứng dụng quan trọng của thống kê sản xuất. Sản xuất Máy quét điện tử tại quầy tính tiền bán lẻ thu thập dữ liệu cho một loạt các ứng dụng nghiên cứu thị trường. Marketing
Dữ liệu và tập dữ liệu Dữ liệu là những sự kiện và con số được thu thập, phân tích và tổng hợp để trình bày và diễn giải. Tất cả các dữ liệu thu thập trong một nghiên cứu cụ thể được gọi là tập dữ liệu nghiên cứu.
Phần tử là các thực thể mà từ đó dữ liệu được thu thập. Biến là một đặc tính của phần tử cần quan tâm. Tập hợp các số đo thu được của một phần tử được gọi là một quan sát. Tổng số giá trị của dữ liệu trong một tập dữ liệu hoàn chỉnh là số phần tử nhân với số biến. Phần tử, Biến, Và quan sát Một tập dữ liệu với n phần tử có n quan sát.
Stock Annual Earn/ Exchange Sales($M) Share($) Dữ liệu, Tập dữ liệu, Phần tử, Biến, và Quan sát Company Dataram EnergySouth Keystone LandCare Psychemedics NQ 73.10 0.86 N 74.00 1.67 N 365.70 0.86 NQ 111.40 0.33 N 17.60 0.13 Biến Tên các phần tử Tập dữ liệu Quan sát
Thang đo Thang đo cho biết cách tóm tắt dữ liệu và phân tích thống kê nào là phù hợp. Thang đo xác định lượng thông tin chứa trong dữ liệu Các loại thang đo: Danh nghĩa Thứ bậc Khoảng Tỷ lệ
Thang đo Danh nghĩa Nhãn ký tự hoặc mã số có thể được sử dụng. Dữ liệu có nhãn hoặc tên được sử dụng để xác định một thuộc tính của phần tử.
Ví dụ: Sinh viên đại học được phân loại theo trường, trong đó chúng ta sử dụng nhãn ký tự như Kinh tế, Nhân văn, Sư phạm… Hoặc mã số được dùng cho biến trường ( ví dụ 1 là Kinh tế, 2 là Nhân Văn, 3 là Sư phạm…) Thang đo Danh nghĩa
Thang đo Thứ bậc Nhãn ký tự hoặc mã số có thể được sử dụng. Dữ liệu thể hiện tính chất của dữ liệu danh nghĩa và thứ tự hoặc xếp hạng của dữ liệu này có ý nghĩa .
Thang đo Thứ bậc Ví dụ: Sinh viên của một trường đại học được phân loại theo niên khóa và chúng ta sử dụng nhãn ký tự như năm nhất, năm 2, năm 3, năm 4 Ngoài ra mã số có thể được dùng cho biến niên khóa học (ví dụ 1 là năm nhất, 2 là năm 2, tương tự).
Thang đo Khoảng Dữ liệu khoảng luôn là dữ liệu số . Dữ liệu có thuộc tính của dữ liệu thức bậc và khoảng cách giữa các giá trị được thể hiện dưới dạng đơn vị đo lường cố định.
Thang đo Khoảng Ví dụ: Melissa có điểm SAT là 1205, Kevin có điểm SAT là 1090. Điểm số của Melissa cao hơn Kevin 115 điểm.
Thang đo Tỷ lệ Dữ liệu có đầy đủ tính chất của dữ liệu khoảng và tỷ lệ giữa 2 giá trị có ý nghĩa. Các biến như khoảng cách, chiều cao, trọng lượng và thời gian đều sử dụng thang đo Tỷ lệ. Thang đo này phải có giá trị 0 chỉ ra rằng không có gì tồn tại trong biến tại điểm 0.
Thang đo Tỷ lệ Ví dụ: Hồ sơ đại học cho biết Melissa tích lũy được 36 tín chỉ, trong khi Kevin tích lũy được 72 credit tín chỉ. Kevin tích lũy được số tín chỉ gấp đôi số tín chỉ của Melissa.
Dữ liệu có thể được phân thành 2 loại là phân loại và định lượng. Dùng phân tích thống kê nào phụ thuộc vào dữ liệu là phân loại hay định lượng. Nói chung, có nhiều lựa chọn phân tích thống kê hơn khi dữ liệu là định lượng. Dữ liệu phân loại và Dữ liệu định lượng
Dữ liệu phân loại Nhãn hay tên được dùng để xác định thuộc tính của mỗi phần tử. Thường được gọi là dữ liệu định tính Thường dùng thang đo danh nghĩa hoặc thứ bậc Có thể là số hoặc không phải là số Phân tích thống kê thường bị hạn chế
Dữ liệu định lượng Dữ liệu định lượng là : rời rạc , nếu là số nguyên liên tục, nếu là số thực Dữ liệu định lượng luôn là số . Những phép tính số học thông thường phù hợp với dữ liệu định lượng.
Thang đo Phân loại Định lượng Số Số Không phải số Dữ liệu Danh nghĩa Thứ bậc Danh nghĩa Thứ bậc Khoảng Tỷ lệ
Dữ liệu thời điểm Dữ liệu thời điểm được thu thập ở cùng hoặc xấp xỉ vào cùng một thời điểm. Ví dụ: Dữ liệu chi tiết số lượng giấy phép xây dựng đã ban bành vào tháng hai năm 2010 của mỗi quận ở Ohio.
Dữ liệu chuỗi thời gian Dữ liệu chuỗi thời gian được thu thập qua nhiều giai đoạn thời gian. Ví dụ : Dữ liệu chi tiết số lượng giấy phép xây dựng được ban hành ở quận Lucas, Ohio trong 36 tháng qua.
Dữ liệu chuỗi thời gian U.S. Average Price Per Gallon For Conventional Regular Gasoline Source: Energy Information Administration, U.S. Department of Energy, May 2009.
Nguồn dữ liệu Nguồn có sẵn Hồ sơ nội bộ công ty – bất kỳ bộ phận nào Dịch vụ dữ liệu kinh doạnh – Dow Jones & Co. Tổ chức chính phủ - Bộ Lao Động Mỹ Hiệp hội ngành – Hiệp hội ngành du lịch nước Mỹ Tổ chức đặc biệt – Ban liên lạc cựu sinh viên Mạng Internet – Rất nhiều công ty
Hồ sơ Một số dữ liệu sẵn có Nguồn dữ liệu Dử liệu sẵn có từ Hồ sơ nội bộ công ty Hồ sơ nhân viên Hồ sơ sản xuất Hồ sơ tồn kho Hồ sơ bán hàng Hồ sơ tín dụng Hồ sơ khách hàng Tên, địa chỉ, số an sinh xã hội Số bộ phận, số lượng sản xuất, chi phí nhân công trực tiếp, chi phí nguyên liệu Số bộ phận, số lượng tồn kho, mức đặt hàng lại, số lượng đơn hàng Số sản phẩm, lượng hàng bán, lượng hàng bán theo vùng. Tên khách hàng, hạn mức tín dụng, khoản phải thu Tuổi, giới tính, thu nhập, số người trong hộ
Cơ quan chính phủ Một số dữ liệu có sẵn Nguồn dữ liệu Dữ liệu có sẵn từ các cơ quan chính phủ Cục Điều tra Dân số Mỹ www.census.gov Cục Dự trữ Liên Bang Mỹ www.federalreserve.gov Cục QL hành chánh và NS www.whitehouse.gov/omb Bô Thương mại Mỹ www.doc.gov Cục Thống kê lao động Mỹ www.bls.gov Số liệu dân số, số hộ gia đình, thu nhập hộ Dữ liệu về cung tiền, tỷ giá hối đoái, lãi suất chiết khấu. Dữ liệu về thu, chi, nợ chính phủ Dữ liệu hoạt động kinh doanh, doanh số, lợi nhuận ngành công nghiệp. Chi tiêu dùng, tỷ lệ thất nghiệp, thu nhập theo giờ, an toàn lao động
Nghiên cứu thống kê – Thử nghiệm Nguồn dữ liệu Trong một nghiên cứu thử nghiệm biến quan tâm được xác định đầu tiên. Sau đó một hoặc nhiều biến khác được xác định và kiểm soát sao cho dữ liệu thu được phản ánh cách chúng ảnh hưởng đến biến quan tâm. Nghiên cứu thử nghiệm lớn nhất từng được thực hiện là cuộc thử nghiệm của dịch vụ y tế công cộng năm 1954 về vắc-xin bại liệt Salk. Gần 2 triệu trẻ em Mỹ (lớp 1 đến lớp 3) đã được chọn.
Nghiên cứu thống kê – Quan sát Nguồn dữ liệu Trong nghiên cứu quan sát (phi thực nghiệm) không cần kiểm soát hay tác động đến biến quan tâm. Khảo sát là một ví dụ điển hình Nghiên cứu về người hút thuốc và không hút thuốc là nghiên cứu quan sát bởi vì nhà nghiên cứu không xác định hoặc kiểm soát ai sẽ hút thuốc ai sẽ không hút thuốc.
Lưu ý khi thu thập dữ liệu Thời gian yêu cầu Chi phí thu thập Dữ liệu lỗi Tìm kiếm thông tin phải tính đến thời gian. Thông tin có thể không mang tính thời sự vì nó có sẵn. Công ty thường phải trả phí cho thông tin ngay cả khi nó không phải là hoạt động kinh doanh chính của họ. Sử dụng bất kỳ dữ liệu có sẵn hay thu thập mà không cẩn thận đều có thể dẫn đến thông tin sai lệch
Thống kê mô tả Hầu hết thông tin thống kê trong báo, tạp chí, báo cáo công ty và các ấn phẩm khác chứa dữ liệu được tổng hợp và trình bày theo một hình thức dễ dàng cho người đọc hiểu Tóm tắt dữ liệu có thể là bảng, đồ họa, hoặc số được gọi là thống kê mô tả .
Ví dụ: Hudson Auto Repair Quản lý của Hudson Auto muốn biết về chi phí của các bộ phân liên quan đến điều chỉnh động cơ được thực hiện trong cửa hàng của cô ấy. Cô ấy kiểm tra 50 hóa đơn của khách hàng có nhu cầu điều chỉnh động cơ. Chi phí của các bộ phận được làm tròn đến đồng đô la và được trình bày ở slide kết tiếp.
Ví dụ: Hudson Auto Repair Ví dụ chi phí các bộ phận (đô la) của 50 khách hàng điều chỉnh động cơ
Bảng tóm tắt: Tần số và Tần suất 50-59 60-69 70-79 80-89 90-99 100-109 2 13 16 7 7 5 50 4 26 32 14 14 10 100 (2/50)100 Chi phí (đô la) Tần số Tần suất % Ví dụ: Hudson Auto
Đồ thị tóm tắt: Histogram 2 4 6 8 10 12 14 16 18 Chi phí (đô la) Tần số 50 − 59 60 − 69 70 − 79 80 − 89 90 − 99 100-110 Chi phí điều chỉnh động cơ Ví dụ: Hudson Auto
Thống kê mô tả số Chi phí trung bình các bộ phận của Hudson, trên khảo sát 50 khách hàng điểu chỉnh động cơ là 79 đô la (lấy tổng của 50 giá trị chi phí chia cho 50 ). Thống kê mô tả bằng số phổ biến là trung bình (average hoặc mean ). Trung bình đo lường khuynh hướng tập trung hoặc vị trí trung tâm của dữ liệu cho một biến
Suy diễn thống kê Tổng thể Mẫu Suy diễn thống kê Điều tra toàn bộ Điều tra mẫu − Tập hợp tất cả phần tử được quan tâm trong một nghiên cứu cụ thể − Là tập con của tổng thể − Là quá trình sử dụng dữ liệu từ một mẫu ước lượng và kiểm định giả thuyết về các đặc tính của một tổng thể thống kê. − Thu thập dữ liệu trong toàn bộ tổng thể − Thu thập dữ liệu cho một mẫu
Các bước suy diễn thống kê 2 . Một mẫu 50 động cơ đã diều chỉnh được kiểm tra Dữ liệu mẫu cho biết chi phí trung bình là 79 đô la một động cơ. 4 . Trung bình mẫu được dùng để ước lượng cho trung bình tổng thể 1 . Tổng thể của tất cả nhu cầu điều chỉnh động cơ. Chi phí trung bình là chưa biết
Máy tính và phân tích thống kê Các nhà thống kê thường sử dụng các phần mềm máy tính để tính toán chỉ tiêu thống kê đối với bộ dữ liệu lớn. Đề thuận lợi cho việc sử dụng máy tính, nhiều bộ dữ liệu nói đến trong cuốn sách này được để trên website. Các tập tin dữ liệu có thể tải về dưới dạng Minitab hoặc Excel . Ngoài ra, công cụ thống kê để thêm vào trong Excel cũng có thể tải về từ Website. Các phụ lục cuối chương hướng dẫn việc sử dụng Minitab, Excel, và các công cụ thống kê.
Kho dữ liệu Các tổ chức thu được dữ liệu lớn hàng ngày bằng các đầu đọc thẻ từ, máy quét mã vạch, các điểm kết nối bán hàng và màn hình cảm ứng. Wal-Mart thu thập dữ liệu được trên 20-30 triệu giao dịch mỗi ngày Visa xử lý 6.800 giao dịch thanh toán mỗi giây. Thu thập, lưu trữ và duy trì dữ liệu, gọi là kho dữ liệu , một công việc có ý nghĩa.
Khai thác dữ liệu Phân tích các dữ liệu trong kho dữ liệu có thể giúp cho việc ra quyết định cho chiến lược mới và mang lại lợi nhuận cao hơn cho tổ chức. Sử dụng kết hợp các thủ tục thống kê, toán học, và kho học máy tính, phân tích “ mỏ dữ liệu ” để chuyển đổi nó thành thông tin hữu ích. Các hệ thống khai thác dữ liệu hiệu quả nhất sử dụng các thủ tục tự động để khám phá các mối quan hệ trong dữ liệu và dự đoán kết quả tương lai,…thông qua những yêu cầu có vẻ là chung chung, thậm chí là mơ hồ bởi người dùng.
Các ứng dụng khai thác dữ liệu Các ứng dụng chính của khai thác dữ liệu đã được thực ở nhiều công ty chủ yếu là ở mảng khách hàng như bán lẻ, tài chính, và truyền thông. Khai thác dữ liệu được sử dụng đề tìm hiểu các sản phẩm liên quan có khả năng mua cùng khi khách hàng mua một sản phẩm cụ thể (và sau đó cửa sổ pop-ups được dùng để thu hút sữ chú ý cho những sản phẩm liên quan) giúp bán được nhiều hàng hơn. Một ví dụ khác, khai thác dữ liệu được sử dụng để xác định khách hàng nào sẽ nhận được những ưu đãi đặc biệt dựa trên lịch sử mua hàng trong quá khứ.
Những yêu cầu khai thác dữ liệu Phương pháp thống kê như hồi quy, hồi quy logistic, tương quan thường được dùng nhiều. Cũng cần đến khoa học máy tính liên quan đến trí tuệ nhân tạo và học máy. Một sự đầu tư đáng kể về thời gian và tiền bạc là xứng đáng.
Mô hình khai thác dự liệu đáng tin cậy Tìm được một mô hình thống kê hiệu quả cho một mẫu dữ liệu cụ thể không nhất thiết nó sẽ phù hợp, đáng tin cậy khi áp dụng cho bộ dữ liệu khác. Với lượng dữ liệu lớn có sẵn, có thể chia dữ liệu thành hai tập con, một tập dữ liệu thực hiện ( để xây dựng mô hình) và một tập dữ liệu kiểm tra (để kiểm tra lại mô hình) Tuy nhiên thật nguy hiểm khi dùng mô hình bám thật sát các điểm dữ liệu có thể dẫn đến gợi ý sai mối liên hệ Giải thích cẩn thận kết quả và thử nghiệm rộng rãi là rất quan trọng.
Nguyên tắc đạo đức trong thực hànhthống kê Trong nghiên cứu thống kê, hành vi vi phạm đạo đức bao gồm: Lấy mẫu không đúng Các phân tích không phù hợp với dữ liệu Xây dựng đồ thị gây hiểu lầm Sử dụng số liệu tóm tắt thống kê không phù hợp. Giải thích sai lệch kết quả thống kê Bạn phải luôn cố gắng công bằng, toàn diện, khách quan và trung lập khi thu thập, phân tích và trình bày dữ liệu. Là một người dùng số liệu bạn nên lưu ý những hành vi vi phạm đạo đức của những người khác.
Nguyên tắc đạo đức trong thực hànhthống kê Hiệp hội thống kê Mỹ phát hành báo cáo “Nguyên tắc đạo đức trong thực hành thống kê”. Tính chuyên nghiệp Trách nhiệm nhà tài trợ, khách hàng, nhà tuyển dụng lao động Trách nhiệm trong các ấn phẩm và các bằng chứng Trách nhiệm của đối tượng nghiện cứu Trách nhiệm của các nhóm nghiên cứu. Báo cáo gồm 67 nguyên tắc chia thành 8 lĩnh vực: Trách nhiệm của các nhà thống kê/học viên Trách nhiệm tố giác các hành vi sai trái Trách nhiệm của nhà tuyền dụng bao gồm: Tổ chức, cá nhân, luật sư, khách hàng