Docsity
Docsity

Prepare for your exams
Prepare for your exams

Study with the several resources on Docsity


Earn points to download
Earn points to download

Earn points by helping other students or get them with a premium plan


Guidelines and tips
Guidelines and tips

file học xác suất thống kê, Schemes and Mind Maps of Commercial Law

học xác suất khiến bạn giỏi hơn

Typology: Schemes and Mind Maps

2023/2024

Uploaded on 04/18/2024

chi-nguyen-73
chi-nguyen-73 🇻🇳

2 documents

1 / 9

Toggle sidebar

This page cannot be seen from the preview

Don't miss anything!

bg1
BÀI TẬP XÁC SUẤT THỐNG KÊ ỨNG DỤNG
TUẦN 1:
-Nội dung 1: Tải, cài đặt R và R Studio
-Nội dung 2: Link video
Tóm tắt: Làm quen với giao diện R Studio.
-Nội dung 3: Link video
Tóm tắt: Nhập dữ liệu trực tiếp: Hàm c(); Hàm scan(); Hàm data.frame() ghép các vector
thành data.
Bài tập:
1. Nhập vào R dãy số sau: 3, - 3, 7, 9, 15, 21, -5.
2. Nhập vào R biến KhuVuc như sau: Bac, Trung, Bac, Nam, Trung, Nam, Bac
3. Scan dãy số sau vào R: 2 3 6 2 -1 7 5 90 21 32 57 24
-Nội dung 4: Link video
Tóm tắt: Nhập dữ liệu từ File: Đổi thư mục, Đọc các loại file txt, csv, rda, xls; Hàm
getwd(); Hàm save() lưu dữ liệu.
Chú ý:
- Trong R ta không sửa lại được các lệnh đã gõ, nhưng có thể lấy lại những lệnh đó để
chỉnh sửa rồi chạy lại. Ta dùng phím mũi tên ↑ hoặc ↓ trên bàn phím để lấy lại các lệnh
đã gõ phía trước (mỗi lần nhấn phím này sẽ duyệt lại lần lượt lệnh phía trên hoặc lệnh
phía dưới, có thể nhấn nhiều lần), chỉnh sửa lệnh rồi nhấn Enter để chạy lại lệnh.
- Trong cửa sổ Environment (cửa sổ thứ 4) có hiển thị tên các dữ liệu hiện có trong R. Dữ
liệu chia làm 2 loại:
Values liệt kê các véc tơ dữ liệu (một biến hay chính là một dãy số liệu);
Data liệt kê các bảng dữ liệu (một bảng có nhiều dòng và nhiều cột). Chú ý ta có
thể bấm vào tên data để xem trước dữ liệu, còn đối với dữ liệu véc tơ (ở mục
Values) thì không thể xem trước giống như thế. Muốn xem dữ liệu ta gõ tên dữ liệu
vào cửa số Console (cửa sổ thứ 2) rồi Enter để hiển thị dữ liệu.
- Trong trường hợp tên file rda không trùng với tên của dữ liệu trong R, ta không biết dữ
liệu mới lấy vào là dữ liệu nào, cũng không muốn xóa các file dữ liệu đang có, thì ta làm
như sau để tìm tên dữ liệu:
+ Lấy file rda vào R như bình thường, khi đó cửa sổ gõ lệnh sẽ tự động xuất hiện
lệnh như sau
load("C:/BoMonToan/XacSuatThongKe/DuLieuThucHanh_XSTK/
HocSinh.rda")
pf3
pf4
pf5
pf8
pf9

Partial preview of the text

Download file học xác suất thống kê and more Schemes and Mind Maps Commercial Law in PDF only on Docsity!

BÀI TẬP XÁC SUẤT THỐNG KÊ ỨNG DỤNG

TUẦN 1:

  • Nội dung 1: Tải, cài đặt R và R Studio
  • Nội dung 2: Link video Tóm tắt: Làm quen với giao diện R Studio.
  • Nội dung 3: Link video Tóm tắt: Nhập dữ liệu trực tiếp: Hàm c(); Hàm scan(); Hàm data.frame() ghép các vector thành data. Bài tập:
  1. Nhập vào R dãy số sau: 3, - 3, 7, 9, 15, 21, -5.
  2. Nhập vào R biến KhuVuc như sau: Bac, Trung, Bac, Nam, Trung, Nam, Bac
  3. Scan dãy số sau vào R: 2 3 6 2 -1 7 5 90 21 32 57 24
  • Nội dung 4: Link video Tóm tắt: Nhập dữ liệu từ File: Đổi thư mục, Đọc các loại file txt, csv, rda, xls; Hàm getwd(); Hàm save() lưu dữ liệu. Chú ý:
  • Trong R ta không sửa lại được các lệnh đã gõ, nhưng có thể lấy lại những lệnh đó để chỉnh sửa rồi chạy lại. Ta dùng phím mũi tên ↑ hoặc ↓ trên bàn phím để lấy lại các lệnh đã gõ phía trước (mỗi lần nhấn phím này sẽ duyệt lại lần lượt lệnh phía trên hoặc lệnh phía dưới, có thể nhấn nhiều lần), chỉnh sửa lệnh rồi nhấn Enter để chạy lại lệnh.
  • Trong cửa sổ Environment (cửa sổ thứ 4) có hiển thị tên các dữ liệu hiện có trong R. Dữ liệu chia làm 2 loại:  Values liệt kê các véc tơ dữ liệu (một biến hay chính là một dãy số liệu);  Data liệt kê các bảng dữ liệu (một bảng có nhiều dòng và nhiều cột). Chú ý ta có thể bấm vào tên data để xem trước dữ liệu, còn đối với dữ liệu véc tơ (ở mục Values) thì không thể xem trước giống như thế. Muốn xem dữ liệu ta gõ tên dữ liệu vào cửa số Console (cửa sổ thứ 2) rồi Enter để hiển thị dữ liệu.
  • Trong trường hợp tên file rda không trùng với tên của dữ liệu trong R, ta không biết dữ liệu mới lấy vào là dữ liệu nào, cũng không muốn xóa các file dữ liệu đang có, thì ta làm như sau để tìm tên dữ liệu: + Lấy file rda vào R như bình thường, khi đó cửa sổ gõ lệnh sẽ tự động xuất hiện lệnh như sau load("C:/BoMonToan/XacSuatThongKe/DuLieuThucHanh_XSTK/ HocSinh.rda")
  • Nhấn phím mũi tên (↑) trên bàn phím để lấy lại lệnh load dữ liệu ở trên, sau đó đưa con trỏ về đầu dòng lệnh và đặt tên cho lệnh này, chẳng hạn đặt tên lệnh này là a như bên dưới, sau đó gõ phím Enter

a = load("C:/BoMonToan/XacSuatThongKe/DuLieuThucHanh_XSTK/HocSinh.rd a")

  • Gõ a rồi nhấn phím Enter ta được kết quả như sau:

a [1] "DL" Như vậy tên file rda là HocSinh.rda, còn tên dữ liệu trong R là DL. Các em gõ DL rồi Enter sẽ ra dữ liệu, còn nếu gõ HocSinh rồi Enter sẽ bị báo lỗi “not found”.

  • Đối với các loại file xls, xlsx, csv (file txt không được) ta còn một cách Import tiện lợi hơn, đó là trong cửa sổ Files (cửa sổ thứ 3), ta bấm trực tiếp vào tên file. Chẳng hạn khi bấm vào file HamLuongAlbumin.xls sẽ xuất hiện các lựa chọn như sau Ta bấm vào Import Dataset để lấy dữ liệu vào R. Nội dung 5 : Dùng lệnh read.table và read.csv để lấy dữ liệu Trong một số trường hợp (R hoặc các gói lệnh cần update chẳng hạn), các thao tác import dữ liệu từ các file dạng xls, xlsx, txt, csv có thể bị lỗi. Trong trường hợp đó ta lấy dữ liệu như sau: Bước 1: Chuyển đến thư mục chứa dữ liệu (Vào Session → chọn Set Working Directory → chọn Choose Directory → chọn đến thưc mục chứa dữ liệu → chọn Open) Bước 2: Đọc dữ liệu
  • Đối với file txt, chẳng hạn file txt có tên là Data1.txt ta dùng lệnh sau:

DuLieu=read.table(‘Data1.txt’, header = T) Khi đó sẽ xuất hiện một object có tên là DuLieu trong R. Đó chính là dữ liệu ta mới lấy vào.

  • Đối với file csv, chẳng hạn file csv có tên là Data2.csv ta dùng lệnh sau:

DuLieu = read.csv(‘Data2.csv’, header = T)

Khi đó ta không thể lấy ra 2 cột GioiTinh, Tuoi của bảng DL nếu chỉ gõ GioiTinh hoặc Tuoi rồi Enter. Ta có 2 cách xử lý việc này như sau: Cách 1: Dùng $, chẳng hạn gõ DL$Tuoi rồi Enter để lấy ra cột Tuoi của bảng DL Cách 2: Xóa 2 véc tơ bị trùng tên trong phần Values (trong cửa sổ thứ 4 của Rstudio) đi bằng lệnh sau:

rm(GioiTinh,Tuoi) hoặc > remove(GioiTinh,Tuoi) Hai lệnh này chỉ xóa các véc tơ bị trùng tên chứ không xóa hết dữ liệu như khi ta bấm vào hình chiếc chổi trong cửa sổ thứ 4. Nội dung 8: Link video Tóm tắt: Lọc dữ liệu vector, data frame, dùng subset(). Bài tập: Làm quiz W1-ND TUẦN 2: Nội dung 1: Link video Tóm tắt: Dùng hàm sum() đếm số quan sát thỏa mãn điều kiện; Dùng [] lọc dữ liệu từ data frame theo chỉ số dòng; Lệnh dim() và head() Bài tập : Làm quiz W2-ND Nội dung 2: Link video Tóm tắt: Bảng tần số một chiều; Hàm table(), prop.table(), cumsum(), phân tổ dữ liệu bằng hàm cut(). Một số chú ý đối với nội dung phân tổ:

  1. Phân tổ đều: để khai báo cho tham số break ta dùng dùng hàm seq
  2. Phân tổ không đều
    • Các tổ cùng có dạng [,) hoặc cùng có dạng (,]  Dùng hàm cut, tham số break phải tự nhập  Dùng tham số right để quy định các tổ có dạng (,] hoặc có dạng [,):  right = T (giá trị mặc định): các tổ có dạng (,]  right = F: các tổ có dạng [,) Ví dụ 1: Phân tổ cho ChiSoIQ (file ChiSoIQ.rda) với các tổ là: <100, [100,130), [130,135), >= Giải: Ở VD này, các điểm chia là: 56, 100, 130, 135, 136 => Lệnh như sau: pt1=cut(ChiSoIQ,breaks = c(56,100,130,135,136),right = F,include.lowest = F)
    • Trong trường hợp các tổ không cùng dạng [,) hoặc cùng dạng (,] => Không dùng được hàm cut nữa Ví dụ 2: Phân tổ cho ChiSoIQ (file ChiSoIQ.rda) với các tổ là: <100, [100,130], > => Các tổ phải là: [56,100), [100,130], (130,136] (nhớ rằng min = 56, max = 136) Khi đó ta phải dùng lệnh như sau: pt2 = c() # tạo ra một véc tơ rỗng pt2[ChiSoIQ<100]=1 # Ở những chỗ nào chỉ số IQ < 100 thì pt2 nhận giá trị 1 pt2[ChiSoIQ>=100&ChiSoIQ<=130]=2 # tương tự pt2[ChiSoIQ>130]=3 # tương tự table(pt2) # tính tần số sau khi phân tổ Bài tập: Làm quiz W2-ND Nội dung 3: Link video Tóm tắt: Hàm table(,); Hàm prop.table() với tham số margin: Bài tập : Làm quiz W3-ND TUẦN 3: Nội dung 1: Link video Tóm tắt: Biểu đồ thanh, biểu đồ tròn cho cả dữ liệu thứ cấp và sơ cấp (Dữ liệu dùng thực hành DieuTraDienThoai.xls). Bài tập : Làm quiz W3-ND Nội dung 2: Link video Tóm tắt: Biểu đồ phân phối tần số Histogram; Đa giác tần số (dữ liệu dùng thực hành DieuTraDienThoai.xls). Bài tập : Làm quiz W3-ND Nội dung 3: Link video Tóm tắt: Biểu đồ thân và lá Bài tập : Làm quiz W3-ND

b. Một bạn hs phải đạt tối thiểu bao nhiêu điểm để thuộc vào top 5% những bạn có điểm thi SAT cao nhất? c. Chọn ngẫu nhiên 5 học sinh cuối PTTH đã dự thi SAT. Xác suất để cả 5 bạn đều có điểm thi dưới 600 là bao nhiêu? Giải Goi X là BNN chỉ điểm thi SAT của một thí sinh => X ~ N(500, 100^2 ) c. Gọi Y là BNN chỉ số học sinh có điểm thi dưới 600 trong số 5 học sinh được chọn. Tính P(Y = 5) Y tuân theo phân phối nhị thức:

  • Chọn ngẫu nhiên 5 hs => Thực hiện phép thử: Chọn ngẫu nhiên 1 hs 5 lần
  • Mỗi lần thử cho ra 1 trong 2 kq: hs được chọn có điểm SAT < 600 hoặc >= 600
  • XS để chọn được hs có điểm thi dưới 600 trong 1 lần thử nghiệm là bằng nhau và bằng P(X<600) = 0.
  • KQ của các lần thử là độc lập ⇨ Y ~ B(n=5, p=0.84) ⇨ P(Y=5) = dbinom(5, 5, 0.84) = 0. TUẦN 6:
  • Nội dung 1: ULD, ULK cho trung bình tổng thể: https://youtu.be/Y-qsOazfipw Bài tập: Làm quiz W6-ND
  • Nội dung 2: ULK cho Tỉ lệ (số liệu cho trước): https://youtu.be/0SX9a5PmF Bài tập: Làm quiz W6-ND
  • Nội dung 3: ULK cho Tỉ lệ (xử lý số liệu): https://youtu.be/ddvrq-foR8w Bài tập: Làm quiz W6-ND
  • Nội dung 4: Kiểm định 1 TB (ko cần XL số liệu): https://youtu.be/g8Qqcsm2tVw Bài tập: Làm quiz W6-ND
  • Nội dung 5: Kiểm định 1 TL (ko cần XLSL): https://youtu.be/mQksLUw5tOA Bài tập: Làm quiz W6-ND
  • Nội dung 6: Kiểm định 1 TB (cần XLSL): https://youtu.be/-_ZrVsHcIsk Bài tập: Làm quiz W6-ND
  • Nội dung 7: Kiểm định 1 TL (cần XLSL): https://youtu.be/E-h27mha6oU Bài tập: Làm quiz W6-ND TUẦN 7:
  • Nội dung 1: KĐ 2 TB, mẫu độc lập, phương sai khác nhau: https://youtu.be/hBnEYfYU5Rg Bài tập: Làm quiz W7-ND
  • Nội dung 2: Kiểm định 2 TB, mẫu theo cặp: https://youtu.be/QQ1eMZ5Tpbw Bài tập: Làm quiz W7-ND
  • Nội dung 3: Kiểm định 2 Tỉ lệ: https://youtu.be/htIk4201q7Y Bài tập: Làm quiz W7-ND
  • Nội dung 4: Kiểm định 2 PS: https://youtu.be/F673JTn8RNI Bài tập: Làm quiz W7-ND TUẦN 8:
  • Nội dung 1: PTPS (nhập dữ liệu trực tiếp) : https://youtu.be/HNfGy5yn7e Bài tập: Làm quiz W8-ND
  • Nội dung 2: PT sâu (nhập dữ liệu trực tiếp): https://youtu.be/lqJL_OtsO1s Bài tập: Làm quiz W8-ND
  • Nội dung 3: PTPS (dữ liệu dạng data.frame cho trước) – đọc hướng dẫn thực hành bên dưới Ví dụ: Dùng dữ liệu SoLieu.csv hãy kiểm định giả thuyết: Thu nhập trung bình của người dân ở cac khu vực khác nhau là bằng nhau. Dùng mức ý nghĩa 5%. Giả thiết các tổng thể tuân theo phân phối chuẩn và có phương sai bằng nhau. Giải: Trước tiên ta phải xem có tất cả bao nhiêu tổng thể. Ta lấy dữ liệu SoLieu.csv vào R và dùng lệnh Ta thấy có tất cả 4 khu vực. Vậy ta đặt bài toán như sau: Giải: Gọi m1, m2, m3, m4 lần lượt là thu nhập trung bình của người dân ở các khu vực Hải đảo, Miền núi, Nông thôn, Thành phố H0: m1 = m2 = m3 = m H1: Tồn tại i, j; 1 ≤ i , j ≤ 4; i ≠ j sao cho mi ≠ mj Trong tập dữ liệu SoLieu đã có sẵn mẫu gộp của 4 mẫu, đó chính là cột ThuNhap. Ta cũng có luôn vector phân nhóm, đó chính là cột KhuVuc. Vậy ta tìm p-giá trị như sau: