Note for probability | Schemes and Mind Maps Mathematical finance

NOTE 2

Thống kê suy luận

Tuần gần nhất, chúng ta đã học về thống kê mô tả (descriptive statistics) bao gồm các bước mô tả

(describe) và tóm tắt (summerize) dữ liệu quan sát (observed data) trong thực tế. Nội dung sắp tới chúng

ta sẽ học về thống kê suy luận/ suy luận thống kê (inferential statistics/ statistical inference).

Thống kê suy luận (inferential statistics) là quá trình suy luận và nhận định về các đặc điểm (properties)

của tổng thể thống kê (statistical population) từ dữ liệu quan sát. Dữ liệu quan sát được gọi là một mẫu (a

sample) thu thập từ tổng thể thống kê. Tại sao việc này cần thiết?

Trong hầu hết các trường hợp trong thực tế, người nghiên cứu không thể thu thập được toàn bộ tổng thể

thống kê. Ví dụ, khi điều tra về dữ liệu sinh học, như chiều cao hoặc cân nặng, cho tổng thể gần 100 triệu

dân Việt Nam là không khả thi, bởi lý do tài chính và quy mô. Nhà nghiên cứu chỉ có thể thu thập một

mẫu nhất định, từ vài nghìn đến vài chục nghìn người, và từ đó suy luận về toàn bộ dân số.

Tương tự, trong một dây chuyền sản xuất đồ uống đóng chai, người vận hành muốn kiểm tra xem lượng

đồ uống trong chai có đúng như thể tích định sẵn (ví dụ 250ml với sai số 2%). Việc kiểm tra toàn bộ chai

trên dây chuyền là bất khả thi; thay vào đó, họ chỉ có thể chọn một mẫu ngẫu nhiên nhất định để kiểm tra,

đảm bảo cân bằng giữa tài chính và yêu cầu kiểm soát chất lượng.

Phương pháp thống kê suy luận

Thống kê suy luận bắt đầu bằng việc trừu tượng hóa dữ liệu quan sát thông qua lý thuyết xác suất. Sự trừu

tượng hóa này giúp chúng ta có thể liên kết được từ dữ liệu quan sát tới tổng thể cần nghiên cứu.

Giả sử chúng ta có một mẫu quan sát chiều cao nam thanh niên Việt Nam có cỡ mẫu là

n=5

. Cỡ mẫu này

yêu cầu chúng ta thiệt lập một mẫu ngẫu nhiên (a random sample) mang tính trừu tượng bao gồm 5 biến

ngẫu nhiên (five random variables):

X1, X2, X 3, X 4, X5

Năm biến ngẫu nhiên được giả định là độc lập và đồng nhất phân phối (five variables are assumed to be

independent and identical distributed - IID). Giả định đồng nhất phân phối nhằm đảm bảo 5 biến

Xi(i=1,2…5)

ĐỀU đến từ phân phối của tổng thể, ví dụ như phân phối chuẩn

N(μ , σ 2)

Giả định độc lập phân phối nhằm đảm bảo (một phần) tính ngẫu nhiên của mẫu. Tính ngẫu nhiên có nghĩa

là các biến ngẫu nhiên này không thuộc vào một nhóm con nhất định của tổng thể, chẳng hạn như nhóm

người người chơi bóng rổ hay nhóm người chậm phát triển sinh học. Đây còn gọi là mẫu đại diện

(representative) cho tổng thể. Về mặt toán học, xác suất xảy ra từng số đo chiều cao của

không liên

quan đến xác suất xảy từng số đo chiều cao của

X2,

mang ý nghĩa là

và

không hề có mối quan hệ

nào, nên không thuộc cùng một nhóm con nào trong tổng thể.

Với cỡ mẫu

n=5

, chúng ta có thể thể hiện về mặt toán học cho mẫu ngẫu nhiên gồm 5 biến ngẫu nhiên

IID như sau:

XiN

(

μ , σ 2

)

,i=1,2…5

X1, X2, X 3, X 4, X5độclập từng đôi một

Ở đây,

(

μ , σ2

)

là phân phối của tổng thể. Hai tham số

và

σ2

là những đặc điểm không biết (ẩn số)

(unknown parameters of the population distribution) mà chúng ta cần đi điều tra từ dữ liệu quan sát. Cần

Note for probability, Schemes and Mind Maps of Mathematical finance

Related documents

Partial preview of the text

Download Note for probability and more Schemes and Mind Maps Mathematical finance in PDF only on Docsity!

NOTE 2

X

, X

, X

, X

, X

X

X

X

X

X

X

N

X

, X

, X

, X

, X

N ( μ , σ

X

, X

, X

, X

, X

X

, X

, X

, X

, X

X

N ( μ , σ

X

N

) (nó giống như

X

X

X

X

X

X

, X

, X

, X

, X

X

, X

, X

, X

, X

X

, X

, X

, X

, X

, X

, X

, X

, X

, X

, X

, X

, X

X =

X

S

X

− X