CFA Level I – Module 7: Estimation and Inference - Dịch vụ kế toán thuế tại Hà Nội

Ước lượng, suy luận thống kê và nền tảng ra quyết định trong tài chính

Trong chương trình CFA Level I – Quantitative Methods, Module 7: Estimation and Inference đóng vai trò then chốt trong việc giúp thí sinh hiểu cách suy luận về tổng thể dựa trên dữ liệu mẫu. Đây là nền tảng cho mọi quyết định tài chính dựa trên dữ liệu, từ phân tích thị trường, định giá tài sản đến quản trị rủi ro.

Module này tập trung vào ba nội dung lớn: phương pháp chọn mẫu, định lý giới hạn trung tâm & sai số chuẩn, và ước lượng tham số tổng thể.

1. Phương pháp chọn mẫu trong thống kê (LOS 7.a)

Trong thực tế, việc thu thập dữ liệu toàn bộ tổng thể là rất khó khăn. Do đó, các nhà phân tích thường phải sử dụng chọn mẫu (sampling). Có hai nhóm phương pháp chính:

Lấy mẫu xác suất (Probability Sampling)
Lấy mẫu phi xác suất (Non-probability Sampling)

1.1. Lấy mẫu xác suất (Probability Sampling)

Đặc điểm chung của phương pháp này là mỗi phần tử trong tổng thể đều có xác suất được chọn vào mẫu, giúp kết quả mang tính đại diện cao.

Các phương pháp phổ biến gồm:

Simple Random Sampling
Mẫu được chọn hoàn toàn ngẫu nhiên, mọi quan sát có xác suất như nhau.
Systematic Sampling
Chọn các quan sát theo chu kỳ cố định (mỗi quan sát thứ k).
Stratified Random Sampling
Tổng thể được chia thành các nhóm (strata) theo đặc điểm chung, sau đó lấy mẫu ngẫu nhiên trong từng nhóm theo tỷ trọng.
Cluster Sampling
Tổng thể được chia thành các cụm (cluster), sau đó chọn ngẫu nhiên một số cụm và lấy dữ liệu trong các cụm này.

👉 Trong CFA, stratified sampling thường được đánh giá cao vì giúp giảm sai số lấy mẫu.

1.2. Lấy mẫu phi xác suất (Non-probability Sampling)

Khác với lấy mẫu xác suất, phương pháp này không đảm bảo tính đại diện thống kê, nhưng thường được sử dụng khi dữ liệu bị hạn chế.

Convenience Sampling
Lựa chọn mẫu dựa trên tính dễ tiếp cận hoặc dữ liệu sẵn có.
Judgmental Sampling
Dựa trên kinh nghiệm và đánh giá chủ quan của người nghiên cứu.

👉 Các phương pháp này ít được ưu tiên trong CFA vì dễ gây thiên lệch.

2. Sai số lấy mẫu và Định lý giới hạn trung tâm (LOS 7.b)

2.1. Sai số lấy mẫu (Sampling Error)

Sai số lấy mẫu là sự khác biệt giữa thống kê mẫu và tham số tổng thể.

Ví dụ với trung bình:

Sampling error of the mean = X̄ − μ

Sai số này là điều không thể tránh khỏi khi làm việc với dữ liệu mẫu.

2.2. Định lý giới hạn trung tâm (Central Limit Theorem – CLT)

Định lý giới hạn trung tâm là một trong những khái niệm quan trọng nhất trong thống kê và CFA.

Phát biểu chính:

Khi cỡ mẫu đủ lớn (n ≥ 30), phân phối của trung bình mẫu sẽ xấp xỉ phân phối chuẩn, bất kể phân phối gốc của tổng thể.

Các hệ quả quan trọng:

Mean của sampling distribution = μ (trung bình tổng thể)
Variance của sampling distribution = σ² / n

👉 CLT là lý do vì sao Z-test và T-test được sử dụng rộng rãi trong tài chính.

2.3. Sai số chuẩn của trung bình mẫu

Sai số chuẩn (Standard Error) là:

Độ lệch chuẩn của phân phối các trung bình mẫu

Khi biết độ lệch chuẩn tổng thể:
SE = σ / √n
Khi không biết độ lệch chuẩn tổng thể:
SE = s / √n

Sai số chuẩn càng nhỏ → ước lượng càng chính xác.

3. Ước lượng tham số tổng thể (Pre.i & Pre.ii)

3.1. Ước lượng điểm và ước lượng khoảng

Ước lượng điểm (Point Estimate): cho ra một giá trị duy nhất
Ước lượng khoảng (Confidence Interval): cho ra một khoảng giá trị có độ tin cậy xác định

Khoảng tin cậy (Confidence Interval) được định nghĩa là:

Một khoảng giá trị bao quanh ước lượng điểm, với xác suất 100(1 − α)% chứa giá trị thực của tham số tổng thể.

3.2. Lựa chọn thống kê kiểm định (Test Statistic)

Việc chọn Z-statistic hay T-statistic phụ thuộc vào:

Cỡ mẫu
Phân phối tổng thể
Việc có biết phương sai tổng thể hay không

Trong CFA Level I:

Z-statistic: dùng cho mẫu lớn hoặc khi biết phương sai
T-statistic: dùng khi không biết phương sai tổng thể

4. Tái chọn mẫu – Resampling Methods (LOS 7.c)

Tái chọn mẫu là kỹ thuật tính toán lặp lại từ mẫu ban đầu để suy luận thống kê.

Hai phương pháp chính:

Bootstrap
Lấy mẫu có hoàn lại nhiều lần để ước lượng sai số chuẩn và khoảng tin cậy.
Jackknife
Loại bỏ từng quan sát một để kiểm tra độ ổn định của thống kê.

👉 Đây là công cụ quan trọng trong phân tích dữ liệu hiện đại và quản trị rủi ro.