Khoảng tin cậy Wilson
Hàm wilsonScoreLowerBound()
tính giá trị biên dưới của khoảng tin cậy Wilson cho một tỷ lệ thành công trong thống kê, thường được dùng để đánh giá xếp hạng hoặc xác suất với độ tin cậy cao mà không bị nhiễu bởi kích thước mẫu nhỏ.
✅ Mục đích:
- Tính một ước lượng thấp nhất đáng tin cậy cho tỷ lệ thành công với mức tin cậy (ví dụ 95%).
- Dùng trong: đánh giá sản phẩm, tỷ lệ bán hàng, xếp hạng (ranking), A/B testing, v.v.
📐 Giải thích toán học
1. Định nghĩa biến
- : số lần thành công (successes)
- : tổng số thử nghiệm (total trials)
- : tỷ lệ thành công quan sát được
- : giá trị Z tương ứng với mức độ tin cậy (95% → 1.96, 90% → 1.645)
2. Công thức toán học đầy đủ của Wilson Score Interval:
Đây là công thức khoảng tin cậy Wilson:
- : cho phép tính cả biên dưới và biên trên
- Trong hàm này, ta chỉ tính biên dưới (lower bound)
3. Diễn giải từng phần:
Thành phần | Diễn giải |
---|---|
Tỷ lệ thành công quan sát | |
Z-score cho mức tin cậy | |
Điều chỉnh trung tâm (center correction) | |
Biên sai số (margin of error) | |
Mẫu số | Chuẩn hóa khoảng giá trị |
4. Mã PHP tương ứng:
$p = $s / $n; // Tỷ lệ quan sát
$z2 = $z * $z; // z^2
$denominator = 1 + ($z2 / $n); // Mẫu số
$center = $p + $z2 / (2 * $n); // Tâm hiệu chỉnh
$margin = $z * sqrt(($p * (1 - $p) + $z2 / (4 * $n)) / $n); // Sai số
$score = ($center - $margin) / $denominator; // Biên dưới
📊 Ví dụ minh họa
Giả sử:
- ,
- (95%)
Tính:
→ Dù bạn thấy tỉ lệ là 50%, Wilson chỉ ước lượng thấp hơn (23.6%) để phòng trường hợp bị overfitting (mẫu nhỏ quá).
📌 So sánh với các cách khác
Phương pháp | Mô tả | Nhược điểm |
---|---|---|
Tỷ lệ thông thường | Quá nhạy cảm nếu mẫu nhỏ | |
Laplace smoothing | Không điều chỉnh theo độ tin cậy | |
Wilson Score ✅ | Làm mượt theo xác suất thống kê | Phức tạp hơn |
✅ Khi nào dùng Wilson Score?
-
Khi bạn muốn:
- Đánh giá tỷ lệ thành công với mức tin cậy cao.
- So sánh ranking công bằng giữa các nhóm có mẫu nhỏ/lớn khác nhau.
- Tránh bias do “ít dữ liệu mà tỷ lệ cao”.
Ví dụ:
- Sản phẩm A: bán được 1/1 → 100% (nhưng mẫu nhỏ)
- Sản phẩm B: bán được 20/40 → 50% → Wilson sẽ "phạt" sản phẩm A do độ tin cậy thấp.
All rights reserved