Confidence Interval là gì
Confidence interval có nghĩa là khoảng tin cậy, là khoảng ước tính của một tham số tổng thể được xây dựng từ thống kê mẫu.
Trong thống kê, khoảng tin cậy của mẫu xác suất là khoảng ước lượng của một tham số tổng thể của mẫu. Khoảng tin cậy cho biết mức độ mà giá trị thực của tham số này có một xác suất nhất định rơi vào xung quanh kết quả đo, cung cấp cho mức độ tin cậy của giá trị đo của tham số được đo, tức là “một xác suất” được yêu cầu ở trên.
Lý thuyết khoảng tin cậy
Khoảng tin cậy là một phương pháp ước lượng khoảng thường được sử dụng. Cái gọi là khoảng tin cậy là một khoảng bao gồm các giới hạn tin cậy trên và dưới của thống kê. Đối với một tập dữ liệu mẫu nhất định, giá trị trung bình là μ và độ lệch chuẩn là σ, khi đó khoảng tin cậy 100 (1-α)% cho giá trị trung bình của dữ liệu tổng thể là (μ-Zα / 2σ, μ + Zα / 2σ ), trong đó α là vùng bao phủ của mức độ không tin cậy trong phân phối chuẩn và Zα / 2 là điểm tiêu chuẩn tương ứng.
Đối với một tập dữ liệu nhất định, được xác định là đối tượng quan sát, W là tất cả các quan sát có thể có, X là giá trị quan sát thực tế, khi đó X thực sự là một biến ngẫu nhiên được xác định trên và phạm vi giá trị trên W. Tại thời điểm này, định nghĩa của khoảng tin cậy là một cặp hàm u (.) Và v (.), Nghĩa là, đối với một quan sát X =, khoảng tin cậy là. Trên thực tế, nếu giá trị thực là w, thì mức độ tin cậy là xác suất c:
c = Pr(u(X) < w < v(X))
trong đó U = u (X) và V = v (X) đều là thống kê (biến ngẫu nhiên có thể quan sát được) và khoảng tin cậy do đó cũng là khoảng ngẫu nhiên: (U, V)
Thế nào là khoảng tin cậy đối xứng
Trung bình của mẫu ngẫu nhiên trong biểu thức tính khoảng cách tin cậy nhận giá trị sai lệch so với giá trị tuyệt đối nhỏ hơn được gọi là khoảng tin cậy đối xứng.
Khoảng cách tin cậy 95% là gì
Khoảng cách tin cậy có một mức độ tin cậy liên quan, thông thường 95% là mức độ tin cậy được sử dụng nhiều nhất.
Độ tin cậy là gì
Độ tin cậy hay còn gọi là mức độ tin cậy, hoặc gọi là mức ý nghĩa thống kê (Statistical significance), dùng để chỉ mức rủi ro mà giả thuyết rỗng phải bị bác bỏ nếu giả thuyết rỗng là đúng, còn được gọi là mức xác suất, hoặc mức ý nghĩa.
Hệ số góc là gì
Hệ số góc còn được gọi là độ dốc, à tiếp tuyến của một đường thẳng với góc dương của trục abscissa, phản ánh độ nghiêng của đường thẳng đối với mặt phẳng nằm ngang. Tiếp tuyến của góc tạo bởi một đường thẳng và hướng của nửa trục dương của trục abscissa của một hệ tọa độ hình chữ nhật phẳng là hệ số góc của đường thẳng so với hệ tọa độ.
Nếu đường thẳng và trục x vuông góc với nhau thì tiếp tuyến của góc vuông là tan90 °, do đó đường thẳng không có hệ số góc (cũng có thể nói rằng hệ số góc của đường thẳng là vô hạn). Khi tồn tại hệ số góc của đường thẳng L, đối với một hàm tuyến tính y = kx + b (hệ số góc), k là hệ số góc ảnh của hàm số.
Công thức hệ số góc
Khi hệ số góc của đường thẳng L tồn tại công thức hệ xiên y = kx + b. Khi x = 0 thì y = b.
Khi hệ số góc của đường thẳng L tồn tại thì công thức hệ số góc y2-y1 = k (x2-x1).
Đối với bất kỳ điểm nào trên bất kỳ hàm số nào, hệ số góc của nó bằng tang của góc tạo bởi tiếp tuyến của nó và chiều dương của trục x, tức là k = tanα.
Tính hệ số góc: đường thẳng ax + by + c = 0, hệ số góc k = -a / b.
Đặt đường thẳng y = kx + b (k ≠ 0) thì ta có
1. Tích hệ số góc của hai đường thẳng chéo nhau vuông góc là -1: k1 x k2 = -1;
2. Hệ số góc của hai đường thẳng song song bằng nhau: k1 = k2
Cách tính khoảng cách tin cậy
Công thức tính khoảng tin cậy phụ thuộc vào số liệu thống kê được sử dụng. Khoảng tin cậy được tính ở các mức ý nghĩa xác định trước, thường được gọi là alpha (chữ cái Hy Lạp alpha), như đã đề cập trước đó, sẽ được đặt thành 0,05 trong hầu hết các trường hợp.
Mức độ tin cậy là (1-α) hoặc 100 × (1-α)%. Vì vậy, nếu α = 0,05, thì độ tin cậy là 0,95 hoặc 95%, biểu diễn sau thường được sử dụng hơn. Các phương pháp thường được sử dụng để tính khoảng tin cậy như sau:
Pr (c1 <= μ <= c2) = 1-α
trong đó: α là mức ý nghĩa (ví dụ: 0,05 hoặc 0,10);
Pr là viết tắt của xác suất, là viết tắt của từ xác suất;
100% * (1-α) hoặc (1-α) hoặc tham chiếu đến mức độ tin cậy (ví dụ: 95% hoặc 0,95);
Biểu thức: khoảng (c1, c2) – khoảng tin cậy.
Cách tra bảng độ tin cậy
1. Dưới cùng một mức độ tin cậy, cỡ mẫu càng lớn thì khoảng tin cậy càng hẹp.
2. Tốc độ thu hẹp khoảng tin cậy không nhanh bằng tốc độ tăng kích thước mẫu, nghĩa là kích thước mẫu không tăng gấp đôi, và khoảng tin cậy cũng bị thu hẹp một nửa (thực tế đã chứng minh rằng kích thước mẫu phải được tăng lên 4 lần trước khi khoảng tin cậy có thể được thay đổi. hẹp hơn một nửa), vì vậy khi kích thước mẫu đạt đến một kích thước nhất định (thường là 1.200) thì không cần thêm mẫu nữa.
Do đó: khoảng tin cậy = ước lượng điểm ± (giá trị chính × độ lệch chuẩn của ước lượng điểm). Cỡ mẫu càng lớn (càng lớn) thì khoảng tin cậy càng hẹp (nhỏ hơn), những thứ khác bằng nhau.
Độ tin cậy và khoảng tin cậy
Hoa Kỳ đã thực hiện một cuộc khảo sát về mức độ hài lòng trong công việc của các tổng thống. Trong số 1.200 người được lấy mẫu trong cuộc khảo sát, 60 phần trăm ca ngợi công việc của tổng thống, với sai số lấy mẫu là ± 3 phần trăm và mức độ tin cậy 95 phần trăm; nếu bạn giảm sai số lấy mẫu xuống ± 2,3 phần trăm, mức độ tin cậy giảm xuống 90 phần trăm.
So sánh hai bộ số có kết quả là: Với cùng cỡ mẫu (cả 1.200 người), độ tin cậy càng cao (95%) thì khoảng tin cậy càng rộng
Mức ý nghĩa là gì
Mức ý nghĩa có nghĩa là bất kỳ sự khác biệt nào giữa thái độ của hai nhóm là do các yếu tố hệ thống chứ không phải là các yếu tố may rủi. Chúng tôi giả định rằng chúng tôi kiểm soát tất cả các yếu tố khác có thể ảnh hưởng đến sự khác biệt giữa hai nhóm, vì vậy phần giải thích còn lại là yếu tố chúng tôi suy ra, và yếu tố này không thể đảm bảo 100%, vì vậy sẽ có một giá trị xác suất nhất định, được gọi là mức ý nghĩa (Mức độ đáng kể).
Nói chung, nó thể hiện khả năng khác biệt của các nhóm với nhau. Trong kiểm định giả thuyết thống kê, giá trị xác suất của sự kiện xác suất nhỏ được công nhận được gọi là mức ý nghĩa của kiểm định giả thuyết thống kê, và cùng một đại lượng được đo nhiều lần, rồi tính giá trị trung bình.
Độ chính xác là gì
Độ chính xác của phép đo là mức độ thỏa thuận giữa kết quả đo và giá trị thực được đo; độ chính xác của phương tiện đo là mức độ mà dụng cụ đo đưa ra mức độ thỏa thuận gần với giá trị thực. Độ chính xác chỉ là một khái niệm định tính và không có biểu thức định lượng.
Giá trị tuyệt đối của sai số đo lớn và độ chính xác thấp. Nhưng độ chính xác không bằng sai số. Độ chính xác chỉ có thể được thể hiện như: cao, thấp; lớn, nhỏ; đạt và không đạt. Đối với độ chính xác của dụng cụ đo, cũng có các cấp hoặc các biểu thức khác. Độ chính xác được đưa ra trong giá trị liều lượng là sai, ví dụ: độ chính xác là 0,5 mg và tham chiếu đến 0,5 mg ở đây là không rõ ràng.
Trung bình là gì
Giá trị trung bình, một thuật ngữ thống kê, là thước đo xu hướng trung tâm của một tập hợp dữ liệu, là tổng của tất cả dữ liệu trong một tập hợp dữ liệu chia cho số dữ liệu trong tập hợp. Nó là một chỉ số phản ánh xu hướng trong tập dữ liệu. Chìa khóa để giải bài toán về số trung bình là xác định “tổng số” và tổng số bản sao tương ứng với tổng số.
Trong công tác thống kê, giá trị trung bình (mean) và độ lệch chuẩn là hai thước đo quan trọng nhất để mô tả khuynh hướng trọng tâm và độ phân tán của dữ liệu.
Độ lệch chuẩn là gì
Độ lệch chuẩn, một thuật ngữ toán học, là căn bậc hai số học của trung bình cộng (nghĩa là: phương sai) của độ lệch bình phương so với giá trị trung bình, được ký hiệu là σ. Độ lệch chuẩn, còn được gọi là độ lệch chuẩn, hoặc độ lệch chuẩn thực nghiệm, được sử dụng phổ biến nhất trong thống kê xác suất như một thước đo mức độ của một phân phối thống kê.
Độ lệch chuẩn là căn bậc hai số học của phương sai. Độ lệch chuẩn có thể phản ánh mức độ phân tán của một tập dữ liệu. Hai tập dữ liệu có cùng giá trị trung bình có thể không nhất thiết phải có cùng độ lệch chuẩn.
P-value là gì
Giá trị P là một tham số được sử dụng để xác định kết quả của kiểm định giả thuyết, và cũng có thể được so sánh theo các phân phối khác nhau bằng cách sử dụng vùng bác bỏ của phân phối. Nó được đề xuất lần đầu tiên bởi R · A · Fisher.
Giá trị P là xác suất của một kết quả cực đoan hơn các quan sát mẫu kết quả khi giả thuyết rỗng là đúng. Nếu giá trị P nhỏ có nghĩa là xác suất xuất hiện của giả thuyết rỗng là rất nhỏ, và nếu nó xảy ra thì theo nguyên tắc xác suất nhỏ, chúng ta có lý do để bác bỏ giả thuyết vô hiệu vì P càng nhỏ giá trị, lý do càng mạnh để chúng ta bác bỏ giả thuyết vô hiệu.
Kết luận, giá trị P càng nhỏ, kết quả càng có ý nghĩa. Nhưng kết quả thử nghiệm là “có ý nghĩa”, “có ý nghĩa vừa phải” hay “có ý nghĩa cao” cần được chúng ta giải quyết tùy theo kích thước của giá trị P và vấn đề thực tế.
Phương pháp xác định độ tin cậy
Bước 1: Tìm giá trị trung bình của một mẫu.
Bước 2: Tính toán sai số lấy mẫu. Sau khi thực hành, người ta thường coi sai số lấy mẫu của 100 mẫu là ± 10%; sai số lấy mẫu của 500 mẫu là ± 5%; sai số lấy mẫu của 1200 mẫu là ± 3%.
Bước 3: Sử dụng “trung bình mẫu” được tính ở bước đầu tiên để cộng hoặc trừ “sai số lấy mẫu” được tính ở bước thứ hai để thu được hai điểm cuối của khoảng tin cậy.
Ký hiệu độ lệch chuẩn
Độ lệch chuẩn trong tiếng Anh là Standard Deviation, viết tắt ký hiệu là SD.
Công thức tính độ lệch chuẩn xác suất thống kê
Độ lệch tiêu chuẩn dân số:
Độ lệch chuẩn mẫu:
Lỗi tiêu chuẩn:
với phương sai: phương sai = bình phương độ lệch chuẩn.
Trong thử nghiệm, một phép đo duy nhất chắc chắn sẽ tạo ra sai số. Vì lý do này, chúng tôi thường đo nhiều lần, sau đó sử dụng giá trị trung bình của các giá trị được đo để đại diện cho lượng phép đo và sử dụng các thanh sai số để mô tả sự phân bố của dữ liệu, trong đó chiều cao của các thanh lỗi là ± sai số chuẩn. Đây là độ lệch chuẩn.
Hệ số biến thiên:
Ứng dụng thực tế của độ lệch chuẩn
Độ lệch chuẩn, được sử dụng phổ biến nhất trong thống kê xác suất như một thước đo phân tán thống kê. Độ lệch chuẩn được định nghĩa là căn bậc hai của trung bình cộng của độ lệch bình phương của giá trị chuẩn của mỗi đơn vị tổng thể so với giá trị trung bình của nó. Nó phản ánh mức độ phân tán giữa các cá nhân trong một nhóm. Kết quả đo mức độ phân bố về nguyên tắc có hai tính chất:
- Nó là một giá trị không âm và có cùng đơn vị với dữ liệu đo lường. Có sự khác biệt giữa độ lệch chuẩn của tổng dân số hoặc độ lệch chuẩn của một biến ngẫu nhiên và độ lệch chuẩn của số lượng mẫu trong một tập hợp con.
- Nói một cách đơn giản, độ lệch chuẩn là thước đo mức độ lan tỏa trung bình của một tập dữ liệu. Độ lệch chuẩn lớn hơn có nghĩa là hầu hết các giá trị khác với giá trị trung bình của chúng nhiều hơn; độ lệch chuẩn nhỏ hơn có nghĩa là các giá trị này gần giá trị trung bình hơn.
Ví dụ về độ lệch chuẩn
Ví dụ, trong khoa học vật lý, khi thực hiện các phép đo lặp lại, độ lệch chuẩn của bộ giá trị đo thể hiện độ chính xác của các phép đo đó. Độ lệch chuẩn của giá trị đo đóng vai trò quyết định khi quyết định liệu giá trị đo có khớp với giá trị dự đoán hay không: nếu giá trị trung bình đo được quá xa giá trị dự đoán (và so với giá trị của độ lệch chuẩn), giá trị đo được và giá trị dự đoán được coi là mâu thuẫn.
Điều này cũng dễ hiểu vì nếu các giá trị đo được đều nằm ngoài một khoảng số nào đó thì việc suy ra giá trị dự đoán có đúng hay không là điều hoàn toàn hợp lý.
Độ lệch chuẩn được sử dụng trong các khoản đầu tư như một thước đo tính ổn định của lợi nhuận. Giá trị độ lệch chuẩn càng lớn thì rủi ro càng cao vì lợi tức thu được khác xa giá trị trung bình trong quá khứ, và lợi tức kém ổn định. Ngược lại, giá trị độ lệch chuẩn càng nhỏ thì lợi nhuận càng ổn định và rủi ro càng thấp.
Công thức độ lệch chuẩn trong Excel
Ví dụ, có 6 học sinh ở mỗi nhóm A và B cùng làm bài kiểm tra ngôn ngữ 67. Điểm trung bình của hai nhóm này là 70, nhưng độ lệch chuẩn của nhóm A khoảng 17,08 điểm và độ lệch chuẩn của nhóm B khoảng 2,16 điểm, cho thấy khoảng cách giữa học sinh nhóm A lớn hơn nhiều so với học sinh trong nhóm B nhiều.
Trong trường hợp dân số (nghĩa là để ước tính phương sai tổng thể), hãy chia bình phương cho n (tương ứng với hàm excel: STDEV.P);
Trong trường hợp lấy mẫu (nghĩa là để ước tính phương sai mẫu), hãy chia bình phương cho (n-1) (tương ứng với hàm excel: STDEV.S);
Vì chúng ta xử lý rất nhiều mẫu, nên chia cho (n-1) trong căn bậc hai thường được sử dụng.
Ý nghĩa của phương sai và độ lệch chuẩn
Tất cả các số bị trừ đi từ tổng bình phương của số trung bình của chúng, kết quả được chia cho số của nhóm (hoặc số trừ đi một, nghĩa là phương sai), sau đó giá trị kết quả được bình phương và số thu được là tiêu chuẩn của nhóm sự khác biệt dữ liệu này.
Phạm vi giá trị nằm trong một độ lệch chuẩn so với giá trị trung bình chiếm 68,2% tất cả các giá trị (tức là 1). Đối với phân phối chuẩn, tỷ lệ nằm trong hai độ lệch chuẩn cộng lại lên tới 95,4%. Đối với phân phối chuẩn, tỷ lệ trong phạm vi cộng hoặc trừ ba độ lệch chuẩn cộng lại lên tới 99,6%. Do tính chất này của độ lệch chuẩn, hướng dẫn ba-siegma được hình thành.