Dđộ lệch chuẩn trung vị sai số chuẩn là gì năm 2024
0% found this document useful (0 votes) 380 views 8 pages Original Titleđộ lệch hay sai số chuẩn Copyright© Attribution Non-Commercial (BY-NC) Available FormatsPDF, TXT or read online from Scribd Share this documentDid you find this document useful?0% found this document useful (0 votes) 380 views8 pages Độ Lệch Hay Sai Số Chuẩn1 Lâm sàng th ố ng kê Độ l ệ ch chu ẩ n hay sai s ố chu ẩ n? Nguy ễ n V ă n Tu ấ n Trong vài n ă m qua, tôi nh ậ n khá nhi ề u email h ỏ i v ề nh ữ ng v ấ n đề c ă n b ả n trong th ố ng kê sinh h ọ c và ph ươ ng pháp d ị ch t ễ h ọ
đị nh m ở m ụ c Lâm sàng th ố ng kê (Statistical Clinic) để trao đổ i v ớ i b ạ n đọ c v ề các v ấ n đề mà tôi th ấ y quan tr ọ ng này. Tôi hân hoan chào đ ón các câu h ỏ i c ủ a b ạ n đọ c để có c ả m h ứ ng tr ả l ờ
ă m th ư h ỏ i và tham v ấ n trong th ờ i gian 3 n ă m qua, tôi đế m có đế n 5 th ư h ỏ i v ề v ấ n đề mà tôi l ấ y làm t ự a đề cho bài vi ế t này. Ch ẳ ng h ạ n nh ư m ộ t b ạ n đọ c ở Hà N ộ i vi ế t email đế n tôi h ỏ i: “Th ư a th ầ y! Em đọ c th ấ y trong các t ậ p san y h ọ c ng ườ i ta th ườ ng hay trình bày s ố trung bình kèm theo SEM, nh ư ng c ũ ng có bài báo trình bày s ố trung bình kèm theo SD. Xin h ỏ i Th ầ y cách trình bày nào đ úng?” Đ ây là m ộ t câu h ỏ i đơ n gi ả n nh ư ng tôi th ấ y có ý ngh ĩ a ứ ng d ụ ng khá r ộ ng, nên mu ố n nhân c ộ t báo Lâm sàng th ố ng kê để tr ả l ờ i b ạ n đọ c . *** Trong các t ậ p san y h ọ c, chúng ta th ườ ng th ấ y nh ữ ng c ộ t s ố d ướ i hình th ứ c x ± y , trong đ ó x là s ố trung bình, còn y thì có khi là độ l ệ ch chu ẩ n (standard deviation – SD) hay sai s ố chu ẩ n (standard error – SE). C ũ ng có tác gi ả vi ế t SEM (vi ế t t ắ t t ừ c ụ m t ừ standard error of the mean ). Cách trình bày nh ư th ế thông d ụ ng đế n n ỗ i m ộ t s ố chuyên gia và các ban biên t ậ p t ậ p san y h ọ c ph ả i lên ti ế ng khuy ế n cáo. Theo khuy ế n cáo chung và c ũ ng là qui ướ c nghiên c ứ u y h ọ c: để mô t ả m ộ t bi ế n s ố lâm sàng tuân theo lu ậ t phân ph ố i chu ẩ n, các nhà nghiên c ứ u nên cách trình bày s ố trung bình và kèm độ l ệ ch chu ẩ n (không ph ả i sai s ố chu ẩ n; để mô t ả m ộ t bi ế n s ố lâm sàng không tuân theo lu ậ t phân ph ố i chu ẩ n, nên trình bày s ố trung v ị và s ố ở v ị trí 25% và 75% (t ứ c là interquartile range) . Để hi ể u qui ướ c này, chúng ta c ầ n ph ả i tìm hi ể u ý ngh ĩ a c ủ a độ l ệ ch chu ẩ n và sai s ố chu ẩ
ấ y đ i ề u này c ầ n thi ế t, b ở i vì h ầ u h ế t sách giáo khoa th ố ng kê (ngay c ả sách giáo khoa do ng ườ i Tây ph ươ ng vi ế đề u không gi ả i rõ nh ữ ng khác bi ệ t v ề ý ngh ĩ a c ủ a hai ch ỉ s ố th ố ng kê này. Mô t ả m ộ t bi ế n s ố theo lu ậ t phân ph ố i chu ẩ n 2 Xin nh ắ c l ạ i thu ậ t ng ữ : c ụ m t ừ “phân ph ố i chu ẩ n” ở đ ây chính là “Normal distribution” (hay có sách còn g ọ i là “Gaussian distribution”, l ấ y t ừ tên c ủ a nhà toán h ọ c v ĩ đạ i ng ườ i Đứ c Frederick Gauss). M ộ t bi ế n s ố tuân theo lu ậ t phân ph ố i chu ẩ n, khi v ẽ b ằ ng bi ể u đồ , gi ố ng nh ư hình m ộ t cái chuông cân đố i ( Bi ể u đồ 1 ). Phân ph ố i này đượ c xác đị nh b ằ ng hai thông s ố : s ố trung bình và độ l ệ ch chu ẩ Để ti ế t ki ệ m ch ữ ngh ĩ a, tôi s ẽ l ấ y kí hi ệ u m th ể hi ệ n s ố trung bình, và s th ể hi ệ n độ l ệ ch chu ẩ
ạ i sao chúng ta c ầ n độ l ệ ch chu ẩ n? Để tr ả l ờ i câu h ỏ i này, chúng ta th ử xem qua ví d ụ sau đ ây: Ví d ụ 1 . M ộ t bi ế n s ố ph ả n ả nh tình tr ạ ng c ủ a m ộ t b ệ nh trong hai nhóm b ệ nh nhân (nhóm A g ồ m 6 b ệ nh nhân, và nhóm B g ồ m 4 b ệ nh nhân) nh ư sau: Nhóm A: 6, 7, 8, 4, 5, 6 Nhóm B: 10, 2, 3, 9 Có th ể d ễ dàng th ấ y r ằ ng s ố trung bình c ủ a nhóm A là 6, b ằ ng v ớ i s ố trung bình c ủ a nhóm B. Tuy có cùng s ố trung bình, chúng ta khó có th ể k ế t lu ậ n hai nhóm này t ươ ng đươ ng nhau, b ở i vì độ khác bi ệ t trong nhóm B cao h ơ n trong nhóm A. Th ậ t v ậ y, độ khác bi ệ t gi ữ a s ố l ớ n nh ấ t và s ố nh ỏ nh ấ t trong nhóm B là 8 (t ứ c 10 tr ừ cho 2) g ấ p hai l ầ n so v ớ i nhóm A v ớ i độ khác bi ệ t là 4 (l ấ y 8 tr ừ cho 4). Chúng ta c ầ n m ộ t ch ỉ s ố để ph ả n ả nh s ự khác bi ệ t gi ữ a các b ệ nh nhân (hay nói theo thu ậ t ng ữ là bi ế n thiên ). Cách làm hi ể n nhiên nh ấ t là l ấ y k ế t qu ả c ủ a t ừ ng b ệ nh nhân tr ừ cho s ố trung bình và c ộ ng chung l ạ
ọ i ch ỉ s ố này là D, và để phân bi ệ t hai nhóm A và B, chúng ta dùng kí hi ệ u d ướ i dòng (subscript): Nhóm A: A D \= (6- 6 ) + (7- 6 ) + (8- 6 ) + (4- 6 ) + (5- 6 ) + (6- 6 ) = 0 Nhóm B: B D \= (10- 6 ) + (2- 6 ) + (3- 6 ) + (9- 6 ) = 0 Nh ư th ấ y trên, v ấ n đề ở đ ây là t ổ ng s ố khác bi ệ t c ủ a D là 0. Nh ư v ậ y D v ẫ n ch ư a ph ả n ả nh đượ c độ bi ế n thiên mà chúng ta mu ố
ộ t cách làm cho D có “h ồ n” h ơ n là chúng ta l ấ y bình ph ươ ng c ủ a t ừ ng cá nhân và c ộ ng s ố bình ph ươ ng l ạ i v ớ i nhau. G ọ i ch ỉ s ố m ớ i này là 2 D , chúng ta có: Nhóm A: 2 A D \= (6- 6 ) 2 + (7- 6 ) 2 + (8- 6 ) 2 + (4- 6 ) 2 + (5- 6 ) 2 + (6- 6 ) 2 \= 10 Nhóm B: 2 B D \= (10- 6 ) 2 + (2- 6 ) 2 + (3- 6 ) 2 + (9- 6 ) 2 \= 50 3 Bây gi ờ thì 2 D rõ ràng cho th ấ y nhóm B có độ bi ế n thiên cao h ơ n nhóm A. Nh ư ng còn m ộ t v ấ n đề , vì 2 D là t ổ ng s ố , t ứ c là ch ị u ả nh h ưở ng s ố c ỡ m ẫ u trong t ừ ng nhóm. M ộ t cách đ i ề u ch ỉ nh h ợ p lí nh ấ t là chia 2 D cho s ố c ỡ m ẫ
ọ i ch ỉ s ố m ớ i này là S 2 , chúng ta có: Nhóm A: 2 S \= 10 / 6 = 1.67 Nhóm B: 2 B S \= 50 / 4 = 12.5 Nh ư ng để khách quan h ơ n n ữ a, chúng ta còn ph ả i đ i ề u ch ỉ nh cho s ố thông s ố s ử d ụ ng trong tính toán. Chú ý r ằ ng khi tính D hay 2 D , chúng ta tr ừ k ế t qu ả m ỗ i b ệ nh nhân cho s ố trung bình (t ứ c là t ố n m ộ t thông s ố ). Vì th ế , thay vì chia 2 D cho s ố c ỡ m ẫ u, chúng ta ph ả i chia cho s ố c ỡ m ẫ u tr ừ 1. G ọ i ch ỉ s ố m ớ i nh ấ t là 2 s , chúng ta có: Nhóm A: 2 10251 A s \= \=− Nhóm B: 2 5016.741 B s \= \=− Ch ỉ s ố 2 s ở đ ây chính là ph ươ ng sai . Nh ư ng còn m ộ t v ấ n đề nh ỏ n ữ a: b ở i vì đơ n v ị ph ươ ng sai là bình ph ươ ng, khác v ớ i đơ n v ị c ủ a s ố trung bình. Vì th ế , cách hoán chuy ể n t ố t nh ấ t là chuy ể n giá tr ị c ủ a ph ươ ng sai sao cho có cùng đơ n v ị v ớ i s ố trung bình b ằ ng cách l ấ y c ă n s ố b ậ c hai, và đ ây chính là độ l ệ ch chu ẩ n (kí hi ệ u s ). Nhóm A: 21.41 A s \= \= Nhóm B: 16.74.08 B s \= \= Đế n đ ây, chúng ta có th ể th ấ y nhóm B có độ bi ế n thiên cao h ơ n nhóm A. M ộ t cách để đị nh l ượ ng hóa độ l ệ ch chu ẩ n t ươ ng quan v ớ i s ố trung bình là l ấ y độ l ệ ch chu ẩ n chia cho s ố trung bình (và n ế u c ầ n, nhân cho 100). K ế t qu ả c ủ a tính toán này có tên là h ệ s ố bi ế n thiên (coefficient of variation – CV): Nhóm A: CV A \= 1.41 / 6 × 100 = 23.5% Nhóm B: CV B \= 4.08 / 6 × 100 = 68.3% Độ lệch chuẩn là gì lớp 10?2. Độ lệch chuẩn: Khi chú ý đơn vị đo ta thấy phương sai sx2 có đơn vị đo là bình phương của đơn vị đo được nghiên cứu ( đơn vị đo nghiên cứu là cm thì sx2 là cm2), để tránh tình trạng này ta dùng căn bậc hai của phương sai gọi là độ lệch chuẩn. Sai lệch chuẩn là gì?Độ lệch chuẩn hay còn gọi là Standard Deviation. Là đại lượng dùng để phản ánh độ phân tán của các giá trị trong bộ dữ liệu. Thể hiện sự biến thiên của giá trị trong một thời điểm phản ánh xu thế của sự thay đổi. Phương sai và độ lệch chuẩn là gì?Độ lệch chuẩn, hay độ lệch tiêu chuẩn (Standard Deviation) là một đại lượng thống kê dùng để đo mức độ phân tán của một tập dữ liệu đã được lập thành bảng tần số. Có thể tính ra độ lệch chuẩn bằng cách lấy căn bậc hai của phương sai. Mean and Standard Deviation là gì?Độ lệch chuẩn (Standard Deviation) hay độ lệch tiêu chuẩn là một chỉ số dùng để đo mức độ phân tán của một tập dữ liệu quanh giá trị trung bình (Mean). Trong các phần mềm thống kê, độ lệch chuẩn thường được ký hiệu là hoặc S.D hoặc Std. Deviation. |