Estimator Là Gì

Cmùi hương 3 Thống kê cơ bản

Trong section này ta sẽ mày mò các ngôn từ cơ bạn dạng bao phủ Thống kê:

Ước lượng tđắm đuối số chưa biết tổng thểKiểm địnhKhoảng tin cậy

Những cách thức này được áp dụng cực kỳ những vào Kinh tế lượng. Các vụ việc kinh tế lượng nhiều phần số đông xẩy ra trong ngôi trường phù hợp chưa chắc chắn toàn diện và tổng thể là gì.

Bạn đang xem: Estimator là gì

Bạn đã xem: Estimator là gì

3.1 Ước lượng mức độ vừa phải tổng thể

Estimators là đông đảo hàm số suy đoán dữ liệu tổng thể và toàn diện từ bỏ dữ liệu chủng loại. Estimates là hầu như cực hiếm số học tập được xem vị estimator dựa vào dữ liệu mẫu. Estimator là thốt nhiên vị chúng là hàm số của dữ liệu hốt nhiên. Trong lúc ấy estimate thì ko tự dưng.

Giả sử đứng bên dưới góc nhìn tài chính, hotline (Y) là thu nhập cá nhân theo tiếng của sinh viên. Giả sử ta vẫn quyên tâm (mu_Y) vừa đủ của (Y). Để khẳng định đúng đắn (mu_Y) ta cần phải chất vấn hầu hết sinch viên vào nền tài chính. Điều này sẽ không lúc nào đã đạt được bởi nguồn lực về tài thiết yếu với thời gian. Tuy nhiên, ta rất có thể lựa mẫu bỗng nhiên của ( n) quan liêu giáp (i.i.d) với ước lượng (mu_Y) bằng phương pháp thực hiện cách làm sau:

Liệu đây bao gồm là một estimator giỏi của (mu_Y). Ta đối chiếu với cùng một estimator đơn giản dễ dàng hơn, quan lại gần kề trước tiên (Y_1). Giả sử (Y_1 sim chi_12^2) do thu nhập thì không âm cùng phân phối hận thường nghiêng bắt buộc, hầu hết Điểm sáng quá tương xứng với phân pân hận Chi bình phương thơm. Cùng liếc qua PDF của phân pân hận này.


*

Ta hoàn toàn có thể tạo ra một mẫu bài bản (100) quan liêu gần cạnh cùng mang quan liêu ngay cạnh đầu tiên mang đến (Y_1) nhỏng sau.

## 8.257893Ước lượng (8.26) không thực sự xa so với (mu_Y=12). Vậy thân ( Y) cùng (Y_1) estimator làm sao giỏi hơn vào Việc phản ánh (mu_Y)?

Một estimator xuất sắc cần được bảo vệ hồ hết đề nghị sau:

Không thiên lệch unbiasedness: mức độ vừa phải của phân pân hận lấy mẫu mã của một estimator đề xuất bằng vừa phải đúng: (E(hatmu_Y) = mu_Y).Tính đồng điệu consistency: sự lệch lạc của estimator phải sút dần khi số lượng quan giáp mẫu mã tăng lên. Nghĩa là, Tỷ Lệ mà lại ước chừng (hatmu_Y) đề xuất phía trong một khoảng thanh mảnh xung quanh (mu_Y) tiến gần về (100\%) lúc (n) tăng.Hiệu quả efficiency: mang sử ta có hai estimator, (hatmu_Y) với ( ildemu_Y). Với cùng đồ sộ mẫu (n) cùng (E(hatmu_y) = E( ildemu_Y) = mu_Y), nếu ( extVar(hatmu_Y) thì (hatmu_Y) tốt hơn.

Để chu đáo vừa đủ chủng loại nhỏng một estimator đến vừa phải toàn diện, ta tiến hành thuật tân oán R như sau:

tạo thành một toàn diện và tổng thể bao gồm (10000) quan tiền gần kề từ bỏ phân păn năn (N(10,1)).mang chủng loại bất chợt tự toàn diện và tổng thể này và tính (Y) cho từng mẫu mã.tái diễn (N=25000) lần.

pop rnorm(10000,10,1)est1 replicate(extruyền thông quảng cáo = mean(sample(x = pop, kích thước = 5)), n=25000) est2 replicate(expr = mean(sample(x = pop, form size = 25)), n=25000)fo replicate(exquảng cáo = sample(x=pop, form size = 5), n=25000)plot(density(fo), col = 'green', lwd = 2, ylyên = c(0,2), xlab = 'Ước lượng', main = 'Phân pân hận rước mẫu', ylab = 'Mật độ')lines(density(est1), col = 'steelblue', lwd = 2, bty = 'l')lines(density(est2), col = 'red2', lwd=2)abline(v=10, lty=2)curve(dnorm(x, mean = 10), lwd = 2, lty = 2, add = T)legend('topleft', legend = c('N(10,1)', expression(Y), expression(bar(Y) ~ n==5), expression(bar(Y) ~ n==25) ), lty = c(2,1,1,1), col = c('black', 'green', 'steelblue','red2'), lwd = 2 )

*

Trước hết, hầu như phân phối lấy mẫu mã (con đường đường nét liền) những triệu tập bao phủ (mu=10). Đây là vật chứng cho thấy tính unbiasedness của (Y_1, arY_5,arY_25).

Tiếp tục chú ý độ phân tán của phân phối.

Phân phối hận rước mẫu mã của (Y_1) (greed color lá cây) hết sức khớp với PDF (N(10,1)) kim chỉ nan (mặt đường gạch). Vấn đề này không tồn tại gì không thể tinh được do (Y_1) được chọn đột nhiên (25000) lần từ phân pân hận (N(10,1)).Cả hai phân phối mang chủng loại (arY) đều cho biết thêm độ phân tán thấp rộng tương đối nhiều so với phân phối hận của (Y_1). Vấn đề này cho biết pmùi hương sai của (arY) rẻ hơn so với của (Y_1). bởi thế estimator (arY) tốt hơn.Khi (n) tăng thì độ phân tán bớt dần, cho thấy estimator giỏi hơn.

3.1.1 Bình phương nhỏ nhất

Giả sử ta tất cả quan sát (Y_1,...,Y_n) của đổi mới (Y syên N(10,1)) (tất nhiên là ta lừng khừng thông tin về tổng thể). Ta mong mỏi tìm kiếm một estimator (m) nào kia làm thế nào cho dự đân oán quan liêu gần kề tốt nhất có thể. Nói nôm na, ta chọn (m) làm thế nào để cho tổng chênh lệch bình phương thơm thân quý hiếm dự đoán thù và cực hiếm quan liêu gần kề là bé dại nhất: (sum_i=1^n(Y_i - m)^2).

Ta hãy coi (Y_i-m) như là 1 lỗi sai Khi dự đoán thù (Y_i) bởi estimator (m) cùng trách nhiệm của ta là tra cứu (m) nhằm lỗi không nên này nhỏ độc nhất. Ta cũng rất có thể tối tđọc hoá tổng của quý giá tuyệt đối chênh lệch này tuy thế về tối tđọc hoá tổng của bình phương chênh lệch về mặt toán học tập vẫn tiện rộng. Đó là nguyên do tại sao estimator có tên là bình phương thơm nhỏ nhất. Và (m=arY) là một trong estimator làm được điều đó. Ta chứng tỏ trải qua R nlỗi sau.

curve(sqm(x),from = -50, to lớn = 70, xlab = 'm', ylab = 'Tổng bình phương')abline(v = mean(y), lty = 2, col = 'darkred')text(x = mean(y), y = 0, labels = paste(round(mean(y),2)))
*

Vì hàm số bình phương thơm nhỏ tuổi độc nhất là bậc 2 nên có thể gồm duy nhất một giá trị nhỏ nhất. Hình vẽ cho biết cực hiếm này nằm đúng mực tại vừa đủ mẫu của dữ liệu mẫu.

Cho mang đến bây giờ, ta giả định ngầm rằng dữ liệu quan lại giáp (Y_i) đa số được lấy tự các bước mang mẫu mã đồng tình điều kiện lấy mẫu mã bất chợt. Giả định này thường được sử dụng Khi ước tính trung bình toàn diện và tổng thể bằng estimator (arY). Nếu không chấp nhận, ước chừng sẽ ảnh hưởng thiên lệch.

Quay lại tổng thể và toàn diện pop đã có được khái niệm ngơi nghỉ trên, bao gồm (10000) quan lại gần cạnh với ta có thể tính mức độ vừa phải toàn diện và tổng thể trải qua hàm mean(). Bây giờ ta và tính estimator (arY) mang đến chủng loại bài bản (10) được lặp lại (25000) lần. Tuy nhiên lần này chũm vị đem mẫu ngẫu nhiên (tức là tỷ lệ từng cực hiếm vào tổng thể mở ra ngang nhau) thì ta vẫn phân bổ Phần Trăm cao hơn nữa đối với (2500) quan tiền gần kề nhỏ dại độc nhất.

est3 replicate(n=25000, exquảng cáo = mean(sample(x=sort(pop), kích thước = 10, prob = c(rep(4,2500),rep(1,7500)))))plot(density(est2), col = 'steelblue', lwd = 2, xllặng = c(8,11), xlab = '', ylab = '', main = '')lines(density(est3), col = 'red2', lwd = 2)abline(v = mean(pop), lty = 2, col = 'darkred', lwd = 2)text(x = mean(pop), y = 0, labels = paste(mean(pop)))legend('topleft', legover = c(expression(bar(Y) ~ ', không i.i.d'), expression(bar(Y) ~ 'i.i.d'), 'vừa đủ tổng thể'), lty = c(1,1,2), col = c('red2', 'steelblue', 'darkred'), lwd = 2)

*

Hình vẽ cho biết, rước mẫu mã không ngẫu nhiên (xuất xắc mang định (i.i.d) ko được thoả mãn) thì ta vẫn ước chừng thấp giá trị mức độ vừa phải toàn diện và tổng thể.

3.2.1 Giả thuyết và chu chỉnh thống kê

Trong kiểm định, ta mong muốn khai thác đọc tin gồm trong một chủng loại để làm bằng chứng ủng hộ tốt bác bỏ giả tmáu. Những đưa thuyết là hầu hết câu hỏi nhị phân dễ dàng và đơn giản mà lại được vấn đáp yes xuất xắc no. Trong kiểm định ta thường giải quyết và xử lý nhì trả thuyết:

Giả tmáu null (H_0): là đưa tmáu nhưng mà ta buộc phải chu chỉnh.Giả ttiết alternative (H_a/H_A/H_1): giả tngày tiết biết tới đúng nếu (H_0) bị bác vứt.

Đối cùng với bài bác toán thù tương quan mang đến kiểm nghiệm vừa đủ tổng thể, cặp giả thuyết được phương pháp nhỏng sau

Đây hotline là kiểm nghiệm hai đuôi.

3.2.2 p-value

Giả sử rằng (H_0) đúng, thì (p)-value là cực hiếm Xác Suất của việc ta giết mổ nhầm, tức là ta chưng bỏ (H_0), một giả tmáu đúng. Cụ thể: |arY^act - mu_Y,0| ight> >

trong các số ấy, (arY^act) là trung bình mẫu thực tính. bởi thế, nhằm tính được (p)-value, ta nên biết về phân pân hận lâý mẫu mã của (arY) lúc (H_0) đúng. Tuy nhiên, phần nhiều các ngôi trường hợp phân păn năn này ta lưỡng lự. Nhưng theo CLT thì (arY approx N(mu_Y,0,sigma^2_arY), ext sigma^2_arY = fracsigma^2_Yn). Do đó:

vì vậy đối với chủng loại bài bản Khủng, (p)-value có thể được xem mà lại ko cần biết đúng mực phân phối đem mẫu của (arY).

Giả sử (sigma_arY) đang biết tới. lúc đó ta hoàn toàn có thể viết lại cách làm (p)-value như sau: Big| fracarY^act- musigma_arY Big| ight> \ &= 2 imes Phileft endaligned>

lúc đó (p)-value được chú ý theo như hình sau:

curve(dnorm(x), xlim = c(-4,4), main = 'p-value', yaxs = 'i', ylab = '', xlab = 'z', lwd = 2, axes = F)axis(1, at = c(-1.5,0,1.5), padj = 0.75, labels = c(expression(-frac(bar(Y)^'act' ~-~ bar(mu),sigma)), 0, expression(frac(bar(Y)^'act' ~-~ bar(mu),sigma))))polygon(x = c(-6, seq(-6,-1.5,0.01), -1.5), y = c(0,dnorm(seq(-6,-1.5,0.01)),0), col = 'steelblue')polygon(x = c(1.5, seq(1.5,6,0.01), 6), y = c(0,dnorm(seq(1.5,6,0.01)),0), col = 'steelblue')

*

3.2.3 Phương thơm không đúng chủng loại, độ lệch chuẩn chỉnh chủng loại với không đúng số chuẩn

Nếu (sigma_Y^2) chưa biết, nó phải được ước chừng thông qua phương sai mẫu:

Tương tự, độ lệch chuẩn chỉnh mẫu (s_Y = sqrts^2_Y) là estimator của độ lệch chuẩn chỉnh tổng thể và toàn diện. Trong R độ lệch chuẩn chủng loại được xem bằng hàm sd().

Xem thêm: Địa Chỉ Trường Đại Học Fpt Hồ Chí Minh, Trường Đại Học Fpt

n c(10000, 5000, 2000, 1000, 500)sq_y replicate(n = 10000, exquảng bá = sd(rnorm(n,10,10)))plot(density(sq_y), main = expression('Phân phối hận đem mẫu' ~ s), xlab = expression(s), lwd = 2)for (i in 2:length(n)) sq_y replicate(n=10000, exquảng cáo = sd(rnorm(n,10,10))) lines(density(sq_y), col = i, lwd = 2)abline(v = 10, col = 6, lwd = 2)text(x = 10, y=0,labels = '10')legend('topleft', legkết thúc = c(expression(n==10000), expression(n==5000), expression(n==2000), expression(n==1000), expression(n==500), 'Phương không nên tổng thể'), col = 1:6, lwd = 2)

Đồ thị cho biết phân păn năn của (s_Y) đang dong dỏng rộng cùng xoay quanh quý giá đúng (sigma_Y = 10) khi (n) tăng.

Hàm số ước tính độ lệch chuẩn của một estimator được Call là không đúng số chuẩn. Với một đổi mới (Y sim i.i.d) thì phân phối rước chủng loại của nó là (fracsigma_Y^2n). Sai số chuẩn chỉnh của (arY), ký hiệu là (SE(arY)) là một trong những estimator của độ lệch chuẩn chỉnh của (arY):

Ta thường xuyên dùng R nhằm điều tra (SE(arY)) với (Y) tuân thủ theo đúng phân phối hận Bernoulli (i.i.d) bao gồm (p=0.1). Ta biết rằng (E(Y) = 0.1) với ( extVar(Y) = p(1-p)=0.09). (E(Y)) được ước tính vì chưng (arY) và nếu như ta để ý mẫu đồ sộ (n=100) thì nó gồm pmùi hương sai:

với độ lệch chuẩn:

mean_est numeric(10000)se_est numeric(10000)for (i in 1:10000) s sample(0:1, kích thước = 100, prob = c(0.9,0.1), replace = T) mean_est mean(s) se_est sqrt(mean(s)*(1-mean(s))/100)mean(mean_est)## 0.02956867Ta thấy (SE(arY) = 0.0295687) hết sức ngay gần cùng với (sigma_arY = 0.03) vì vậy nó là 1 trong estimator bao gồm tính nhất quán.

Trong ngôi trường hợp phương không nên tổng thể và toàn diện chưa biết, (p)-value được tính nlỗi sau: \>

Trong R ta tiến hành như sau để tính:

samplemean_act mean(sample(0:1, prob = c(0.9,0.1), replace = T, kích thước = 100))mean_h0 0.1SE_samplemean sqrt(samplemean_act*(1-samplemean_act)/100)pvalue 2*pnorm(-abs(samplemean_act - mean_h0)/ SE_samplemean)pvalue

3.2.4 Thống kê (t)

Trong chu chỉnh, vừa đủ mẫu mã chuẩn hoá được call là những thống kê (t):

Bây Giờ, ta vẫn tính kết thúc thống kê (t) trong R trong ví dụ trên: (samplemean_act - mean_h0)/ SE_samplemean. Nếu (H_0) đúng, thì thống kê (T) sẽ tuân theo phân păn năn giao động (N(0,1)) khi (n) bự.

t_stat numeric(10000)n 300for (i in 1:10000) s sample(0:1, kích thước = n, prob = c(0.9,0.1), replace = T) t_stat = (mean(s)-0.1)/sqrt(var(s)/n)plot(density(t_stat), xlab = 'Thống kê t', main = '', ylab = '',lwd = 2, col = 'steelblue', xlyên ổn = c(-4,4))curve(dnorm(x), add = T, lty = 2, lwd = 2)

Ta thấy ví dụ Việc chọn quý hiếm (n=300) khá hợp lý bởi vì phân pân hận của t_stat siêu dao động phân pân hận (N(0,1)).

3.2.5 Kiểm định những thống kê với mức ý nghĩa cho trước

Trong kiểm tra, có nhị nhiều loại lỗi không đúng hoàn toàn có thể xảy ra:

Lỗi không nên một số loại I: ta chưng vứt (H_0) tuy nhiên nó đúng.Lỗi không đúng các loại II: ta không bác bỏ quăng quật (H_0) mặc dù nó sai.

Mức ý nghĩa của kiểm định là Phần Trăm rơi vào lỗi sai một số loại I mà họ gật đầu đồng ý trước. Mức ý nghĩa được lựa chọn trước khi chu chỉnh được triển khai.

Tính đến ngày nay, ta ra ra quyết định những thống kê dựa trên vấn đề đối chiếu nhì ttê mê số (p)-value cùng nấc ý nghĩa. Crúc ý cả nhì rất nhiều liên quan đến lỗi không nên loại I. Nếu (p- extvalue nấc ý nghĩa thì ta bác bỏ bỏ (H_0).

Một giải pháp khác để ra đưa ra quyết định đó là so sánh thống kê kiểm tra và quý giá cho tới hạn của thống kê lại kiểm nghiệm. Giá trị cho tới hạn được xác định dựa vào nút ý nghĩa sâu sắc vẫn đưa ra. Giá trị cho tới hạn này đang xác định rực rỡ giới giữa hai vùng: vùng chấp nhận cùng vùng bác bỏ bỏ. Vùng chấp nhận không mọi giá trị của thống kê lại kiểm tra cơ mà không bác bỏ quăng quật (H_0) trong khi kia vùng bác quăng quật đựng mọi quý hiếm bác vứt (H_0).

Với thống kê lại (t), quý giá cho tới hạn của nó trên ý nghĩa (5\%) là (1.96).

Xác suất mà lại kiểm định chưng quăng quật đưa ttiết đúng được Call là đồ sộ kiểm định, chính là nút ý nghĩa sâu sắc. Trong lúc ấy, xác suất mà kiểm nghiệm chưng vứt đúng trả thuyết sai được Hotline là sức khỏe kiểm định.

3.2.6 Kiểm định một đuôi

Đôi thời điểm chúng ta quyên tâm mang đến kiểm nghiệm liệu trung bình bé dại hơn hay to hơn một giá trị nào đó. Giả sử ta đang điều tra khảo sát sự khác hoàn toàn thân nút lương ra ngôi trường của hai nhóm sinc viên, một được giảng dạy chuyên nghiệp với một không nhiều được huấn luyện và giảng dạy tốt. Cặp mang tmáu dưới đó là một ví dụ điển hình nổi bật mang đến kiểm nghiệm đuôi phải: mu_Y,0>

trong số ấy (mu_Y) là mức độ vừa phải lương theo tiếng của nhóm được huấn luyện và giảng dạy tốt với (mu_Y,0) là lương theo giờ mức độ vừa phải của nhóm còn lại. Ta đang bác quăng quật (H_0) trường hợp quý giá thống kê lớn hơn giá trị tới hạn (1.64) (chũm vị (1.96) của kiểm định hai đuôi), đây là quantile (95\%) của (N(0,1)). Vùng bác vứt như sau:


3.3 Khoảng tin cậy

Ta sẽ không khi nào thống kê giám sát đúng đắn quý giá vừa phải toàn diện của (Y) bằng phương pháp thực hiện mẫu ngẫu nhiên. Tuy nhiên, ta rất có thể tính khoảng chừng tin cậy mang lại mức độ vừa phải tổng thể và toàn diện. Đó là khoảng chừng có cất mức độ vừa phải toàn diện với cùng 1 phần trăm cho trước. Khoảng tin yêu (95\%) của trung bình toàn diện (mu_Y) là:

Trong R để tính khoảng tầm tin tưởng ta hoàn toàn có thể cần sử dụng hàm t.test() cùng ls() được xây sẵn vào gói stats.

## "alternative" "conf.int" "data.name" "estimate" "method" ## "null.value" "p.value" "parameter" "statistic"## 9.306651 12.871096## attr(,"conf.level")## 0.95Kết quả cho thấy thêm khoảng chừng tin cậy (95\%) là (), khoảng này cất cực hiếm đúng của vừa đủ là (10). Sau trên đây ta sẽ chăm chú phần đông ban bố từ bỏ hàm t.test().

## ## One Sample t-test## ## data: sampledata## t = 12.346, df = 99, p-value Ta thấy t.test() không chỉ là tính khoảng chừng tin tưởng ngoại giả auto thực hiện kiểm định nhị đuôi cho giả ttiết (H_0: mu_Y = 0) trên nút chân thành và ý nghĩa (5\%). Trong ví dụ này, ta Tóm lại mức độ vừa phải toàn diện và tổng thể có ý nghĩa thống kê (tức là khác (0) về khía cạnh thống kê) với khoảng (5\%).

3.4 Kiểm định so sánh

Giả sử ta quan tâm mang đến trung bình của nhì tổng thể khác nhau, cam kết hiệu là (mu_1) với (mu_2), câu hỏi đề ra là liệu chúng có không giống nhau ko. Cặp đưa tngày tiết làm việc đó chính là:

trong số đó (d_0) là khoảng chừng chênh lệch trả định. Giả thuyết (H_0) được kiểm nghiệm nhờ vào thống kê lại (t):

trong đó: (SE(arY_1 - arY_2) = sqrtfracs_1^2n_1 + fracs_2^2n_2).

Đối cùng với chủng loại bài bản mập thì những thống kê (t) theo đúng Standard Normal.

Trong R chu chỉnh này (khoác định (d_0=0)) được triển khai như sau.

set.seed(1)sample_pop1 rnorm(100,10,10)sample_pop2 rnorm(100,10,20)t.test(sample_pop1, sample_pop2)

3.5 Hệ số tương quan

Đồ thị điểm rải áp dụng dữ liệu hai phía, (n) quan gần cạnh (X_i) với (Y_i). Để tưởng tượng rõ rộng, xem đoạn code sau.

phối.seed(123)X runif(n=100, min=18,max = 70)Y X + rnorm(n=100, 50, 15)plot(X,Y, type = 'p', main = 'Đồ thị điểm rải', col = 'steelblue', pch = 19)

Hiệp phương thơm không nên cùng hệ số tương quan của nhị biến chuyển vẫn liên quan mang lại phân phối xác suất hòa hợp của các biến hóa này. Estimator khoảng chừng hiệp pmùi hương sai chính là hiệp phương không đúng mẫu mã.

Tương từ bỏ vậy ta bao gồm thông số tương quan mẫu

Trong R để tính tân oán các đại lượng này ta làm nlỗi sau.


3.6.1 Câu 1: Thiên lệch

Xem xét một estimator khác đến (mu_Y):

Chứng minc rằng estimator này bị thiên lệch. Sử dụng set.seed(123). Thực hiện quá trình sau:

Định nghĩa Y_tildeLấy thiên nhiên (5) quan gần kề trường đoản cú (N(10,25)) và tính ước lượng Y_tilde. Lặp lại (10000) lầnVẽ histogramVẽ đường trung bình tổng thểeyJsYW5ndWFnZSI6InIiLCJzYW1wbGUiOiIjIFN0ZXAgMVxuWV90aWxkZSA8LSBmdW5jdGlvbih4KXtcblxufVxuXG5zZXQuc2VlZCgxMjMpXG4jIFN0ZXAgMlxuXG4jIFN0ZXAgM1xuXG4jIFN0ZXAgNCIsInNvbHV0aW9uIjoiWV90aWxkZSA8LSBmdW5jdGlvbih4KXtcbiAgKDEvKGxlbmd0aCh4KS0xKSkqc3VtKHgpXG59XG5zZXQuc2VlZCgxMjMpXG5lc3RfYmlhc2VkIDwtIHJlcGxpY2F0ZShuPTEwMDAwLGV4cHIgPSBZX3RpbGRlKHJub3JtKG49NSwgbWVhbiA9IDEwLCBzZCA9IDUpKSlcbmhpc3QoZXN0X2JpYXNlZClcbmFibGluZSh2PTEwLCBjb2wgPSAncmVkJykifQ==eyJsYW5ndWFnZSI6InIiLCJzYW1wbGUiOiJzZXQuc2VlZCgxMjMpXG4jIFRcdTFlZWIgcGhcdTAwZTJuIHBoXHUxZWQxaSBOKDEwLDI1KSBsXHUxZWFieSBuZ1x1MWVhYnUgbmhpXHUwMGVhbiAxMDAwIHF1YW4gc1x1MDBlMXQsIHRcdTAwZWRuaCBnaVx1MDBlMSB0clx1MWVjYiBZX3RpbGRlLCBsXHUxZWI3cCBsXHUxZWExaSAxMDAwMCBsXHUxZWE3bi5cblxuXG5cbiMgVlx1MWViZCBoaXN0b2dyYW1cblxuIyBUaFx1MDBlYW0gXHUwMTExXHUwMWIwXHUxZWRkbmcgdGhcdTFlYjNuZyBcdTAxMTFcdTFlZTluZyB0aFx1MWVjMyBoaVx1MWVjN24gdHJ1bmcgYlx1MDBlY25oIHRcdTFlZDVuZyB0aFx1MWVjMyBcdTAxMTFcdTAwZmFuZy4iLCJzb2x1dGlvbiI6IllfdGlsZGUgPC0gZnVuY3Rpb24oeCl7XG4gICgxLyhsZW5ndGgoeCktMSkpKnN1bSh4KVxufVxuc2V0LnNlZWQoMTIzKVxuZXN0X2NvbnNpc3RlbnQgPC0gcmVwbGljYXRlKG49MTAwMDAsZXhwciA9IFlfdGlsZGUocm5vcm0obj0xMDAwLCBtZWFuID0gMTAsIHNkID0gNSkpKVxuaGlzdChlc3RfY29uc2lzdGVudClcbmFibGluZSh2ID0gMTAsIGNvbCA9ICdyZWQnKSJ9

3.6.3 Câu 3: Tính hiệu quả

Cho hai estimators nhỏng sau:

và:

trong những số ấy (b_i) cho (n/2) quan sát đầu tiên gồm trọng số to hơn cùng với (n) chẵn.

Giữa nhị estimators này, chiếc làm sao hiệu quả hơn? Cho biết vector trọng số của (b_i) nhỏng sau c(rep((1+0.5)/n,n/2),rep((1-0.5)/n,n/2))

eyJsYW5ndWFnZSI6InIiLCJzYW1wbGUiOiJuIDwtIDEwMFxudyA8LSBjKHJlcCgoMSswLjUpL24sbi8yKSxyZXAoKDEtMC41KS9uLG4vMikpXG5cbm11X3RpbGRlIDwtIGZ1bmN0aW9uKHgpe1xuXHQjQlx1MWVhZnQgXHUwMTExXHUxZWE3dSBjb2RlIFx1MWVkZiBcdTAxMTFcdTAwZTJ5OiBcdTAxMTFcdTFlY2JuaCBuZ2hcdTAxMjkgaFx1MDBlMG0gbXVfdGlsZGVcblxuXG5cblx0I0tcdTFlYmZ0IHRoXHUwMGZhYyBjb2RlIFx1MWVkZiBcdTAxMTFcdTAwZTJ5XG59XG5cbnNldC5zZWVkKDEyMylcbiMgQ29kZTogdFx1MWVlYiBwaFx1MDBlMm4gcGhcdTFlZDFpIE4oNSwxMCkgY2hcdTFlY2RuIG1cdTFlYWJ1IHF1eSBtXHUwMGY0IDEwMCwgbFx1MWViN3AgbFx1MWVhMWkgMTAwMDAgbFx1MWVhN25cblxuXG4jIENvZGU6IHRcdTAwZWRuaCBwaFx1MDFiMFx1MDFhMW5nIHNhaSBtXHUxZWFidSBjaG8gdFx1MWVlYm5nIGVzdGltYXRvciIsInNvbHV0aW9uIjoibiA8LSAxMDBcbncgPC0gYyhyZXAoKDErMC41KS9uLG4vMikscmVwKCgxLTAuNSkvbixuLzIpKVxuXG5tdV90aWxkZSA8LSBmdW5jdGlvbih4KXtcbiAgc3VtKHcqeClcbn1cblxuc2V0LnNlZWQoMTIzKVxuZXN0X2JhciA8LSByZXBsaWNhdGUobj0xMDAwMCwgZXhwciA9IG1lYW4ocm5vcm0oMTAwLDUsMTApKSlcbmVzdF90aWxkZSA8LSByZXBsaWNhdGUobj0xMDAwMCwgZXhwciA9IG11X3RpbGRlKHJub3JtKDEwMCw1LDEwKSkpXG5cbnZhcl9iYXIgPC0gdmFyKGVzdF9iYXIpXG52YXJfdGlsZGUgPC0gdmFyKGVzdF90aWxkZSlcbmQgPC0gY2JpbmQodmFyX2Jhcix2YXJfdGlsZGUpXG5jb2xuYW1lcyhkKSA8LSBjKGV4cHJlc3Npb24oaGF0KG11KSksIGV4cHJlc3Npb24odGlsZGUobXUpKSlcbmxpYnJhcnkoa25pdHIpXG5rYWJsZShkKSAlPiVcbiAga2FibGVfc3R5bGluZyhib290c3RyYXBfb3B0aW9ucyA9IFwic3RyaXBlZFwiLCBmdWxsX3dpZHRoID0gRikifQ==