Jeg har prøvd å bruke følgende kode for å evaluere falske positive frekvensen av en forskjell i middel estimat.
sm_n <- 10
dat <- data.frame(b=rep(c(a,b),c(4,6)),
x = c(0,1,0,0,0,1,0,0,1,1),
nb=rep(c(4,6),c(4,6)))
dat$y0 <- 1000*dat$x+c(0,0,0,0,1,2,3,400,5000,60000)
## summary(lm(y0~x,data=dat))$r.squared
## dat$Z <- ifelse(dat$b==a,complete_ra(N=4), complete_ra(N=6,m=2))
set.seed(12345)
dat$Z <- block_ra(blocks = dat$b, block_m = c(2,2))
dat$tau <- c(2500,0,2500,0,25000,25000,0,0,0,50000)
dat$y1 <- dat$y0 + dat$tau
trueATE <- with(dat,mean(y1-y0))
trueRankATE <- with(dat,mean(rank(y1)-rank(y0)))
dat$Y <- with(dat,Z*y1 + (1-Z)*y0)
dat$ZF <- factor(dat$Z)
dat %<>% group_by(b) %>% mutate(pi=mean(Z), #prob treated
nbwt=Z/pi + (1-Z)/(1-pi))
Estimatet på seg selv fungerer fint, og det gjør den funksjonen som genererer et nytt tilfeldig oppdrag med ingen systematisk sammenheng mellom Z og alt annet. Men når jeg prøver å kjøre funksjonen til å trekke p-verdiene, får jeg følgende feilmelding:
Feil i kamp (x, bord, nomatch = 0L): 'match' krever vektor argumenter '
Problemet synes å ha oppstått i 'difference_in_means (Y ~ newexp (b), blokkerer = b, data = dat)'
est3 <- difference_in_means(Y~Z,blocks=b,data=dat)
summary(est3)
newexp <- function(b){
## A new random assignment with no systematic relationship between Z and anything else
Z <- block_ra(blocks = dat$b, block_m = c(2,2))
return(Z)
}
get_p_val_from_difference_in_means<-function(){
## First, shuffle to break the relationship, to make the truth zero
## Then, test
theest <- difference_in_means(Y~newexp(b), blocks=b,data=dat)
thep <- coef(summary(theest))[1,4]
thep
}
est3ps <- replicate(1000, get_p_val_from_difference_in_means())
mean(est3ps < .05)
plot(ecdf(est3ps ), ylim = c(0,1), xlim = c(0,1))
abline(0,1)