Saturday 26 August 2017

Stata Generate Moving Average Variable


Esta estrutura de dados é bastante imprópria para fins. Assumindo um id identificador você precisa remodelar. por exemplo. Então, uma média móvel é fácil. Use tssmooth ou apenas gere. por exemplo. Mais informações sobre por que sua estrutura de dados é bastante imprópria: não só o cálculo de uma média móvel precisa de um loop (não envolvendo necessariamente o egen), mas você criaria várias novas variáveis ​​extras. Usar aqueles em qualquer análise subsequente estaria em algum lugar entre estranho e impossível. EDITAR Eu dou um loop de amostra, enquanto não me movendo da minha posição de que é uma técnica fraca. Eu não vejo uma razão por trás de sua convenção de nomeação, pelo que P1947 é um meio para 1943-1945. Eu suponho que isso é apenas um erro de digitação. Vamos supor que temos dados para 1913-2012. Por meio de 3 anos, perdemos um ano em cada final. Isso poderia ser escrito de forma mais concisa, à custa de uma enxurrada de macros dentro das macros. O uso de pesos desiguais é fácil, como acima. O único motivo para usar egen é que ele não desiste se houver faltas, o que acima irá fazer. Por uma questão de integridade, note que é fácil lidar com falhas sem recorrer a Egen. E o denominador Se todos os valores estiverem faltando, isso diminui para 00, ou falta. Caso contrário, se algum valor estiver faltando, adicionamos 0 ao numerador e 0 ao denominador, o que é o mesmo que ignorá-lo. Naturalmente, o código é tolerável como acima para as médias de 3 anos, mas para esse caso ou para uma média de mais de anos, substituiria as linhas acima por um loop, o que o Egen faz. Muitas vezes, podemos estar interessados ​​em gerar uma Média móvel espacial de uma característica X. Podemos usar essa média móvel para ajudar a controlar a heterogeneidade na população que pode estar relacionada à distribuição espacial das observações. Para fazer isso precisamos ter um método de geração de uma média espacial. Codigo isso manualmente porque não tenho experiência com dados espaciais no Stata e não sei o que o comando embutido é (assumindo que existe um). Se você está apenas procurando o meio espacial, então você pode favorecer o comando embutido. No entanto, este método é flexível e facilmente modificável se, por exemplo, você gostaria de usar medidas além da fórmula de distância Euclidiana 2D e, em vez disso, preferiria a fórmula 3D ou fórmula nD realmente. Da mesma forma, a estatística média móvel pode ser facilmente substituída por variância em movimento ou qualquer outra estatística que possa ser gerada através do comando Egen. Assim, este exercício pode ser útil para examinar, mesmo que seja redundante. Global Nobs 1000 clear set obs Nobs Gerar 2D coordenadas gen latt runiform () 100 gen longg runiform () 100 Gerar a variável de interesse. A variável terá um componente aleatório e um componente espacialmente dependente. Gen X (lattlongg) 100rnormal () dois (scatter latt X) (scatter longg X) Podemos ver que, embora haja uma tendência geral para valores maiores como longitude ou aumento de latitude, é difícil identificar qualquer padrão forte. Agora, vamos calcular a média móvel de X para cada observação. (Provavelmente há um comando para isso que eu não sei). Gen Xave. Gen dist. Forv i1Nobs Calcular a distância de todos os pontos de obs i substituir dist ((latt-latti) 2 (longg-longgi) 2) .5 Calcular a média de X se a distância estiver dentro da faixa de interesse egen tempx mean (X) if distltmeanange Substitua Xave tempx se ni cair tempx dois (scatter latt Xave) (scatter longg Xave) Agora, olhando a média móvel, podemos identificar visualmente o efeito da localização no valor esperado de X.

No comments:

Post a Comment