Saturday 5 January 2019

Análise de fatores policíclicos em stata forex


Eu estou usando Stata 12.0, e Ive baixou o comando polychoricpca escrito por Stas Kolenikov, que eu queria usar com dados que incluem uma combinação de variáveis ​​categóricas e contínuas. Dado o número de variáveis ​​(cerca de 25), meu pressentimento é que eu precisarei gerar mais de 3 componentes. Em última análise, gostaria de gerar um punhado de componentes significativos (em vez de dezenas de variáveis) e usar os componentes como variáveis ​​independentes na regressão logística. Usando polychoricpca. Posso gerar uma tabela que mostra os autovalores e os autovetores (carregamentos) para cada variável apenas para os três primeiros componentes (3). Polychoricpca parece chamar esses coeficientes de pontuação de carga e produz estes para cada nível da variável, de modo que se uma variável possui três categorias, você verá três coeficientes de pontuação (carregamentos) para essa variável. Nunca tendo trabalhado com PCA policoric antes, eu costumava ver apenas uma carga por variável. Quero examinar esses coeficientes (carregamentos) para tentar entender quais são os componentes e como eles podem ser rotulados. (1) E se parece que eu deveria gerar 4 componentes Parece que eu não seria capaz de examinar e entender o que é o 4º componente porque não consigo ver como cada um dos itens é carregado nesse 4º componente, apenas os primeiros 3 . Existe uma maneira de ver como cada item carrega em mais do que os três primeiros componentes (2) Posso usar a matriz de correlação policromática combinada com o comando Statas pcamat para examinar como cada item é carregado em cada componente (a tabela do vetor de auto). Eu pensei que isso poderia ser uma maneira de poder examinar as cargas se eu tiver mais de 3 componentes. A idéia veio dessas postagens de UCLA de estatísticas sobre como usar o factormat com uma matriz de correlação policaróica. O pcamat em Stata, no entanto, produz apenas 1 carga (coeficiente) por variável, e não 1 carga para cada nível da variável. Qualquer opinião sobre se seria apropriado apenas denunciar o único carregamento do pcamat. Solicitado 13 de dezembro 12 às 18: 25NOTICE: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar a manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisas Digitais e Educação Ajude o Grupo de Consultoria Estatal dando um presente Stata FAQ Como posso realizar uma análise fatorial com variáveis ​​categóricas (ou categóricas e contínuas) Métodos padrão de análise fatorial (ou seja, baseados em uma matriz de Correlações Pearsons) assumem que as variáveis ​​são contínuas e seguem uma distribuição normal multivariada. Se o modelo inclui variáveis ​​que são dicotômicas ou ordinais, uma análise fatorial pode ser realizada usando uma matriz de correlação policaróica. Em Stata podemos gerar uma matriz de correlações policortricas usando o comando policarralizado escrito pelo usuário. Você pode encontrar e instalar o comando polychoric digitando findit polychoric na janela de comando Stata e seguindo as instruções na tela. Para obter mais informações sobre como localizar e instalar comandos escritos pelo usuário, consulte nossas Perguntas frequentes: Como eu uso findit para pesquisar programas e ajuda adicional. Observe que as variáveis ​​usadas com policarico podem ser binárias (01), ordinais ou contínuas, mas não podem ser nominais (categorias não ordenadas). Observe também que as correlações na matriz produzida pelo comando policarico não são todas correlações policortricas. Quando ambas as variáveis ​​têm 10 ou menos valores observados, uma correlação policarólica é calculada, quando apenas uma das variáveis ​​assume 10 ou menos valores (ou seja, uma variável é contínua e a outra categórica) uma correlação polyserial é calculada e se ambas as variáveis ​​tomam Em mais de 10 valores, uma correlação Pearsons é calculada. Uma vez que tenhamos uma matriz de correlação policaróica, podemos usar o comando factormat para realizar uma análise de fatores exploratórios usando a matriz como entrada, e não como variáveis ​​brutas. O conjunto de dados para este exemplo inclui dados em 1428 estudantes universitários e seus instrutores. O exemplo de análise inclui variáveis ​​dicotômicas, incluindo o sexo do corpo docente (facsex) e a nacionalidade do corpo docente (cidadão dos EUA ou cidadão estrangeiro, facnat). Variáveis ​​categóricas ordenadas, incluindo classificação de faculdade (facrank), classificação de alunos (grau de estudo) e grau (A, B, C, Etc.) e as variáveis ​​contínuas do salário da faculdade (salário), anos de ensino na Universidade do Texas (ano) e número de alunos na turma (nstud) nesta análise. Essas variáveis ​​foram selecionadas para representar uma gama de tipos de variáveis ​​(ou seja, dicotômicas, ordenadas categóricas e contínuas) e não formam necessariamente fatores substancialmente significativos. Abaixo, abrimos o conjunto de dados e geramos a matriz de correlação policarólica para as oito variáveis ​​em nossa análise. Você pode notar que o comando policíclico corre um pouco mais lentamente do que Statas correlacionar e comandos pwcorr, isso é normal. O comando polychoric não exibe o número de casos (com exclusão de lista) usado para gerar a matriz, mas armazena n in r (sumw) para que possamos usar o comando de exibição para visualizá-lo. Em seguida, usamos o comando matricial para armazenar a matriz de correlação policorica (salva em r (R) pelo comando policarral) como r. Para que possamos usá-lo com o comando factormat. O comando factormat é seguido pelo nome da matriz que desejamos usar para a análise (ou seja, r). O quotoptionquot n (.) Dá o tamanho da amostra e é necessário. Utilizamos os fatores (.) Opção para indicar que desejamos reter três fatores. A saída de análise de fator acima pode ser interpretada de forma semelhante a um modelo de análise de fatores padrão, incluindo o uso de métodos de rotação para aumentar a interpretabilidade. Eu uso Stata 12.0, e Ive baixou o comando polychoricpca escrito por Stas Kolenikov, que eu queria usar Com dados que incluem uma combinação de variáveis ​​categóricas e contínuas. Dado o número de variáveis ​​(cerca de 25), meu pressentimento é que eu precisarei gerar mais de 3 componentes. Em última análise, gostaria de gerar um punhado de componentes significativos (em vez de dezenas de variáveis) e usar os componentes como variáveis ​​independentes na regressão logística. Usando polychoricpca. Posso gerar uma tabela que mostra os autovalores e os autovetores (carregamentos) para cada variável apenas para os três primeiros componentes (3). Polychoricpca parece chamar esses coeficientes de pontuação de carga e produz estes para cada nível da variável, de modo que se uma variável possui três categorias, você verá três coeficientes de pontuação (carregamentos) para essa variável. Nunca tendo trabalhado com PCA policoric antes, eu costumava ver apenas uma carga por variável. Quero examinar esses coeficientes (carregamentos) para tentar entender quais são os componentes e como eles podem ser rotulados. (1) E se parece que eu deveria gerar 4 componentes Parece que eu não seria capaz de examinar e entender o que é o 4º componente porque não consigo ver como cada um dos itens é carregado nesse 4º componente, apenas os primeiros 3 . Existe uma maneira de ver como cada item carrega em mais do que os três primeiros componentes (2) Posso usar a matriz de correlação policromática combinada com o comando Statas pcamat para examinar como cada item é carregado em cada componente (a tabela do vetor de auto). Eu pensei que isso poderia ser uma maneira de poder examinar as cargas se eu tiver mais de 3 componentes. A idéia veio dessas postagens de UCLA de estatísticas sobre como usar o factormat com uma matriz de correlação policaróica. O pcamat em Stata, no entanto, produz apenas 1 carga (coeficiente) por variável, e não 1 carga para cada nível da variável. Qualquer opinião sobre se seria apropriado apenas denunciar o único carregamento do pcamat. Solicitado 13 de dezembro 12 às 18: 25 Estou usando Stata 12. Meu conjunto de dados contém cerca de 50 variáveis ​​categóricas (ordinais). Estou tentando desenvolver uma escala. Como minhas variáveis ​​são categóricas, em vez da correlação de Pearson, eu estava tentando fazer análise de componente principal baseada em correlação policarólica. Eu digitei vírgulas policristalinas e recebi saída de matriz de correlação e saída de PCA com autovalores, proporção explicada, etc., tudo bem. Em seguida, eu estava tentando obter um screeplot e depois fazer análises paralelas (usando o comando fapara, que eu baixei). Mas quando eu dei o comando screeplot recebi a seguinte resposta: Então tentei o comando polychoricpca, mas também surgiu a mesma resposta enquanto tentava o screeplot. Então eu tentei o comando pcamat r (R), n (tamanho da amostra) que surgiu com a seguinte resposta: Alguém pode me ajudar com as seguintes perguntas: 1) Qual seria a maneira correta de fazer PCA com matriz de correlação policaróica, ou seja, o comando 2) É possível obter screeplot depois de fazer o PCA Como 3) É possível fazer análises paralelas Como, por favor, também me educem na análise fatorial, pois farei isso depois. Há algumas perguntas. Para o número (2): quot screeplot obtém automaticamente os autovalores após os comandos de estimativa que possuem eigen como um de seus e (propriedades) e que armazenam os autovalores na matriz e (Ev).quot Isso não parece manter para o usuário escrito Comando policíclico. Portanto, o erro. Isto é claramente indicado na ajuda screeplot. Ndash Roberto Ferrer 25 de janeiro 15 às 5:42 Isso é principalmente fora do tópico, tanto quanto o estouro de pilha está em causa. A maioria dos tópicos fora de tópico é o pedido para educá-lo na análise fatorial: essa seria uma questão muito ampla em qualquer fórum que eu conheça. Como Roberto Ferrer disse com razão que o screeplot não é suportado pelos comandos que você usou e isso é explicado claramente nas mensagens de erro. Digitar os autovalores em Stata como dados é uma maneira fácil, embora tediosa, de trabalhar em direção a uma trama de sucesso. Ndash Nick Cox jan 25 15 às 10:31

No comments:

Post a Comment