AVIS: Le groupe de consultation IDRE Statistical migrera le site Web vers le WordPress CMS en février pour faciliter la maintenance et la création de nouveaux contenus. Certaines de nos anciennes pages seront supprimées ou archivées de sorte qu'elles ne seront plus conservées. Nous essaierons de maintenir les redirections afin que les anciennes URL continuent à fonctionner de la meilleure façon possible. Bienvenue à l'Institut de recherche et d'éducation numérique Aidez le Stat Consulting Group en donnant un cadeau Stata FAQ Comment puis je recoder les valeurs manquantes dans différentes catégories Stata nous permet de coder différents types de valeurs manquantes numériques. Il comporte 27 catégories manquantes numériques. Quot. a quot. Qu quot et quot. Quot. Dans cette page, nous allons montrer comment coder les valeurs manquantes dans différentes catégories. Nous créons d'abord un ensemble de données à des fins d'illustration. Dans cet ensemble de données, toutes les variables sont numériques et les variables femelle et ses ont des valeurs manquantes. Les valeurs non manquantes pour la variable femelle est 0 (pour le mâle) et 1 (pour le féminin). Les valeurs non manquantes pour la variable ses sont 0 (bas), 1 (med) et 2 (haut). Le reste des valeurs sont considérés comme des valeurs manquantes. Disons que nous voulons coder 999 dans une catégorie, 99 dans une autre et le reste de valeurs manquantes dans une troisième catégorie pour toutes les variables. Méthode 1: Utilisation de la commande replace Nous pouvons manuellement remplacer les valeurs manquantes par quot. a quot pour 999, quot. b quot pour 99 et. c pour le reste des valeurs manquantes. Par exemple, pour variable femelle. Nous pouvons faire ce qui suit: La commande codebook ci dessus montre que variable femelle a trois types de valeurs manquantes et 4 valeurs manquantes. Méthode 2: Utilisation de la commande mvdecode La méthode 1 peut ne pas être le meilleur moyen de recoder les valeurs manquantes dans différentes catégories. D'une part, nous devons faire une variable à la fois. Statas mvdecode commande vient très pratique pour nous. Mieux encore, nous pouvons utiliser le mot clé tous pour faire référence à toutes les variables dans l'ensemble de données. Passer de codes de valeur manquants à des valeurs numériques L'autre question que nous allons aborder ici est de savoir comment changer les codes de valeur manquants à des valeurs numériques. La commande mvencode est jumelée à la commande mvdecode que nous venons de voir ci dessus et est celle à utiliser ici. Le contenu de ce site Web ne doit pas être interprété comme un endossement d'un site Web, d'un livre ou d'un produit logiciel particulier par l'Université de Californie. Data Reed Site Navigation Données manquantes dans Stata Note: Lorsque vous travaillez avec des données manquantes, Pourquoi ces données sont manquantes. Dans les données d'enquête, les valeurs manquantes peuvent signifier que l'enquêteur n'a pas posé la question, que le répondant n'a pas répondu à la question ou que les données manquent vraiment. (Certains ensembles de données ont ces trois cas codés différemment d'autres les groupent. Vérifiez votre metadatacodebook pour vous assurer que vous savez ce que vous travaillez avec) Pour les données numériques, gardez à l'esprit que les données manquantes ne sont pas les mêmes que la valeur de zéro. (Cela peut sembler évident, mais j'ai eu beaucoup d'étudiants nonchalamment dire oh, donc nous pouvons simplement remplacer ceux avec des zéros. Non.) Considérez ceci dans le contexte du kilométrage de gaz. MPG 0 est très différent de MPG Im pas sûr. Différents codes logiciels statiques manquent des données différemment. Dans Stata, si votre variable est numérique et que vous manquez des données, vous verrez. Période dans votre jeu de données. Si vous travaillez avec des variables de chaîne, les données apparaîtront 160 160 160 vierges. Les valeurs de données manquantes affecteront la façon dont Stata gère vos données. Certaines procédures communes sont ci dessous pour d'autres, vérifiez la documentation Stata. Résumer n'utilise que des valeurs non manquantes. Tabulation: les valeurs manquantes sont exclues par défaut. Utilisez l'option manquante dans l'onglet pour inclure les valeurs manquantes. Les corrélations calculées sur des paires avec des données non manquantes par défaut (suppression par paires des données manquantes) utilisent pwcorr pour la suppression de la liste des données manquantes. Regression si une observation manque de données pour une variable dans le modèle de régression, cette obsevation est exclue de la régression (suppression de la liste des données manquantes) Recherche de valeurs manquantes Lorsque vous chargez des données dans Stata, vous verrez probablement des statistiques descriptives ou certaines Autres données sommaire. La commande resume affichera la liste du nombre de valeurs manquantes que vous avez. Les ressources supplémentaires que vous pouvez utiliser pour rechercher les valeurs manquantes sont les paquetages mdesc, mvpatters et misschk. Ces paquets ne sont pas fournis avec Stata, mais peuvent être téléchargés en tapant findit mdesc à la ligne de commande Stata. Suppression de données manquantes Utilisez la commande Statas drop, associée à une instruction conditionnelle logique, pour supprimer les valeurs manquantes. Exemples: Drop cases missing string data (pour la variable importanttringvariable) drop if importantvariable 160 Drop cases missing données numériques160 (for variable variablenumericvariable) drop if importantvariable. Drop cases missing data (string160 ou numeric, pour la variable importanteitherkindofvariable) drop if missing (importantitherkindofvariable) 160 Vous pouvez également recoder ou remplacer les valeurs manquantes voir ci dessous pour plus de détails sur ces opérations. Valeurs manquantes: Quelques documents pertinents
No comments:
Post a Comment