Uso y Manejo Básico de Bases de datos en STATA 12

Uso y Manejo Básico de Bases de datos en STATA 12 Carrera: Economía Aplicada Asignatura: Econometría 1 Profesor: Carlos Narváez Silva Inicialmente

55 downloads 7 Views 526KB Size

Recommend Stories


ANÁLISIS DE DATOS CON STATA (Manejo de base de datos) Fortino Vela Peón Agosto, 2011
ANÁLISIS DE DATOS CON STATA (Manejo de base de datos) Fortino Vela Peón [email protected] Agosto, 2011 F. VELA Introducción  Las bases de da

Manejo de Bases de Datos Mysql en Lenguaje C
http://undersecurity.net Servidor irc : irc.ircnode.com Canal irc : #undersec Manejo de Bases de Datos Mysql en Lenguaje C By: S[e]C Entendiendo el

Story Transcript

Uso y Manejo Básico de Bases de datos en STATA 12

Carrera: Economía Aplicada Asignatura: Econometría 1 Profesor: Carlos Narváez Silva

Inicialmente la interfaz del programa STATA presenta las siguientes opciones para trabajar

1

2

4

3

5

Las opciones presentadas en 1 son muy similares a la barra de opciones de un Word aunque con ciertas características especiales. File: permiten abrir/ guardar archivos Edit: Copiar/Guardar Data: Permite un mayor control en las variables utilizadas, esto es: reconocer su etiqueta, cambiar nombres, crear matrices de variables, etc. Graphics: Creación de gráficos Statistics: Opciones para análisis de datos, estadísticos descriptivos, regresiones, pruebas estadísticas, etc.

User, Window, Help: Opciones de apoyo del programa Stata El espacio dentro de la interfaz de Stata que corresponde a Command (2) guardará por defecto todos los comandos usados El espacio dentro de la interfaz de Stata que corresponde a STATA (3), que es el espacio más grande de la pantalla presentará todos los resultados de nuestro trabajo El espacio dentro de la interfaz de Stata que corresponde a Variables (4), presentará todas las variables a usar, es decir, al momento de abrir la base de datos ésta se abrirá en este espacio con el nombre de cada una de sus variables El espacio dentro de la interfaz de Stata que corresponde a Command (5) corresponde el área donde se introducen los comandos para analizar la base de datos, por ejemplo: “tab x”, siendo x una variable de nuestra base de datos Indica, entre otros estadígrafos, la frecuencia y el porcentaje de las observaciones que caracterizan a la variable “X”.

Para abrir una base de datos

Abrir una base de datos es igual a abrir cualquier archivo en Word, o Excel. Solo se presiona en la carpetita señalada por la flecha y se busca en sus documentos el archivo de la base de datos deseado.

*Las bases de datos serán proporcionadas en el Blog de la clase o enviadas a un correo del Aula en formato SPSS, para pasarlo a archivo “.dta” que es el tipo de archivo que reconoce el STATA se hará uso del Stat-Transfer.

Para abrir un Do-file

Un Do-File es una opción que el Stata nos presenta en el cual se permite guardar toda la secuencia que se ha trabajado, es un registro de los comandos usados al momento de modificar o analizar la base de datos. Al momento de dar click en la pestaña señalada por la flecha se abrirá una ventana nueva, de ésta ventana se puede abrir desde “File” el archivo “.do”

que

representa

nuestro do-file. El

do-

file

puede

ser

ejecutado con la pestaña “Execute” presentada con la flecha. Esto correrá toda la secuencia guardada

Ejemplo de Uso

Utilizando “label list” como comando, se puede obtener el valor asignado por el digitador de datos a la variable en cuestión, aquí el digitador utilizó el valor 1 para representar el área de residencia Urbana. Utilizó 2 para representar el área de residencia Rural

Una vez abierto el STATA y su base de datos, en este caso “Población” Según la EMNV 2005, se pueden obtener datos específicos de la misma, si se quiere obtener el porcentaje y frecuencia de mujeres y hombres capturados por la encuesta se utiliza el comando “tab”

Ej:

tab s2p3

ENTER

Si se quiere saber el área de residencia se utiliza el mismo proceso Ej: tab i05

ENTER

Se puede apreciar que la mayoría de los encuestados son mujeres (50.6%) y que los encuestados en su mayoría son rurales. Esto

nos da un total de 36,612 de

encuestados.

De esta manera se pueden obtener datos aún más específicos. Si le queremos decir al software que nos proporcione a el número de mujeres que se encuentran en el área rural se procede de la siguiente manera

Este comando nos dice que tabulemos la pregunta referente a sexo si ésta es mujer y se encuentra en el área rural: 9,380 mujeres habitan en zonas rurales.

Para conocer otros estadígrafos sobre una variable, se utiliza el comando “sum” el cual nos da el número de observaciones, la media, la desviación estándar, el mínimo y el máximo de la variable. . sum precio Variable

Obs

Mean

precio

5024

50.58632

Std. Dev. 59.09051

Min

Max

.8064

226.8

Como podemos observar aquí se aplicó el comando “sum” a la variable “precio” el cual nos indica que contamos con 5,024 observaciones en la variable; la media del precio es de 50.59 córdobas. Por otro lado la desviación estándar es de 59.09 y que el precio mínimo es de 0.80 córdobas y el precio máximo es de 226.8 córdobas.

Los comandos “gen” como “replace” son comandos importantes a la hora de manejo de base de datos, esto es debido a que el comando “gen” nos permite generar una variable dentro de la base de datos, mientras que el comando “replace” nos ayuda a remplazar datos en una variable ya existente. Tras haber explicado esto es necesario un ejemplo para tener un mayor entendimiento por lo que se les presenta un ejemplo. Por ejemplo, queremos generar una variable que se llame “rural” en el cual queremos indicar que cuando sea “1” la variable indique a todas las personas que residen en el área rural mientras que si toma valor igual a 0 es que residen en una área urbana. . gen rural=0 . . replace rural=1 if i06==2 (19325 real changes made) . tab rural rural

Freq.

Percent

Cum.

0 1

17,287 19,325

47.22 52.78

47.22 100.00

Total

36,612

100.00

Como se puede ver en la imagen primero se generó una variable que sea igual a 0 con el comando “gen”. Luego se utiliza el comando “replace” para editar la variable rural que se ha creado y que ésta tome uno (1) cuando la pregunta “i06”, la cual hace referencia al área de residencia, es igual a dos (2) debido a que este es el código para el área rural asignado por el digidator de datos en la pregunta. Después de esto utilizamos el comando “tab” para observar cu{ntas personas se encuentran en el área rural y debido a que anteriormente se le había asignado al número “1” como las personas que habitan en el {rea rural podemos decir que 19,325 personas pertenecen a esta y 17,287 son del área urbana.

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.