Probabilidades y Estadística. Tarea 4

Universidad abierta para adultos (UAPA).

Bienvenidos a la cuarta semana de trabajo en la asignatura Probabilidades y Estadística, en la que se realizarán las siguientes actividades:

INTRODUCCION

El presente trabajo vamos a definir algunos conceptos muy importantes, ya un poco más avanzado dentro de la estadística. Con estos conceptos vamos a poder comprender más a fondo todo lo relacionado con estadística y probabilidades.

Los conceptos que vamos a estar definiendo son: el muestreo, estimación paramétrica, Dócimas paramétricas, entre otros.

Tarea IV

Investigar en la Web o en cualquier otra fuente Bibliográfica los siguientes conceptos asociados a la unidad III y última del programa de Probabilidades y Estadística:

Muestreo y estimación paramétrica:

Muestreo: es la técnica para la selección de una muestra a partir de una población estadística.

Al elegir una muestra aleatoria se espera conseguir que sus propiedades sean extrapolables a la población. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a los que se alcanzarían si se realizase un estudio de toda la población. En las investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger información sobre poblaciones.

Estimación paramétrica: es una rama de la estadística inferencial que comprende los procedimientos estadísticos y de decisión que están basados en las distribuciones de los datos reales. Estas son determinadas usando un número finito de parámetros. Esto es, por ejemplo, si conocemos que la altura de las personas sigue una distribución normal, pero desconocemos cuál es la media y la desviación de dicha normal. La media y la desviación típica de la distribución normal son los dos parámetros que queremos estimar. Cuando desconocemos totalmente qué distribución siguen nuestros datos entonces deberemos aplicar primero un test no paramétrico, que nos ayude a conocer primero la distribución.

Dócimas paramétricas para parámetros de una población:

Se llama parámetros poblacionales a cantidades que se obtienen a partir de las observaciones de la variable y sus probabilidades y que determinan perfectamente la distribución de esta, así como las características de la población, por ejemplo: La media, μ, la varianza σ2, la proporción de determinados sucesos, P.

Los Parámetros poblacionales son números reales, constantes y únicos.

Dócimas y prueba de hipótesis paramétrica y no paramétrica:

Las pruebas paramétricas asumen distribuciones estadísticas subyacentes a los datos. Por tanto, deben cumplirse algunas condiciones de validez, de modo que el resultado de la prueba paramétrica sea fiable. Por ejemplo, la prueba t de Student para dos muestras independientes será fiable solo si cada muestra se ajusta a una distribución normal y si las varianzas son homogéneas.

Las pruebas no paramétricas no deben ajustarse a ninguna distribución. Pueden por tanto aplicarse incluso aunque no se cumplan las condiciones de validez paramétricas.

Técnicas de Análisis de Varianzas con una o dos características de clasificación, varianza y desvío de una población:

En estadística, el análisis de la varianza (ANOVA, ANalysis Of VAriance, según terminología inglesa) es una colección de modelos estadísticos y sus procedimientos asociados, en el cual la varianza está particionada en ciertos componentes debidos a diferentes variables explicativas.

En primer lugar, y como se realizarían simultánea e independientemente varios contrastes de hipótesis, la probabilidad de encontrar alguno significativo por azar aumentaría. En cada contraste se rechaza la H0 si la t supera el nivel crítico, para lo que, en la hipótesis nula, hay una probabilidad a. Si se realizan m contrastes independientes, la probabilidad de que, en la hipótesis nula, ningún estadístico supere el valor crítico es (1 – a) m, por lo tanto, la probabilidad de que alguno lo supere es 1 – (1 – a) m, que para valores de a próximos a 0 es aproximadamente igual a a m. Una primera solución, denominada método de Bonferroni, consiste en bajar el valor de a, usando en su lugar a/m, aunque resulta un método muy conservador.

Modelos y método del Diseño experimental: es una técnica estadística que permite identificar y cuantificar las causas de un efecto dentro de un estudio experimental. En un diseño experimental se manipulan deliberadamente una o más variables, vinculadas a las causas, para medir el efecto que tienen en otra variable de interés. El diseño experimental prescribe una serie de pautas relativas qué variables hay que manipular, de qué manera, cuántas veces hay que repetir el experimento y en qué orden para poder establecer con un grado de confianza predefinido la necesidad de una presunta relación de causa-efecto.
El diseño experimental encuentra aplicaciones en la industria, la agricultura, la mercadotecnia, la medicina, la ecología, las ciencias de la conducta, etc. constituyendo una fase esencial en el desarrollo de un estudio experimental.

Es una técnica estadística que permite identificar y cuantificar las causas de un efecto dentro de un estudio experimental. En un diseño experimental se manipulan deliberadamente una o más variables, vinculadas a las causas, para medir el efecto que tienen en otra variable de interés. El diseño experimental prescribe una serie de pautas relativas qué variables hay que manipular, de qué manera, cuántas veces hay que repetir el experimento y en qué orden para poder establecer con un grado de confianza predefinido la necesidad de una presunta relación de causa-efecto.

El diseño experimental encuentra aplicaciones en la industria, la agricultura, la mercadotecnia, la medicina, la ecología, las ciencias de la conducta, etc. constituyendo una fase esencial en el desarrollo de un estudio experimental.

Muestreo: es la técnica para la selección de una muestra a partir de una población estadística.

Regresión y correlación:

Regresión: el análisis de regresión consiste en emplear métodos que permitan determinar la mejor relación funcional entre dos o más variables concomitantes (o relacionadas). El análisis de correlación estudia el grado de asociación de dos o más variables.

Correlación: el análisis de correlación emplea métodos para medir la significación del grado o intensidad de asociación entre dos o más variables. El concepto de correlación está estrechamente vinculado al concepto de regresión, pues, para que una ecuación de regresión sea razonable los puntos muéstrales deben estar ceñidos a la ecuación de regresión.

Estimaciones: Estimación (o estimar) es el proceso de encontrar una aproximación sobre una medida, lo que se ha de valorar con algún propósito es utilizable incluso si los datos de entrada pueden estar incompletos, incierto, o inestables. En el ámbito de la estadística estimación implica ” usar el valor de una estadística derivada de una muestra para estimar el valor de un parámetro correspondiente a población”; la muestra establece que la información puede ser proyectada a través de diversos factores, formal o informalmente, son procesos para determinar una gama muy probablemente y descubrir la información que falta. Cuando una estimación resulta ser incorrecta, se denomina “overestimate” si la estimación superó el resultado real y una subestimación si la estimación se quedó corto del resultado real.

Dócimas: Es otra forma de hacer inferencia estadística (inductiva) cuyo objetivo es probar una hipótesis acerca de los parámetros de una población (esperanza, varianza, etc.) o acerca de la población misma (algún modelo probabilístico particular,. . ., etc.). Definiendo a partir de la m.a. un procedimiento o regla de decisión que nos permita concluir probabilísticamente la aceptación o rechazo de tal hipótesis.

Selección de variables:

En aprendizaje de máquina y estadística, selección de característica, también conocida como selección de variable, selección de atributo o selección de subconjunto variable, es el proceso de seleccionar un subconjunto de características pertinentes (variables, predictores) para su uso en construcción de modelos. Las técnicas de selección de la característica son utilizadas por cuatro razones:

Simplificación de modelos con el fin de hacerlas más sencillas de interpretar para los usuarios/investigadores,1
Tiempo de entrenamiento más corto,
Para evitar la maldición de la dimensionalidad (curse of dimensionality),
Generalización realzada por reducir overfitting2 (formalmente, reducción de varianza)

La premisa central cuando se utiliza una técnica de selección de características es que el dato contiene muchas redundantes o irrelevantes, y así pueden ser removidas sin incurrir en mucha pérdida de la información. Las características redundantes o irrelevantes son dos nociones distintas, pues una característica relevante puede ser redundante en la presencia de otra característica relevante con la que está fuertemente correlacionada.

Análisis de Residuos:

Si bien para la estimación por mínimos cuadrados de los coeficientes de un modelo de regresión, sólo es necesaria la asunción de linealidad, la normalidad de los mismos, en base a la cual se realizan los contrastes de hipótesis, está basada también en las asunciones de normalidad y homoscedasticidad. Por consiguiente, conviene asegurar que dichas asunciones se cumplen en cada caso.

Hay que tener en cuenta que, en caso de que no se cumpla la normalidad, no se puede utilizar la t ni la F para los contrastes de hipótesis. Puede usarse, sin embargo, la desigualdad de Tchebysheff, que establece que para cualquier variable aleatoria

CONCLUSION

Al concluir este trabajo, podemos entender la importancia de algunos conceptos y de cómo estos nos ayudarían a la hora de hacer un trabajo de estadística. Como por ejemplo el muestreo nos ayuda a coger una pequeña proporción de la población que se va a encuestar, para así no tener que hacérselo a la población completa sino a una sola parte de esta.

[ratings]

Universidad abierta para adultos (UAPA).

Related Posts

Deja una respuesta Cancelar la respuesta