Название: Estadística aplicada a la ingeniería y los negocios
Автор: Carlos José Castillo
Издательство: Bookwire
Жанр: Математика
isbn: 9789972453564
isbn:
Luego, la probabilidad solicitada es: P(|(p1 − p2) – (π1 – π1) |≤ 0.1)
24. El Departamento de Sistemas de una empresa consultora desea comparar dos paquetes de software para el procesamiento de proyectos de Data Mining. Estos proyectos requieren del manejo de un gran volumen de datos, cuyo procesamiento consume gran cantidad de tiempo, dependiendo del volumen de los datos. Suponga que el tiempo de procesamiento de un proyecto de Data Mining estándar empleado por el software A es una variable aleatoria normal con media 54 minutos y desviación estándar 3 minutos, mientras que con el software B el tiempo de procesamiento tiene una distribución normal con media 52 minutos y desviación estándar 4 minutos. El ingeniero encargado de la evaluación de los paquetes de software ejecutará 21 veces el software A y 13 veces el software B.
a) Calcule la probabilidad de que la desviación estándar muestral de los tiempos de procesamiento obtenidos con el software A sea menor que la desviación estándar muestral obtenida con el software B.
Solución
X1: Tiempo de procesamiento, minutos, aplicando el software A
μ1 = 54 min, S1 = 3 min, n1 = 21
X1: Tiempo de procesamiento, minutos, aplicando el software B.
μ2 = 52 min, S2 = 4 min, n2 = 13
Se sabe que:
Se tiene que:
Se solicita calcular: P(S1 < S2)
b) Escenario A. Otro de los aspectos de evaluación se refiere al tiempo necesario para la adecuación de los datos al formato de ingreso en los mencionados paquetes de software. Para esta evaluación se ha decidido adecuar bases de datos de por lo menos 5000 registros y 20 columnas. Se sabe lo siguiente: el tiempo de adecuación de los datos para el ingreso en el software A presenta una distribución normal con media 172 seg y con una varianza desconocida pero estimada en 64 seg2; mientras que el tiempo de adecuación de los datos para el ingreso en el software B presenta una distribución normal con media 175 seg y con una varianza desconocida pero estimada en 100 seg2. Si se realizan pruebas con 32 y 35 bases de datos para el software A y B, respectivamente, determine la probabilidad de que la media muestral del tiempo de adecuación de datos para el software A supere a la media muestral del software B en a lo más 1 segundo. Suponga que las varianzas poblacionales son homogéneas.
Solución
1 : Media muestral del tiempo (en seg) de adecuación de datos para software A μ1 = 172 seg, S1 = 8 seg, n1 = 32
2 : Media muestral del tiempo (en seg) de adecuación de datos para software B
μ2 = 175 seg, S2 = 10 seg, n2 = 35
Se sabe que:
Entonces:
Se tiene que:
Luego, la probabilidad solicitada es:
c) Escenario B. Uno de los encargados del manejo de bases de datos ha determinado que las principales inconsistencias registradas en las bases de datos son:
• A: categorías de los atributos escritas de distinta forma y por lo tanto reconocidas como categorías diferentes.
• B: unidades de medida registradas en diferentes unidades a la establecida, lo cual genera errores en las proyecciones de venta.
Se determinó que el 2 % y 3 % de los registros presentan la inconsistencia tipo A y tipo B, respectivamente. Se realizará una revisión automatizada de 200 y 240 registros para la búsqueda de inconsistencias tipo A y tipo B, respectivamente. Determine la probabilidad de que la diferencia de las proporciones muestrales de registros con inconsistencias tipo A y B difiera en a lo más el 0.5 % con respecto a la diferencia de las proporciones poblacionales correspondientes.
Solución
p1: Proporción muestral de registros que presentan la inconsistencia tipo A
π1 = 0.02, n1 = 200
p2: Proporción muestral de registros que presentan la inconsistencia tipo B
π2 = 0.03, n2 = 240
Se sabe que:
μ(p1 − p2) = π1 - π2 = 0.02 – 0.03 = – 0.01
Luego, la probabilidad solicitada es: P(|(p1 − p2) − (π1 − π2) |≤ 0.005)
PROBLEMAS PROPUESTOS
1. En un distrito del cono este de Lima se viene desarrollando con mucho éxito la Escuela Municipal de Fútbol (EMF). Dicha escuela brinda entrenamiento a niños y adolescentes en 3 rangos de edades (categorías) en 2 turnos. En cada categoría y en cada turno se encuentran inscritos 40 participantes. El regidor encargado de las actividades deportivas y culturales ha pedido a uno de los practicantes de su despacho que realice una encuesta piloto para conocer diversos aspectos de los participantes y la percepción de estos sobre el desarrollo de los entrenamientos. A continuación se presenta un extracto del informe:
En base a una muestra piloto de los niños y adolescentes participantes СКАЧАТЬ