30
1 UNIVERSIDAD ABIERTA Y A DISTANCIA DE MÉXICO DIVISIÓN DE CIENCIAS EXACTAS, INGENIERÍA Y TECNOLOGÍA Análisis Estadístico y Probabilístico de la Deserción Escolar del IEMSDF mediante el Método de Regresión por Mínimos Cuadrados.PRESENTACION DEL PROYECTO TERMINAL PARA OBTENER EL TÍTULO DE: LICENCIATURA EN MATEMÁTICAS PRESENTA EL ALUMNO SUSTENTANTE: C. PEDRO DANIEL LARA MALDONADO DIRIGIDA POR: MAT. BEATRIZ CARRASCO TORRES EVALUADA POR: DRA. MARLEN HERNÁNDEZ ORTIZ. ELABORADO EN LA: CIUDAD DE MÉXICO, DISTRITO FEDERAL, 2015-2016.

Pt2 definitivo a1_e2_pelm (1)

Embed Size (px)

Citation preview

Page 1: Pt2 definitivo a1_e2_pelm (1)

1

UNIVERSIDAD ABIERTA Y A DISTANCIA DE MÉXICO

DIVISIÓN DE CIENCIAS EXACTAS, INGENIERÍA Y TECNOLOGÍA

“Análisis Estadístico y Probabilístico de la Deserción Escolar del IEMSDF

mediante el Método de Regresión por Mínimos Cuadrados.”

PRESENTACION DEL PROYECTO TERMINAL PARA OBTENER

EL TÍTULO DE:

LICENCIATURA EN MATEMÁTICAS

PRESENTA EL ALUMNO SUSTENTANTE:

C. PEDRO DANIEL LARA MALDONADO

DIRIGIDA POR:

MAT. BEATRIZ CARRASCO TORRES

EVALUADA POR:

DRA. MARLEN HERNÁNDEZ ORTIZ.

ELABORADO EN LA:

CIUDAD DE MÉXICO, DISTRITO FEDERAL, 2015-2016.

Page 2: Pt2 definitivo a1_e2_pelm (1)

2

1. Resumen

El tema de este proyecto se circunscribe a los datos registrados en el Sistema de

Información Mexicana del Distrito Federal (INFOMEXDF) dentro de la dependencia

paraestatal del Instituto de Educación Media Superior del Distrito Federal por parte de la

Dirección Estudiantil; a través del conducto de la Subdirección de Administración Escolar.

El objetivo de este proyecto es hacer predicciones de la deserción estudiantil en las últimas

generaciones que comprenden del año 2013 hasta el año 2014, considerado para toda la

dependencia; se aplicaron los modelos de ajuste de funciones polinomiales mediante el

método regresión por mínimos cuadrados para encontrar una función polinomial de ajuste a

los datos. Este ajuste se centró en el cálculo del error que define su desviación estándar con

distribución 𝑡 −student para poder construir un intervalo de predicción que representa una

estimación muestral de estudiantes desertores para las generaciones venideras. Cuyos

límites de cada intervalo predicho, generó incremento en el indicador del porcentaje de

deserción; interpretándolo a corto plazo, permitió plantear una aproximación probable a la

magnitud del fenómeno de abandono estudiantil. Esto propuso a las autoridades

competentes del IEMSDF el promover a sus estudiantes, una estimulación de pertenencia

trascendental al desarrollo profesional.

Palabras claves: Deserción estudiantil, Análisis estadístico y Ajuste matemático.

Page 3: Pt2 definitivo a1_e2_pelm (1)

3

2. Introducción

La deserción escolar en esta dependencia paraestatal del IEMS-DF es un grave

problema para el desarrollo sustentable de la población, particularmente en la entidad

federativa de la Ciudad de México (Díaz, 2015). Tal situación implica una conducta de

riesgo entre sus habitantes, como la consecuencia de gastos presupuestales y pérdidas

económicas a nivel local respecto a las oportunidades de trabajo; esto afecta a nivel

familiar, en los ingresos salariales que sustenta una mejor calidad de vida individual

(Gujarati, 2012).

Por lo tanto, en la actualidad el uso de las Herramientas Matemáticas Probabilísticas ha

permitido optimizar y determinar los Procesos de los Indicadores de Desempeño en

cuestión de considerar la información a través de los datos registrados en un plantel

determinado por esta dependencia paraestatal sobre la situación de la Deserción Estudiantil

del Sistema Escolarizado cuya causa de este objetivo depende de la relación de la

Cuantificación de su Ingreso y Egreso por Generación que se analiza a través del “Modelo

Estadístico del Ajuste de Funciones mediante el Método de Regresión por Mínimos

Cuadrados” ;cuyo creador fue el matemático alemán Karl Friedrich Gauss en 1795 (Pérez,

2002), el cual permite interpretar geométricamente sus variaciones, en efectuar y

determinar la predicción certera del cálculo de la probabilidad como variable de respuesta

del pronóstico porcentual de la deserción estudiantil que ocurra en base a la tendencia que

ha seguido los datos registrados de estos eventos a lo largo del tiempo y asimismo. Cuyo

fin se considere a la situación problemática de este análisis estadístico cuantitativo como

argumento para que las autoridades competentes puedan fundamentarlo como un primer

paso para tomar medidas preventivas de atención y reflexión de la importancia en corto y a

largo plazo de cómo puede afectar a esta dependencia paraestatal y buscarle una decisión

alternativa a través de la instrumentación del diseño de estrategias de acciones que

pretendan involucrarlos en conocer esta información de la situación de este fenómeno, para

que así con base a esas predicciones realizadas adviertan mejores decisiones que faciliten la

viabilidad de reducir su incidencia desertora para que sea orientada como una propuesta al

fomento del incremento del egreso estudiantil que conlleva a la dimensión del bienestar en

su permanencia en el plantel.

3. Marco Teórico

3.1. Deserción Estudiantil

La deserción estudiantil es un indicador situacional de abandono del sistema escolar,

provocado por la combinación de factores que se generan en el entorno como en contextos

interpersonales (Lara, 2016).

Page 4: Pt2 definitivo a1_e2_pelm (1)

4

El evento de desertar puede ocurrir en cualquier momento durante el período por

generación: por ejemplo, si un individuo deserta en la mitad del semestre que esté

estudiando y otro lo hace finalizando el semestre que estudió, la duración en la institución

es diferente. Sin embargo, en la base de datos que permitirá estimar los parámetros del

modelo, la duración será igual para dichos individuos (tres semestres), tomando así

únicamente valores discretos generacionales (1, 2, 3, ..., etc.). Entonces, la relación del flujo

escolar de una generación desertora, se define por medio de la siguiente fórmula:

𝐏𝐃𝐆 = (𝐄𝐈𝐆 − 𝐄𝐄𝐆

𝐄𝐈𝐆 ) ∗ 𝟏𝟎𝟎(Ponce, 2003)… (𝟏)

Donde:𝐏𝐃𝐆 = Porcentaje de deserción generacional

𝐄𝐄𝐆 = Número de estudiantes que egresarón por generación𝐄𝐈𝐆 = Número de estudiantes que ingresarón por generación

El propósito de la ecuación …(𝟏) es dar información útil y verídica, que explica

cuantitativamente el fenómeno de la deserción estudiantil en el instituto y esto contribuirá

en desarrollar un óptimo modelo matemático para el pronóstico cuantitativo, que determina

el comportamiento futuro de este indicador analítico, para diseñar estrategias de prevención

y atención a la población estudiantil que cursa este nivel educativo en la dependencia.

3.2 Análisis estadístico

Es importante considerar a la Estadística como una herramienta de apoyo que puede dar

respuesta a muchas de las necesidades que la actual sociedad plantea, a razón de que su

tarea fundamental es la reducción de datos, con el objetivo de representar la realidad y

describirla, predecir su futuro o simplemente conocerla; en nuestros días se ha convertido

en una rama de la matemática efectiva para describir con exactitud los valores de datos

físicos, políticos y sociales que sirve para relacionar y analizar dichos datos. Esto implica

que esta herramienta no consiste sólo en resumir y tabular los datos, sino en enfocarse en el

proceso de interpretación de esta información (Levin, 2004).

Es importante considerar que Pronosticar o dar aproximaciones a futuros eventos ha sido

una práctica frecuente para los seres humanos. En tiempos remotos estos pronósticos se

realizaban mediante métodos un poco ortodoxos. Con el paso del tiempo y gracias a los

avances teóricos y tecnológicos de la ciencia, estas aproximaciones han ido cambiando

hasta llegar a metodologías rigurosamente científicas y bien fundamentadas teóricamente

(Cannavos, 1988).

Con esto decimos que el desarrollo de la Teoría de la Probabilidad ha aumentado el

alcance de las aplicaciones de la estadística a razón de que muchos de los conjuntos de

datos se pueden aproximar, con gran exactitud, utilizando modelos probabilísticos; por lo

tanto, los resultados de estas pueden utilizarse para analizar datos estadísticos. Así, la

Probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para

Page 5: Pt2 definitivo a1_e2_pelm (1)

5

predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico

(Figueroa, 2014).

Entonces el análisis del Método de Regresión es una técnica estadística para investigar y

modelar la relación entre variables, de tal manera que son numerosas las aplicaciones de

esto en cualquier campo; incluyendo ciencias físicas, experimentales y sociales; y de hecho

se puede decir que esta técnica estadística es la más usada. Por lo tanto, este análisis

sustenta la fundamentación de los métodos numéricos que se basan en los modelos

matemáticos para desarrollarlo y efectuarlo mediante un ajuste polinomial (Hines, 1996).

3.3. Ajuste Matemático

3.3.1 Fundamentos sobre el Ajuste de Funciones polinomiales

El ajuste de funciones polinomiales es una técnica para el modelado de datos mediante

una ecuación (Bittinger, 2002), y es importante considerar la siguiente pregunta:

¿Cómo decidir qué tipo de función polinomial si existe, podría ajustarse a los datos?

Una forma simple consiste en examinar un Diagrama de Dispersión que es una gráfica

de datos de dos variables en la variable independiente está en el eje horizontal y la variable

dependiente en el eje vertical, entonces con esto se hace el énfasis en definir qué Tipos de

Variables se van a considerar en este modelo:

● Variable Dependiente: Es la variable que se predice o se explica. Se representa por

𝑦.

● Variable Independiente: Es la variable que sirve para predecir o explicar. Se

representa por 𝑥.

Luego, es importante buscar un patrón que se parezca a una de las gráficas de los tipos

de funciones polinomiales que hay. A continuación, se presenta un Procedimiento que se

considera y que la mayoría de las veces funciona para determinar modelos matemáticos:

1. Representar gráficamente los datos (en la forma de Diagrama de Dispersión).

2. Observar el diagrama de dispersión para determinar si parece ajustarse a una

función conocida.

3. Determinar una función que ajuste los datos.

Ahora con esto se va a utilizar el grupo de funciones polinomiales para observar cuál

función, si existe, podría ajustarse a ciertos datos:

● Los datos podrían modelarse mediante una función polinomial lineal si la gráfica

parece una línea recta.

● Los datos podrían modelarse mediante una función polinomial cuadrática, si la

gráfica sube y luego baja, o baja y luego sube, en una forma encorvada que se

parezca a una parábola.

Page 6: Pt2 definitivo a1_e2_pelm (1)

6

● Si los datos caen, luego aumentan, y vuelven a caer (de modo que no se ajustan a

una función polinomial lineal o una función polinomial cuadrática), pero podrían

ajustarse a una función polinomial cúbica.

3.3.2. Definición del Método de Regresión por Mínimos Cuadrados

Es una técnica de análisis numérico enmarcada dentro de la optimización matemática, en

la que, dados un conjunto de pares ordenados que incluyen una variable independiente y

una variable dependiente. La cual busca encontrar la función continua, que mejor se

aproxime a los datos (un "mejor ajuste"), de acuerdo con el criterio de mínimo error

cuadrático. Más aun, esto coincide con el principio de máxima probabilidad de la

estadística (Valdés, 2014).

Entonces decimos que, desde un punto de vista estadístico, un requisito implícito para

que funcione el método de mínimos cuadrados es que los errores de cada medida estén

distribuidos de forma aleatoria para determinar el mejor ajuste de una función polinomial a

través de la consideración de utilizar como mínimo cuatro puntos (Gerald, 2000).

3.3.3. Procedimiento del Método de Regresión por Mínimos Cuadrados

Se supone que se conocen datos que consta de 𝑛 puntos que se definen como:

(𝑥1, 𝑦1), (𝑥2, 𝑦2), … , (𝑥𝑛, 𝑦𝑛) y que el objetivo es hallar una función polinomial 𝑦 = 𝑓(𝑥)

que se ajuste razonablemente a los datos, por lo que el primer paso es decidir qué tipo de

función probar a través de la inspección gráfica de los 𝑛 puntos, como se muestra en la

𝐅𝐢𝐠𝐮𝐫𝐚 𝟏.

𝐅𝐢𝐠𝐮𝐫𝐚 𝟏. Representación gráfica de los diferentes tipos de ajuste para encontrar una función polinomial

(Chapra, 2011).

Es importante evitar incertidumbres en la elección de la función de ajuste. Por lo tanto, se

considera una óptima decisión, a través del mínimo valor en su coeficiente de

determinación 𝑅2 define su procedimiento a efectuar en este análisis, el cual representa el

comportamiento general de los datos como se muestra en la ecuación …(𝟐) (Carrillo,

2008).

𝑹𝟐 = ∑𝒌=𝟏𝒏 [𝒚𝒌 − 𝒇(𝒙𝒏)]

𝟐 … (𝟐)

Page 7: Pt2 definitivo a1_e2_pelm (1)

7

3.3.4. Clasificación de Modelos en las Funciones Polinomiales para el Método de

Regresión por Mínimos Cuadrados.

El caso más usado en la práctica es poder ajustar funciones polinomiales, ya que en este

caso los parámetros serán funciones de cualquier tipo que son fáciles de estimar (Marín,

2014).

El modelo a ajustar estará basado en su generalización del ajuste polinomial de grado 𝑚

que está dado por:

𝒇(𝒙; 𝒂𝟏, 𝒂𝟐, … , 𝒂𝒎) = 𝒂𝟎 + 𝒂𝟏𝒙 + 𝒂𝟐𝒙𝟐 +⋯+ 𝒂𝒎𝒙

𝒎…(𝟑)

Por medio de esta consideración en la ecuación …(𝟑) se aproxima ahora a un conjunto

de datos {(𝑥𝑖 , 𝑦𝑖)}𝑖=1𝑚 con una función polinomial algebraica de grado 𝑛 < 𝑚 − 1 mediante

el procedimiento de mínimos cuadrados (Mathews, 2000); por lo que se ha definido el

polinomio como:

𝒇𝒏(𝒙𝒊) = 𝒂𝟎 + 𝒂𝟏𝒙𝒊 +⋯+ 𝒂𝒏−𝟏𝒙𝒊𝒏−𝟏 + 𝒂𝒏𝒙𝒊

𝒏 = ∑𝒋=𝟎𝒏 𝒂𝒋𝒙𝒊

𝒋…(𝟒)

Para obtener el error más bajo en mínimos cuadrados, es necesario seleccionar de la

ecuación …(𝟒) las constantes 𝑎0, 𝑎1, … , 𝑎𝑛 de tal manera que las derivadas parciales con

respecto a cada una de ellas sean cero y así para cada 𝑗:

𝑹𝟐 = ∑𝒊=𝟏𝒎 [𝒚𝒊 − 𝒇(𝒙𝒊)]

𝟐 = ∑𝒊=𝟏𝒎 𝒚𝒊

𝟐 − 𝟐∑𝒋=𝟎𝒏 𝒂𝒋(∑𝒊=𝟏

𝒎 𝒚𝒊𝒙𝒊𝒋) + ∑𝒋=𝟎

𝒏 ∑𝒌=𝟎𝒏 𝒂𝒋𝒂𝒌(∑𝒊=𝟏

𝒎 𝒙𝒊𝒋+𝒌)… (𝟓)

𝝏𝑹𝟐

𝝏𝒂𝒋= −𝟐∑

𝒊=𝟏𝒎 𝒚𝒊𝒙𝒊

𝒋+ 𝟐∑

𝒌=𝟎𝒎 𝒂𝒌∑𝒊=𝟏

𝒎 𝒙𝒊𝒋+𝒌

…(𝟔)

Esto da 𝑛 + 1 ecuaciones normales con 𝑛 + 1 incógnitas 𝑎𝑗, por lo tanto,

∑𝒌=𝟎𝒏 𝒂𝒌∑𝒊=𝟏

𝒎 𝒙𝒊𝒋+𝒌

= ∑𝒊=𝟏𝒎 𝒚𝒊𝒙𝒊

𝒋…(𝟕)

Para cada 𝑗 = 0,1, … , 𝑛 se tiene:

𝒂𝟎(∑𝒊=𝟏𝒎 𝒙𝒊

𝟎) + 𝒂𝟏(∑𝒊=𝟏𝒎 𝒙𝒊

𝟏) + 𝒂𝟐(∑𝒊=𝟏𝒎 𝒙𝒊

𝟐) + ⋯+ 𝒂𝒏(∑𝒊=𝟏𝒎 𝒙𝒊

𝒏) = ∑𝒊=𝟏𝒎 𝒚𝒊𝒙𝒊

𝟎

𝒂𝟎(∑𝒊=𝟏𝒎 𝒙𝒊) + 𝒂𝟏(∑𝒊=𝟏

𝒎 𝒙𝒊𝟐) + 𝒂𝟐(∑𝒊=𝟏

𝒎 𝒙𝒊𝟑) + ⋯+ 𝒂𝒏(∑𝒊=𝟏

𝒎 𝒙𝒊𝒏+𝟏) = ∑𝒊=𝟏

𝒎 𝒚𝒊𝒙𝒊𝟏

⋮𝒂𝟎(∑𝒊=𝟏

𝒎 𝒙𝒊𝒏) + 𝒂𝟏(∑𝒊=𝟏

𝒎 𝒙𝒊𝒏+𝟏) + 𝒂𝟐(∑𝒊=𝟏

𝒎 𝒙𝒊𝒏+𝟐) + ⋯+ 𝒂𝒏(∑𝒊=𝟏

𝒎 𝒙𝒊𝟐𝒏) = ∑𝒊=𝟏

𝒎 𝒚𝒊𝒙𝒊𝒏

…(𝟖)

Por lo tanto, estas ecuaciones normales …(𝟖) tienen solución única siempre y cuando

las 𝑥𝑖 sean distintas y en tal caso, la función apropiada de mínimos cuadrados

(probablemente un polinomio de grado 𝑛) puede deducirse con los valores de la función

que se reemplace con los datos cuando la medida de bondad de ajuste de 𝑅2 sea

suficientemente pequeña, a esto se le denomina “suavizamiento de datos” y su aplicación

Page 8: Pt2 definitivo a1_e2_pelm (1)

8

de esto es encontrar los parámetros: 𝑎1, 𝑎2, … , 𝑎𝑛 a través de la resolución de sistemas de

ecuaciones normales (Spiegel, 1970).

Entonces se supone ajustar una pareja de datos a través de este modelo de la función

polinomial generalizada en cuestión de la suma de los errores al cuadrado 𝑅2 que está dada

por:

𝑹𝟐 = ∑𝒌=𝟏𝑵 [𝒚𝒌 − (𝒂𝟎 + 𝒂𝟏𝒙 + 𝒂𝟐𝒙

𝟐 +⋯+ 𝒂𝒎𝒙𝒎)]𝟐…(𝟗)

Para encontrar el valor de los parámetros 𝑎0, 𝑎1, … , 𝑎𝑚 de …(𝟗) se procede a relacionar

el cambio de variables de los subíndices 𝑛 con 𝑚 que se definen en las sumatorias de

…(𝟖); por lo tanto, se obtiene el sistema de ecuaciones normales para el grado 𝑚 que está

dada por:

𝒂𝟎𝑵+ 𝒂𝟏(∑𝒊=𝟏𝑵 𝒙𝒊) +⋯+ 𝒂𝒎(∑𝒊=𝟏

𝑵 𝒙𝒊𝒎) = ∑𝒊=𝟏

𝑵 𝒚𝒊

𝒂𝟎(∑𝒊=𝟏𝑵 𝒙𝒊) + 𝒂𝟏(∑𝒊=𝟏

𝑵 𝒙𝒊𝟐) + ⋯+ 𝒂𝒎(∑𝒊=𝟏

𝑵 𝒙𝒊𝒎+𝟏) = ∑𝒊=𝟏

𝑵 𝒙𝒊𝒚𝒊⋮

𝒂𝟎(∑𝒊=𝟏𝑵 𝒙𝒊

𝒎) + 𝒂𝟏(∑𝒊=𝟏𝑵 𝒙𝒊

𝒎+𝟏) + ⋯+ 𝒂𝒎(∑𝒊=𝟏𝑵 𝒙𝒊

𝟐𝒎) = ∑𝒊=𝟏𝑵 𝒙𝒊

𝒎𝒚𝒊

…(𝟏𝟎)

Sin embargo, para hallar la función de mejor ajuste, se determinan los valores o

coeficientes respectivamente en cada caso de los tipos de funciones para 𝑎0, 𝑎1, … , 𝑎𝑚

donde 𝑚 ≥ 0.

Por lo tanto, se considera el sistema de ecuaciones normales del ajuste polinomial de

grado 𝒎 …(𝟗) en términos matriciales de la forma 𝑿�̂� = 𝒀, es decir:

[

𝑵∑𝒊=𝟏𝑵 𝒙𝒊⋮

∑𝒊=𝟏𝑵 𝒙𝒊

𝒎

∑𝒊=𝟏𝑵 𝒙𝒊

∑𝒊=𝟏𝑵 𝒙𝒊

𝟐

⋮∑𝒊=𝟏𝑵 𝒙𝒊

𝒎+𝟏

⋯⋯⋱⋯

∑𝒊=𝟏𝑵 𝒙𝒊

𝒎

∑𝒊=𝟏𝑵 𝒙𝒊

𝒎+𝟏

⋮∑𝒊=𝟏𝑵 𝒙𝒊

𝟐𝒎 ]

[

𝒂𝟎𝒂𝟏⋮𝒂𝒎

] =

[ ∑𝒊=𝟏𝑵 𝒚𝒊

∑𝒊=𝟏𝑵 𝒙𝒊𝒚𝒊⋮

∑𝒊=𝟏𝑵 𝒙𝒊

𝒎𝒚𝒊]

… (𝟏𝟏)

Para encontrar la solución matricial se tiene que multiplicar la ecuación matricial 𝑿�̂� =

𝒀 y después se calcula su inversa (se multiplicó por la matriz transpuesta para que quede

una matriz cuadrada)

𝑿𝑻𝑿�̂� = 𝑿𝑻𝒀 →∴ �̂� = (𝑿𝑻𝑿)−𝟏𝑿𝑻𝒀… (𝟏𝟐)

Este sistema de ecuaciones lineales simultáneas se puede resolver fácilmente usando la

famosa regla de Cramer (para polinomios lineales y cuadráticos) y el método de

eliminación Gaussiana (para polinomios al menos de tercer grado).

Los coeficientes de la matriz de …(𝟏𝟏) se encuentran acomodando los datos en la

Tabla 1.

Page 9: Pt2 definitivo a1_e2_pelm (1)

9

𝐓𝐚𝐛𝐥𝐚 𝟏. 𝐀𝐣𝐮𝐬𝐭𝐞 𝐩𝐨𝐥𝐢𝐧𝐨𝐦𝐢𝐚𝐥 𝐝𝐞 𝐠𝐫𝐚𝐝𝐨 𝒎.

𝒊 𝒙𝒊 𝒙𝒊𝟐 𝒙𝒊

𝟑 ⋯ 𝒙𝒊𝟐𝒎 𝒚𝒊 𝒙𝒊𝒚𝒊 𝒙𝒊

𝟐𝒚𝒊 ⋯ 𝒙𝒊𝒎𝒚𝒊

1 𝑥1 𝑥12 𝑥1

3 ⋯ 𝑥12𝑚 𝑦1 𝑥1𝑦1 𝑥1

2𝑦1 ⋯ 𝑥1𝑚𝑦1

2 𝑥2 𝑥22 𝑥2

3 ⋯ 𝑥22𝑚 𝑦2 𝑥2𝑦2 𝑥2

2𝑦2 ⋯ 𝑥2𝑚𝑦2

3 𝑥3 𝑥32 𝑥3

3 ⋯ 𝑥32𝑚 𝑦3 𝑥3𝑦3 𝑥3

2𝑦3 ⋯ 𝑥3𝑚𝑦3

⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮

𝑁 𝑥𝑁 𝑥𝑁2 𝑥𝑁

3 ⋯ 𝑥𝑁2𝑚 𝑦𝑁 𝑥𝑁𝑦𝑁 𝑥𝑁

2𝑦𝑁 ⋯ 𝑥𝑁𝑚𝑦𝑁

∑𝑖=1𝑁 𝑥𝑖 ∑𝑖=1

𝑁 𝑥𝑖2 ∑𝑖=1

𝑁 𝑥𝑖3 ⋯ ∑𝑖=1

𝑁 𝑥𝑖2𝑚 ∑𝑖=1

𝑁 𝑦𝑖 ∑𝑖=1𝑁 𝑥𝑖𝑦𝑖 ∑𝑖=1

𝑁 𝑥𝑖2𝑦𝑖 ⋯ ∑𝑖=1

𝑁 𝑥𝑖𝑚𝑦𝑖

3.3.4.1. Ajuste de la función polinomial lineal 𝒚 = 𝒂𝟎 + 𝒂𝟏𝒙

Se recuerda que una aproximación por mínimos cuadrados consiste en ajustar a una línea

recta un conjunto de datos discretos de la forma: (𝑥1, 𝑦1), (𝑥2, 𝑦2), … , (𝑥𝑁, 𝑦𝑁)

Por lo tanto, se inicia en considerar una ecuación de una línea recta a la cual se relaciona

al comportamiento de los datos y el modelo propuesto, de esta forma se tiene: 𝑦 = 𝑎0 +

𝑎1𝑥 dónde 𝑎0 =es la ordenada al origen y 𝑎1 =es la pendiente.

Al aplicar el criterio de que el “mejor” ajuste se cumple cuando se puede minimizar la

suma de los cuadrados de los residuos 𝑹𝟐, es decir, el error entre el modelo y los datos

experimentales, se tiene que:

𝑹𝟐 = ∑𝒊=𝟏𝒏 (𝒚𝟏 − 𝒂𝟎 − 𝒂𝟏𝒙𝒊)

𝟐…(𝟏𝟑)

Este criterio tiene la ventaja de proporcionar una línea única para un conjunto de datos.

Para determinar los valores de 𝑎0 y 𝑎1 que minimizan la ecuación se deriva la ecuación

con respecto a cada uno de los coeficientes

𝝏𝑹𝟐

𝝏𝒂𝟎= −𝟐∑(𝒚𝒊 − 𝒂𝟎 − 𝒂𝟏𝒙𝒊) = 𝟎

𝝏𝑹𝟐

𝝏𝒂𝟏= −𝟐∑[(𝒚𝟏 − 𝒂𝟎 − 𝒂𝟏𝒙𝒊)𝒙𝒊] = 𝟎

… (𝟏𝟒)

Al igualar ambas derivadas en las ecuaciones …(𝟏𝟒) a cero, se genera un mínimo para

la suma de los cuadrados de los residuos 𝑹𝟐 de la siguiente forma:

−𝟐∑(𝒚𝒊 − 𝒂𝟎 − 𝒂𝟏𝒙𝒊) = 𝟎 = ∑𝒚𝒊 − ∑𝒂𝟎 − ∑𝒂𝟏𝒙𝒊…(𝟏𝟓)

−𝟐∑[(𝒚𝟏 − 𝒂𝟎 − 𝒂𝟏𝒙𝒊)𝒙𝒊] = 𝟎 = ∑𝒚𝒊𝒙𝒊 − ∑𝒂𝟎𝒙𝒊 − ∑𝒂𝟏𝒙𝒊𝟐 … (𝟏𝟔)

De la ecuación …(𝟏𝟒) se obtiene

∑𝒚𝒊 = 𝒏𝒂𝟎 + 𝒂𝟏∑𝒙𝒊…(𝟏𝟕)

De la ecuación …(𝟏𝟓) se obtiene

Page 10: Pt2 definitivo a1_e2_pelm (1)

10

∑𝒚𝒊𝒙𝒊 = 𝒂𝟎∑𝒙𝒊 + 𝒂𝟏∑(𝒙𝒊)𝟐… . (𝟏𝟖)

Al resolver en forma simultánea las ecuaciones …(𝟏𝟕) y …(𝟏𝟖) se obtienen los valores

de 𝑎0 y 𝑎1 mediante las siguientes ecuaciones:

𝒂𝟏 =𝒏∑𝒙𝒊𝒚𝒊 − ∑𝒙𝒊𝒚𝟏

𝒏∑𝒙𝒊𝟐 − (∑𝒙𝒊)𝟐

… (𝟏𝟗), 𝒂𝒐 =∑𝒚𝒊𝒏

− 𝒂𝟏 (∑𝒙𝒊𝒏)… (𝟐𝟎)

Por lo tanto, construyendo la Tabla 2; para el caso lineal.

𝐓𝐚𝐛𝐥𝐚 𝟐. 𝐀𝐣𝐮𝐬𝐭𝐞 𝐩𝐨𝐥𝐢𝐧𝐨𝐦𝐢𝐚𝐥 𝐥𝐢𝐧𝐞𝐚𝐥

𝒊 𝒙𝒊 𝒙𝒊𝟐 𝒚𝒊 𝒙𝒊𝒚𝒊

1 𝑥1 𝑥12 𝑦1 𝑥1𝑦1

2 𝑥2 𝑥22 𝑥2 𝑥2𝑦2

3 𝑥3 𝑥32 𝑦3 𝑥3𝑦3

⋮ ⋮ ⋮ ⋮ ⋮

𝑁 𝑥𝑁 𝑥𝑁2 𝑦𝑁 𝑥𝑁𝑦𝑁

Suma por

columna ∑𝒊=𝟏𝑵 𝒙𝒊 ∑𝒊=𝟏

𝑵 𝒙𝒊𝟐 ∑𝒊=𝟏

𝑵 𝒚𝒊 ∑𝒊=𝟏𝑵 𝒙𝒊𝒚𝒊

Las ecuaciones normales matriciales para el caso del ajuste lineal están dadas por:

[𝑵 ∑𝒊=𝟏

𝑵 𝒙𝒊∑𝒊=𝟏𝑵 𝒙𝒊 ∑𝒊=𝟏

𝑵 𝒙𝒊𝟐] [

𝒂𝟎𝒂𝟏] = [

∑𝒊=𝟏𝑵 𝒚𝒊

∑𝒊=𝟏𝑵 𝒙𝒊𝒚𝒊

]… (𝟐𝟏)

Este sistema de ecuaciones …(𝟐𝟏) se puede resolver con los métodos habituales (suma y

resta, Cramer, sustitución, etc.).

3.3.4.2. Ajuste de la función polinomial cuadrático 𝒚 = 𝒂𝟎 + 𝒂𝟏𝒙 + 𝒂𝟐𝒙𝟐 De la misma

manera considerando la Tabla 3; para una ajuste cuadrático o parabólico.

𝐓𝐚𝐛𝐥𝐚 𝟑. 𝐀𝐣𝐮𝐬𝐭𝐞 𝐩𝐨𝐥𝐢𝐧𝐨𝐦𝐢𝐚𝐥 𝐜𝐮𝐚𝐝𝐫á𝐭𝐢𝐜𝐨.

𝒊 𝒙𝒊 𝒙𝒊𝟐 𝒙𝒊

𝟑 𝒙𝒊𝟒 𝒚𝒊 𝒙𝒊𝒚𝒊 𝒙𝒊

𝟐𝒚𝒊

1 𝑥1 𝑥12 𝑥1

3 𝑥14 𝑦1 𝑥1𝑦1 𝑥1

2𝑦1

2 𝑥2 𝑥22 𝑥2

3 𝑥24 𝑥2 𝑥2𝑦2 𝑥2

2𝑦2

3 𝑥3 𝑥32 𝑥3

3 𝑥34 𝑦3 𝑥3𝑦3 𝑥3

2𝑦3

⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮

𝑁 𝑥𝑁 𝑥𝑁2 𝑥𝑁

3 𝑥𝑁4 𝑦𝑁 𝑥𝑁𝑦𝑁 𝑥𝑁

2𝑦𝑁 Suma por

columna ∑𝒊=𝟏𝑵 𝒙𝒊 ∑𝒊=𝟏

𝑵 𝒙𝒊𝟐 ∑𝒊=𝟏

𝑵 𝒙𝒊𝟑 ∑𝒊=𝟏

𝑵 𝒙𝒊𝟒 ∑𝒊=𝟏

𝑵 𝒚𝒊 ∑𝒊=𝟏𝑵 𝒙𝒊𝒚𝒊 ∑𝒊=𝟏

𝑵 𝒙𝒊𝟐𝒚𝒊

Las ecuaciones normales para el caso del ajuste polinomial cuadrático están dadas por:

Page 11: Pt2 definitivo a1_e2_pelm (1)

11

[

𝑵 ∑𝒊=𝟏𝑵 𝒙𝒊 ∑𝒊=𝟏

𝑵 𝒙𝒊𝟐

∑𝒊=𝟏𝑵 𝒙𝒊 ∑𝒊=𝟏

𝑵 𝒙𝒊𝟐 ∑𝒊=𝟏

𝑵 𝒙𝒊𝟑

∑𝒊=𝟏𝑵 𝒙𝒊

𝟐 ∑𝒊=𝟏𝑵 𝒙𝒊

𝟑 ∑𝒊=𝟏𝑵 𝒙𝒊

𝟒

] [

𝒂𝟎𝒂𝟏𝒂𝟐] = [

∑𝒊=𝟏𝑵 𝒚𝒊

∑𝒊=𝟏𝑵 𝒙𝒊𝒚𝒊

∑𝒊=𝟏𝑵 𝒙𝒊

𝟐𝒚𝒊

]… (𝟐𝟐)

Este sistema de ecuaciones …(𝟐𝟐) se puede resolver con los métodos de Cramer de 3

variables con 3 incógnitas.

3.3.4.3. Ajuste de la función polinomial cúbico: 𝒚 = 𝒂𝟎 + 𝒂𝟏𝒙 +𝒂𝟐𝒙𝟐 + 𝒂𝟑𝒙

𝟑

Similarmente, considerando la Tabla 4; para el caso cúbico.

𝐓𝐚𝐛𝐥𝐚 𝟒. 𝐀𝐣𝐮𝐬𝐭𝐞 𝐩𝐨𝐥𝐢𝐧𝐨𝐦𝐢𝐚𝐥 𝐜ú𝐛𝐢𝐜𝐨

𝒊 𝒙𝒊 𝒙𝒊𝟐 𝒙𝒊

𝟑 𝒙𝒊𝟒 𝒙𝒊

𝟓 𝒙𝒊𝟔 𝒚𝒊 𝒙𝒊𝒚𝒊 𝒙𝒊

𝟐𝒚𝒊 𝒙𝒊𝟑𝒚𝒊

1 𝑥1 𝑥12 𝑥1

3 𝑥14 𝑥1

5 𝑥16 𝑦1 𝑥1𝑦1 𝑥1

2𝑦1 𝑥13𝑦1

2 𝑥2 𝑥22 𝑥2

3 𝑥24 𝑥2

5 𝑥26 𝑥2 𝑥2𝑦2 𝑥2

2𝑦2 𝑥23𝑦2

3 𝑥3 𝑥32 𝑥3

3 𝑥34 𝑥3

5 𝑥36 𝑦3 𝑥3𝑦3 𝑥3

2𝑦3 𝑥33𝑦3

⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮

𝑁 𝑥𝑁 𝑥𝑁2 𝑥𝑁

3 𝑥𝑁4 𝑥𝑁

5 𝑥𝑁6 𝑦𝑁 𝑥𝑁𝑦𝑁 𝑥𝑁

2𝑦𝑁 𝑥𝑁3𝑦𝑁

Suma por

columna ∑𝒊=𝟏𝑵 𝒙𝒊 ∑𝒊=𝟏

𝑵 𝒙𝒊𝟐 ∑𝒊=𝟏

𝑵 𝒙𝒊𝟑 ∑𝒊=𝟏

𝑵 𝒙𝒊𝟒 ∑𝒊=𝟏

𝑵 𝒙𝒊𝟓 ∑𝒊=𝟏

𝑵 𝒙𝒊𝟔 ∑𝒊=𝟏

𝑵 𝒚𝒊 ∑𝒊=𝟏𝑵 𝒙𝒊𝒚𝒊 ∑𝒊=𝟏

𝑵 𝒙𝒊𝟐𝒚𝒊 ∑𝒊=𝟏

𝑵 𝒙𝒊𝟑𝒚𝒊

Las ecuaciones normales matriciales para el caso del ajuste cúbico están dadas por el

siguiente sistema de 4 variables y 4 ecuaciones:

[

𝑵∑𝒊=𝟏𝑵 𝒙𝒊

∑𝒊=𝟏𝑵 𝒙𝒊

𝟐

∑𝒊=𝟏𝑵 𝒙𝒊

𝟑

∑𝒊=𝟏𝑵 𝒙𝒊

∑𝒊=𝟏𝑵 𝒙𝒊

𝟐

∑𝒊=𝟏𝑵 𝒙𝒊

𝟑

∑𝒊=𝟏𝑵 𝒙𝒊

𝟒

∑𝒊=𝟏𝑵 𝒙𝒊

𝟐

∑𝒊=𝟏𝑵 𝒙𝒊

𝟑

∑𝒊=𝟏𝑵 𝒙𝒊

𝟒

∑𝒊=𝟏𝑵 𝒙𝒊

𝟓

∑𝒊=𝟏𝑵 𝒙𝒊

𝟑

∑𝒊=𝟏𝑵 𝒙𝒊

𝟒

∑𝒊=𝟏𝑵 𝒙𝒊

𝟓

∑𝒊=𝟏𝑵 𝒙𝒊

𝟔]

[

𝒂𝟎𝒂𝟏𝒂𝟐𝒂𝟑

] =

[ ∑𝒊=𝟏𝑵 𝒚𝒊

∑𝒊=𝟏𝑵 𝒙𝒊𝒚𝒊

∑𝒊=𝟏𝑵 𝒙𝒊

𝟐𝒚𝒊∑𝒊=𝟏𝑵 𝒙𝒊

𝟑𝒚𝒊]

… (𝟐𝟑)

Se sugiere utilizar los casos de la Tabla 2 hasta la Tabla 4 de la generalización de la

Tabla 1, a razón de que estos dan un óptimo ajuste para poder encontrar el valor de los

parámetros 𝑎𝑘 con 𝑘 = 1,… ,𝑚 que minimicen esta suma; es decir:

𝐦𝐢𝐧𝒂𝟏,…,𝒂𝒎

𝑹𝟐 = 𝐦𝐢𝐧𝒂𝟏,…,𝒂𝒎

∑[𝒚𝒌 − 𝒇(𝒙𝒌; 𝒂𝟏, 𝒂𝟐, … , 𝒂𝒎)]𝟐…(𝟐𝟒)

Para poder encontrar estos coeficientes de la ecuación …(𝟐𝟒) se debe cumplir cada una de

las ecuaciones presentadas en los casos de la Tabla 2 hasta la Tabla 4; a través del criterio

siguiente:

𝝏(𝑹𝟐)

𝝏𝒂𝒊= 𝟎 𝐜𝐨𝐧 𝒊 = 𝟏,… ,𝒎. … (𝟐𝟓)

Page 12: Pt2 definitivo a1_e2_pelm (1)

12

En términos generales es un sistema de ecuaciones no lineales con 𝑚 restricciones

(Marín, 2014).

3.3.5. Los residuales que definen al Método de Regresión por Mínimos Cuadrados

En el caso práctico no es posible encontrar esta función polinomial 𝑦 = 𝑓(𝑥) y que

satisfaga exactamente todas las relaciones:

𝒚𝟏 = 𝒇(𝒙𝟏)𝒚𝟐 = 𝒇(𝒙𝟐)

⋮𝒚𝒏 = 𝒇(𝒙𝒏)

… (𝟐𝟔)

Por lo general, uno está dispuesto a aceptar un "residual" (que dependerá de cada

observación) y se define de la manera siguiente:

𝒇(𝒙𝒌) = 𝒚𝒌 + 𝒆𝒌…(𝟐𝟕)

Donde 𝑒𝑘 es el residual que define la medición observada en el dato. La pregunta que

uno se hace es ¿cómo poder encontrar "la mejor aproximación" que pase por los puntos?

(Smith, 1988). Para responder esta pregunta, hay que considerar los residuales (también

llamado como las desviaciones) y están dados como la diferencia del valor estimado por el

modelo 𝑓(𝑥𝑘) menos el valor observado 𝑦𝑘, es decir:

Residuales de Medición

𝒆𝒌 = 𝒇(𝒙𝒌) − 𝒚𝒌 𝐩𝐚𝐫𝐚 𝟏 ≤ 𝒌 ≤ 𝒏…(𝟐𝟖) 𝐑𝐞𝐬𝐢𝐝𝐮𝐚𝐥 = 𝐕𝐚𝐥𝐨𝐫 𝐄𝐬𝐭𝐢𝐦𝐚𝐝𝐨 − 𝐕𝐚𝐥𝐨𝐫 𝐎𝐛𝐬𝐞𝐫𝐯𝐚𝐝𝐨… (𝟐𝟗)

Esta diferencia también suele denotarse por 𝑒𝑖y con esto se podrá determinar el “residual de

estimación” que permite fijar límites dentro de los cuales estará el valor real con cierto

grado de confiabilidad entre los datos verdaderos u observados de 𝑦𝑖 y los datos estimados

o evaluados de 𝑦�̂� , es decir:

𝒆𝒊 = 𝒚𝒊 − 𝒚�̂� →∴ 𝒆𝒊 = 𝒚𝒊 − �̂�(𝒙𝒊)… (𝟑𝟎)

Esta ecuación debe satisfacer la condición de minimizar la suma de las residuales (𝑒𝑖) del

comportamiento de cada par de datos discretos (Quintana, 2005), con respecto al modelo

propuesto, elevadas al cuadrado, es decir:

∑𝒆𝒊𝟐 =∑[𝒚𝒊 − �̂�(𝒙𝒊)]

𝟐𝒏

𝒊=𝟏

=∑(𝒚𝒊 − 𝒚�̂�)𝟐 →∴∑(𝒚𝒊,𝒎𝒆𝒅𝒊𝒅𝒂 − �̂�𝒊,𝒎𝒐𝒅𝒆𝒍𝒐)

𝟐…(𝟑𝟏)

En la Figura 2 se representa la ecuación …(𝟐𝟗)

Page 13: Pt2 definitivo a1_e2_pelm (1)

13

𝐅𝐢𝐠𝐮𝐫𝐚 𝟐. Comparación gráfica de los valores observados y de los valores estimados en el residual de medición(Marín, 2013)

Este análisis describe las predicciones generacionales a través del cálculo del residual;

que este sea lo más exacto posible, es decir un valor mínimo para encontrar el mejor ajuste

para los datos presentados e inferir qué acciones se debe llevar a cabo para cada situación

respectiva en la modalidad del estudio a efectuar (Anderson, 2008).

La validez de la aplicación del método de mínimos cuadrados para el ajuste de funciones

descansa sobre tres suposiciones sobre los residuales que son la:

1.-Independencia: requiere que los residuales sean independientes unos de otros.

2.-Normalidad: requiere que los residuales se distribuyen normalmente en cada valor de la

variable independiente.

3.-Homocedasticidad: requiere que la varianza de los residuales sea constante; es decir

requiere que tengan igual varianza.

Esta validez de la aplicación del método de mínimos cuadrados se define como el criterio

de determinación del mejor ajuste polinomial, dado por (Infante, 2012):

𝐦𝐢𝐧𝐑𝟐 > 𝐑𝐚𝟐…(𝟑𝟐)

𝐃𝐨𝐧𝐝𝐞:R2 = Coeficiente de determinación

Ra2 = Coeficiente de determinación ajustado

La ecuación …(𝟑𝟐) precisa que modelo de función polinomial es el óptimo, para que

este sea el detonador de poder pronosticar los rangos con certeza.

3.3.6. Intervalos de predicción

Considerando el ajuste de la función polinomial, se asume que tienen 𝑁 parejas de

números (𝑥1, 𝑦1), (𝑥2, 𝑦2) hasta (𝑥𝑁 , 𝑦𝑁) y se desea ajustar el mejor polinomio de grado 𝑚

dado por:

𝒚 = 𝒂𝟎 + 𝒂𝟏𝒙 + 𝒂𝟐𝒙𝟐 +⋯+ 𝒂𝒎𝒙

𝒎…(𝟑𝟑)

Page 14: Pt2 definitivo a1_e2_pelm (1)

14

Por lo tanto, se definen los probables intervalos de predicción al 95% de la deserción

estudiantil para esta dependencia del IEMSDF, con su respectiva generación en 𝑥𝑝, dada

por (Wackerly, 2010):

𝒚𝒑 = 𝑿𝒑�̂� ± 𝒕𝟎.𝟗𝟕𝟓𝑵−(𝒎+𝟏)�̂�√𝟏 + 𝑿𝒑(𝑿

𝑻𝑿)−𝟏𝑿𝒑𝑻…(𝟑𝟒)

𝐃𝐨𝐧𝐝𝐞:La variable definida generacional del porcentaje de deserción a predecir = 𝒚𝒑

La matriz pronóstico para 𝑝 datos generacionales = 𝑿𝒑 = [𝟏 𝒙𝒑 ⋯ 𝒙𝒑𝒎]

La matriz de parámetros = �̂� = (𝑿𝑻𝑿)−𝟏𝑿𝑻𝒀 = [

𝒂𝟎𝒂𝟏⋮𝒂𝒎

]

El percentil de una 𝑡 Student = 𝒕𝟎.𝟗𝟕𝟓𝑵−(𝒎+𝟏)

con 𝑵 − (𝒎 + 𝟏) = 𝒗 grados de libertad.

𝐂𝐨𝐧𝐬𝐢𝐝𝐞𝐫𝐚𝐧𝐝𝐨 𝐪𝐮𝐞:𝒎 = Grado del polinomio que se obtuvo en el ajuste.

𝑿 = [

𝟏𝟏⋮𝟏

𝒙𝟏𝒙𝟐⋮𝒙𝑵

⋯⋯⋱⋯

𝒙𝟏𝒎

𝒙𝟐𝒎

⋮𝒙𝑵𝒎

] = La matriz de diseño del ajuste polinomial.

𝒀 = [

𝒚𝟏𝒚𝟐⋮𝒚𝑵

] = La matriz de respuesta del modelo ajustado a los datos.

𝑿𝑻 = La matriz transpuesta de diseño del ajuste polinomial.𝑵 = Número de datos.

(𝑿𝑻𝑿)−𝟏= La matriz inversa.

El error estándar de estimación = �̂� = √𝑺𝑪𝑬

𝑵 − (𝒎+ 𝟏)= √

𝒀𝑻𝒀 − �̂�𝑻𝑿𝑻𝒀

𝑵 − (𝒎+ 𝟏)

𝐃𝐞𝐟𝐢𝐧𝐢𝐞𝐧𝐝𝐨:𝑺𝑪𝑬 = Suma de cuadrados del error.

𝒀𝑻 = La matriz transpuesta de respuesta del modelo ajustado a los datos.

�̂�𝑻 = La matriz transpuesta de los parámetros.

Respecto al orden de la bivalencia ± el intervalo de predicción es expresado como:

𝑿𝒑�̂� − 𝒕𝟎.𝟗𝟕𝟓𝑵−(𝒎+𝟏)�̂�√𝟏 + 𝑿𝒑(𝑿

𝑻𝑿)−𝟏𝑿𝒑𝑻 ≤ 𝒚𝒑 ≤ 𝑿𝒑�̂� + 𝒕𝟎.𝟗𝟕𝟓

𝑵−(𝒎+𝟏)�̂�√𝟏 + 𝑿𝒑(𝑿𝑻𝑿)−𝟏𝑿𝒑

𝑻 … (𝟑𝟓)

La hipótesis indica que el valor esperado de los residuales sea cero y también que la

varianza de los errores sea constante (Infante, 2012), es decir:

𝑬[𝒆𝒌] = 𝟎 𝐩𝐚𝐫𝐚 𝒌 = 𝟏, 𝟐,… , 𝒏

𝑽𝒂𝒓[𝒆𝒌] = �̂� 𝐩𝐚𝐫𝐚 𝒌 = 𝟏, 𝟐,… , 𝒏 … (𝟑𝟔)

Page 15: Pt2 definitivo a1_e2_pelm (1)

15

4. Metodología

En este proyecto fue necesario recurrir al ordenador, para poder resolver el objetivo

planteado; por lo que se utilizaron las siguientes herramientas computacionales:

● La hoja de cálculo de Microsoft Excel 2016 del sistema operativo Windows 10.

● Wólfram Alpha desde: http://www.wolframalpha.com/

● Matrixcalc versión slu. desde: https://matrixcalc.org/es/slu.html

● Octave-MATLAB desde: http://octave-online.net/

Es de especial importancia considerarlo a razón de que se plantea el modelo óptimo para

dar respuesta a las siguientes cuestiones fundamentales:

1). ¿Cuáles son las relaciones en las que estará basado el modelo? El fenómeno de la

deserción estudiantil en la dependencia del IEMS-DF se considera por medio de las

generaciones escolares, en este caso se tomará la relación del ingreso-egreso de cada

generación de todos los planteles de la modalidad escolarizada.

2). ¿Cuál es la formulación del Modelo? A través de los datos registrados del Sistema de

Información Mexicana del Distrito Federal (INFOMEXDF), para poder inferir los valores

estimados a pronosticar a través del ajuste de funciones polinomiales, se considera la

relación numérica de orden cronológico de la generación en los valores discretos, es decir:

Si la primera generación del IEMS-DF fue en 2001-2002, se considera por conveniencia al

modelo, como generación 1.

3). ¿Qué atributos caracterizan el modelo? Por medio de la fórmula del porcentaje de

deserción generacional-PDG, ecuación …(𝟏), para aplicarlo en Excel:

𝐓𝐚𝐛𝐥𝐚 𝟓. 𝐃𝐚𝐭𝐨𝐬 𝐝𝐞 𝐥𝐚 𝐝𝐞𝐩𝐞𝐧𝐝𝐞𝐧𝐜𝐢𝐚 𝐈𝐄𝐌𝐒𝐃𝐅 (𝐒𝐢𝐬𝐭𝐞𝐦𝐚 𝐈𝐍𝐅𝐎𝐌𝐄𝐗𝐃𝐅, 𝟐𝟎𝟏𝟔).

𝐆𝐞𝐧𝐞𝐫𝐚𝐜𝐢ó𝐧 𝐄𝐈𝐆 𝐄𝐄𝐆 𝐏𝐃𝐆

2001 − 𝟏 3062 349 𝟖𝟖. 𝟔𝟎

2002 − 𝟐 3719 644 𝟖𝟐. 𝟔𝟖

2003 − 𝟑 3401 901 𝟕𝟑. 𝟓𝟏

2004 − 𝟒 5647 1390 𝟕𝟓. 𝟑𝟗

2005 − 𝟓 5443 1602 𝟕𝟎. 𝟓𝟕

2006 − 𝟔 5538 1765 𝟔𝟖. 𝟏𝟑

2007 − 𝟕 5762 1735 𝟔𝟗. 𝟖𝟗

2008 − 𝟖 5804 1533 𝟕𝟑. 𝟓𝟗

2009 − 𝟗 5729 1502 𝟕𝟑. 𝟕𝟖

2010 − 𝟏𝟎 6149 1591 𝟕𝟒. 𝟏𝟑

2011 − 𝟏𝟏 6625 1700 𝟕𝟒. 𝟑𝟒

Page 16: Pt2 definitivo a1_e2_pelm (1)

16

2012 − 𝟏𝟐 6372 1601 𝟕𝟒. 𝟖𝟕

2013 − 𝟏𝟑 6349 ¿ ? ¿ ? 2014 − 𝟏𝟒 6826 ¿ ? ¿ ?

4.) ¿Cuáles son las restricciones a emplear para simplificar el modelo? Cabe aclarar que

en el presente trabajo se tomará en cuenta las siguientes variables:

● Variable cuantitativa independiente (𝑥): Define la generación del año escolar

donde se analiza la deserción de estudiantes en esta dependencia del IEMS-DF.

● Variable cuantitativa dependiente (𝑦): Define el porcentaje de la deserción

generacional estudiantil de esta dependencia del IEMS-DF.

Esto implica relacionar y definir las siguientes parejas ordenadas:

(𝐱𝟏, 𝐲𝟏 ) = (𝐠𝐞𝐧𝐞𝐫𝐚𝐜𝐢ó𝐧 𝟏, 𝐏𝐃𝐆𝟏)⋮

(𝐱𝐧, 𝐲𝐧) = (𝐠𝐞𝐧𝐞𝐫𝐚𝐜𝐢ó𝐧 𝐧, 𝐏𝐃𝐆𝐧)… (𝟑𝟕)

Dónde la ecuación …(𝟑𝟕) se delimita, como los valores discretos por conveniencia a la

respectiva generación 𝑛 = 1,2, … ,12; que estos se relacionan, como:

(𝐱𝟏, 𝐲𝟏 ) = (𝟏, 𝐏𝐃𝐆𝟏)⋮

(𝐱𝟏𝟐, 𝐲𝟏𝟐) = (𝟏𝟐, 𝐏𝐃𝐆𝟏𝟐)… (𝟑𝟖)

Luego, se toma la consideración de la ecuación …(𝟑𝟖), para poder realizar el siguiente

arreglo, que va a definir el ajuste:

𝐓𝐚𝐛𝐥𝐚 𝟔. 𝐑𝐞𝐥𝐚𝐜𝐢ó𝐧 𝐝𝐞 𝐯𝐚𝐫𝐢𝐚𝐛𝐥𝐞𝐬 𝐟𝐮𝐧𝐝𝐚𝐦𝐞𝐧𝐭𝐚𝐥𝐞𝐬 𝐩𝐚𝐫𝐚 𝐞𝐥 𝐚𝐣𝐮𝐬𝐭𝐞 𝐩𝐨𝐥𝐢𝐧𝐨𝐦𝐢𝐚𝐥 𝐜𝐮𝐚𝐝𝐫á𝐭𝐢𝐜𝐨.

𝒙𝒊 𝒚𝒊

𝟏 88.60

𝟐 82.68

𝟑 73.51

𝟒 75.39

𝟓 70.57

𝟔 68.13

𝟕 69.89

𝟖 73.59

𝟗 73.78

𝟏𝟎 74.13

𝟏𝟏 74.34

𝟏𝟐 74.87

Page 17: Pt2 definitivo a1_e2_pelm (1)

17

𝐒𝐢𝐞𝐧𝐝𝐨:

𝒙𝒊 = 𝐑𝐞𝐩𝐫𝐞𝐬𝐞𝐧𝐭𝐚𝐜𝐢ó𝐧 𝐝𝐞 𝐥𝐚 𝐠𝐞𝐧𝐞𝐫𝐚𝐜𝐢ó𝐧 𝐞𝐬𝐜𝐨𝐥𝐚𝐫 𝐞𝐧 𝐥𝐨𝐬 𝐯𝐚𝐥𝐨𝐫𝐞𝐬 𝐝𝐢𝐬𝐜𝐫𝐞𝐭𝐨𝐬

𝒚𝒊 = 𝐏𝐨𝐫𝐜𝐞𝐧𝐭𝐚𝐣𝐞 𝐝𝐞 𝐝𝐞𝐬𝐞𝐫𝐜𝐢ó𝐧 𝐠𝐞𝐧𝐞𝐫𝐚𝐜𝐢𝐨𝐧𝐚𝐥 (𝐏𝐃𝐆) = (𝐄𝐈𝐆 − 𝐄𝐄𝐆

𝐄𝐈𝐆) ∗ 𝟏𝟎𝟎

5.) ¿Cuál es el criterio del mejor ajuste a los datos en el modelo? Para poder realizar el

óptimo ajuste polinomial a los datos de la Tabla 6, se corrobora mediante el software

wólfram alpha: http://www.wolframalpha.com/ de la siguiente manera:

fit {{1,86.60}, {2,82.68}, {3,73.51}, {4,75.39}, {5,70.57}, {6,68.13}, {7,69.89}, {8,73.59},

{9,73.78}, {10,74.13}, {11,74.34}, {12,74.87}}

Esta sintaxis a ejecutar, dará las mejores opciones de ajuste polinomiales a los datos que en

este caso, su diagnóstico, es:

𝐅𝐢𝐠𝐮𝐫𝐚 𝟑. El diagnóstico de los ajustes viables a los datos en 𝑤ó𝑙𝑓𝑟𝑎𝑚 𝑎𝑙𝑝ℎ𝑎.

Para encontrar el óptimo ajuste polinomial a los datos, del diagnóstico de la Figura 3, se

emplea el criterio de determinación del mejor ajuste de la ecuación …(𝟑𝟐), para poder

encontrar la función que definirá los intervalos de predicción de la ecuación …(𝟑𝟓); por lo

tanto, en este caso, resulta:

𝐦𝐢𝐧 𝐑𝟐 > 𝐑𝐚𝟐 → 0.793787 > 0.747962 →∴ 𝐅𝐮𝐧𝐜𝐢ó𝐧 𝐂𝐮𝐚𝐝𝐫á𝐭𝐢𝐜𝐚… (𝟑𝟗)

Con la determinación de la ecuación …(𝟑𝟗) se va a proceder a realizar manualmente la

Tabla 3 del ajuste polinomial cuadrático correspondiente para poder aplicar la relación de

variables en el método de los mínimos cuadrados de la siguiente manera:

𝐓𝐚𝐛𝐥𝐚 𝟕. 𝐀𝐣𝐮𝐬𝐭𝐞 𝐩𝐨𝐥𝐢𝐧𝐨𝐦𝐢𝐚𝐥 𝐝𝐞 𝐥𝐚 𝐝𝐞𝐩𝐞𝐧𝐝𝐞𝐧𝐜𝐢𝐚 𝐈𝐄𝐌𝐒𝐃𝐅

𝒊 𝒙𝒊 𝒙𝒊𝟐 𝒙𝒊

𝟑 𝒙𝒊𝟒 𝒚𝒊 𝒙𝒊𝒚𝒊 𝒙𝒊

𝟐𝒚𝒊

1 1 1 1 1 88.60 88.60 88.60

2 2 4 8 16 82.68 165.36 330.72

3 3 9 27 81 73.51 220.53 661.59

4 4 16 64 256 75.39 301.56 1206.24

5 5 25 125 625 70.57 352.85 1764.25

Page 18: Pt2 definitivo a1_e2_pelm (1)

18

6 6 36 216 1296 68.13 408.78 2452.68

7 7 49 343 2401 69.89 489.23 3424.61

8 8 64 512 4096 73.59 588.72 4709.76

9 9 81 729 6561 73.78 664.02 5976.18

10 10 100 1000 10000 74.13 741.30 7413.00

11 11 121 1331 14641 74.34 817.74 8995.14

12 12 144 1728 20736 74.87 898.44 10781.28

Suma por

columna 𝟕𝟖

∑𝒊=𝟏𝟏𝟐 𝒙𝒊

𝟔𝟓𝟎∑𝒊=𝟏𝟏𝟐 𝒙𝒊

𝟐 𝟔𝟎𝟖𝟒∑𝒊=𝟏𝟏𝟐 𝒙𝒊

𝟑 𝟔𝟎𝟕𝟏𝟎∑𝒊=𝟏𝟏𝟐 𝒙𝒊

𝟒 𝟖𝟗𝟗. 𝟒𝟖∑𝒊=𝟏𝟏𝟐 𝒚𝒊

𝟓𝟕𝟑𝟕. 𝟏𝟑∑𝒊=𝟏𝟏𝟐 𝒙𝒊𝒚𝒊

𝟒𝟕𝟖𝟎𝟒. 𝟎𝟓∑𝒊=𝟏𝟏𝟐 𝒙𝒊

𝟐𝒚𝒊

Entonces, las ecuaciones normales para el caso del ajuste polinomial cuadrático están

dadas por la ecuación …(𝟐𝟐):

[ 𝟏𝟐 ∑𝒊=𝟏

𝟏𝟐 𝒙𝒊 ∑𝒊=𝟏𝟏𝟐 𝒙𝒊

𝟐

∑𝒊=𝟏𝟏𝟐 𝒙𝒊 ∑𝒊=𝟏

𝟏𝟐 𝒙𝒊𝟐 ∑𝒊=𝟏

𝟏𝟐 𝒙𝒊𝟑

∑𝒊=𝟏𝟏𝟐 𝒙𝒊

𝟐 ∑𝒊=𝟏𝟏𝟐 𝒙𝒊

𝟑 ∑𝒊=𝟏𝟏𝟐 𝒙𝒊

𝟒]

[

𝒂𝟎𝒂𝟏𝒂𝟐] =

[ ∑𝒊=𝟏

𝟏𝟐 𝒚𝒊

∑𝒊=𝟏𝟏𝟐 𝒙𝒊𝒚𝒊

∑𝒊=𝟏𝟏𝟐 𝒙𝒊

𝟐𝒚𝒊]

… (𝟒𝟎)

Para resolver el sistema de ecuaciones …(𝟒𝟎) de este ajuste polinomial cuadrático, se

emplea el software Matrixcalc: https://matrixcalc.org/es/slu.html cuya indicación a ejecutar

es el Método de la matriz inversa en relación a la forma de la ecuación …(𝟐𝟐), por lo que

en este caso se define, como:

𝑨 ∙ �̂� = 𝑩 →∴ �̂� = 𝑨−𝟏 ∙ 𝑩 → [

𝒂𝟎𝒂𝟏𝒂𝟐] = [

𝑵 ∑𝒊=𝟏𝑵 𝒙𝒊 ∑𝒊=𝟏

𝑵 𝒙𝒊𝟐

∑𝒊=𝟏𝑵 𝒙𝒊 ∑𝒊=𝟏

𝑵 𝒙𝒊𝟐 ∑𝒊=𝟏

𝑵 𝒙𝒊𝟑

∑𝒊=𝟏𝑵 𝒙𝒊

𝟐 ∑𝒊=𝟏𝑵 𝒙𝒊

𝟑 ∑𝒊=𝟏𝑵 𝒙𝒊

𝟒

]

−𝟏

[

∑𝒊=𝟏𝑵 𝒚𝒊

∑𝒊=𝟏𝑵 𝒙𝒊𝒚𝒊

∑𝒊=𝟏𝑵 𝒙𝒊

𝟐𝒚𝒊

]… (𝟒𝟏)

5. Resultados

En este caso la forma matricial de la ecuación …(𝟒𝟎) se define como los valores de las

sumatorias encontradas en la Tabla 7 y esto se sustituye respectivamente de la siguiente

manera:

[𝟏𝟐 𝟕𝟖 𝟔𝟓𝟎𝟕𝟖 𝟔𝟓𝟎 𝟔𝟎𝟖𝟒𝟔𝟓𝟎 𝟔𝟎𝟖𝟒 𝟔𝟎𝟕𝟏𝟎

] [

𝒂𝟎𝒂𝟏𝒂𝟐] = [

𝟖𝟗𝟗. 𝟒𝟖𝟓𝟕𝟑𝟕. 𝟏𝟑𝟒𝟕𝟖𝟎𝟒. 𝟎𝟓

]… (𝟒𝟐)

Realizando la multiplicación matricial en el lado izquierdo de la ecuación …(𝟒𝟐) nos

conduce a resolver un sistema de ecuaciones, para encontrar los coeficientes respectivos de

este ajuste polinomial cuadrático:

Page 19: Pt2 definitivo a1_e2_pelm (1)

19

𝟏𝟐𝒂𝟎 + 𝟕𝟖𝒂𝟎 + 𝟔𝟓𝟎𝒂𝟎 +

𝟕𝟖 𝒂𝟏 +𝟔𝟓𝟎𝒂𝟏 +𝟔𝟎𝟖𝟒𝒂𝟏 +

𝟔𝟓𝟎𝒂𝟐 =𝟔𝟎𝟖𝟒𝒂𝟐 =𝟔𝟎𝟕𝟏𝟎𝒂𝟐 =

𝟖𝟗𝟗. 𝟒𝟖𝟓𝟕𝟑𝟕. 𝟏𝟑𝟒𝟕𝟖𝟎𝟒. 𝟎𝟓

… (𝟒𝟑)

Entonces, considerando los valores matriciales de la ecuación …(𝟒𝟐), como:

𝑨 = [𝟏𝟐 𝟕𝟖 𝟔𝟓𝟎𝟕𝟖 𝟔𝟓𝟎 𝟔𝟎𝟖𝟒𝟔𝟓𝟎 𝟔𝟎𝟖𝟒 𝟔𝟎𝟕𝟏𝟎

] ; 𝑩 = [𝟖𝟗𝟗. 𝟒𝟖𝟓𝟕𝟑𝟕. 𝟏𝟑𝟒𝟕𝟖𝟎𝟒. 𝟎𝟓

]…(𝟒𝟒)

Luego se calcula la inversa de 𝐴 en el software Matrixcalc:

𝑨−𝟏 =

[ 𝟒𝟕

𝟒𝟒

−𝟏𝟓

𝟒𝟒

𝟏

𝟒𝟒

−𝟏𝟓

𝟒𝟒

𝟓𝟑𝟓

𝟒𝟎𝟎𝟒

−𝟑

𝟑𝟎𝟖

𝟏

𝟒𝟒

−𝟑

𝟑𝟎𝟖𝟑

𝟒𝟎𝟎𝟒 ]

… (𝟒𝟓)

Por lo tanto, se procede a encontrar los coeficientes del ajuste cuadrático en el software

Matrixcalc:

�̂� = 𝑨−𝟏 ∙ 𝑩 → [

𝒂𝟎𝒂𝟏𝒂𝟐] =

[ 𝟒𝟕

𝟒𝟒

−𝟏𝟓

𝟒𝟒

𝟏

𝟒𝟒

−𝟏𝟓

𝟒𝟒

𝟓𝟑𝟓

𝟒𝟎𝟎𝟒

−𝟑

𝟑𝟎𝟖

𝟏

𝟒𝟒

−𝟑

𝟑𝟎𝟖𝟑

𝟒𝟎𝟎𝟒 ]

∙ [𝟖𝟗𝟗. 𝟒𝟖𝟓𝟕𝟑𝟕. 𝟏𝟑𝟒𝟕𝟖𝟎𝟒. 𝟎𝟓

] =

[ 𝟐𝟎𝟏𝟏𝟑𝟑

𝟐𝟐𝟎𝟎

−𝟖𝟏𝟑𝟕

𝟏𝟒𝟑𝟎𝟓𝟒𝟏𝟕

𝟏𝟒𝟑𝟎𝟎 ]

… (𝟒𝟔)

En la ecuación …(𝟒𝟔) se encuentra la solución, para los coeficientes del ajuste polinomial

cuadrático, que está dado por:

𝒂𝟎 = 𝟗𝟏. 𝟒𝟐𝟒𝟎𝟗, 𝒂𝟏 = −𝟓.𝟔𝟗𝟎𝟐𝟏, 𝒂𝟐 = 𝟎. 𝟑𝟕𝟖𝟖𝟏 … (𝟒𝟕)

Por lo tanto, se relaciona los coeficientes encontrados en …(𝟒𝟕) para sustituirlos en el

mejor modelo de ajuste polinomial cuadrático:

�̂� = 𝒂𝟎 + 𝒂𝟏𝒙 + 𝒂𝟐𝒙𝟐 →∴ �̂� = 𝟗𝟏. 𝟒𝟐𝟒𝟎𝟗 − 𝟓. 𝟔𝟗𝟎𝟐𝟏𝒙 + 𝟎. 𝟑𝟕𝟖𝟖𝟏𝒙𝟐…(𝟒𝟖)

Esta ecuación …(𝟒𝟖) implica encontrar los probables intervalos de predicción al 95% de

confianza sobre el porcentaje de la deserción estudiantil para esta dependencia, que está

dado por la ecuación …(𝟑𝟒):

𝒚𝒑 = 𝑿𝒑�̂� ± 𝒕𝟎.𝟗𝟕𝟓𝟏𝟐−(𝟐+𝟏)�̂�√𝟏 + 𝑿𝒑(𝑿𝑻𝑿)−𝟏𝑿𝒑𝑻 … (𝟒𝟗)

Page 20: Pt2 definitivo a1_e2_pelm (1)

20

Después en la ecuación …(𝟒𝟗) se realiza operaciones correspondientes en el lado derecho

de la bivalencia ± :

𝒚𝒑 = 𝑿𝒑�̂� ± 𝒕𝟎.𝟗𝟕𝟓𝟗 (√

𝒀𝑻𝒀 − �̂�𝑻𝑿𝑻𝒀

𝟏𝟐 − (𝟐 + 𝟏))√𝟏 + 𝑿𝒑(𝑿𝑻𝑿)−𝟏𝑿𝒑𝑻…(𝟓𝟎)

Esto implica, encontrar el percentil de la distribución 𝑡 Student, que en este caso se define

como: 𝒕𝟎.𝟗𝟕𝟓𝟗 , por lo que este valor, se corrobora mediante el software wólfram alpha:

http://www.wolframalpha.com/ de la siguiente manera:

97.5 Percentile Student´s t distribution degrees of freedom 9

Esta sintaxis a ejecutar, da el valor correspondiente de 𝒕𝟎.𝟗𝟕𝟓𝟗 = 𝟐. 𝟐𝟔𝟐𝟏𝟔… (𝟓𝟏)

Luego, se procede a calcular el error de la estimación:

�̂� = √𝒀𝑻𝒀 − �̂�𝑻𝑿𝑻𝒀

𝟗… (𝟓𝟐)

Para obtener la suma de cuadrados del error (𝑺𝑪𝑬), se define, para este caso de ajuste

polinomial cuadrático, los elementos matriciales del numerador de la ecuación …(𝟓𝟐), por

lo tanto se emplea el software Matrixcalc: https://matrixcalc.org/es/slu.html de la siguiente

forma:

Page 21: Pt2 definitivo a1_e2_pelm (1)

21

𝑿 =

[ 𝟏𝟏⋮𝟏

𝒙𝟏𝒙𝟐⋮𝒙𝟏𝟐

𝒙𝟏𝟐

𝒙𝟐𝟐

⋮𝒙𝟏𝟐𝟐 ]

=

[ 𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏

𝟏𝟐𝟑𝟒𝟓𝟔𝟕𝟖𝟗𝟏𝟎𝟏𝟏𝟏𝟐

𝟏𝟒𝟗𝟏𝟔𝟐𝟓𝟑𝟔𝟒𝟗𝟔𝟒𝟖𝟏𝟏𝟎𝟎𝟏𝟐𝟏𝟏𝟒𝟒]

→∴ 𝑿𝑻 = [𝟏 𝟏 𝟏

𝟏 𝟐 𝟒

𝟏 𝟑 𝟗

𝟏𝟒𝟏𝟔

𝟏𝟓𝟐𝟓

𝟏𝟔𝟑𝟔

𝟏𝟕𝟒𝟗

𝟏𝟖𝟔𝟒

𝟏𝟗𝟖𝟏

𝟏𝟏𝟎𝟏𝟎𝟎

𝟏𝟏𝟏𝟏𝟐𝟏

𝟏𝟏𝟐𝟏𝟒𝟒

]

𝒀 = [

𝒚𝟏𝒚𝟐⋮𝒚𝟏𝟐

] =

[ 𝟖𝟖. 𝟔𝟎𝟖𝟐. 𝟔𝟖𝟕𝟑. 𝟓𝟏𝟕𝟓. 𝟑𝟗𝟕𝟎. 𝟓𝟕𝟔𝟖. 𝟏𝟑𝟔𝟗. 𝟖𝟗𝟕𝟑. 𝟓𝟗𝟕𝟑. 𝟕𝟖𝟕𝟒. 𝟏𝟑𝟕𝟒. 𝟑𝟒𝟕𝟒. 𝟖𝟕]

→∴ 𝒀𝑻 = [𝟖𝟖. 𝟔𝟎 𝟖𝟐. 𝟔𝟖 𝟕𝟑. 𝟓𝟏 𝟕𝟓. 𝟑𝟗 𝟕𝟎. 𝟓𝟕 𝟔𝟖. 𝟏𝟑 𝟔𝟗. 𝟖𝟗 𝟕𝟑. 𝟓𝟗 𝟕𝟑. 𝟕𝟖 𝟕𝟒. 𝟏𝟑 𝟕𝟒. 𝟑𝟒 𝟕𝟒. 𝟖𝟕]

�̂� = [

𝒂𝟎𝒂𝟏𝒂𝟐] = [

𝟗𝟏. 𝟒𝟐𝟒𝟎𝟗−𝟓. 𝟔𝟗𝟎𝟐𝟏𝟎. 𝟑𝟕𝟖𝟖𝟏

] →∴ �̂�𝑻 = [𝟗𝟏. 𝟒𝟐𝟒𝟎𝟗 −𝟓. 𝟔𝟗𝟎𝟐𝟏 𝟎. 𝟑𝟕𝟖𝟖𝟏]

… (𝟓𝟑)

Esto implica, sustituir los elementos matriciales de la ecuación …(𝟓𝟑), para poder efectuar

la operación matricial del numerador de la ecuación …(𝟓𝟐) con el software Matrixcalc:

https://matrixcalc.org/es/slu.html de la siguiente manera:

𝒀𝑻𝒀 = 𝟔𝟕𝟕𝟔𝟓. 𝟗�̂�𝑻𝑿𝑻𝒀 = 𝟔𝟕𝟔𝟗𝟕. 𝟑

�̂� = √𝟔𝟕𝟕𝟔𝟓. 𝟗 − 𝟔𝟕𝟔𝟗𝟕. 𝟑

𝟗

�̂� = √68.6

9

→∴ �̂� = √7.62222�̂� = 𝟐. 𝟕𝟔𝟎

… (𝟓𝟒)

Por lo tanto, se sustituye los valores de las ecuaciones …(𝟓𝟏) y …(𝟓𝟒) en el intervalo de

predicción de la ecuación …(𝟓𝟎):

𝒚𝒑 = 𝑿𝒑�̂�± (𝟐.𝟐𝟔𝟐𝟏𝟔)(𝟐.𝟕𝟔𝟎)√𝟏+ 𝑿𝒑(𝑿𝑻𝑿)

−𝟏𝑿𝒑𝑻 … (𝟓𝟓)

El intervalo de predicción de la ecuación …(𝟓𝟓) define el pronóstico para las generaciones

del 2013 al 2014:

Para la generación 2013.

En este caso, se define el pronóstico como un valor discreto, por lo tanto, 𝑝 = 13 y este se

sustituye en la ecuación …(𝟓𝟓):

Page 22: Pt2 definitivo a1_e2_pelm (1)

22

𝒚𝟏𝟑 = 𝑿𝟏𝟑�̂� ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟏 + 𝑿𝟏𝟑(𝑿𝑻𝑿)−𝟏𝑿𝟏𝟑𝑻 … (𝟓𝟔)

Entonces, para esta generación, su matriz pronóstico, que se define en la ecuación …(𝟑𝟒)

es:

𝑿𝟏𝟑 = [𝟏 𝒙𝟏𝟑 ⋯ 𝒙𝟏𝟑𝟐 ] → 𝑿𝟏𝟑 = [𝟏 𝟏𝟑 𝟏𝟔𝟗]→∴ 𝑿𝟏𝟑

𝑻 = [𝟏𝟏𝟑𝟏𝟔𝟗

] … (𝟓𝟕)

Esto implica, encontrar la operación matricial 𝑿𝟏𝟑�̂� , considerando el elemento matricial

𝑿𝟏𝟑 de la ecuación …(𝟓𝟕) y el elemento matricial �̂� definido en la ecuación …(𝟓𝟑) y estos

elementos matriciales se sustituyen en la ecuación …(𝟓𝟔):

𝒚𝟏𝟑 = [𝟏 𝟏𝟑 𝟏𝟔𝟗] [𝟗𝟏. 𝟒𝟐𝟒𝟎𝟗−𝟓. 𝟔𝟗𝟎𝟐𝟏𝟎. 𝟑𝟕𝟖𝟖𝟏

] ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟏 + 𝑿𝟏𝟑(𝑿𝑻𝑿)−𝟏𝑿𝟏𝟑𝑻 … (𝟓𝟖)

En la ecuación …(𝟓𝟖) se realiza su operación matricial del lado izquierdo de la bivalencia

± con el software wólfram alpha: http://www.wolframalpha.com/ donde se ejecuta la

siguiente instrucción:

{{1,13,169}}*{{91.42409},{-5.69021},{0.37881}}

Esta sintaxis, da el resultado de esta operación matricial y por lo tanto este valor resultante

se sustituye en la ecuación …(𝟓𝟖):

𝒚𝟏𝟑 = 𝟖𝟏. 𝟒𝟕𝟎 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟏 + 𝑿𝟏𝟑(𝑿𝑻𝑿)−𝟏𝑿𝟏𝟑𝑻 … (𝟓𝟗)

Luego, se efectúa la operación matricial √𝟏 + 𝑿𝟏𝟑(𝑿𝑻𝑿)−𝟏𝑿𝟏𝟑

𝑻 , considerando el elemento

matricial 𝑿𝟏𝟑 de la ecuación …(𝟓𝟕) y los elementos matriciales 𝑿,𝑿𝑻 que están definidos

en la ecuación …(𝟓𝟑) y estos elementos matriciales se sustituyen en la ecuación …(𝟓𝟗):

𝒚𝟏𝟑 = 𝟖𝟏.𝟒𝟕𝟎± (𝟐.𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)

𝟏+ [𝟏 𝟏𝟑 𝟏𝟔𝟗]

(

[𝟏 𝟏 𝟏

𝟏 𝟐 𝟒

𝟏 𝟑 𝟗

𝟏𝟒𝟏𝟔

𝟏𝟓𝟐𝟓

𝟏𝟔𝟑𝟔

𝟏𝟕𝟒𝟗

𝟏𝟖𝟔𝟒

𝟏𝟗𝟖𝟏

𝟏𝟏𝟎𝟏𝟎𝟎

𝟏𝟏𝟏𝟏𝟐𝟏

𝟏𝟏𝟐𝟏𝟒𝟒

]

[ 𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏

𝟏𝟐𝟑𝟒𝟓𝟔𝟕𝟖𝟗𝟏𝟎𝟏𝟏𝟏𝟐

𝟏𝟒𝟗𝟏𝟔𝟐𝟓𝟑𝟔𝟒𝟗𝟔𝟒𝟖𝟏𝟏𝟎𝟎𝟏𝟐𝟏𝟏𝟒𝟒]

)

−𝟏

[𝟏𝟏𝟑𝟏𝟔𝟗

] … (𝟔𝟎)

Después, se realiza la multiplicación de matrices del paréntesis de la ecuación …(𝟔𝟎) con

el software Matrixcalc: https://matrixcalc.org/es/slu.html y por lo tanto esta multiplicación

matricial resulta:

Page 23: Pt2 definitivo a1_e2_pelm (1)

23

𝒚𝟏𝟑 = 𝟖𝟏. 𝟒𝟕𝟎 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟏 + [𝟏 𝟏𝟑 𝟏𝟔𝟗] ([𝟏𝟐 𝟕𝟖 𝟔𝟓𝟎

𝟕𝟖 𝟔𝟓𝟎 𝟔𝟎𝟖𝟒

𝟔𝟓𝟎𝟔𝟎𝟖𝟒𝟔𝟎𝟕𝟏𝟎

])

−𝟏

[𝟏𝟏𝟑𝟏𝟔𝟗

] … (𝟔𝟏)

Esto implica, efectuar las operaciones matriciales del radicando de la ecuación …(𝟔𝟏)

mediante el software wólfram alpha: http://www.wolframalpha.com/ donde se ejecuta la

siguiente instrucción:

{{1,13,169}}*inverse({{12,78,650},{78,650,6084},{650,6084,60710}})*{{1},{13},{169}}

Esta sintaxis, da el resultado de esta operación matricial y por lo tanto este valor resultante

se sustituye en la ecuación …(𝟔𝟏):

𝒚𝟏𝟑 = 𝟖𝟏. 𝟒𝟕𝟎 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟏 + 𝟏. 𝟎𝟔𝟖𝟏𝟖 … (𝟔𝟐)

Realizando operaciones elementales en el radicando de la ecuación …(𝟔𝟐):

𝒚𝟏𝟑 = 𝟖𝟏. 𝟒𝟕𝟎 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟐. 𝟎𝟔𝟖𝟏𝟖 … (𝟔𝟑)

Se encuentra la raíz cuadrada de la ecuación …(𝟔𝟑):

𝒚𝟏𝟑 = 𝟖𝟏. 𝟒𝟕𝟎 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)(𝟏. 𝟒𝟑𝟖𝟏𝟏𝟔𝟖𝟐𝟒) … (𝟔𝟒)

Luego, se efectúa la multiplicación del lado derecho de la bivalencia ± de la ecuación

… (𝟔𝟒):

𝒚𝟏𝟑 = 𝟖𝟏. 𝟒𝟕𝟎 ± 𝟖. 𝟗𝟕𝟖 … (𝟔𝟓)

Finalmente, el resultado del intervalo de predicción de la ecuación …(𝟔𝟓) se interpreta de

acuerdo a la definición del orden bivalente ± de la ecuación …(𝟑𝟓):

81.470 − 8.978 ≤ 𝑦13 ≤ 81.470 + 8.978 →∴ 𝟕𝟐. 𝟒𝟗% ≤ 𝒚𝟏𝟑 ≤ 𝟗𝟎. 𝟒𝟒%…(𝟔𝟔)

Para la generación 2014.

En este caso, se define el pronóstico como un valor discreto, por lo tanto, 𝑝 = 14 y este se

sustituye en la ecuación …(𝟓𝟓):

𝒚𝟏𝟒 = 𝑿𝟏𝟒�̂� ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟏 + 𝑿𝟏𝟒(𝑿𝑻𝑿)−𝟏𝑿𝟏𝟒𝑻 … (𝟔𝟕)

Entonces, para esta generación, su matriz pronóstico, que se define en la ecuación …(𝟑𝟒)

es:

Page 24: Pt2 definitivo a1_e2_pelm (1)

24

𝑿𝟏𝟒 = [𝟏 𝒙𝟏𝟒 ⋯ 𝒙𝟏𝟒𝟐 ] → 𝑿𝟏𝟒 = [𝟏 𝟏𝟒 𝟏𝟗𝟔] →∴ 𝑿𝟏𝟒

𝑻 = [𝟏𝟏𝟒𝟏𝟗𝟔

] … (𝟔𝟖)

Esto implica, encontrar la operación matricial 𝑿𝟏𝟒�̂� , considerando el elemento matricial

𝑿𝟏𝟒 de la ecuación …(𝟔𝟖) y el elemento matricial �̂� definido en la ecuación …(𝟓𝟑) y estos

elementos matriciales se sustituyen en la ecuación …(𝟔𝟕):

𝒚𝟏𝟒 = [𝟏 𝟏𝟒 𝟏𝟗𝟔] [𝟗𝟏. 𝟒𝟐𝟒𝟎𝟗−𝟓. 𝟔𝟗𝟎𝟐𝟏𝟎. 𝟑𝟕𝟖𝟖𝟏

] ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟏 + 𝑿𝟏𝟒(𝑿𝑻𝑿)−𝟏𝑿𝟏𝟒𝑻 … (𝟔𝟗)

En la ecuación …(𝟔𝟗) se realiza su operación matricial del lado izquierdo de la bivalencia

± con el software wólfram alpha: http://www.wolframalpha.com/ donde se ejecuta la

siguiente instrucción:

{{1,14,196}}*{{91.42409},{-5.69021},{0.37881}}

Esta sintaxis, da el resultado de esta operación matricial y por lo tanto este valor resultante

se sustituye en la ecuación …(𝟔𝟗):

𝒚𝟏𝟒 = 𝟖𝟔. 𝟎𝟎𝟖 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟏 + 𝑿𝟏𝟒(𝑿𝑻𝑿)−𝟏𝑿𝟏𝟒𝑻 … (𝟕𝟎)

Luego, se efectúa la operación matricial √𝟏 + 𝑿𝟏𝟒(𝑿𝑻𝑿)−𝟏𝑿𝟏𝟒

𝑻 , considerando el elemento

matricial 𝑿𝟏𝟒 de la ecuación …(𝟔𝟖) y los elementos matriciales 𝑿,𝑿𝑻 que están definidos

en la ecuación …(𝟓𝟑) y estos elementos matriciales se sustituyen en la ecuación …(𝟕𝟎):

𝒚𝟏𝟒 = 𝟖𝟔.𝟎𝟎𝟖± (𝟐.𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)

𝟏+ [𝟏 𝟏𝟒 𝟏𝟗𝟔]

(

[𝟏 𝟏 𝟏

𝟏 𝟐 𝟒

𝟏 𝟑 𝟗

𝟏𝟒𝟏𝟔

𝟏𝟓𝟐𝟓

𝟏𝟔𝟑𝟔

𝟏𝟕𝟒𝟗

𝟏𝟖𝟔𝟒

𝟏𝟗𝟖𝟏

𝟏𝟏𝟎𝟏𝟎𝟎

𝟏𝟏𝟏𝟏𝟐𝟏

𝟏𝟏𝟐𝟏𝟒𝟒

]

[ 𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏

𝟏𝟐𝟑𝟒𝟓𝟔𝟕𝟖𝟗𝟏𝟎𝟏𝟏𝟏𝟐

𝟏𝟒𝟗𝟏𝟔𝟐𝟓𝟑𝟔𝟒𝟗𝟔𝟒𝟖𝟏𝟏𝟎𝟎𝟏𝟐𝟏𝟏𝟒𝟒]

)

−𝟏

[𝟏𝟏𝟒𝟏𝟗𝟔

] … (𝟕𝟏)

Después, se realiza la multiplicación de matrices del paréntesis de la ecuación …(𝟕𝟏) y

por lo tanto esta multiplicación matricial resulta:

𝒚𝟏𝟒 = 𝟖𝟔. 𝟎𝟎𝟖 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟏 + [𝟏 𝟏𝟒 𝟏𝟗𝟔] ([𝟏𝟐 𝟕𝟖 𝟔𝟓𝟎

𝟕𝟖 𝟔𝟓𝟎 𝟔𝟎𝟖𝟒

𝟔𝟓𝟎𝟔𝟎𝟖𝟒𝟔𝟎𝟕𝟏𝟎

])

−𝟏

[𝟏𝟏𝟒𝟏𝟗𝟔

] … (𝟕𝟐)

Page 25: Pt2 definitivo a1_e2_pelm (1)

25

Esto implica, efectuar las operaciones matriciales del radicando de la ecuación …(𝟕𝟐)

mediante el software wólfram alpha: http://www.wolframalpha.com/ donde se ejecuta la

siguiente instrucción:

{{1,14,196}}*inverse({{12,78,650},{78,650,6084},{650,6084,60710}})*{{1},{14},{196}}

Esta sintaxis, da el resultado de esta operación matricial y por lo tanto este valor resultante

se sustituye en la ecuación …(𝟕𝟐):

𝒚𝟏𝟒 = 𝟖𝟔. 𝟎𝟎𝟖 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟏 + 𝟏. 𝟗𝟒𝟗𝟑𝟎 … (𝟕𝟑)

Realizando operaciones elementales en el radicando de la ecuación …(𝟕𝟑):

𝒚𝟏𝟒 = 𝟖𝟔. 𝟎𝟎𝟖 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟐. 𝟗𝟒𝟗𝟑𝟎 … (𝟕𝟒)

Se encuentra la raíz cuadrada de la ecuación …(𝟕𝟒):

𝒚𝟏𝟒 = 𝟖𝟔. 𝟎𝟎𝟖 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)(𝟏. 𝟕𝟏𝟕𝟑𝟓𝟐𝟔𝟏𝟒) … (𝟕𝟓)

Luego, se efectúa la multiplicación del lado derecho de la bivalencia ± de la ecuación

… (𝟕𝟓):

𝒚𝟏𝟒 = 𝟖𝟔. 𝟎𝟎𝟖 ± 𝟏𝟎. 𝟕𝟐𝟐 … (𝟕𝟔)

Finalmente, el resultado del intervalo de predicción de la ecuación …(𝟕𝟔) se interpreta de

acuerdo a la definición del orden bivalente ± de la ecuación …(𝟑𝟓):

86.008 − 10.722 ≤ 𝑦14 ≤ 86.008 + 10.722 →∴ 𝟕𝟓. 𝟐𝟖% ≤ 𝒚𝟏𝟒 ≤ 𝟗𝟔. 𝟕𝟑%…(𝟕𝟕)

Estos intervalos de predicción de las ecuaciones …(𝟔𝟔) y …(𝟕𝟕) se corrobora mediante el

software de Octave-MATLAB desde: http://octave-online.net/ donde se consideran las

siguientes instrucciones definidas a ejecutar:

[p,S] = polyfit(x,y,n): Da los coeficientes del polinomio p de grado n que se

encontró manualmente en la ecuación …(𝟒𝟖) que ajusta los puntos (x,y) por

mínimos cuadrados, con errores estimados S

[Y,D] = polyconf(p,X,S,alpha): Predicción polinómica con intervalos de

confianza Y±D de la salida S dada por polyfit con nivel de confianza alpha

(considerando la ecuación …(𝟑𝟒), se menciona que es del 95%, es decir 0.05)

Estas instrucciones definidas, implica introducir las variables de los puntos del ajuste

considerado, es decir (x,y)=(Generacion,Desercion) con el siguiente orden

fundamental:

octave:1>Desercion=[88.60,82.68,73.51,75.39,70.57,68.13,69.89,73.59,

73.78,74.13,74.34,74.87];

octave:2> Generacion=[1,2,3,4,5,6,7,8,9,10,11,12];

Page 26: Pt2 definitivo a1_e2_pelm (1)

26

Luego, se agrega la instrucción de polyfit, definida en este caso como:

octave:3> [p,S] = polyfit(Generacion,Desercion,2)

p =

0.37881 -5.69021 91.42409

S =

scalar structure containing the fields:

yf =

Columns 1 through 8:

86.113 81.559 77.763 74.724 72.443 70.920 70.154

70.146

Columns 9 through 12:

70.896 72.403 74.668 77.690

X =

1 1 1

4 2 1

9 3 1

16 4 1

25 5 1

36 6 1

49 7 1

64 8 1

81 9 1

100 10 1

121 11 1

144 12 1

En efecto, estos resultados concuerdan con los obtenidos en las ecuaciones …(𝟒𝟖) y

…(𝟓𝟑).

Por lo tanto, se corroboran los predichos intervalos estudiantiles en la generación 2013 y

2014 de desertores, esto implica considerar lo que se obtuvo de la implementación

polyfit, para que se encuentre la última instrucción definida:

octave:4> [Y,D] = polyconf(p,13,S,0.05)

Y = 81.470

D = 8.978

octave:5> [Y,D] = polyconf(p,14,S,0.05)

Y = 86.008

D = 10.722

Page 27: Pt2 definitivo a1_e2_pelm (1)

27

Esta sintaxis ejecutada en el software de Octave-MATLAB, da certeza de nuestros

resultados obtenidos manualmente en las ecuaciones …(𝟔𝟔) y …(𝟕𝟕), a razón de que

estos valores son idénticos.

En este trabajo se ha partido de la premisa de que un modelo estadístico paramétrico se

encuentra especificado por medio del grado que determina el óptimo ajuste funcional

polinomial, que este se logra con las variables que presentan mayor correlación a los datos

incluidos y que el objetivo es realizar la estimación de intervalos predictivos, que dependen

principalmente del nivel de confianza al 95% y de su vía asociada al percentil de la

distribución 𝑡 de Student cuyos límites inferior y superior involucra qué para tamaños de

muestras grandes, varía los resultados generacionales del 2013 al 2014 de la deserción

estudiantil en la dependencia IEMSDF de la siguiente manera:

Para la generación 2013 su intervalo predictivo porcentual de la ecuación …(𝟔𝟔),

se compara con el último valor obtenido en los datos del ajuste, es decir el

porcentaje de la generación 2012; por lo tanto, se menciona que para su límite

inferior el valor se considera optimista a razón de que es proporcional y en su límite

superior el valor es fatalista por que incrementa significativamente la deserción

estudiantil.

Para la generación 2014 su intervalo predictivo porcentual de la ecuación …(𝟕𝟕), se

compara en los respectivos límites del intervalo obtenido en la ecuación …(𝟔𝟔), por

lo tanto, se menciona que para su límite inferior el valor aumenta sustancialmente y

en su límite superior el valor es catastrófico porque sigue incrementando la

deserción estudiantil.

Estos resultados conforman una banda única de confianza en los límites respectivos del

intervalo, que refleja el error de muestreo de deserción estudiantil inherente al cálculo del

error estándar de su dispersión generacional, cuyo tratamiento informativo en su valor

porcentual, se interpreta a corto plazo, la cobertura de la eficacia terminal, cuya

determinación, busque alentar a la dependencia, en incentivar la flexibilidad del modelo

educativo en el sistema escolarizado, para considerar un panorama de permanencia a cada

alumno que esté en riesgo de abandonar su plantel y esto promueva el alcance de retomar la

facilitación de continuar los estudios con actitud comprometida, para que el aprendiz

adquiera un sentido de responsabilidad, que estimule en su ser una formación de seguridad

decisiva ante los conflictos de la vida, conllevando así, una visión de superación personal,

que le genere competitividad exitosa, para poder culminar el logro de certificar su egreso

con calidad trascendental al desarrollo profesional.

Page 28: Pt2 definitivo a1_e2_pelm (1)

28

6. Conclusiones y futuras líneas de investigación

En este trabajo se desarrolló un análisis de regresión por el método de mínimos

cuadrados, que consistió en basar sus criterios de determinación, para generar una función

polinomial óptima de ajuste a los datos generacionales, respectivamente a la extrapolación

de un intervalo de predicción porcentual de estudiantes desertores, que:

Puede tomar una variable objetivo fuera del ámbito temporal o espacial.

Puede ser inferido a partir de un profundo estudio del pasado y aceptando que el

comportamiento de los agentes históricos no se modifica sustancialmente.

Define cuál de los posibles valores futuros de la variable objetivo es más probable.

Como futuro trabajo, sería interesante investigar las diferentes variantes de este

problema, por ejemplo:

Amplificar la visibilidad de este modelo en regresión múltiple, cuyas muestras

aleatorias sean el número de estudiantes que estén en situación de receso indefinido

y el número de estudiantes que están dados de baja por la Subdirección de

Administración Escolar del IEMSDF, para formular una hipótesis de comparación

que pueda inferir la verdadera causa de deserción estudiantil en la dependencia.

Construir de este modelo una prueba de bondad de ajuste logístico de frecuencia

estudiantil que esté dado de baja en la dependencia y que esté considerado en la

situación de calidad indefinida de su receso en el plantel, para que muestre una

variable de respuesta binaria de determinación analítica que explique el factor de la

problemática que pueda tener el fenómeno de la deserción estudiantil del IEMSDF.

En mi opinión, este análisis brinda a las autoridades competentes de esta dependencia un

conjunto de técnicas estadísticas, que pueden complementar con su experiencia para el

pronóstico de las principales variables de decisión, así como otorgar criterios para formular

modelos que permitan explicar y predecir el comportamiento de los agentes involucrados a

la deserción estudiantil.

Page 29: Pt2 definitivo a1_e2_pelm (1)

29

7. Referencias bibliográficas

Anderson, David R. (2008) Estadística para Administración y Economía (10ª

Edición) Ed. Cengage Learning.

Bittinger, Marvin L. (2002) Cálculo para Ciencias Económico-Administrativas. (7ª

Edición) Ed. Pearson Educación.

Carrillo Ramírez, Teresa. (2008) Apuntes de Mínimos Cuadrados de la asignatura

de Métodos Numéricos II para la Licenciatura en Matemáticas Aplicadas y

Computación. Ed. FES-Acatlán-UNAM en: https://drive.google.com/file/d/0B-

8i8s0wQyqyYVRhUFBxUFI1OTQ/view?usp=sharing

Cannavos, George C. (1988) Probabilidad y Estadística: Aplicaciones y Métodos.

(1ª Edición) Ed. McGraw-Hill Interamericana.

Chapra, Steven C. (2011). Métodos numéricos para ingenieros. (6ª Edición) Ed.

McGraw-Hill Interamericana.

Díaz Martínez, Juan Pablo (2015) Deserción Escolar en la Educación Media

Superior: Una aproximación logística Ed. UNAM-Facultad de Ciencias en:

http://132.248.9.195/ptd2015/junio/306158177/Index.html

Figueroa García, Edith (2014) Métodos Probabilísticos de Optimización. Estado de

México, Municipio de Naucalpan de Juárez. Ed. UNAM-FES Acatlán-Ingeniería

Civil.

Gerald, Curtis F. (2000) Análisis Numérico con aplicaciones. (6ª Edición) Ed.

Pearson Educación.

Gujarati, Damodar N. (2010) Econometría (5ª Edición) Ed. McGraw-Hill

Interamericana.

Hines, William W. (1996) Probabilidad y Estadística para Ingeniería y

Administración (2ª Edición) Ed. CECSA.

Infante Gil, Said. (2012) Métodos Estadísticos: Un Enfoque Interdisciplinario. (3ª

Edición) Ed. La Gaya Ciencia-COLPOS-SAGARPA.

Lara Maldonado, Pedro Daniel. (2016) Análisis Estadístico y Probabilístico de la

Deserción Escolar de los planteles del IEMSDF con amplio histórico

generacional mediante el método de regresión por Mínimos Cuadrados. Ed. SEP-

SES-UnADM-DCEIT-SECDMX-IEMSDF-GAM.I.-PBD en:

https://drive.google.com/file/d/0B-

8i8s0wQyqyWlJEQjVHbjlobDQ/view?usp=sharing

Levin, Richard I. (2004) Estadística para Administración y Economía. (7ª Edición)

Ed. Pearson Educación

Marín Salguero, Rafael. (2013). Temas Selectos de Matemáticas Preuniversitarias:

“El Ajuste de Curvas funcionales por la vía del Método de Regresión por

Mínimos Cuadrados.” Ed. IEMSDF-GAM.I. en:

https://drive.google.com/file/d/0B-

Page 30: Pt2 definitivo a1_e2_pelm (1)

30

8i8s0wQyqyUVdzSXVyM1FkcVZlYVBqdkR3REdaaFZ2MWtz/view?usp=sha

ring

Marín Salguero, Rafael. (2014). Matemáticas Preuniversitarias: “Probabilidad y

Estadística.” Ed. IEMSDF-GAM.I. en: https://drive.google.com/file/d/0B-

8i8s0wQyqyczRFOVhyRWk1R18wbHN1UlpQdGY2YkhPaFFF/view?usp=sha

ring

Mathews, John H. (2000) Métodos Numéricos con MATLAB. (3ª Edición). Ed.

Prentice-Hall.

Pérez López, César. (2002) MATLAB y sus aplicaciones en las ciencias y la

ingeniería. Ed. Pearson Educación S.A.

Ponce de León Topete, María del Socorro. (2003) Guía para el seguimiento de

Trayectorias Escolares a Nivel Medio Superior y Superior. (1ª Edición) Ed. DGP-

UAEH, en http://intranet.uaeh.edu.mx/DGP/pdf/2_guia_trayectoria.pdf

Quintana Hernández, Pedro Alberto. (2005) Métodos Numéricos con Aplicaciones

en Excel. Ed. Reverté-SEP-Gto. -ITC.

Sistema de Información Mexicana del Distrito Federal, INFOMEXDF. (2016)

“Solicitud de Información Pública registrada y aprobada con el número de folio:

0311000001716; con los datos estadísticos estudiantiles del ingreso (apartado 4))

y del egreso (apartado 3)) desde su primera generación hasta su última

generación en todos los planteles que la conforman.” Ed. DE-SAE-IEMSDF, en:

http://www.infomexdf.org.mx/flslayer/seguimiento/d90c0f2c/06cd56f7/Respuest

a%201716.pdf

Smith W, Allen. (1988) Análisis Numérico. Ed. Prentice-Hall Hispanoamericana

S.A.

Spiegel, Murray R. (1970) Teoría y problemas de Estadística (1ra. Edición) Serie

de Compendios Schaum Editorial McGraw-Hill.

Valdés Prada, Francisco José. (2014) Breviario sobre Modelado Matemático. (1ª

Edición) Ed. CBI-UAM-Iztapalapa.

Wackerly, Dennis D. (2010) Estadística Matemática con Aplicaciones. (7ª

Edición) Ed. Cengage Learning.