En este estudio de caso, examinaremos de cerca el precio minorista en las autopistas ($/galón) para la gasolina ¨No. 2 Ultra bajo sulfuro (0-15 ppm) de Diesel” en las nueve regiones o Distritos de Defensa de Administración de Petróleo (PADD por sus siglas en inglés). Llevamos a cabo un analisis del componente principal, con el fin de encontrar un mínimo sub grupo de los principales componentes que capturan (o explican) la variación en los precios entre las regiones con una pérdida mínima de información.
Los datos de la muestra empiezan en Febrero 5 de 2007 y terminan en Mayo 6 de 2013 (327 observaciones). Cada observación representa los precios promedio semanales en nueve regiones:
- Costa Este
- Nueva Inglaterra
- Atlántico Central (PADD 1B)
- Atlántico Bajo (PADD 1C)
- Midwest
- La Costa del Golfo
- Rocky Mountain
- La Costa Oeste
- California
Proceso
Seleccione el rango de celdas para los cinco valores variables de entrada.
Notas:
- Descarte las últimas tres observaciones de manera que nuestros datos de entrada terminen en Abril 15 de 2013. Los tres puntos restantes serán usados para comparar los valores de pronóstico más adelante.
- Deje el campo llamado “Máscara de variables” en blanco por ahora. Revisitaremos este campo en entradas posteriores.
Ahora, seleccione la pestaña de “Opciones”.
Inicialmente, la pestaña está programada con los siguientes valores:
- “Entradas Estándar” va marcada. Deje esta opción marcada.
- “Principal Componente de salida” va marcada. Deje esta opción marcada.
- El nivel de signifcado (aka. $\alpha$) está programado al 5%.
- Bajo el “componente principal” marque la opción “Valores” de manera que las tablas de salida generadas incluyan los valores del componente principal para diferentes fechas.
- “Variables de entrada” no va marcada. Deje esta opción sin marcar.
Ahora, haga click en la pestaña “Valores Faltantes”.
En esta pestaña se puee seleccionar una aproximación para tratar con valores faltantes en el conjunto de datos (X). Por defecto, cualquier valor faltante encontrado en cualquier observación excluiría la obervación del análisis.
Este tratamiento es una buena aproximación para nuestro análisis así que no lo alteremos.
Ahora hagamos click en “OK” para generar las tablas de salida.
Análisis
1. Estadísticas
2. Cargas
Examinando las variables de salida (ej. Precio de la región) las cargas para el primer componente muestran una carga uniforme para todas las variables. Esto se puede interpretar como el factor-nivel (precio que es neutral a nivel local).
Para el segundo factor, la gráfica es un tanto diferente:
- Para todas las regiones PADD en el este, la carga es negativa.
- – Para todas las regiones PADD en el oeste, la carga es positiva.
- – La carga de la Costa del Golfo es ligeramente negativa.
- – La carga del Medio Oeste es ligeramente positiva.
Nota: Las cargas de las variables de entrada para el primer componente son muy comparables, de manera que, el segundo componente (factor) es lo que conduce el precio diferencial entre las distintas regiones PADD.
3. Valores del Componente Principal
NOTA: La falta de un emparejamiento exacto puede ser atribuida a otros costos incurridos en la elaboración del Diesel Sulfuro Ultra liviano No. 2: mano de obra, precios de la energía, materia prima, etc. Además, las refinerías construyen un inventario de productos (ej. Diesel) en anticipación a los picos de demanda estacional, de manera que puede haver un retraso.
4. Añadiendo Precios de contado WTI
Echemos una mirada a las cargas de variables de entrada en cada componente principal (ej. Impulsor):
Notas:
- Las cargas para el primer componente son similares a las calculadas anteriormente con sólo precios de Diesel. Nótese que las cargas WTI son levemente más bajas que sus contrapartes Diesel. De nuevo, designaremos este factor como el precio de nivel general (neutral de la región).
- Las cargas para el segundo factor son muy diferentes ahora, y la carga para WTI es negativa (-%94.5) mientras que todo el resto son positivas. Podemos designar este factor como el costo del craqueo de Diesel en crudo.
- La carga para el factor 3 es muy similar a la carga para el segundo componente en los conjuntos de datos anteriores. De nuevo, la carga varía de acuerdo a la locación (este vs. Oeste). El WTI, la Costa del Golfo y el Medio Oeste son casi neutrales.
Grafiquemos ahora las series de tiempo del factor:
Para el segundo componente, suponemos que este es el más cercano al costo del craqueo de Diesel.
Conclusión
Qué sigue?
Por qué?
De manera intuitiva, los precios futuros reflejan la anticipación del mercado de (1) la demanda futura, (2) el costo de almacenaje futuro, y posiblemente una valiosa escacés de abastecimiento.
Esta aplicación está hecha para darles una muestra de cómo aplicar PCA y series de tiempo; así como también para mostrarles cómo usar o interceptar las variables de carga derivando un agente práctico para ellas.
En suma, PCA es un procedimiento matemático que NumXL puede ayudarles a ejecutar. Dándole sentido e interpretando los resultados es donde su experiencia e intuición son indispensables.