Gráfico de datos para el promedio semanal puntual de diésel con azufre ultra bajo en nueve (9) regiones EIA PADD.

Interpretando los Precios de la Gasolina Diesel

En este estudio de caso, examinaremos de cerca el precio minorista en las autopistas ($/galón) para la gasolina ¨No. 2 Ultra bajo sulfuro (0-15 ppm) de Diesel” en las nueve regiones o Distritos de Defensa de Administración de Petróleo (PADD por sus siglas en inglés). Llevamos a cabo un analisis del componente principal, con el fin de encontrar un mínimo sub grupo de los principales componentes que capturan (o explican) la variación en los precios entre las regiones con una pérdida mínima de información.

Los datos de la muestra empiezan en Febrero 5 de 2007 y terminan en Mayo 6 de 2013 (327 observaciones). Cada observación representa los precios promedio semanales en nueve regiones:

  1. Costa Este
  2. Nueva Inglaterra
  3. Atlántico Central (PADD 1B)
  4. Atlántico Bajo (PADD 1C)
  5. Midwest
  6. La Costa del Golfo
  7. Rocky Mountain
  8. La Costa Oeste
  9. California
Los precios semanales a lo largo de las diferentes regiones están altamente correlacionados:
En este tutorial, investigaremos a los conductores detrás de la variación del precio entre las distintas regiones, e intentaremos suponer la representación física de esos componentes usando los precios de embarque de cada región.

Proceso

Ahora estamos listos para conducir nuestro principal componente de análsis. Primero, seleccione una celda desocupada en su hoja de cálculo donde quisiera que se genere el resultado, luego localice y haga click en el ícono del componente principal (PCA) en la etiqueta NumXL (o barra de herramientas).
Aparece el asistente de análisis del componente principal.

Seleccione el rango de celdas para los cinco valores variables de entrada.

Notas:

  1. Descarte las últimas tres observaciones de manera que nuestros datos de entrada terminen en Abril 15 de 2013. Los tres puntos restantes serán usados para comparar los valores de pronóstico más adelante.
  2. Deje el campo llamado “Máscara de variables” en blanco por ahora. Revisitaremos este campo en entradas posteriores.

Ahora, seleccione la pestaña de “Opciones”.

Inicialmente, la pestaña está programada con los siguientes valores:

  • “Entradas Estándar” va marcada. Deje esta opción marcada.
  • “Principal Componente de salida” va marcada. Deje esta opción marcada.
  • El nivel de signifcado (aka. $\alpha$) está programado al 5%.
  • Bajo el “componente principal” marque la opción “Valores” de manera que las tablas de salida generadas incluyan los valores del componente principal para diferentes fechas.
  • “Variables de entrada” no va marcada. Deje esta opción sin marcar.

Ahora, haga click en la pestaña “Valores Faltantes”.

En esta pestaña se puee seleccionar una aproximación para tratar con valores faltantes en el conjunto de datos (X). Por defecto, cualquier valor faltante encontrado en cualquier observación excluiría la obervación del análisis.

Este tratamiento es una buena aproximación para nuestro análisis así que no lo alteremos.

Ahora hagamos click en “OK” para generar las tablas de salida.

Análisis

1. Estadísticas

En la tabla anterior hemos mostrado la varianza de cada componente proncipal y la proporción de la variable total de la varianza del conjunto de datos de salida (estandar) que la justifica. Examinando la tabla de manera más cercana, los primeros dos componentes caputran el 99.8% de la variación del conjunto de datos.

2. Cargas

En la tabla de cargas subrayamos los pesos del componente principal en cada variable de entrada:

Examinando las variables de salida (ej. Precio de la región) las cargas para el primer componente muestran una carga uniforme para todas las variables. Esto se puede interpretar como el factor-nivel (precio que es neutral a nivel local).

Para el segundo factor, la gráfica es un tanto diferente:

  • Para todas las regiones PADD en el este, la carga es negativa.
  • – Para todas las regiones PADD en el oeste, la carga es positiva.
  • – La carga de la Costa del Golfo es ligeramente negativa.
  • – La carga del Medio Oeste es ligeramente positiva.
Esta carga de factores puede verse como próxima a (o disponible para) la capacidad de refinerías o puertos de improtación (ejemplo: el Puerto de Nueva York). El segundo factor refleja el costo del transporte y de y del impuesto de gasolina.

Nota: Las cargas de las variables de entrada para el primer componente son muy comparables, de manera que, el segundo componente (factor) es lo que conduce el precio diferencial entre las distintas regiones PADD.

3. Valores del Componente Principal

Examinemos los valores de los primeros dos componentes principales.
Las dos series de tiempo muestran algo de estacionalidad, sin embargo, es más evidente en el segundo factor. Además, el primer componente principal muestra un patrón cercano a los precios del crudo.

NOTA: La falta de un emparejamiento exacto puede ser atribuida a otros costos incurridos en la elaboración del Diesel Sulfuro Ultra liviano No. 2: mano de obra, precios de la energía, materia prima, etc. Además, las refinerías construyen un inventario de productos (ej. Diesel) en anticipación a los picos de demanda estacional, de manera que puede haver un retraso.

4. Añadiendo Precios de contado WTI

Como una última observación del precio de contado WTI, incluiremos el precio de contado WTI en nuestro conjunto de datos de entrada y re examinaremos las cargas de entrada. De manera intuitiva, sumar una variable de entrada para precio de materia prima (ej. Crudo) con los precios finales de los productos en el mismo conjunto de datos revelará otro impulsor: el costo de producción.
Ahora, hemos necesitado tres impulsores para justificar el 99.8% de la variación del precio.
IMPORTANTE: Los componentes principales del nuevo conjunto de datos no son necesariamente los mismos que los computados anteriormente con sólo los precios del diesel.

Echemos una mirada a las cargas de variables de entrada en cada componente principal (ej. Impulsor):

Notas:

  1. Las cargas para el primer componente son similares a las calculadas anteriormente con sólo precios de Diesel. Nótese que las cargas WTI son levemente más bajas que sus contrapartes Diesel. De nuevo, designaremos este factor como el precio de nivel general (neutral de la región).
  2. Las cargas para el segundo factor son muy diferentes ahora, y la carga para WTI es negativa (-%94.5) mientras que todo el resto son positivas. Podemos designar este factor como el costo del craqueo de Diesel en crudo.
  3. La carga para el factor 3 es muy similar a la carga para el segundo componente en los conjuntos de datos anteriores. De nuevo, la carga varía de acuerdo a la locación (este vs. Oeste). El WTI, la Costa del Golfo y el Medio Oeste son casi neutrales.

Grafiquemos ahora las series de tiempo del factor:

En términos generales, el primer y tercer componente so muy similares a los primeros dos componentes que hemos calculado anteriormente (sin WTI en el conjunto de datos).

Para el segundo componente, suponemos que este es el más cercano al costo del craqueo de Diesel.

Conclusión

En este tutorial, hemos examinado una aplicacion no trivial para PCA. Hicimos el intentdo de explicar la variación del precio entre diferentes regiones PADD mediante el descubrimiento de fuerzas impulsoras detrás de los precios.

Qué sigue?

Hemos mencionado anterioremente qe las refinerías han desarrollado un inventario de productos (ej. Diesel) en anticipación de los picos de demanda estacional, de manera que puede haber un retraso. Como capturamos esta variable? Futuro: podemos incluir los precios futuros de Diesel y Crudo.

Por qué?

De manera intuitiva, los precios futuros reflejan la anticipación del mercado de (1) la demanda futura, (2) el costo de almacenaje futuro, y posiblemente una valiosa escacés de abastecimiento.

Esta aplicación está hecha para darles una muestra de cómo aplicar PCA y series de tiempo; así como también para mostrarles cómo usar o interceptar las variables de carga derivando un agente práctico para ellas.

En suma, PCA es un procedimiento matemático que NumXL puede ayudarles a ejecutar. Dándole sentido e interpretando los resultados es donde su experiencia e intuición son indispensables.

Leave a Reply

Your email address will not be published. Required fields are marked *

We are glad you have chosen to leave a comment. Please keep in mind that comments are moderated according to our comment policy.