9  1.Cópulas

Autor/a

Esteban Bermúdez Aguilar

Fecha de publicación

28 de enero de 2024

9.1 Definición y Propiedades Básicas

Consideremos sos variables aleatorias \(X\) y \(Y\) con función de distribución \(F(x)=P(X \leq x)\) y \(G(X)=P(Y \leq y)\) respectivamente y con una distribución conjunta \(H(x,y)=P(X \leq x,Y \leq y)\).

Para cada par de puntos \((x,y)\) podemos asociarles tres numeros: \(F(x),G(y)\) y \(H(x,y)\). Observemos que estos número estan dentro del intervalo \([0,1]\). Es decir para cada par de puntos \((x,y)\) existe un punto \((F(x),G(y))\) en el cuadro unidad \([0,1]\text{x}[0,1]\), a su vez el par corresponde a un número \(H(x,y)\) en \([0,1]\).

Nuestro objetivo será crear una relación entre el valor de la función de Distribución Conjunta con cada par ordenado de los valores de las funciones de distribución individuales, esta relación es una Función, la cual llamaremos Cópula.

Por la propiedad N°5, de las Funciones de Distribución Conjuntas, sabemos que si \(H(x,y)\) es una Función de Distribución y \(a_1 < b_1\) y \(a_2 < b_2\) entonces:

\[H(b_1,b_2)-H(a_1,b_2)-H(b_1,a_2)+H(a_1,a_2)\geq 0\] Si definimos el rectángulo \(B=[a_1,b_1]\text{x}[a_2,b_2]\), podemos definir el H-volumen de B, que lo denotaremos \(V_H(B)\), donde:

\[V_H(B)=H(b_1,b_2)-H(a_1,b_2)-H(b_1,a_2)+H(a_1,a_2)\] Definamos la diferencia de primer orden de \(H\) como

\[\Delta_{x_1}^{x_2}H(x,y)=H(x_2,y)-H(x_1,y)\] \[\Delta_{y_1}^{y_2}H(x,y)=H(x,y_2)-H(x,y_1)\]

Entonces el H-volumen de B es la diferencia de segundo orden de H sobre B,

\[V_H(B)=\Delta_{a_2}^{b_2}\Delta_{a_1}^{b_1}H(x,y)\]

Observe que si \(H\) es una Función de Distribución Conjunta, y \(B=[x_1,x_2]\text{x}[y_1,y_2]\) entonces:

\[\Delta_{x_1}^{x_2}H(x,y)\geq0 \;,\; \Delta_{y_1}^{y_2}H(x,y)\geq 0\] esto por la propiedad N°3 (no decreciente en cada variable).

Definición

Sea \(H(x,y)\) una función bivariada real, si para cualquier rectángulo \(B=[x_1,x_2]\text{x}[y_1,y_2]\) en \(\mathbb{R}^2\) se cumple que \(V_H(B)\geq0\) se dice que \(H(x,y)\) es 2-creciente.

Nota

  1. Hay autores que denomina el H-volumen en B, como la H-medida en B.

  2. Hay autores que denomina 2-creciente, como casi monótona.

  3. Que \(H(x,y)\) sea 2-creciente no implica que cada argumento sea no decreciente, ni que si cada argumento de \(H(x,y)\) sea no decreciente implica que \(H(x,y)\) sea 2-creciente.

Ejemplo 1

Sea \(H(x,y)\) una función definida en \(\mathbb{I}^2=[0,1]\text{x}[0,1]\) tal que: \(H(x,y)=max(x,y)\)

Mostremos que \(\Delta_{x_1}^{x_2}H(x,y)\geq0\) para \(0\leq x_1 \leq x_2 \leq 1\) y con \(0\leq y \leq 1\). Por definición tenemos que:

\[\Delta_{x_1}^{x_2}H(x,y)=H(x_2,y)-H(x_1,y)\] Caso 1: \(y\leq x_1\)

\(H(x_2,y)=x_2\) y \(H(x_1,y)=x_1\) esto implica que

\[\Delta_{x_1}^{x_2}H(x,y)=x_2-x_1 \geq 0 \text{ (por el enunciado) }\] Caso 2: \(x_2\leq y\)

\(H(x_2,y)=y\) y \(H(x_1,y)=y\) esto implica que

\[\Delta_{x_1}^{x_2}H(x,y)=y-y = 0 \]

Caso 3: \(x_1 \leq y\leq x_2\)

\(H(x_2,y)=x_2\) y \(H(x_1,y)=y\) esto implica que

\[\Delta_{x_1}^{x_2}H(x,y)=x_2-y \geq 0 \text{ (por el enunciado) }\]

Conclusión:

\(\Delta_{x_1}^{x_2}H(x,y) \geq 0\) es decir, es no decreciente para el componente \(x\).

Con un análisis similar (ejercicio) se llega a la conclusión que para el componente \(y\) es no decreciente.

Ahora veamos el H-volumen en \(B \in \mathbb{I}^2\), sea \(B=[x_1,x_2]\text{x}[y_1,y_2]\), tenemos que:

\[V_H(B)=H(x_2,y_2)-H(x_2,y_1)-H(x_1,y_2)+H(x_1,y_1)\] Caso 1: \(y_1\leq y_2\leq x_1\)

\[V_H(B)=0\]

Caso 2: \(x_2\leq y_1\leq y_2\)

\[V_H(B)=0\]

Caso 3: \(x_1\leq y_1\leq y_2\leq x_2\)

\[V_H(B)=x_2-x_2-y_2+y_1\leq 0\]

Hemos encontrado un H-volumen negativo, por lo tanto \(H\) no es 2-creciente.

Ejemplo 2

Sea \(H(x,y)\) una función definida en \(\mathbb{I}^2\) tal que: \(H(x,y)=(2x-1)(2y-1)\).

Estimemos el H-volumen para un rectangulo \(B=[x_1,x_2]\text{x}[y_1,y_2]\)

\[V_H(B)=H(x_2,y_2)-H(x_2,y_1)-H(x_1,y_2)+H(x_1,y_1)\]

\[\Rightarrow 4x_2y_2-2x_2-2y_2+1-(4x_2y_1-2x_2-2y_1+1)-(4x_1y_2-2x_1-2y_2+1)+4x_1y_1-2x_1-2y_1+1\]

\[\Rightarrow 4x_2y_2-4x_2y_1-4x_1y_2+4x_1y_1=4x_2(y_2-y_1)-4x_1(y_2-y_1)=4(x_2-x_1)(y_2-y_1)\geq0\]

Conclusión \(H\) es 2-creciente.

Analicemos la componente x:

\[\Delta_{x_1}^{x_2}H(x,y)=H(x_2,y)-H(x_1,y)=4x_2y-2x_2-2y+1-(4x_1y-2x_1-2y+1)\]

\[\Rightarrow 4x_2y-2x_2-4x_1y+2x_1=4y(x_2-x_1)-2(x_2-x_1)=2(x_2-x_1)(2y-1)\]

Es decir que \(\Delta_{x_1}^{x_2}H(x,y)\geq 0\) si sólo si \(y\geq 1/2\), por lo tanto en la componente \(x\) puede ser decreciente, caso similar para la componente \(y\) (ejercicio).

Lema

Sea \(S_1, S_2\) conjunto no vacio de \(\mathbb{\bar R}\), (\(\mathbb{\bar R}=[-\infty,\infty]\)) y sea \(H\) una función 2-creciente con dominio \(S_1\text{x}S_2\):

  1. Sea \(x_1 \leq x_2\) con \(x_1,x_2 \in S_1\), se define una función \(f(t)=H(t,y_2)-H(t,y_1)\) con \(y_1 \leq y_2\) con \(y_1,y_2 \in S_2\), entonces f(t) es no decreciente en \(S_1\).

  2. Sea \(y_1 \leq y_2\) con \(y_1,y_2 \in S_2\), se define una función \(g(t)=H(x_2,t)-H(x_1,t)\) con \(x_1 \leq x_2\) con \(x_1,x_2 \in S_1\), entonces g(t) es no decreciente en \(S_2\).

Con este lema, nos faltaría un hipótesis adicional para que en caso que H sea 2-creciente, cada componente sea no decreciente.

Definición

Sea \(S_1, S_2\) conjunto no vacio de \(\mathbb{\bar R}\), y \(H(x,y)\) una función 2-creciente con dominio \(S_1\text{x}S_2\). Sea \(a_1\) el elemento mínimo de \(S_1\) y \(a_2\) el elemento mínimo de \(S_2\).Tal que:

\[H(x;a_2)=0=H(a_1,y)\; \forall (x,y) \in S_1\text{x}S_2\]

se dice que \(H(x,y)\) es una función fundamentada (grounded)

Lema

Sea \(S_1, S_2\) conjunto no vacio de \(\mathbb{\bar R}\), y sea \(H\) una función 2-creciente fundamentada con dominio \(S_1\text{x}S_2\). Entonces \(H\) es no decreciente en cada argumento.

Definición

Sea \(S_1, S_2\) conjunto no vacio de \(\mathbb{\bar R}\), y \(H(x,y)\) una función con dominio \(S_1\text{x}S_2\), se dice que \(H\) tiene marginales y que sus marginales de H son las funciones \(F\) y \(G\) dadas por:

\[F(x)=H(x,b_2) \quad\forall x \in S_1\] \[G(y)=H(b_1,y) \quad\forall y \in S_2\]

donde \(b_1\) es el máximo de \(S_1\) y \(b_2\) el máximo de \(S_2\).

Ejemplo 3

Sea \(H\) una función con dominio \([-1,1]\text{x}[0;\infty]\) tal que:

\[H(x,y)=\frac{(x+1)(e^{y}-1)}{x+2e^{y}-1}\] Entonces \(H\) es fundamentada porque:

\[H(x,0)=0=H(-1,y)\] H posee funciones marginales \(F(x)\) y \(G(y)\) dadas por:

\[F(x)=H(x,\infty)=\frac{x+1}{2}\] \[G(y)=H(1,y)=1-e^{-y}\]

Lema

Sea \(S_1, S_2\) conjunto no vacio de \(\mathbb{\bar R}\), y sea \(H\) una función 2-creciente fundamentada con dominio \(S_1\text{x}S_2\), con funciones marginales \(F\) y \(G\). Para cualquier par de puntos \((x_1,y_1)\) y \((x_2,y_2)\) en \(S_1\text{x}S_2\). Entonces:

\[|H(x_2,y_2)-H(x_1,y_1)|\leq |F(x_2)-F(x_1)|+|G(y_2)-G(y_1)|\]

Prueba: Ejercicio, completar la prueba del libro.

Definición

Una subcópula bidimensional, o 2-subcópula o subcópula es una función \(C'\) que tiene las siguientes propiedades:

  1. Dominio de \(C'\) = \(S_1\text{x}S_2 \subseteq \mathbb{I}^2\) que contine al 0 y al 1.

  2. \(C'\) es 2-creciente y fundamentada.

  3. Para cualquier \(u \in S_1\) y \(v \in S_2\):

\[C'(u,1)=u \text{ y } C'(1,v)=v\]

Observe que para todo \((u,v)\) en el dominio de \(C'\) se cumple que \(0\leq C'(u,v)\leq1\), es decir el rango de \(C'\) es un subconjunto \(\mathbb{I}\).

Definición

Una Cópula bidimensional, o 2-Cópula o Cópula es una subcópula \(C\) con dominio \(\mathbb{I}^2\).

Una Cópula \(C\) también es una función de \(\mathbb{I}^2 \to \mathbb{I}\). Y tiene las siguientes propiedades

  1. Para cualquier \(u,v \in \mathbb{I}\),

\[C(u,0)=C(0,v)=0\] \[C'(u,1)=u \text{ y } C'(1,v)=v\]

  1. Para cualquier \(u_1,u_2,v_1,v_2 \in \mathbb{I}\) tal que \(u_1\leq u_2\) y \(v_1\leq v_2\)

\[C(u_2,v_2)-C(u_2,v_1)-C(u_1,v_2)+C(u_1,v_1)\geq 0\]

Aunque muchas de las propiedades de las Cópulas proviene de las Sub-Cópulas, y podríamos pensar que su diferencia radica únicamente en la definición del dominio, su diferencia toma importancia con el Teorema de Sklar que veremos en las próximas secciones.

Teorema Desigualdades de Fréchet-Hoeffding

Sea \(C'\) una subcópula. Entonces para todo (u,v) en el Dominio de \(C'\), se cumple:

\[max(u+v-1,0)\leq C'(u,v) \leq min(u,v)\]

Prueba

Sea \((u,v)\) un punto arbitrario del Dominio de \(C'\), se tiene que \(C'(u,v)\leq C'(u,1)=u\) además se tiene que \(C'(u,v)\leq C'(1,v)=v\) por lo tanto \(C'(u,v)\leq min(u,v)\)

Por otro lado, se tiene que el \(C\)-volumen del intervalo \(B=[u,1]\text{x}[v,1]\) es no negativo, es decir que:

\[V_{C'}(B)=C'(1,1)-C'(1,v)-C'(u,1)+C'(u,v)\geq 0\]

\[\Rightarrow 1-v-u+C'(u,v)\geq 0 \Rightarrow C'(u,v)\geq u+v-1\]

Pero también se tiene que \(C'(u,v)\geq 0\) por lo que \(max(u+v-1,0)\leq C'(u,v)\)

Como toda Cópula es una sub-cópula estas desigualdades se cumplen para las Cópulas, y en particular estos límites son Cópulas ( ejercicio 2.2 del Libro) y se denota usualmente como:

\[M(u,v)=min(u,v)\] \[W(u,v)=max(u+v-1,0)\]

Definición

Se llama desigualdad de Fréchet-Hoeffding para Cópulas a:

\[W(u,v)\leq C(u,v)\leq M(u,v)\]

La función \(M\) se le domina cota superior de Fréchet-Hoeffding y a la función \(W\) como cota inferior de Fréchet-Hoeffding.

Otra Cópula importante por uso frecuente es la Cópula producto \(\Pi(u,v)=uv\) ( ejercicio comprobar que es Cópula)

Usando la desigualdad triangular, y la cota superior de Fréchet-Hoeffding, se puede comprobar que para cualquier sub-cópula, por ende a cualquier cópula el siguiente teorema:

Teorema

Sea \(C'\) una sub-cópula, para cualquier \((u_1,u_2),(v_1,v_2)\) en el dominio de \(C'\),se cumple que:

\[|C'(u_2,v_2)-C'(u_1,v_1)|\leq|u_2-u_1|+|v_2-v_1|\]

Entonces \(C'\) es uniformemente continua sobre su Dominio.

Definición

Sea \(C\) una cópula, y sea \(a \in [0,1]\), se define:

  1. Sección Horizontal de \(C\) a \(f(t)=C(t,a)\).

  2. Sección Vertical de \(C\) a \(f(t)=f(a,t)\)

  3. Sección Diagonal de \(C\) a \(\delta_C(t)=C(t,t)\)

Corolario

Las secciones Horizontal, Vertical y Diagonal de una cópula \(C\) son no decreciente y continuas uniformemente en \(\mathbb{I}\).

Gráficos de Cópulas

En muchas aplicaciones de cópulas, es necesario comprender gráficamente el comportamiento de la misma, usualmente se puede representar una cópula \(C\) por medio de un gráfico de superficie de \(Z=C(u,v)\), esta superficie se ubicará en el cubo unidad (\(\mathbb{I}^3\))

La otra forma de representar una Cópula es por medio de un gráfico de contorno que permite observar mejor los niveles de la función en el intervalo \(\mathbb{I}^2\).

A continuación los ejemplos de la Cópulas estudiadas hasta el momento:

library(copula)
d <- 2
ic <- indepCopula(dim = d)

### Frechet-Hoeffding bounds

set.seed(2024)
U <- runif(100)

u <- seq(0, 1, length.out = 40) 
u12 <- expand.grid("u[1]" = u, "u[2]" = u) # construccion del grid

W <- pmax(u12[,1] + u12[,2] - 1, 0) # Valores de W

M <- pmin(u12[,1], u12[,2]) # Valores de M

P<- u12[,1]*u12[,2] # Valor de Pi

val.W <- cbind(u12, "W(u[1],u[2])" = W) 
val.M <- cbind(u12, "M(u[1],u[2])" = M) 
val.P <- cbind(u12, "P(u[1],u[2])" = P) 

#Superficie

wireframe2(val.W,main="Cota Inferior Frechet-Hoeffding")

wireframe2(val.M,main="Cota Superior Frechet-Hoeffding")

wireframe2(val.P,main="C. Producto")

#Contornos

contourplot2(val.W, xlim = 0:1, ylim = 0:1,main="Cota Inferior Frechet-Hoeffding")

contourplot2(val.M, xlim = 0:1, ylim = 0:1,main="Cota Superior Frechet-Hoeffding")

contourplot2(val.P, xlim = 0:1, ylim = 0:1,main="C. Producto")

Para finalizar esta sección enunciaremos dos teoremas relacionados con las derivadas de las cópulas.

Teorema

Sea C una cópula para cualquier \(v \in \mathbb{I}\), la derivada parcial \(\frac{\partial C}{\partial u}(u,v)\) existe para casi todo \(u\), y para un \(v\) y \(u\) dado, se tiene que:

\[0\leq\frac{\partial C}{\partial u}(u,v)\leq 1\]

Similarmente para cualquier \(u \in \mathbb{I}\), la derivada parcial \(\frac{\partial C}{\partial v}(u,v)\) existe para casi todo \(v\), y para un \(v\) y \(u\) dado, se tiene que:

\[0\leq\frac{\partial C}{\partial v}(u,v)\leq 1\]

Además:

\[f(u)=\frac{\partial C}{\partial v}(u,v) \; \text{ y } g(v)=\frac{\partial C}{\partial u}(u,v)\]

son funciones definidas y no decrecientes en casi cualquier punto en \(\mathbb{I}\)

Teorema

Sea \(C\) una cópula. Si \(\frac{\partial C}{\partial v}(u,v)\) y \(\frac{\partial^2 C}{\partial u\partial v}(u,v)\) son continuas y \(\frac{\partial C}{\partial u}(u,v)\) existe para todo \(u \in (0,1)\) cuando \(v=0\) Entonces:

  1. \(\frac{\partial C}{\partial u}(u,v)\) y \(\frac{\partial^2 C}{\partial v\partial u}(u,v)\) existen para \(\mathbb{I}^2\) y

  2. \(\frac{\partial^2 C}{\partial v\partial u}(u,v)=\frac{\partial^2 C}{\partial u\partial v}(u,v)\)

Ejercicio

Ejercicios de la sección 2.2 del Libro.

9.2 Teorema de Sklar

El teorema Sklar es fundamental para la teoría de cópulas y es la base de muchas de las aplicaciones en la teoría estadística, este teorema relacionada la cópulas con las distribuciones multivariadas y las distribuciones marginales.

Ejemplo

Consideremos las función \(H\) con dominio en \(\mathbb{R}^2\) dada por:

\[ H(x,y)=\begin{cases} \frac{(x+1)(e^{y}-1)}{x+2e^{y}-1}, & (x,y) \in [-1,1]\text{x}[0,\infty] \\ 1-e^{-y}, & (x,y) \in ]1,\infty]\text{x}[0,\infty] \\ 0, & \text{otro caso} \end{cases} \] \(H(x,y)\) es una función de distribución conjunta, donde se puede verificar que es 2-creciente, fundamentada (\(H(x,-\infty)=H(-\infty,y)=0\)) y \(H(\infty,\infty)=1\), además que sus funciones marginales \(F\) y \(G\) son:

\[F(x) \sim U[-1,1]\] \[G(X) \sim Exp(1)\]

Desde esta perspectiva, podemos brindar una definición no probabilista de las funciones de distribución, como la siguiente:

Definición

\(F\) es una función con dominio \(\mathbb{R}\), se dice que es una función de distribución si:

  1. \(F\) es no decreciente,

  2. \(F(-\infty)=0\) y \(F(\infty)=1\)

La función \(H(x,y)\) con dominio \(\mathbb{R}^2\) se dice que es una función de distribución conjunta si:

  1. \(H\) es 2-creciente.

  2. \(H\) es fundamentada, es decir \(H(x,-\infty)=H(-\infty,y)=0\)

  3. \(H(\infty,\infty)=1\)

\(H(x,y)\) posee como marginales las funciones \(F=H(x,\infty)\) y \(G(\infty,y)\), cada una son funciones de distribución.

Esta definición de función de distribución y de función de distribución conjunta, las satisface también las funciones de de distribución y de función de distribución conjunta desde la perspectiva probabilista, por lo que los resultados obtenidos bajo esta definición son válidos desde la perspectiva probabilista.

Teorema de Sklar (1959)

Sea \(H\) una distribución conjunta con marginales \(F\) y \(G\). Entonces existe una cópula \(C\) tal que para todo \(x,y \in \mathbb{R}\),

\[H(x,y)=C(F(x),G(y))\]

Si \(F\) u \(G\) son continuas, entonces \(C\) es única, si no \(C\) es únicamente determinado por el rango de \(F\) y \(G\).

Por otro lado si \(C\) es una cópula y \(F\) y \(G\) son funciones de distribución, entonces la función \(H(x,y)\) definida anteriormente es una función de distribución conjunta con marginales \(F\) y \(G\).

Antes de probar el Teorema de Sklar, veremos dos lemas

Lema

Sea \(H\) una distribución conjunta con marginales \(F\) y \(G\). Entonces existe una única sub-cópula \(C'\) tal que:

  1. Dominio de \(C'\) es Rango \(F\) x Rango \(G\).

  2. \(\forall x,y \in \mathbb{\bar R},\; H(x,y)=C'(F(x),G(y))\)

Prueba

Sea \((x_1,y_1),(x_2,y_2)\in \mathbb{\bar R}\) se sabe que:

\[|H(x_2,y_2)-H(x_1,y_1)|\leq |F(x_2)-F(x_1)|+|G(y_2)-G(y_1)|\] Podemos concluir que si \(F(x_2)=F(x_1)\) y \(G(y_2)=G(y_1)\) entonces \(H(x_2,y_2)=H(x_1,y_1)\)

El conjunto de pares ordenado

\[\{(F(x),G(x)),H(x,y)\}\]

  1. Define una función \(C'\) con dominio Rango \(F\) x Rango \(G \subseteq \mathbb{I}\) que asocia al par \((F(x),G(x))\) con \(H(x,y)\)

  2. \(C'\) es 2-creciente y fundamentado esto por las propiedades de \(H\) al ser una distribución conjunta.

  3. Para \(u\) en el Rango de \(F\), existe un \(x \in \mathbb{\bar R}\) tal que \(F(x)=u\). Entonces \(C'(u,1)=C'(F(x),G(\infty))=H(x,\infty)=F(x)=u\), similar para el caso de \(v\) en el Rango de \(G\).

Lema

Sea \(C'\) una sub-cópula. Entonces existe una Cópula \(C\) tal que \(C(u,v)=C'(u,v)\) para todo \((u,v)\) en el dominio de \(C'\). En otras palabras toda sub-cópula se puede extender a una cópula, pero esta extensión no es única.

Prueba

Sea el dominio de \(C'=S_1\text{x}S_2\). Como \(C'\) es no decreciente, podemos extender a \(C'\) por una función continua \(C''\) con dominio \(\bar S_1\text{x} \bar S_2\), donde \(\bar S_1\) y \(\bar S_2\) son las clausuras de \(S_1\) y \(S_2\).

\(C''\) es una subcópula. Ahora extenderemos a \(C''\) a una función con dominio \(\mathbb{I}^2\)

Sea \((a,b) \in \mathbb{I}^2\) además \(a_1\) y \(a_2\) los valores más pequeño y más grande respectivamente de \(\bar S_1\) que satisface que: \(a_1\leq a\leq a_2\), similarmente tomamos \(b_1\) y \(b_2\) los valores más pequeño y más grande respectivamente de \(\bar S_2\) que satisface que: \(b_1\leq b\leq b_2\).

Observe que si \(a \in \bar S_1\) entonces \(a_1=a=a_2\), similarmente con \(b \in \bar S_2\).

tomemos:

\[ \lambda_1=\begin{cases} \frac{a-a_1}{a_2-a_1}, & a_1<a_2 \\ 1 & a_1=a_2 \end{cases},\; \] \[ \mu_1=\begin{cases} \frac{b-b_1}{b_2-b_1}, & b_1<b_2 \\ 1 & b_1=b_2 \end{cases} \] tomemos

\[C(a,b)=(1-\lambda_1)(1-\mu_1)C''(a_1,b_1)+(1-\lambda_1)\mu_1C''(a_1,b_2)+\lambda_1(1-\mu_1)C''(a_2,b_1)+\lambda_1\mu_1C''(a_2,b_2)\] Esta forma de interpolación, es lineal en cada entrada, y es llamada interpolación bilineal.

Es claro que el domino de C es \(\mathbb{I}^2\) y que \(C(a,b)=C''(a,b)\) si \((a,b)\) esta en el dominio de \(C''\), en particular:

\[C(a,0)=C(0,b)=0\]

Sea \(a \in \mathbb{I}\) si está en el dominio de \(\bar S_1\) se tiene que

\[C(a,1)=C''(a,1)=a\]

Si \(a\) no está en el dominio de \(S_1\) entonces

\[C(a,1)=(1-\lambda_1)C''(a_1,1)+\lambda_1C''(a_2,1)\]

\[=\left(1-\frac{a-a_1}{a_2-a_1}\right)a_1+\frac{a-a_1}{a_2-a_1}a_2=a\] similarmente se puede comprobar que \(C(1,b)=b\)

Nos faltaría comprobar que C-volumen de cualquier par ordenado sea no negativo.

Tomaremos el punto \((a,b)\) estará relacionado con \(a_1,b_1,a_2,b_2,\lambda_1,\mu_1\) y el punto \((c,d)\) relacionado con \(c_1,d_1,c_2,d_2,\lambda_2,\mu_2\). Tomaremos el rectangulo \(B=[a,c]\text{x}[b,d]\) y considaremos el caso en que entre \(a\) y \(c\) no existen puntos de \(\bar S_1\) y que tampoco existen puntos de \(\bar S_2\) entre \(b\) y \(d\), entonces en este caso se cumple que \(c_1=a_1,c_2=a_2,d_1=b_1,d_2=b_2\) simplificando la expresión del \(V_c(B)\) se obtiene:

\[V_C(B)=(\lambda_2-\lambda_1)(\mu_2-\mu_1)V_C([a_1,a_2]\text{x}[b_1,b_2])\] Como \(c\geq a\) y \(d \geq b\), se tiene que \(\lambda_2-\lambda_1\geq 0\) y \(\mu_2-\mu_1 \geq 0\) por lo que \(V_c(B)\geq 0\)

Otro caso es que los punto se ubique como se muestra en el gráfico

Caso simple En este caso podemos crear pequeños volumenes entre los puntos tal que:

formula

los otros caso se prueba en forma similar.

Prueba del Teorema de Sklar

La existencia de la cópula C, se prueba con los lemas anteriores. Si \(F\) y \(G\) son continuas entonces sus Rangos son \(\mathbb{I}\) y es única la cópula.

La ecuación del Teorema de Sklar

\[H(x,y)=C(F(x),G(y))\]

nos da una expresión de la Función de distribución conjunta en términos de una Cópula y dos Distribuciones. Pero “invertir” la expresión, es decir:

\[C(x,y)=H(F^{-1}(x),G^{-1}(y))\]

Poder expresar una Cópula según la Función de distribución Conjunta y con las inversas de dos marginales, generan que no necesariamente las marginales a considerar sean estrictamente creciente o no posean una inversa como tal, por lo que debemos primero hablar de una “cuasi-inversa”

Definición

Sea \(F\) una función de distribución. Su “cuasi-inversa” de \(F\) es una función \(F^{-1}\) con Dominio \(\mathbb{I}\) tal que:

  1. Si \(t\) pertenece al Rango de \(F\), entonces \(F(F^{-1}(t))=t\)

  2. Si \(t\) no pertenece al Rango de \(F\) entonces

\[F^{-1}(t)=\inf\{x|F(x)\geq t\}=\sup\{x|F(x)\leq t\}\] Si \(F\) es estrictamente creciente entonces sólo posee una cuasi-inversa, que es la función inversa ordinaria.

Ejemplo

Sea \((a,b) \in \mathbb{R}^2\) y considere la función de distribución:

\[ H(x,y)=\begin{cases} 0, & x<a \text{ o } y<b, \\ 1, & x\geq a \text{ y } y\geq b. \end{cases} \] Las marginales de \(H(x,y)\) son la funciones de paso unitario,

\[\delta_a(x)\begin{cases} 0, & x<a \\ 1, & x\geq a \end{cases}\]

\[\delta_b(y)\begin{cases} 0, & y<b \\ 1, & y\geq b \end{cases}\]

Podemos crear una sub-cópula con dominio \(\{0,1\}\text{x}\{0,1\}\) tal que \(C'(0,0)=C'(0,1)=C'(1,0)=0\) y C’(1,1)=1.

Para extender \(C'\) a una cópula, analizemos los valores de \(\lambda_1=a\) y \(\mu_1=b\). Tomemos el punto \((a,b)\), la Cópula extendida sería:

\[C(a,b)=(1-a)(1-b)C''(0,0)+(1-a)bC''(0,1)+a(1-b)C''(1,0)+abC''(1,1)=ab\] Es decir que la extensión de la sub-cópula es \(\Pi\) (Cópula producto).

Por el Teorema de Sklar podemos expresar

\[H(x,y)=C(F(x),G(y))=C(\delta_a(x),\delta_b(y))=\delta_a(x)\delta_b(y)\]

consideremos la cuasi-inversa de \(\delta_a(t)\)

\[ \delta_a^{-1}(t)=\begin{cases} a_0, & t=0, \\ a, & t \in (0,1)\\ a_1, & t=1 \end{cases} \]

donde \(a_0 \leq a \leq a_1\)

Corolario

Sea \(H\) función de distribución conjunta con marginales \(F\) y \(G\) y \(C'\) la sub-cópula generada por \(H\), sea \(F^{-1}\) y \(G^{-1}\) las cuasi-inversas de \(F\) y \(G\) respectivamente. Entonces para cualquier \((u,v)\) en el Dominio de \(C'\),

\[C'(u,v)=H(F^{-1}(u),G^{-1}(v))\]

Cuando F y G son continuas, el resultado aplica para cópulas. Este Corolario nos genera un método para construir Cópulas.

Ejemplo

\[ H(x,y)=\begin{cases} \frac{(x+1)(e^{y}-1)}{x+2e^{y}-1}, & (x,y) \in [-1,1]\text{x}[0,\infty] \\ 1-e^{-y}, & (x,y) \in [1,\infty]\text{x}[0,\infty] \\ 0, & \text{otro caso} \end{cases} \]

Tiene marginales:

\[ F(x)=\begin{cases} 0, & x<1 \\ \frac{x+1}{2}, & x\in[-1,1]\\ 1,&x>1 \end{cases} \]

\[ G(y)\begin{cases} 0, & y<1 \\ 1-e^{-y}, & y\in[-1,1]\\ 1, &y>1 \end{cases} \]

Las cuasi-inversas de \(F\) y \(G\) son dadas por \(F^{-1}(u)=2u-1\) y \(G^{-1}(v)=-ln(1-v)\) para \(u,v \in \mathbb{I}\), como el Rango de \(F\) y \(G\) es \(\mathbb{I}\) la Cópula \(C\) es:

\[C(u,v)=H(F^{-1}(u),G^{-1}(v))=H(2u-1,-ln(1-v))\] \[C(u,v)=\frac{((2u-1)+1)(e^{-ln(1-v)}-1)}{(2u-1)+2e^{-ln(1-v)}-1}\] \[C(u,v)=\frac{((2u)(\frac{1}{(1-v)}-1)}{(2u+2\frac{1}{(1-v)}-2}=\frac{uv}{u+v+uv}\]

Ejemplo Distribución Exponencial Bivariada de Gumbel

Este ejemplo ilustra a una familia de Cópulas llamadas Arquimedianas, que son muy comunes porque son fáciles de generar, además que son asimétricas y son adecuadas para representar eventos extremos.

Sea:

\[ H(x,y)=\begin{cases} 1-e^{-x}-e^{-y}+e^{-(x+y+\theta xy)}, & x,y \geq 0 \\ 0 & \text{ en otro caso} \end{cases} \] donde \(\theta\) es un parámetro entre \([0,1]\), llamado grado de dependencia, las marginales son distribuciones exponenciales. con cuasi-inversas en \(\mathbb{I}\) definidas como \(F^{-1}(u)=-ln(1-u)\) y \(G^{-1}(v)=-ln(1-v)\). Su Cópula correspondiente sería

\[C_\theta(u,v)=u+v-1+(1-u)(1-v)e^{-\theta ln(1-u)ln(1-v)}\]

Ejemplos Cópula Gumbel, distinto \(\theta\)

Observemos como los datos en los extremos poseen una alta concentración, en especial la dependencia positiva (cola de la derecha).

Otras Cópulas de esta familia, es la Cópula de Clayton, que asigna mayor probabilidad a la cola izquierda, y la Cópula de Frank que es simétrica y con colas poco dependientes.

Ejemplo Normal Bivariada

Otra familia de Cópulas, son la llamadas Elípticas, que son las que generalizan a la distribución Normal multivariante, en este caso podemos encontrar la Cópula Gaussiana y la t-Cópula.

Un ejemplo de una Distribución Bivariada con Marginales normal estándar, que genera una Normal Bivariada con correlación \(\rho\) esta dada por:

\[C(u,v)=N(\Phi^{-1}(u),\Phi^{-1}(v))\]

\[=\frac{1}{2\pi\sqrt{1-\rho^2}}\int_{-\infty}^{\Phi^{-1}(u)}\int_{-\infty}^{\Phi^{-1}(v)}exp \left[\frac{-(s^2-2\rho st+t^2)}{2(1-\rho^2)}\right]dsdt\]

donde \(\rho\) es el coeficiente de correlación entre las variables y no toma valores de (1,-1). y la función \(\phi^{-1}\) es la función inversa de la normal estandar.

Esta cópula también se llama Cópula Normal y es muy usada en el mundo financiero. Este tipo de Cópula representa bien la dependencia en el centro (cerca de la media), sin embargo no captura bien la dependencias entre los extremos (en los extremos en las colas es nula).

La cópula gaussiana es más flexible que la distribución Normal Bivariada, dado que la primera puede aceptar otras distribuciones marginales que no sean normales.

Ejemplos Cópula Normal, distinto \(\rho\)

Por otro lado, dada una cópula \(C\) esta nos define una función de distribución conjunta \(H_C(x,y)\) dada por

\[ H_C(x,y)=\begin{cases} 0, & x<0 \text{ o } y<0 \\ C(x,y), & (x,y) \in \mathbb{I}^2\\ x, & y>1,\; x\in \mathbb{I} \\ y, & x>1,\; y\in \mathbb{I} \\ 1, & x,y \geq 1 \end{cases} \]

Donde las funciones marginales son distribuciones \(U[0,1]\), en ocasiones las cópulas son definidas como una función distribución conjunta en \(\mathbb{I}^2\) con funciones marginales \(U[0,1]\).

9.3 Cópulas y Variables Aleatorias

Hasta el momento hemos desarrollado la teoría de la cópulas de forma analítica, sin introducir el concepto de variable aleatoria. El siguiente teorema es una reformulación del Teorema de Sklar.

Teorema

Sea \(X\) y \(Y\) dos variables aleatorias con funciones de distribución \(F\) y \(G\) respectivamente y distribución Conjunta \(H\). Entonces existe una Cópula \(C\) tal que:

\[H(x,y)=C(F(x),G(y))\].

Si \(F\) y \(G\) son continuas, \(C\) es único. Si no entonces \(C\) se determina en forma única dentro del Rango de \(F\) y Rango de \(G\).

La Cópula de del teorema anterior se llama Cópula de \(X\) y \(Y\) se denota como \(C_{XY}\)

Teorema

Sea \(X\) y \(Y\) dos variables aleatorias continuas, Entonces \(X\) y \(Y\) son independientes si sólo si \(C_{XY}=\Pi\) ( Cópula producto).

Una de la utilidades del uso de la Cópulas en la estadística no paramétrica se origina en el estudio de transformaciones monótonas de las variables aleatorias, las cópulas son invariantes o cambia de manera facil de predecir.

Recordemos que si la función de distribución de una variable aleatoria es continua y \(\alpha(x)\) es estríctamente monótona con dominio el rango de \(X\) entonces la variable aleatoria \(\alpha(X)\) es continua.

Teorema

Sea \(X\) y \(Y\) variables aleatorias continuas con Cópula \(C_{XY}\). Si \(\alpha\) y \(\beta\) son estrictamente crecientes en el Rango de \(X\) y Rango de \(Y\) respectivamente. Entonces:

\[C_{\alpha(X),\beta(Y)}=C_{XY}\]

Es decir que \(C_{XY}\) es invariante bajo transformaciones crecientes de \(X\) y \(Y\).

Prueba

\[C_{\alpha(X),\beta(Y)}(F_2(x),G_2(y))=P(\alpha(X)\leq x,\beta(Y)\leq y)\]

\[=P(X\leq \alpha^{-1}(x),Y\leq \beta^{-1}(y))=C_{XY}(F_1(\alpha^{-1}(x)),G_1(\beta^{-1}(y)))\]

\[=C_{XY}(P(X\leq \alpha^{-1}(x)),P(Y\leq \beta^{-1}(y)))\]

\[=C_{XY}(P(\alpha(X)\leq x),P(\beta(Y)\leq y))=C_{XY}(F_2(x),G_2(y))\]

como \(X\) y \(Y\) son continuas, el Rango de \(F_2\) y \(G_2\) es \(\mathbb{I}\).

Para el caso en que \(\alpha\) y \(\beta\) sean estrictamente decrecientes, es una transformación de \(C_{XY}\).

Teorema

Sea \(X\) y \(Y\) variables aleatorias continuas con Cópula \(C_{XY}\). si \(\alpha\) y \(\beta\) son estrictamente monótonas en el Rango de \(X\) y Rango de \(Y\) respectivamente. Entonces:

  1. Si \(\alpha\) es estrictamente creciente y \(\beta\) estrictamente decreciente entonces:

\[C_{\alpha(X),\beta(Y)}(u,v)=u-C_{XY}(u,1-v)\]

  1. Si \(\alpha\) es estrictamente decreciente y \(\beta\) estrictamente creciente entonces:

\[C_{\alpha(X),\beta(Y)}(u,v)=v-C_{XY}(1-u,v)\]

  1. ambas estrictamente decrecientes entonces:

\[C_{\alpha(X),\beta(Y)}(u,v)=u+v-1+C_{XY}(1-u,1-v)\]

Ejercios página 28-30 (sección 2.4)

9.4 Límites de Fréchet-Hoeffding para Distribuciones Conjuntas

Una consecuencia directa del Teorema de Sklar es que si \(X\) y \(Y\) son variables aleatorias con distribución conjunta \(H\) y marginales \(F\) y \(G\) respectivamente, para todo \(x,y \in \overline{\mathbb{R}}\):

\[max(F(x)+G(Y)-1,0)\leq H(x,y) \leq min(F(x),G(x))\] Por ser los límites una cópula, entonces podemos preguntarnos sobre las propiedades de \(X\) y \(Y\) cuando su función de distribución conjunta es uno de los límites (cotas) de Fréchet-Hoeffding.

  1. Cuando \(H(x,y)=M\), se dice que \(X\) y \(Y\) que posee comonotocidad, esta propiedad indica que el grado de dependencia entre las variables es positiva perfecta, o que casi seguramente \(Y\) es función creciente de \(X\).

  2. Cuando \(H(x,y)=W\), se dice que \(X\) y \(Y\) que posee contramonotocidad, esta propiedad indica que el grado de dependencia entre las variables es negativa perfecta, o que casi seguramente \(Y\) es función decreciente de \(X\).

Definición

Sea \(S \subset \overline{\mathbb{R}}\) se dice que es no decreciente si cualquier \((x,y)\) y \((u,v)\) de \(S\), \(x<u \Rightarrow y \leq v\) ( en caso de desigualdad estricta se llama creciente), similarmente si \(x<u \Rightarrow y \geq v\) se le llama no creciente (decreciente si la desigualdad es estricta).

La propiedad de comonotocidad tiene sus aplicaciones en la gestión de riesgos y en la ciencias actuariales.

9.5 Cópulas de Sobrevivencia

En muchas aplicaciones, en especial en temas de tiempo de vida de personas, u objetos en alguna población, nos interesa conocer la probabilidad que \(x\) sobreviva cierto tiempo. esto lo podemos expresar como:

\[P(X >x)=1-P(X \leq x)=1-F(x)=\overline{F}(x)\] La función \(\overline{F}(x)\) se le denomina función de sobrevivencia.

Para un par de variables aleatorias \((X,Y)\) con función de distribución conjunta \(H\), la función de sobrevivencia conjunta es:

\[\overline{H}(x,y)=P(X>x,Y>y)\]

Las marginales de \(\overline{H}\) son las funciones:

\[\overline{F}(x)=\overline{H}(x,\infty)\]

\[\overline{G}(y)=\overline{H}(\infty,y)\]

\[\overline{H}(x,y)=P(X>x,Y>y)=1-P(X\leq x)-P(Y\leq y)+P(X\leq x,Y \leq y)\]

\[\overline{H}(x,\infty)=1-F(x)-G(y)+H(x,y)\]

\[=\overline{F}(x)+\overline{G}(y)-1+C(F(x),G(y))\]

\[=\overline{F}(x)+\overline{G}(y)-1+C(1-\overline{F}(x),1-\overline{G}(y))\]

Definimos a \(\hat C:\mathbb{I}^2\to\mathbb{I}\) tal que:

\[\hat C(u,v)=u+v-1+C(1-u,1-v)\]

por lo que

\[\overline{H}(x,y)=\hat C(\overline{F}(x),\overline{G}(y))\]

Nota

  1. La función \(\hat C\) es una Cópula (ejercicio) y se le denomina Cópula de sobrevivencia de \(X\) y \(Y\).

  2. La cópula \(\hat C\) se ajusta a la función de distribución de Sobrevivencia conjunta y su funciones marginales de sobrevivencia, en forma análoga a las funciones de distribución y marginales.

  3. Hay que tener cuidado de no confundir la Cópula de sobrevivencia \(\hat C\), con la función de sobrevivencia conjunta \(\bar C\) para dos variables aleatorias uniformes \(U[0,1]\) cuya distribución conjunta es la Cópula \(C\).

\[\bar C(u,v)=P(U>u,V>v)=1-u-v+C(u,v)=\hat C(1-u,1-v)\]

Ejemplo

Consideremos la función Gumbel bivariada con parametro \(\theta\) de los ejemplos anteriores:

\[C_\theta(u,v)=u+v-1+(1-u)(1-v)e^{-\theta ln(1-u)ln(1-v)}\]

usando la definición de la Cópula de Sobrevivencia, se obtiene que:

\[\hat C_\theta(u,v)=uve^{-\theta ln(u) ln(v)}\]

Ejemplo

Consideremos la distribución Bivariada Pareto (Hutchinson and lai 1990). Sea \(X\) y \(Y\) variables aleatorias con función de sobrevivencia conjunta dada por:

\[ \overline{H}(x,y)=\begin{cases} (1+x+y)^{-\theta}, & x \geq 0,y\geq 0 \\ (1+x)^{-\theta}, & x \geq 0,y < 0 \\ (1+y)^{-\theta}, & x < 0,y \geq 0 \\ 1 & x < 0,y < 0 \end{cases} \]

con \(\theta >0\), las funciones marginales de sobrevivencia \(\overline{F},\overline{G}\) son:

\[ \overline{F}(x)=\begin{cases} (1+x)^{-\theta}, & x \geq 0 \\ 1 & x < 0 \end{cases} \]

\[ \overline{G}(y)=\begin{cases} (1+y)^{-\theta}, & y \geq 0 \\ 1 & y < 0 \end{cases} \] \(X\) y \(Y\) tienen identicas distribuciones de Pareto, si invertimos las funciones de sobrevivencia y empleado la siguiente igualdad (prueba ejercicio)

\[\hat C(u,v)=\overline{H}(\overline{F}^{(-1)}(u),\overline{G}^{(-1)}(v))\]

Se obtiene que:

\[\hat C_\theta(u,v)=(u^{-1/\theta}+v^{-1/\theta}-1)^{-\theta}\]

También existen otras funciones de las cópulas, como el dual de la cópula o la co-cópula.

Simbolo Probabilidad Nombre
\(C(u,v)\) \(P(X\leq x,Y \leq y)=C(F(x),G(y))\) Cópula
\(\hat C(u,v)=u+v-1+C(1-u,1-v)\) \(P(X> x,Y > y)=\hat C(\overline{F}(x),\overline{G}(y))\) Cópula de Sobrevivencia
\(\tilde C(u,v)=u+v-C(u,v)\) \(P(X\leq x \vee Y \leq y)=\tilde C(F(x),G(y))\) El dual de la Cópula
\(C^{*}(u,v)=1-C(1-u,1-v)\) \(P(X> x \vee Y > y)=C^{*}(\overline{F}(x),\overline{G}(y))\) Co-Cópula

9.6 Simetría

Para el caso de una variable, tenemos el concepto que una distribución es simétrica con respecto al punto \(a\) si \(P(X-a\leq x)=P(a-X\leq x)\), Entonces \(X\) una variable aleatoria continua y con distribución \(F\) es simétrica si:

\[F(a+x)=\overline{F}(a-x)\]

Cuando queremos extender el concepto a varias variables, surgen tres conceptos diferentes de simetría.

  1. \((X,Y)\) es marginalmente simétrica alrededor de \((a,b)\) si \(X\) y \(Y\) son simétricas alrededor de \(a\) y \(b\) respectivamente.

  2. \((X,Y)\) es radialmente simétrica alrededor de \((a,b)\) si la distribución conjuta \(H\) cumple que:

\[H(x+a,y+b)=\overline{H}(a-X,b-Y)\]

El término radial que se usa para esta simetría surge por que gráficamente los puntos se ubican en lados opuesto (oposición) con respecto \((a,b)\).

Ejemplo gráfico de simetría radial 3. La última simetría es la llamada conjuntamente simétrica alrededor \((a,b)\) donde, los puntos \((X-a,Y-b),(X-a,b-Y),(a-X,Y-b),(a-X,b-Y)\) poseen la misma distribución conjunta.

Nota

  1. Las Cópulas elipticas, como las gaussiana o la t-student son simétricas radiales.

  2. Que \((X,Y)\) sea conjuntamente simétrica implica que es radialmente simétrica, y radialmente simétrica implica que son marginalmente simétrica, por lo que la condición de conjuntamente simétrica es la más fuerte de las tres simetrías.

  3. si \((X,Y)\) es radialmente simétrica alrededor a \((a,b)\), entonces:

\[H(x+a,y+b)=\overline{H}(a-X,b-Y) \iff C=\hat C\] \[\Rightarrow C(u,v)=u+v-1+C(1-u,1-v)=\hat C(u,v), \quad \forall (u,v)\in \mathbb{I}^2\]

  1. Geometricamente si \((X,Y)\) es radialmente simétrica implica que el C-volumen de \(B_1=[0,u]\text{x}[0,v]\) y de \(B_2=[1-u,1]\text{x}[1-v,1]\) son iguales.

  2. La intercambiabilidad de \(X\) con \(Y\) ocurre cuando los pares \((X,Y)\) y \((Y,X)\) son identicamente distribuidos, es decir:

\[H(x,y)=H(y,x) \quad \forall (x,y)\in\overline{\mathbb{R}}^2\]

Teorema

Sea \(X\) y \(Y\) variables aleatorias continuas con función de distribución \(H\) y marginales \(F\) y \(G\) respectivamente y Cópula \(C\).

Entonces \(X\) y \(Y\) son intercambiables si sólo si \(F=G\) y \(C(u,v)=C(v,u) \quad \forall (u,v)\in\overline{\mathbb{I}}^2\)

Si \(C(u,v)=C(v,u) \quad \forall (u,v)\in\overline{\mathbb{I}}^2\) se dice que \(C\) es simétrica.

9.7 Orden en las Cópulas

En general no podemos hablar de un orden para todas las Cópulas, por ejemplo la Cópula \(\Pi\) y el promedio de las cotas de Fréchet-Hoeffding \(C(u,v)=(W+M)/2\), sin embargo si se puede relacionar ciertas Cópulas con otras.

Definición

Si \(C_1\) y \(C_2\) son cópulas, se dice que \(C_1\) es más pequeño que \(C_2\) ( o que \(C_2\) es más grande que \(C_1\)) y se denota por \(C_1 \prec C_2\) \((C_2 \succ C_1)\) si \(C_1(u,v)\leq C_2(u,v)\) para todo \(u,v \in \mathbb{I}\)

Bajo este sentido la cota inferior de Fréchet-Hoeffding (\(W\)), es más pequeño que cualquier Cópula y la cota superior (\(M\)) es más grande que cualquier Cópula. Esta propiedad se le llama que el conjunto de la cópulas es parcialmente ordenado o que tiene un orden de concordancia.

Existen familias de Cópulas que son totalmente ordenadas, esta son familias paramétricas totalmente ordenadas \(\{C_\theta\}\) se dice que son:

  1. Positivamente ordenadas si \(C_\alpha \prec C_\beta\) cuando \(\alpha \leq \beta\).

  2. Negativamente ordenadas si \(C_\alpha \succ C_\beta\) cuando \(\alpha \leq \beta\).

Ejemplo

La Familia de Cópulas Cuadras-Augé (ejercicio 2.5) es ordenado positivamente para \(0\leq \alpha \leq \beta \leq 1\) y \(u,v \in (0,1)\),

\[C_\theta(u,v)=(min(u,v))^\theta(uv)^{1-\theta}\]

\[\frac{C_\alpha(u,v)}{C_\beta(u,v)}=\left(\frac{uv}{min(u,v)}\right)^{\beta-\alpha}\leq 1\]

9.8 Generación de Muestra de Cópulas-Simulación-

Una de las principales aplicaciones de la Cópulas, es la simulación de muestras de diversos eventos, en forma conjunta, basado en la ecuación:

\[C(x,y)=H(F^{-1}(x),G^{-1}(y))\]

El algoritmo para generar una muestra de la Variable aleatoria \((X,Y)\) es el siguiente:

  1. Generar \(U, W \sim U[0,1]\)

  2. Obtener \(V=C^{-1}_U(W)\)

  3. Devolver \((F_1^{-1}(U),F_1^{-1}(V))\)

donde \(C^{-1}_U(t)\) es la cuasi-inversa de \(C_u(t)\),

\[C_u(t)=P(T\leq t|U=u)=\lim_{\Delta u \to 0}\frac{C(u+\Delta u,v)-C(u,v)}{\Delta u}=\frac{\partial C(u,v)}{\partial u}\]

Similarmente se puede generar una muestra para funciones de sobrevivencia usando el el punto 2. \(V=\hat C^{-1}_U(W)\) y sus respectivas funciones de distribución.

Ejemplo 1

Usaremos la Cópula de Clayton, la cual se define como:

\[C(u,v)=(u^{-\alpha}+v^{-\alpha}-1)^{-1/\alpha}\]

en este caso tenemos que;

\[C^{-1}_U(W)=(u^{-\alpha}(w^{-\alpha/(\alpha+1)}-1)+1)^{-1/\alpha}\]

Primero creamos una función que genere muestras de tamaño \(n\) de la distribución de la Cópula de Clayton.

rcclayton <- function(alpha, n) {
  val <- cbind(runif(n), runif(n))
  val[, 2] <- (val[, 1]^(-alpha) * 
              (val[, 2]^(-alpha/(alpha + 1)) - 1) + 1)^(-1/alpha)
  return(val)
}

Creamos una muestra de 10 000 y analizaremos los resultados de dicha muestra, con un \(\alpha=2\)

set.seed(2024)
mclayton <- rcclayton(2, 10000)
plot(mclayton, xlab = "u", ylab = "v")

Para gráficar la densidad Conjunta creada por la Cópula, podemos usar el paquete “sm”

library(sm)
Package 'sm', version 2.2-6.0: type help(sm) for summary information
sm.density(mclayton, xlab = "u", ylab = "v", zlab = "Density")  

En los gráficos, podemos observar como esta Cópula genera una fuerte dependencia entre las variable en la parte izquierda, pero si analizamos las marginales de la Cópula, cada una se mantiene como Uniformes

par(mfrow = c(1, 2))
hist(mclayton[,1], freq = FALSE, xlab = "u")
abline(h = 1)
hist(mclayton[,2], freq = FALSE, xlab = "v")
abline(h = 1) 

Supongamos que dada la muestra obtenida, las distribuciones marginales son distribución exponenciales con \(\lambda_1=1\) y \(\lambda_2=2\) respectivamente. Este sería el ultimo paso de algoritmo.

rcexp <- cbind(qexp(mclayton[,1], 1), qexp(mclayton[,2], 2))
plot(rcexp, xlab = "exp1", ylab = "exp2")  

sm.density(rcexp, xlab = "F(x)", ylab = "G(y)", zlab = "H(x,y)")  

Las marginales de \(H(x,y)\) se puede observar que son exponenciales cada una.

par.old <- par(mfrow = c(1, 2))
hist(rcexp[,1], freq = FALSE, xlab = "exp1")
curve(dexp(x, 1), add = TRUE)
hist(rcexp[,2], freq = FALSE, xlab = "exp2")
curve(dexp(x, 2), add = TRUE)  

El ejemplo lo podemos replicar con el paquete “copula” y “scatterplot3d”

library(copula)
library(scatterplot3d)

clayton.cop <- claytonCopula(2, dim = 2) # caso bidimensional

y <- rCopula(10000, clayton.cop) #Genera la muestra

plot(y, xlab = "u", ylab = "v")

rcexp <- cbind(qexp(y[,1], 1), qexp(y[,2], 2))
plot(rcexp, xlab = "exp1", ylab = "exp2")

hist(rcexp[,1], freq = FALSE, xlab = "exp1")
curve(dexp(x, 1), add = TRUE)

hist(rcexp[,2], freq = FALSE, xlab = "exp2")
curve(dexp(x, 2), add = TRUE)

sm.density(rcexp, xlab = "F(x)", ylab = "G(y)", zlab = "H(x,y)")

Usando la muestra de la Cópula de Clayton, que construimos, cambiaremos una de la distribuciones marginales exponenciales por una Normal estándar.

rcmixta <- cbind(qexp(mclayton[,1], 1), qnorm(mclayton[,2]))
plot(rcmixta, xlab = "exp1", ylab = "Normal")  

sm.density(rcmixta, xlab = "F(x)", ylab = "G(y)", zlab = "H(x,y)")  

hist(rcmixta[,1], freq = FALSE, xlab = "exp1")
curve(dexp(x, 1), add = TRUE)

hist(rcmixta[,2], freq = FALSE, xlab = "Normal")
curve(dnorm(x), add = TRUE)

Ejemplo 2 de Muestras

Replicaremos el ejemplo 1, con marginales exponenciales, pero cambiaremos la cópula generadora, para esto consideremos la función de Distribución

\[ H(x,y)=\begin{cases} \frac{(x+1)(e^{y}-1)}{x+2e^{y}-1}, & (x,y) \in [-1,1]\text{x}[0,\infty] \\ 1-e^{-y}, & (x,y) \in [1,\infty]\text{x}[0,\infty] \\ 0, & \text{otro caso} \end{cases} \] la Cópula asociada es la siguiente:

\[C(u,v)=\frac{uv}{u+v-uv}\]

y

\[C^{-1}_u(t)=\frac{u\sqrt{t}}{1-(1-u)\sqrt{t}}\]

Generaremos la muestra de \(C\)

rcCh <- function(n) {
  val <- cbind(runif(n), runif(n))
  val[, 2] <- (val[, 1]*(val[, 2]^(1/2)))/(1-(1-val[, 1])*(val[, 2]^(1/2))) 
        
  return(val)
}

set.seed(2024)
mch <- rcCh( 10000)


plot(mch, xlab = "u", ylab = "v")

sm::sm.density(mch, xlab = "u", ylab = "v", zlab = "Density")  

En los gráfico, podemos ver una fuerte dependencia en los extremos, pero también cerca del medio de la recta identidad, sin embargo cada marginal es una función uniforme.

par(mfrow = c(1, 2))
hist(mch[,1], freq = FALSE, xlab = "u")
abline(h = 1)
hist(mch[,2], freq = FALSE, xlab = "v")
abline(h = 1) 

Supongamos que dada la muestra obtenida, las distribuciones marginales son distribución exponenciales con \(\lambda_1=1\) y \(\lambda_2=2\) respectivamente y la compararemos con la muestra generada por la Cópula de Clayton.

rchexp <- cbind(qexp(mch[,1], 1), qexp(mch[,2], 2))

par(mfrow = c(1, 2))
plot(rchexp, xlab = "exp1", ylab = "exp2", main="H(x,y)")
plot(rcexp, xlab = "exp1", ylab = "exp2",main="Clayton")

par(mfrow = c(1, 2))
sm.density(rchexp, xlab = "F(x)", ylab = "G(y)", zlab = "H(x,y)")  
sm.density(rcexp, xlab = "F(x)", ylab = "G(y)", zlab = "Clayton")  

Podemos observar que la muestra generada por la Cópula asociada a \(H(x,y)\) es más “abierta” que la generada por la Cópula de Clayton.

9.9 Cópulas Multivariadas

En las secciones anteriores, construimos la 2-Cópula, o simplemente cópula para dos variables, muchos teoremas, definiciones son análogos para el caso de multiples variables, enunciaremos los principales hechos de las Cópulas multivariadas:

Denotaremos a:

  1. \(S_k=[a_k,b_k]\in \overline{\mathbb{R}}\)
  2. Si \(S_k=[0,1]\) el n-cubo identidad esta dado por \(S_1\text{x}S_2\text{x}\cdots\text{x}S_n=\mathbb{I}^n\)
  3. En general n-caja \(B=[a_1,b_2]\text{x}\cdots\text{x}[a_n,b_n]\), los vértices de cualquier n-Caja \(B\) los denotaremos como \(c\)
  4. Si \(a\in\overline{\mathbb{R}}^n\) y \(b\in\overline{\mathbb{R}}^n\) denotaremos que \(a\leq b\) si \(a_k\leq b_k, \quad \forall k=1,2,...,n\)

Definición

Sea \(S_1,S_2,\dots,S_n\) conjuntos no vacios de \(\overline{\mathbb{R}}^n\), con \(H\) una función de n variables real con dominio \(S_1\text{x}S_2\text{x}\cdots\text{x}S_n\), sea \(B\) la n-caja con todos los vértices en el dominio de H. Entonces el H-Volumen de B esta dado por

\[V_H(B)=\sum sgn(c)H(c)\]

donde:

\[ sgn(c)=\begin{cases} 1 & \text{ si }c_k=a_k \; k \text{ par }\\ -1 & \text{ si }c_k=a_k \; k \text{ impar } \end{cases} \] en forma equivalente podemos definir el H-volumen como la \(n\) primer diferencia de \(H\) tal que:

\[V_H(B)=\Delta_a^bH(t)=\Delta_{a_n}^{b_n}\Delta_{a_n-1}^{b_n-1}\cdots\Delta_{a_1}^{b_1}H(t)\]

donde

\[\Delta_{a_k}^{b_k}H(t)=H(t_1,...,t_{k-1},b_k,t_{k+1},...t_n)-H(t_1,...,t_{k-1},a_k,t_{k+1},...,t_n)\]

Definición

Se dice que \(H\) es n-creciente si \(V_H(B)\geq 0\) para cualquier n-caja en el dominio de \(H\), se dice que \(H\) es fundamentada (grounded) si \(H(t_1,...,t_{k-1},a_k,t_{k+1},...,t_n)=0\) para todo \(a_k\) y las funciones marginales de \(H\) están dadas por:

\[H_k:S_k\to \overline{\mathbb{R}}\] \[H_k(x)=H(b_1,...,b_{k-1},x,b_{k+1},...,b_n)\] Similarmente podemos definir las marginales k-dimensional de \(H\) (k-marginal).

Ejemplo

Sea \(H:[-1,1]\text{x}[0,\infty]\text{x}[0,\pi/2]\) dado por:

\[H(x,y,z)=\frac{(x+1)(e^y-1)sin(z)}{x+2e^y-1}\].

  • H es fundamentada dado que \(H(-1,y,z)=H(x,0,z)=H(x,y,0)=0\).

  • Las marginales de \(H\) son \(H_1(x),H_2(y),H_3(z)\) dados por:

\[H_1(x)=H(x,\infty,\pi/2)=(x+1)/2\]

\[H_2(y)=H(-1,y,\pi/2)=1-e^{-y}\]

\[H_3(z)=H(-1,\infty,z)=sen(z)\]

  • Las marginales 2-dimensional (2-marginal) son:

\[H_{1,2}=H(x,y,\pi/2)=\frac{(x+1)(e^y-1)}{x+2e^y-1}\]

\[H_{1,3}=H(x,\infty,z)=\frac{(x+1)sen(z)}{2}\]

\[H_{2,3}=H(1,y,z)=(1-e^{-1})sen(z)\]

Lema

Sea \(S_1,S_2,\dots,S_n\) conjuntos no vacios de \(\overline{\mathbb{R}}^n\), con \(H\) una función de n variables real con dominio \(S_1\text{x}S_2\text{x}\cdots\text{x}S_n\) n-creciente y fundamentada, entonces H es no decreciente en cada argumento, es decir que si \((t_1,...,t_{k-1},x,t_{k+1},...,t_n)\) y \((t_1,...,t_{k-1},y,t_{k+1},...,t_n)\) con \(x<y\) entonces

\[H(t_1,...,t_{k-1},x,t_{k+1},...,t_n)\leq H(t_1,...,t_{k-1},y,t_{k+1},...,t_n)\]

Lema

Bajo lo supuesto de lema anterior, y \(H\) con funciones marginales, entonces para \(x,y\) en el dominio de \(H\) se cumple que:

\[|H(x)-H(y)|\leq \sum_{k=1}^n|H_k(x_k)-H_k(y_k)|\]

Definición

Una n-sub Cópula ( o sub-Cópula n-dimensional) es una función \(C'\) que tiene las siguientes propiedades:

  1. el dominio de \(C'\) es \(S\subseteq \mathbb{I}^n\).

  2. \(C'\) es fundamentado y n-creciente

  3. \(C'\) posee marginales \(C'_k\), k=1,2,…n, que satisfacen que:

\[C'_k(u)=u \quad \forall u \in S_k\] Para cualquier \(u\) en el Dominio de \(C'\) se cumple que \(0\leq C'(u)\leq 1\), es decir el rango de de \(C'\) es un subconjunto de \(\mathbb{I}\).

Definición

Un n-Cópula o Cópula n-dimensional es una sub cópula \(C\) con dominio \(\mathbb{I}^n\)

Equivalentemente un n-cópula es una función \(C:\mathbb{I}^n\to \mathbb{I}\) con las siguiente propiedades:

  1. Si \(u \in \mathbb{I}^n\) posee alguna entrada en 0, entonces \(C(u)=0\) y si todas las entradas de \(u\) son 1 excepto en la entrada \(u_k\) entonces \(C(u)=u_k\).

  2. \(V_c([a,b]) \geq 0\) para cualquier \([a,b] \subseteq \mathbb{I}^n\)

Se puede verificar ( ejercicio) que cualquier n-Cópula \(C\), con \(n\geq 3\), la k-marginal es un k-Cópula.

Similarmente que el caso de las sub-cópulas, las n-subcópulas son uniformemente continuas en el dominio ( en particular las n-cópulas), es decir cumplen la siguiente desigualdad:

\[|C'(v)-C'(u)|=\sum_{k=1}^n|v_k-u_k|\]

Definición

Una función de distribución n-dimensional es una función \(H\) con dominio \(\overline{\mathbb{R}}^n\) tal que:

  1. \(H\) es n-creciente.

  2. H(t)=0 para cualquier \(t \in \overline{\mathbb{R}}^n\), con al menos una entra \(t_k=-\infty\) y \(H(\infty,\infty,...,\infty)=1\).

Dada esta definición \(H\) es fundamentada, y sus marginales \(F_1,F_2,...,F_n\) son funciones de distribución.

Teorema de Sklar para n-dimensiones

Sea \(H\) una funcion de distribución n-dimensional con funciones marginales \(F_1,F_2,...,F_n\). Entonces existe una n-Cópula tal que:

\[H(x_1,x_2,...,x_n)=C(F(x_1),F(x_2),...,F(x_n))\]

Si todas las marginales son continuas entonces \(C\) es única, si no, es únicamente determinada en los rangos de las marginales.

Si \(C\) y \(F_1,F_2,...,F_n\) funciones de distribución, entonces la función \(H\) definida anteriormente es una función de distribución n-dimensional con funciones marginales \(F_1,F_2,...,F_n\).

Similarmente dadas las definición del teorema, y con \(F^{-1}_1,F^{-1}_2,...,F^{-1}_n\) las cuasi-inversas de \(F_1,F_2,...,F_n\) respectivamente para cualquier \(u \in \mathbb{I}\),

\[C(u_1,u_2,...,u_n)=H(F^{-1}_1(u_1),F^{-1}_2(u_2),...,F^{-1}_n(u_n))\]

Para el caso n-dimensional, existen las cotas de Fréchet-Hoeffding definidas como:

\[M^n(u)=min(u_1,u_2,...,u_n)\] \[W^n(u)=max(u_1+\cdots + u_n-n+1,0)\]

Tal que si \(C'\) es una n-subcópula se cumple que:

\[W^n(u)\leq C'(u) \leq M^n(u)\]

Para \(n>2\), la cota inferior en general no es una cópula

También podemos definir la Cópula producto \(\Pi^n\) como

\[\Pi^n(u)=\prod_{i=1}^nu_i\]

Similarmente si \(X_1,X_2,...,X_n\) son variables aleatorias continuas entonces:

  1. Son independientes si sólo si la n-Cópula de \(X_1,X_2,...,X_n\) es \(Pi^n\).

  2. Cada variable aleatoria \(X_1,X_2,...,X_n\) es una función estrictamente creciente,casi seguramente, con respecto a las otras si sólo si la n-Cópula de \(X_1,X_2,...,X_n\) es \(M^n\)

Ejercicio página 49 del libro.