Skip to article frontmatterSkip to article content
Site not loading correctly?

This may be due to an incorrect BASE_URL configuration. See the MyST Documentation for reference.

Glosario

Modelado híbrido
Enfoque de modelado que combina modelos físicos tradicionales con herramientas de aprendizaje automático y técnicas basadas en datos. - Clase 1
Physics Informed Machine Learning (PIML)
Área del aprendizaje automático que incorpora conocimiento físico, ecuaciones diferenciales o restricciones científicas dentro del entrenamiento de modelos de machine learning. - Clase 1
ODE
Ecuación Diferencial Ordinaria (Ordinary Differential Equation). Ecuación que describe la evolución de un estado u(t)u(t) en función de sus derivadas respecto al tiempo: dudt=f(u,t,θ)\frac{du}{dt} = f(u, t, \theta). — Clase 2
PDE
Ecuación en Derivadas Parciales (Partial Differential Equation). Generalización de las ODEs donde el estado depende de múltiples variables independientes (e.g., tiempo y espacio). — Clase 2
NODE
Ecuación Diferencial Ordinaria Neuronal (Neural Ordinary Differential Equation). Modelo donde la dinámica del estado está parametrizada por una red neuronal: dudt=fθ(u,t)\frac{du}{dt} = f_\theta(u, t). Introducido por Chen et al. (2018). — Clase 2
UDE
Ecuación Diferencial Universal (Universal Differential Equation). Generalización de las NODEs donde partes de una ecuación diferencial conocida son reemplazadas por redes neuronales. Introducido por Rackauckas et al. (2020).
Parámetro
Vector θRp\theta \in \mathbb{R}^p que caracteriza el comportamiento de un sistema dinámico. Inferir θ\theta a partir de datos observados es uno de los problemas centrales del curso. — Clase 2
Condición inicial
Valor u0=u(t0)u_0 = u(t_0) que especifica el estado del sistema en el tiempo inicial t0t_0. Junto con la ecuación diferencial ordinaria, determina unívocamente la solución (bajo condiciones de regularidad). — Clase 2
Ajuste de trayectorias
Método de inferencia estadística (trajectory matching) que estima los parámetros θ\theta minimizando la discrepancia entre la solución numérica u(t;θ)u(t;\theta) y las observaciones {yi}\{y_i\}. Ver Ramsay & Hooker (2017). — Clase 2
Programación diferenciable
Paradigma computacional (differentiable programming) que permite calcular gradientes de funciones definidas por programas, incluyendo simulaciones numéricas de ecuaciones diferenciales. Habilita el entrenamiento de modelos híbridos física-datos. Ver Sapienza et al. (2024) y Blondel & Roulet (2024).
Sistema de Lotka-Volterra
Modelo depredador-presa descripto por el sistema de ODEs: dxdt=αxβxy\frac{dx}{dt} = \alpha x - \beta x y, dydt=δxyγy\frac{dy}{dt} = \delta x y - \gamma y. Es uno de los ejemplos recurrentes del curso. — Clase 2
PINN
Physics-Informed Neural Network: Modelo que incorpora ecuaciones diferenciales como restricciones suaves durante el entrenamiento, minimizando Lemp+λD[x(θ)]\mathcal{L}_{\text{emp}} + \lambda \|D[x(\theta)]\|. El hiperparámetro λ\lambda controla cuánto se penaliza el incumplimiento de la ecuación diferencial. — Clase 8 Clase 9
Número de condición
Medida de “mal comportamiento” de un problema de optimización, definida como el cociente entre el mayor y menor autovalor del Hessiano H=2LH = \nabla^2 \mathcal{L}: κ(H)=λmax(H)/λmin(H)\kappa(H) = \lambda_{\max}(H) / \lambda_{\min}(H). Un κ(H)\kappa(H) grande implica curvas de nivel elongadas y convergencia lenta del gradiente descendente. — Clase 9
Sesgo espectral
Tendencia de las redes neuronales con bias a aprender funciones de baja frecuencia antes que las de alta frecuencia. En el contexto de las PINNs, se aplica escalado a la red para corregir este sesgo. — Clase 9 Inductive bias
El sesgo inductivo (inductive bias) es el onjunto de supuestos, restricciones o conocimientos previos utilizados para condicionar el resultado de un algoritmo ante datos observados. — Clase 7
Principio de Máxima Verosimilitud
Este principio busca estimar los parámetros del modelo que maximicen la verosimilitud, esta ultima nos dice que tan probable es observar los parámetros y1y_1 hasta yNy_N dada la trayectoria observada x(ti;θ)x(t_i;\theta), si calculamos esta probabilidad para distintos θ\theta la verosimilitud va a dar distintos valores, entonces lo que queremos estimar es cuales son los parámetros θ\theta que la maximizan. — Clase 6
θ^MLE=argmaxθL(θ;y)=argmaxθ(θ;y)\hat{\theta}_{MLE} = \arg\max_{\theta} L(\theta;y) = \arg\max_{\theta} \ell(\theta;y)

La última igualdad es válida porque el logaritmo es una función monótona creciente.

References
  1. Chen, R. T., Rubanova, Y., Bettencourt, J., & Duvenaud, D. K. (2018). Neural ordinary differential equations. Advances in Neural Information Processing Systems, 31.
  2. Rackauckas, C., Ma, Y., Martensen, J., Warner, C., Zubov, K., Supekar, R., Skinner, D., Ramadhan, A., & Edelman, A. (2020). Universal differential equations for scientific machine learning. arXiv Preprint arXiv:2001.04385.
  3. Ramsay, J., & Hooker, G. (2017). Dynamic data analysis. Springer New York, New York, NY. Doi, 10, 978–1.
  4. Sapienza, F., Bolibar, J., Schäfer, F., Groenke, B., Pal, A., Boussange, V., Heimbach, P., Hooker, G., Pérez, F., Persson, P.-O., & Rackauckas, C. (2024). Differentiable Programming for Differential Equations: A Review. arXiv. 10.48550/arxiv.2406.09699
  5. Blondel, M., & Roulet, V. (2024). The elements of differentiable programming. arXiv Preprint arXiv:2403.14606.