<- 0.001
dt <- c(4, -2, -4, -6, 2, 4)
a <- 1
x1 <- 1
y1 <- 15001
nmax
<- rep(0, nmax)
x <- rep(0, nmax)
y 1] <- x1
x[1] <- y1
y[for (n in 1:(nmax-1)) {
+1] <- x[n] + dt * (x[n] * (a[1] + a[2] * x[n] + a[3] * y[n]))
x[n+1] <- y[n] + dt * (y[n] * (a[4] + a[5] * y[n] + a[6] * x[n]))
y[n }
捕食・被食モデル
捕食・被食関係にある2種の個体群の集団密度の時間変動を表す数理モデルは、Lotka–Volterraモデルとして知られている。 化学反応 (Lotka 1920)や魚種交替のモデル (Volterra 1926) として提案され、NPZモデル (Franks et al. 1986) の基礎となっているだけでなく、積雲対流の自己組織化のモデル (Nober and Graf 2005) にも応用されている。 ここでは、Lawson et al. (1995) に基づいて、捕食・被食モデルを作成し、その随伴を作成する。
支配方程式系
捕食・被食モデルを次の二元連立非線型常微分方程式系で表す。
\[ \begin{aligned} \frac{\mathrm{d}x}{\mathrm{d}t} &= x(a_1 + a_2x + a_3y) \\ \frac{\mathrm{d}y}{\mathrm{d}t} &= y(a_4 + a_5y + a_6x) \end{aligned} \]
\(a_1, a_2, a_3\) 及 び\(a_4, a_5, a_6\) は、それぞれ被食者と捕食者の比成長率 \(\mathrm{d}^{-1}\) 、依存性 \((\text{Number}\,\mathrm{m}^{-2})^{-1}\mathrm{d}^{-1}\) 、減少率 \((\text{Number}\,\mathrm{m}^{-2})^{-1}\mathrm{d}^{-1}\) を表し、 \(x, y\) はそれぞれ被食者と捕食者の個体数 \(\text{Number}\,\mathrm{m}^{-2}\) を表す。
順行モデル
早速Rで実装して、15日間の時間変化を計算してみる。
まず、位相平面で捕食者と被食者の個体数の変化を描画する。
plot(x, y, type = "l", lwd = 2,
xlab = "Prey (x)", ylab = "Predator (y)",
cex.lab = 1.5, cex.axis = 1.5,
xlim = c(0, 2), ylim = c(0, 2))
<- seq(0, 2, length.out = 100)
x.nc points(x1, y1, pch = 4, lwd = 2, cex = 2)
lines(x.nc, -(a[1] + a[2] * x.nc) / a[3], lwd = 2, lty = 2, col = "red")
lines(x.nc, -(a[4] + a[6] * x.nc) / a[5], lwd = 2, lty = 2, col = "blue")
legend("topright", legend = c("x vs y","dx/dt = 0", "dy/dt = 0"),
col = c("black","red", "blue"), lwd = 2, lty = c(1, 2, 2), cex = 1.5)
\(\times\)が初期位置で、個体数の変化は曲線で表されている。 二つの破線は、捕食者(青)と被食者(赤)の個体数がそれぞれ変化しない定常状態を表している。
次に、時間変化を描画する。
plot(seq(0, 15, by = dt), x, type = "l", lwd = 2, col = "red",
xlab = "Time (days)", ylab = "Density",
cex.lab = 1.5, cex.axis = 1.5,
xlim = c(0, 15), ylim = c(0, 2))
lines(seq(0, 15, by = dt), y, lwd = 2, col = "blue")
legend("topright", legend = c("Prey (x)", "Predator (y)"),
col = c("red", "blue"), lwd = 2, cex = 1.5)
随伴法
初期値やパラメタなど制御変数を\(\mathbf{x} = (x_1, \dots, x_m)^\mathrm{T}\)とし、状態変数を\(\mathbf{z}= (z_1, \dots, z_N)^\mathrm{T}\)とする。 捕食・被食モデルの場合は\(\mathbf{x} = (x_1, y_1, a_1, a_2, a_3, a_4, a_5, a_6)^\mathrm{T}\)である。 状態変数は\((x(t), y(t))\)と二要素あるが、ここでは各時刻\(n\)ではスカラー\(z_n\)とする。 随伴モデルの作成の際は、最後の時刻の状態変数\(z_{N+1}\)をコスト函数\(z_{N+1} = J(\mathbf{x}, z_1, \dots, z_{N})\)とする。 モデルを\(f_n\)で表すと、順行計算は次のように表される。
\[ z_1 = f_1(\mathbf{x}),\;z_n = f_n(\mathbf{x}, z_1, \dots, z_{n-1}),\;n = 2, \dots, N + 1 \tag{1}\]
ここで、コスト函数の入力ベクトル\(\mathbf{x}\)に関する微分の計算を容易にするため、Lagrangeの未定乗数法を用いる。
\[ L(\mathbf{x}, \mathbf{z}, \lambda) = J(\mathbf{x}, z_1, \dots, z_{N}) - \lambda_1(z_1 - f_1(\mathbf{x})) - \sum_{n=2}^{N+1} \lambda_n (z_n - f_n(\mathbf{x}, z_1, \dots, z_{n-1})) \tag{2}\]
ここで\(\boldsymbol\lambda = (\lambda_1,\dots,\lambda_{N+1})^\mathrm{T}\)はLagrangeの未定乗数である。 Lagrange函数の鞍点は、\(\mathbf{x},\mathbf{z}, \boldsymbol\lambda\)空間で\(L\)の微分が同時に0になる一点である。 鞍点では、\(\partial L/\partial \boldsymbol\lambda\)から支配方程式(Equation 1) が得られる。
また、\(\partial L/\partial \mathbf{z}\)から随伴方程式 \[ \lambda_{N+1} = \frac{\partial J}{\partial z_{N+1}},\;\lambda_n = \frac{\partial J}{\partial z_n} + \sum_{i=n+1}^{N+1} \frac{\partial f_i}{\partial z_n}\lambda_{i} ,\;n = N, \dots, 1 \tag{3}\] が得られる。
さらに、\(\partial L/\partial \mathbf{x}\)からコスト函数の入力に対する微分、
\[ (\nabla_\mathbf{x}J)_k = (\nabla_\mathbf{x}L)_k = \frac{\partial L}{\partial x_k} = \sum_{i=1}^{N+1} \frac{\partial f_i}{\partial x_k}\lambda_i,\;k = 1, \dots, m \tag{4}\] が得られる。
Equation 4は、モデルの制御変数についての微分にEquation 3 で計算された各ステップの未定乗数を掛けたものを全てのタイムステップで足し合わせれば、コスト函数の制御変数についての微分が求められることを示している。
Equation 4 は、ステップ n+1
以前についてモデルの状態変数についての微分に未定乗数を掛けたものを足し合わせて、ステップ n
でのコスト函数の勾配を加えたものが、ステップ n
での未定乗数であることを示している。
随伴モデルの作成
方程式系の随伴の作り方には、大別して二つの方法がある。
- 支配方程式系に随伴函数を掛けて、部分積分をして、随伴方程式を求めてから離散化して随伴モデルを作る。
- 支配方程式系を離散化し、その接線型モデルを作り、接線型モデルを元に随伴モデルを作成する。
ここでは、これらとは異なり、離散化された順行モデルのプログラムの各行から随伴モデルを作成する。
順行プログラムの一行は \[ Y = G(X, \dots) \] と表される。 \(Y\)は右辺により再定義される従属変数である。 次のステップの値など中間変数を\(Z\)で表すと、順行モデルの典型的な二行は \[ \begin{aligned} Y &= G(X, \dots) \\ Z &= F(X, Y, \dots) \end{aligned} \] となる。 この例におけるLagrange函数は次のように書ける。
\[ L = \dots -\lambda_Y(Y - G(X, \dots)) - \lambda_Z(Z - F(X, Y, \dots)) + \dots \tag{5}\]
(Equation 2)のように、未定乗数は状態\(z_k\)の一つに対して一つずつ用意する。 Lagrange函数を明示的に作る必要はないが、コードに基づくLagrange函数とLagrange函数 (Equation 2) との対応をつけるために、その形を示した。
\(Y\)についての微分が0となることから
\[ \frac{\partial L}{\partial Y} = -\lambda_Y + \lambda_Z\frac{\partial F}{\partial Y} + \dots = 0 \] つまり
\[ \lambda_Y = \lambda_Z\frac{\partial F}{\partial Y} + \dots \] となる。 これらの項は、右辺に\(Y\)が現れるところで計算し積算する必要がある。
\[ \lambda_Y = \lambda_Y + \lambda_Z\frac{\partial F}{\partial Y} \tag{6}\] Lagrangeの未定乗数は積算する前に、0に初期化する必要があることに注意。
同様に、コスト函数の\(X\)に関する微分はLagrange函数 \(L\) の \(X\) についての偏微分であり、 これを \(X\) についての未定乗数 \(\lambda_X\) と呼ぶと
\[ \lambda_X = \lambda_X + \lambda_Z\frac{\partial F}{\partial X} \tag{7}\]
が得られる。 つまり、Equation 7 は変数が従属変数である Equation 6 と同型なので、同一の方法を適用すればよい。
それでは、この方法で随伴モデルを作成する。
<- function(dt, a, x1, y1, nmax) {
forward <- rep(0, nmax)
x <- rep(0, nmax)
y 1] <- x1
x[1] <- y1
y[for (n in 1:(nmax-1)) {
+1] <- x[n] + dt * (x[n] * (a[1] + a[2] * x[n] + a[3] * y[n]))
x[n+1] <- y[n] + dt * (y[n] * (a[4] + a[5] * y[n] + a[6] * x[n]))
y[n
}list(x = x, y = y)
}
<- function(dt, a, x, y, xo, yo, tobs) {
adjoint <- length(x)
nmax <- rep(0, length(a))
aa <- rep(0, nmax)
ax <- rep(0, nmax)
ay for (n in (nmax-1):1) {
if (n %in% tobs) {
<- ax[n] + (x[n] - xo[n])
ax[n] <- ay[n] + (y[n] - yo[n])
ay[n]
}6] <- aa[6] + dt * x[n] * y[n] * ay[n+1]
aa[5] <- aa[5] + dt * y[n] * y[n] * ay[n+1]
aa[4] <- aa[4] + dt * y[n] * ay[n+1]
aa[<- ax[n] + dt * a[6] * y[n] * ay[n+1]
ax[n] <- ay[n] + dt * a[5] * y[n] * ay[n+1]
ay[n] <- ay[n] + (1 + dt * (a[4] + a[5] * y[n] + a[6] * x[n])) * ay[n+1]
ay[n] 3] <- aa[3] + dt * y[n] * x[n] * ax[n+1]
aa[2] <- aa[2] + dt * x[n] * x[n] * ax[n+1]
aa[1] <- aa[1] + dt * x[n] * ax[n+1]
aa[<- ay[n] + dt * a[3] * x[n] * ax[n+1]
ay[n] <- ax[n] + dt * a[2] * x[n] * ax[n+1]
ax[n] <- ax[n] + (1 + dt * (a[1] + a[2] * x[n] + a[3] * y[n])) * ax[n+1]
ax[n] # cat(n, ":", aa, ax[n], ay[n], "\n")
}# cat("Final adjoint state:", aa, "\n")
c(aa, ax[1], ay[1])
}
同化実験
まずは、順行モデルを実行して、真値を作成する。
<- 501
nmax <- 0.001
dt <- c(4, -2, -4, -6, 2, 4)
at <- 1
x1 <- 1
y1 <- seq(2, nmax, by = 2)
tobs <- forward(dt, at, x1, y1, nmax)
forward.result <- forward.result$x
xt <- forward.result$y yt
真値から観測を作成する。
<- xt
xo <- yt yo
<- function(xf, yf, xo, yo) {
calc.cost 0.5 * (sum((xf- xo)^2 + (yf - yo)^2))
}
観測値を同化して順行モデルのパラメタと初期値を推定する。 同化するための準備として、制御変数、履歴を格納するリスト、コスト函数と勾配を定義する。 コスト函数と勾配の評価に必要な引数は、optim()
の可変引数 ...
で受け取る。 履歴は、<<-
を使ってグローバル変数に代入する。
<- c(1, 0, 0, -1, 0, 0)
a <- 2
x1 <- 2
y1 <- c(a, x1, y1)
par <- seq(2, nmax, by = 2)
tobs <- list(maxit = 100, reltol = 1e-5)
cntl
<- list(cost = numeric(0), gnorm = numeric(0), par = vector(length=0))
hist
<- function(par, dt, nmax, xo, yo, tobs) {
fn <- forward(dt, par[1:6], par[7], par[8], nmax)
xyf <- calc.cost(xyf$x[tobs], xyf$y[tobs], xo[tobs], yo[tobs])
cost
cost
}
<- function(par, dt, nmax, xo, yo, tobs){
gr <- forward(dt, par[1:6], par[7], par[8], nmax)
xyf $par <<- rbind(hist$par, par)
hist<- calc.cost(xyf$x[tobs], xyf$y[tobs], xo[tobs], yo[tobs])
cost $cost <<- c(hist$cost, cost)
hist<- adjoint(dt, par[1:6], xyf$x, xyf$y, xo, yo, tobs)
grad $gnorm <<- c(hist$gnorm, sqrt(sum(grad^2)))
hist
grad }
Rには組込の函数 optim()
があるので、これを最適化に使う。 BFGS法を用いると、初期値もパラメタもうまく推定できる。
<- "BFGS"
method <- optim(par, fn, gr, method = method, control = cntl, dt, nmax, xo, yo, tobs) res
plot(log10(hist$cost), type = "l", lwd = 2,
main = paste("cost", method), xlab = "Iteration", ylab = "log10 J",
cex.main = 1.5, cex.lab = 1.5, cex.axis = 1.5)
plot(log10(hist$gnorm), type = "l", lwd = 2,
main = paste("gnorm", method), xlab = "Iteration", ylab = "log10|g|",
cex.main = 1.5, cex.lab = 1.5, cex.axis = 1.5)
plot(hist$par[, 7], ylim = c(0, 2), type = "l", lwd = 2, xlab = "Iteration", ylab = "Initial conditions",
main = paste("init", method), cex.main = 1.5, cex.lab = 1.5, cex.axis = 1.5)
lines(hist$par[, 8], lwd = 2, col = "red")
legend("topright", legend = c("x1", "y1"),
col = c("black", "red"), lwd = 2, cex = 1.5)
plot(hist$par[, 1], ylim = c(-10, 10), type = "l", lwd = 2,
main = paste("prey parameters", method), xlab = "Iteration", ylab = "x parameters",
cex.main = 1.5, cex.lab = 1.5, cex.axis = 1.5)
lines(hist$par[, 2], lwd = 2, col = "red")
lines(hist$par[, 3], lwd = 2, col = "blue")
legend("topleft", legend = c("a1", "a2", "a3"),
col = c("black", "red", "blue"), lwd = 2, cex = 1)
plot(hist$par[, 4], ylim = c(-10, 10), type = "l", lwd = 2,
main = paste("predator parameters", method), xlab = "Iteration", ylab = "y parameters",
cex.main = 1.5, cex.lab = 1.5, cex.axis = 1.5)
lines(hist$par[, 5], lwd = 2, col = "red")
lines(hist$par[, 6], lwd = 2, col = "blue")
legend("topleft", legend = c("a4", "a5", "a6"),
col = c("black", "red", "blue"), lwd = 2, cex = 1)
共軛勾配法は収束が遅い。
<- list(cost = numeric(0), gnorm = numeric(0), par = vector(length=0))
hist
<- list(maxit = 200, reltol = 1e-5)
cntl <- "CG"
method <- optim(par, fn, gr, method = method, control = cntl, dt, nmax, xo, yo, tobs) res
plot(log10(hist$cost), type = "l", lwd = 2,
main = paste("cost", method), xlab = "Iteration", ylab = "log10 J",
cex.main = 1.5, cex.lab = 1.5, cex.axis = 1.5)
plot(log10(hist$gnorm), type = "l", lwd = 2,
main = paste("gnorm", method), xlab = "Iteration", ylab = "log10|g|",
cex.main = 1.5, cex.lab = 1.5, cex.axis = 1.5)
plot(hist$par[, 7], ylim = c(0, 2), type = "l", lwd = 2,
main = paste("init", method), xlab = "Iteration", ylab = "Initial conditions",
cex.main = 1.5, cex.lab = 1.5, cex.axis = 1.5)
lines(hist$par[, 8], lwd = 2, col = "red")
legend("topright", legend = c("x1", "y1"),
col = c("black", "red"), lwd = 2, cex = 1.5)
plot(hist$par[, 1], ylim = c(-10, 10), type = "l", lwd = 2,
main = paste("prey parameters", method), xlab = "Iteration", ylab = "x parameters",
cex.main = 1.5, cex.lab = 1.5, cex.axis = 1.5)
lines(hist$par[, 2], lwd = 2, col = "red")
lines(hist$par[, 3], lwd = 2, col = "blue")
legend("topleft", legend = c("a1", "a2", "a3"),
col = c("black", "red", "blue"), lwd = 2, cex = 1)
plot(hist$par[, 4], ylim = c(-10, 10), type = "l", lwd = 2,
main = paste("predator parameters", method), xlab = "Iteration", ylab = "y parameters",
cex.main = 1.5, cex.lab = 1.5, cex.axis = 1.5)
lines(hist$par[, 5], lwd = 2, col = "red")
lines(hist$par[, 6], lwd = 2, col = "blue")
legend("topleft", legend = c("a4", "a5", "a6"),
col = c("black", "red", "blue"), lwd = 2, cex = 1)