jiku log

データサイエンスの核心を掴む : 学びと発見の記録

「Pythonで学ぶ衛星データ解析基礎」を読む ~第4章 衛星データ解析手法別演習[解析編] ④農業における事例~

はじめに

宮﨑浩之 監修「Pythonで学ぶ衛星データ解析基礎―環境変化を定量的に把握しよう」は,Pythonを用いた衛星データ解析の基礎から実践までを網羅的に解説しており,製造業の競争力強化と持続可能な社会の実現にとって重要な,環境モニタリングやインフラ管理への応用に資する知識を提供すると考えている。本書を読むことを通じて,衛星データ解析を基礎を学ぶ。

本記事は,「第4章 衛星データ解析手法別演習[解析編]」における,農業分野における衛星データ利用事例に関する読書メモである。

4-4 農業分野における衛星データ利用事例

水稲収量の予測」の全体像

背景

適切や農業経営や生産性向上のためには,作物の状況を正しく把握して判断することが重要である。
また農林水産省では,ICTを活用した新たな農林水産統計調査の効率化を目指し,気象データと衛星データを用いた水稲収量の予測に取組んでおり,現地調査にかかる人員の効率化に取り組んでいる。

目的

2007年から2017年までのデータを解析し,水稲の収量を予測する式を作成する。この予測式の検証は,2018年のデータを用いる。

分析対象

茨城県全体を分析対象とする。

分析の流れ

今回の分析では,水稲の収量を予測する式を作る。回帰分析を行なうので,説明変数と目的変数を設定する必要がある。目的変数は水稲の収量であるが,説明変数にはNDVIの精度を向上させた植生の指標であるEVIを用いる。

分析の流れは以下のようになる。

  1. 分析に用いるデータをダウンロードする
    1. 植生のデータとして,MODISのEVIデータを取得する。
    2. 水田域のEVIに限定するため,農地の区画情報である「筆ポリゴン」のデータを取得する。
  2. EVIと終了の単回帰分析を行ない,予測式を構築する。
サンプルコード

今回は,以下のサンプルコードを参照した。
github.com

水稲収量の予測」の詳細

EVIデータの取得

データは,米国の地球観測衛星であるTerraとAquaに搭載されている可視・赤外域の放射計MODISのデータのうち,EVIのデータを用いる。

EVIは,NDVIの精度を向上させた植生指標である。EVIは,

  •  G : ゲイン係数
  •  C1, C2 : エアロゾル補正係数
  •  L : 背面効果補正係数

を用いて,以下のように定義される。


 \begin{align}
EVI = \frac{ G \times (IR - Red) }{ (IR + C1 \times Red) - (C2 \times Blue + L) } \\ \\
\end{align}
で計算される。MODISのEVIプロダクトの場合, G=2.5, C1=6, C2=7.5, L=1である。

データのダウンロードにはpyModisを用いて,2007年~2018年のデータを取得する。

2007年のEVI平均値画像を可視化すると以下のようになる。

2007年のEVI平均値画像
農地の区画情報の取得

先ほど入手したEVIデータは,水稲以外に畑や森林の植生も含まれている。水田の植生に限定するために,農林水産省が提供している農地の区画情報である「筆ポリゴン」を用いる。

筆ポリゴンにおける農地情報を用いてEVIを切り抜くと,下図のようになる。

「筆ポリゴンを用いてEVI画像を切り抜き,EVIの平均値を取得する」という手順を2007年から2018年まで繰り返し,時系列に並べると下図のようになる。

収量データの取得

総務省統計局が運営するポータルサイト(e-Stat)における作物統計調査のデータから,水稲の収量データを取得する。

EVIを説明変数,収量を目的変数として,2007年~2017年のデータを用いて単回帰を行なった結果が下図のようになる。

収量 yの予測式は, y= 0.04EVI + 403.68となることが確認できた。

まとめと感想

今回は,「第4章 衛星データ解析手法別演習[解析編]」における,農業分野における衛星データ利用事例についてまとめた。

サンプルコードによると,農林水産省では複数の気象データを変数とした多変量解析による予測式の作成に取り組んでいるとのことだった。農業分野では,衛星データだけでなく農地のポリゴン情報も整備されているので,様々なデータが揃っていると考えられる。

今回の分析では,最終的に行なった分析が,比較的取組みやすい単回帰分析であった。しかしデータを揃えるまでに,衛星のデータや農地のポリゴンデータ,収量の統計データなど,様々な情報を組合わせる必要があった。衛星のデータは,あくまで地上を観測した時に得られたデータなので,データを取得した際に地上で何が起きていたかという情報も組合わせることで,より示唆に富んだ分析結果が得られると考えられる。しかしそのためには,多様なデータソースの存在やそれらへのアクセス方法,前処理の方法などを良く理解する必要があるので,単にデータサイエンスの力だけでなく,データを取得したり加工したりするデータエンジニアリングの能力も必要な分野だと痛感した。

本記事を最後まで読んでくださり,どうもありがとうございました。