jiku log

データサイエンスの核心を掴む : 学びと発見の記録

「データのつながりを活かす技術」を読む ~第7章 さまざまな分野における実例 ②金融分野~

はじめに

データのつながりに着目した新たなデータ分析の手法を学ぶために,黒木裕鷹・保坂大樹 著 「データのつながりを活かす技術〜ネットワーク/グラフデータの機械学習から得られる新視点」を読むことにした。

本記事は,「第7章 さまざまな分野における実例」における,金融分野におけるネットワーク分析に関する読書メモである。

  • 本書の紹介ページ

gihyo.jp

7.2 金融分野におけるネットワーク分析

本節では,金融分野におけるネットワーク分析について説明している。

金融市場は非常に複雑で,多様な主体が絶えず相互に影響を与え合っている。この市場の複雑性を反映性手,ネットワーク分析ではさまざまなノードやエッジが登場する。

ノードとして考慮されやすいもの

金融分野において,ノードとして考慮されやすいものには以下のようなものが挙げられる。

  • 企業
    • 企業や株式などの金融資産は金融ネットワークの基本的なノードの1つである。
    • 創業や廃業のほか,合併・買収や取引の変化などによってネットワーク全体の構造が変化し,新たなノードが加わることがある。
  • 金融機関
    • 銀行,保険会社,投資ファンド,証券会社などの金融機関は,資金の流れを仲介し,市場に流動性を提供する役割を担っている。
    • 金融機関同士のつながりを分析する場合もあれば,特定の金融機関を通じた資金の流入・流出を追跡することで異種ネットワークを構築することもある。
  • 市場やセグメント
    • 株式市場,債券市場,外国為替市場など,各市場やセグメントも1つのノードとして扱うことができる。
  • 人物
    • 投資家,経営者,債務者など,個々の人物も金融ネットワークにおけるノードになり得る。

エッジとして考慮されやすいもの

金融分野において,エッジとして考慮されやすいものには以下のようなものが挙げられる。

  • 取引関係
    • 金融機関間や企業間で行なわれる資金や商品の取引関係は,ネットワーク分析において代表的なエッジとなる。
    • 資金だけでなく,材料や配送の流れを追跡することで,サプライチェーンネットワークを構築することが可能である。
  • 信用関係
    • 貸付やローン契約,資本関係などをネットワーク化することで,市場全体の信用リスクや流動性に関する洞察が得られる。
  • 情報の流れ
    • 労働者の転職や共同研究,取締役の兼任などを通じて,企業間で情報が共有される。このような情報のやり取りもネットワークにおけるエッジになり得る。
  • 時系列の連動・類似性
    • 資産間の価格変動の相関を分析することは,市場のリスク管理ポートフォリオの最適化に欠かせないものである。
    • 時系列の相関をエッジとして捉える場合には,資産間ネットワークは完全グラフになる。

トランザクションデータの分析

背景と課題

クレジットカードの取引ログには,店舗や顧客,貸し手,銀行など多種多様な主体が存在し,取引ごとに日時や取引額が記録される。こうしたトランザクションデータからネットワークを構築すると,通常はノード数やエッジ数が非常に多い疎な異種ネットワークが得られる。これらの情報を効果的に扱っていくことが課題である。

アプローチ方法

アメリカの大手クレジットカード会社であるCapital Oneの取組みでは,決済のトランザクションデータを活用し,効率的に加盟店(クレジットカード会社と契約している店舗)やブランド(チェーン展開している複数の加盟店をまとめたもの)のノード埋め込みを行なう方法を提案している。埋め込みベクトルを得るには,DeepWalkの近似を用いている。
また得られたベクトルは不正利用の検知などに利用できる。

ノード埋め込みを行なう際には,決済データそのものを扱うとデータの規模が大きくなりすぎるため,任意の時間幅 tをもったスライド窓を用いてデータを区切り,加盟店ペアやブランドペアを作成して,Skip-gramモデルで学習する。

その他の事例

本書ではその他の事例として,

  • 取締役兼任ネットワークの分析
  • 資産価格の総冠王増のネットワーク化と分析
  • リターン予測のためのさまざまなネットワークの作成

などが紹介されていた。

まとめと感想

今回は,「第7章 さまざまな分野における実例」における,金融分野におけるネットワーク分析についてまとめた。

金融分野の分析は普段馴染みが無いので,事例についてはあまりピンとこなかったが,金融データに対してネットワーク分析を適用するために,何をノードやエッジとみなすか,という観点は参考になった。本書の特徴として,ネットワークではないデータからネットワークデータを取り出すための観点が説明されているが,普段扱わないデータにおける観点も参考になると感じた。

事例については様々紹介されていたが,トランザクションデータの分析において大規模なデータからノード埋め込みを作成するための近似手法について説明がされていた。別の種類のデータにおいても参考になり得るので,ネットワークデータが大きくなりすぎる場合には参考にしたい。


本記事を最後まで読んでくださり,どうもありがとうございました。