jiku log

JTCのデータサイエンス中間管理職の学び

「AI・データ分析プロジェクトのすべて」 #書籍紹介

「AI・データ分析プロジェクトのすべて」の紹介

本書は,AI・データ分析業務の進め方において,特に「ビジネス力」に焦点を当ててデータ分析プロジェクトの進め方を説明している。
データ分析にかかわる仕事として,データ分析業務をサービスとしている人や,AIのプロダクトを開発している人,ユーザ企業内のデータ分析組織で働いている人など様々な方がいると思うが,それぞれの立場にとって参考となる話題が書かれていたので紹介したい。

gihyo.jp

本書を読もうとした理由

私は,データ分析をサービスとして提供する企業でキャリアをスタートし,その後日本の製造業(=ユーザ企業)に転職して企業内のデータサイエンティストとしてキャリアを積んできた。現在では,データ分析を担当する部署のリーダーをしている。AI・データ分析プロジェクトや,AI・データ分析に関する研究開発,人材育成などに取り組んできたが,これらは我流で行なっていることが多かった。
現在では,社内FAや中途採用のメンバーも増え,ある程度仕事のやり方を標準化していかないと,うまく回っていかないと考えて,改めてAI・データ分析のプロジェクトの進め方を学ぼうと考え,本書を読むことにした。

本書の構成

本書の構成は以下の通りである。

第1部 プロジェクトの準備
 第1章 AI・データ分析業界の概要
 第2章 データサイエンティストのキャリアと雇用
 第3章 AI・データサイエンティストの実務と情報収集

第2部 プロジェクトの入口
 第4章 社内案件の獲得と外部リソースの検討
 第5章 データのリスクマネジメントと契約

第3部 プロジェクトの実行
 第6章 AI・データ分析プロジェクトの起ち上げと管理
 第7章 データの種類と分析手法の検討
 第8章 分析結果の評価と改善
 第9章 レポーティングとBI
 第10章 データ分析基盤の構築と運用

第4部 プロジェクトの出口
 第11章 プロジェクトのバリューと継続性
 第12章 業界事例

参考になった点

第1部 プロジェクトの準備

PoCに関する話題

本格的なAIシステム開発に入る前に,PoC(Proof of Concepts : 概念検証)を行なうことが多い。これはAIを使ってやってみたい業務がうまくいきそうか試すことである。本書では,PoC開始までのチェックポイントが説明されており,参考になった。ユーザ企業だと,AIサービスを提供している企業から提案を受けてPoCをすることがあると思うが,課題設定や費用対効果に関する論理立てがきちんとしていないと発注側・受注側のお互いが不幸になる。

働く現場に関する話題

先に述べたように,一口にデータサイエンティストといっても,働く場所によって働き方が変わってくる。分析ツール開発会社や事業会社,受託分析会社など様々なパターンにおける働き方や生存戦略を説明している点が,これから職場選びをするデータサイエンティストにとって参考になると感じた。

なお私は,受託分析会社と事業会社の両方を経験している。事業会社のAIエンジニアは,様々な規模の分析案件に取り組むことになる一方で,データ分析を請負う会社の立場だと,受注に行くまでの提案活動において確度の高そうな案件が選ばれる。そのため,味見的なプロジェクトもやってみたい,という人ににとっては事業会社の方がやりやすいかもしれない。

データ分析部署での働き方

ユーザ企業でデータ分析を始めたい場合の働き方について,データ分析部署がある場合とない場合での仕事の始め方が説明されていた。

なお私見だが,データ分析部署がある企業でも,そこに所属できる保証は無い。そのため入社する際には,社内FA制度などがある企業を選ぶのもポイントかもしれない。

第2部 プロジェクトの入口

AI開発契約に関する話題

開発契約の種類として,請負契約と委任契約があることが説明されていた。

私見だが,ユーザ企業が委任契約をする場合,検証結果を小まめに残してもらうように契約することが重要だと考える。委任契約の場合,成果物の提出がないことがあるため,定例会を設けてその会議の資料と議事録を残す,きちんとレビューを行ない足りないデータや情報は出してもらう,といった取り組みが必要になる。ユーザ企業は,自分たちの技術的・予算的に足りないから外部企業にお願いするのであって,丸投げはせず,結果には責任を負うべきだ。

第3部 プロジェクトの実行

データ分析基盤の話題

データ分析を定常的な業務に組込もうとすると,データを管理したり分析したりするためのデータ分析基盤が必要になる。データ分析基盤のうち,データをためる分析用データベースについて,業務用データベースとの比較がなされていた。

ユーザ企業の場合,既存の業務を動かすための仕組みがあるものの,それが分析に適したインターフェイスをしているとは限らない。データ分析用に,業務データをコピーして管理するための基盤を準備することが重要になる。

本書に対する感想とまとめ

データ分析を仕事としている人は,数理統計学機械学習といった手法や,ITシステムなどに興味を持っている人が多いと思うが,実際に業務で価値を生み出すためには,契約周りやプロジェクト業務の進め方を理解しておく必要がある。価値を生み出せるデータサイエンティストになるために,本書の内容をしっかり実践してきたい。