jiku log

データサイエンスの核心を掴む : 学びと発見の記録

読書メモ一覧

馬場ベイズ本(「ベイズ統計モデリングによるデータ分析入門」)をNumPyroで実装 読書メモ一覧

はじめに 私は,製造業のデータサイエンス組織で管理職をしている。業務でデータ分析プロジェクトを推進する立場にいるが,推定結果の不確実性を扱うことができるベイズ統計学は,意思決定において有用であると考えられる。 ベイズ統計学や統計モデリングに…

「ゼロからわかるDifyの教科書」に基づく製造業におけるDify活用の考察

はじめに 私は,製造業のデータサイエンス組織で管理職をしている。近年の生成AIの発展を受けて,生成AIを活用した業務改善やサービス開発に向けた活動が活発化するとともに,自ら生成AIを活用したアプリを利用したいという声が事業部門からも高まっている。…

「実践的データ基盤への処方箋」読書メモ一覧

はじめに 私は,製造業のデータサイエンス組織に所属している。企業内において,データを用いて継続的に事業価値を生み出していくためには,データ分析のPoCをしやすくしたり,データ分析プログラムを業務に組込みやすくするための仕組みが必要になる。継続…

「データサイエンスリーダーのキャリアガイド」読書メモ一覧

はじめに 私は,製造業のデータサイエンス組織において課長を任されている。課長の仕事は,メンバーの業務を支援するだけでなく,評価や人財育成,メンバーが働きやすくするための組織内ルール作りなどが含まれている。 私自身データ分析の仕事について十数…

「確率的機械学習 入門編II」読書メモ一覧

はじめに 製造業のデータサイエンス実務では,統計的手法や機械学習・深層学習モデルを適切に組合わせて,現場で再現性の高い意思決定を支えることが求められる。とりわけ近年は,深層学習の発展により手法の多様化が進んでいるため,機械学習・深層学習を体…

「確率的機械学習 入門編I」読書メモ一覧

はじめに 製造業のデータサイエンス実務では,統計的手法や機械学習・深層学習モデルを適切に組合わせて,現場で再現性の高い意思決定を支えることが求められる。とりわけ近年は,深層学習の発展により手法の多様化が進んでいるため,機械学習・深層学習を体…

「Data-centric AI入門」読書メモ一覧

はじめに 近年AI・データ活用の成果は,アルゴリズムの高度化よりも,データ品質とデータ運用プロセスの整備によって左右されることが明確になりつつある。特に製造業においては,センサ情報,設備ログ,検査データなど,多種多様なデータが日常的に生成され…

「先輩データサイエンティストからの指南書」読書メモ一覧

はじめに 私は製造業のデータサイエンスチームを率いる立場として,メンバーの育成やプロジェクトの推進に日々取り組んでいる。製造業におけるデータ分析は,単発のモデル構築で終わるのではなく,長期運用・システム連携・品質保証までつなげることが重要で…

「入門確率過程」 読書メモ一覧

はじめに 私は製造業のデータサイエンティストであり,製造現場における品質異常検知,設備劣化予測,センサデータの時系列解析などは重要なテーマである。私はこれらのテーマの基礎である数理統計学を学ぶ一環として統計検定準1級・1級を取得し,数理統計学…

「自然科学の統計学」 読書メモ一覧

はじめに 私は統計検定1級を受験する際に,数理統計学の学習にあたって竹村彰通「現代数理統計学」や久保川達也「現代数理統計学の基礎」といった解説の丁寧な参考書を読み進めていた。しかしそれらはときどき難易度が高いことがあり,理解に時間を要する箇…

「スモールデータ解析と機械学習」 読書メモ一覧

はじめに 製造業の現場ではAIや機械学習の活用が注目されているが,実際に私たちが扱うデータは必ずしも「ビッグデータ」とは限らない。むしろ,設備の試験結果や品質検査の履歴,特殊な条件での実験データなど,サンプル数が数十〜数百件といった「スモール…

「増補改訂版 ベイズ最適化 ―適応的実験計画の基礎と実践―」 読書メモ一覧

はじめに 製造業において,生産工程の改善や稼働中のプラントの異常診断など,データサイエンスの重要性が増している。ただ製造業の場合,必ずしもデータが豊富に取れるとは限らず,データの取得についても配慮する必要がある。 効果的なデータ分析に向けて…

「Pythonで学ぶ衛星データ解析基礎」読書メモ一覧

はじめに 私が所属する製造業のデータサイエンス部門は,製造業の競争力強化と持続可能な社会の実現を目指し,データ駆動型のアプローチを推進している。環境規制の厳格化やグローバルなサステナビリティ要求の高まりを受けて,衛星データを活用した環境変化…

「ビジネス課題を解決する技術」読書メモ一覧

はじめに 私は製造業のデータサイエンス部門のリーダーとして,生産ラインの向上や,業務改善といったビジネス課題に取り組んでいる。これらの課題は,データに基づく意思決定を通じて解決可能であるが,日々発生する多様な課題に対してチーム一丸となって解…

「コピュラ理論の基礎」読書メモ一覧

はじめに 私は製造業のデータ分析部門に所属する立場から,江村 剛志 著「コピュラ理論の基礎」を読むことにした。 この理由は,製造業におけるデータ分析において,複数の変数間の複雑な依存関係を精緻にモデル化する必要性が高まっているためである。特に…

「PythonでつくるWebアプリのつくり方」読書メモ一覧

はじめに クジラ飛行机、 杉山 陽一、遠藤 俊輔 著「PythonでつくるWebアプリのつくり方」を読み,Pythonを使ったWebアプリ開発の基礎を学ぶことにした。 製造業におけるデータ分析プロジェクトを行なった後に,業務の中にデータ分析を組み込んでいくために…

「効果検証入門」 読書メモ一覧

はじめに 製造業におけるデータ分析業務では,新たな生産手法の導入,品質改善施策,保全スケジュールの最適化など,さまざまな取組みに対して「本当に効果があったのか?」ということを検証する必要がある。しかし,実際の業務データは施策の対象者やタイミ…

「続々 制御工学のこころ」 読書メモ一覧

はじめに 製造業のデータサイエンス部門で働く私は,統計検定1級を取得しており,数理統計の基本は一通り学んできた。業務では時系列データを扱うことが多く,「システム同定」という技術にも関心を持っているが,制御工学にはこれまでほとんど触れてこなか…

「Pythonではじめる時系列分析入門」 読書メモ一覧

はじめに 製造業におけるデータ分析において,時系列分析は重要かつ頻出課題の1つである。たとえば,センサデータを用いた異常診断・劣化予測や,在庫データを用いた需要予測などが挙げられる。時系列分析には,時系列データ特有の問題点や分析手法があるが…

「機械学習を解釈する技術」 読書メモ一覧

はじめに 分析業務を進めていく中で,上司やお客さまから「このAIの判断は正しいのか?」聞かれたことはないだろうか? 製造業の業務で機械学習モデルを運用する際に,「なぜ今回の結果が得られたのか」ということを説明する必要があるシーンがある。たとえ…

「データのつながりを活かす技術」 読書メモ一覧

はじめに センサデータをはじめとしたテーブルデータ,テキストデータ,画像データなどデータには様々な形式がある。近年着目されているネットワーク/グラフデータは,これらとは異なる形式であり,分析方法も独特なものである。製造業においては,センサデ…

「ベイズ最適化 ―適応的実験計画の基礎と実践―」 読書メモ一覧

はじめに 製造業において,生産工程の改善や稼働中のプラントの異常診断など,データサイエンスの重要性が増している。ただ製造業の場合,必ずしもデータが豊富に取れるとは限らず,データの取得についても配慮する必要がある。 効果的なデータ分析に向けて…

「RAG・AIエージェント[実践]入門」 読書メモ一覧

はじめに 業務でLLMを活用していくためには,検索拡張生成(RAG)やAIエージェントといった技術が必要になってくると考えられる。これらの技術の基礎知識と実践経験を積むために,西見公宏・吉田真吾・大嶋勇樹 著「LangChainとLangGraphによるRAG・AIエージェ…

「データ解析のための統計モデリング入門」 読書メモ一覧

はじめに 統計検定の学習を通じて,数理統計学における基礎的な考え方に触れることができた。次のステップとして,より実践的な内容の書籍を探していた。久保 拓弥 著「データ解析のための統計モデリング入門 一般化線形モデル・階層ベイズモデル・MCMC」は…

「Pythonではじめるベイズ機械学習入門」読書メモ一覧

はじめに 久保拓弥 著 「データ解析のための統計モデリング入門 ―一般化線形モデル・階層ベイズモデル・MCMC―」を読んだときに,ベイズモデルや階層ベイズモデルに触れた。本書ではコードがRで書かれていたので,ChatGPTに相談しながらCmdStanPyで実装した。…

「大規模言語モデル入門」 読書メモ一覧

はじめに 製造業においても,自然言語処理は重要な技術テーマのひとつである。週報などのメール,社内規定などのルール,安全記録や検査記録など,日々多くの文章が業務上で現れる。これらのテキストデータに対して自然言語処理技術を適用して業務効率化を実…