2025年版 生成AI・大規模言語モデルを学ぶための30冊(必須5冊+定番15冊+差をつける10冊) #ChatGPT – Qiita

機械学習についての推奨・必読本リストを毎年更新していますが(2025年版も同時更新しました!)

生成AI関連は別立てとすべく、以前書いた

この記事をベースに書籍に関して大幅増量。「2025年版 生成AI・大規模言語モデルを学ぶための30冊」としてお届けいたします。

  • 現在R&D部門で技術調査が主業務で開発からは離れております。また私の関心があまり開発の方にないので、Dify、エージェント、LangChain、MCPなどは非常に手薄です
  • また、主にテキスト系生成AI、大規模言語モデルがメインで、画像系、音声系は補足的です
  • あくまでもIT企業のエンジニア視点です。アカデミア視点ではないのでご容赦

読む順番のフロー図は悩みましたしまだ悩んでいます。
大体難易度順のフローにしていますが、この本は飛ばしてもいいし、順番が逆の方が人によってはわかりやすいなどもあるかと。あくまでも便宜上の目安で。

カテゴリ 必須 定番 差をつける
ユーザ系 1 2 2 5
社内導入系 0 1 0 1
理論・実装系 4 9 6 19
構築系 0 3 2 5
5 15 10 30

生成AIの理屈はいいからまず、まず使ってみましょう。そのためにはプロンプトの最低限のところから、工夫した使い方までを知りましょう、的なところです。

高度なプロンプトエンジニアリングは「開発系」の方へ。

類書がたくさん出ていますが、すぐ消えそうなパンフレット的なものが多く、要点を整理した本格的な本のみ。1冊ですが。

書名 内容
実践 生成AIの教科書
  • 日立さんにより企業に生成AIを導入するにはのノウハウと注意点など
  • 類書は単に機能紹介がメインですけれど、企業で使うには組織をどうするか倫理やセキュリティはとたくさん気になりますがそこらへんまでカバーしています

エンジニア視点で押さえておいた方が良い理論と、実装の本。実装もTransformersでモデルを扱うなどが中心。
冒頭に申した通り、LangChainやMCPでがっつりシステムを組むなどは私が経験がないので手薄です。

深層学習

深層学習も前提知識と必要ですが別立てとしました。

の「2.3.3. 機械学習アルゴリズム-2(深層学習)の4冊」など

自然言語処理

一部、「機械学習・データ分析の必須10冊+ガチ90冊+Next5冊」のリストと被りますが改めて。

生成AI

「生成AI」と「LLM(大規模言語モデル)」が世の中でかなりごっちゃに使われています。自分なりの整理を別記事に書きました。

ざっくり言いますと

  • AI
    • 予測・識別AI
    • 生成AI
  • LLM(大規模言語モデル)
    • Encoder系
    • Encoder・Decoder系
    • Decoder系
  • 別途画像や音声の研究

のような研究が進んでいましたが、深層学習を用いた深層生成学習が驚異的な進化を遂げ、それらをまるっと「生成AI」と呼ぶようになっている。LLMの中でも深層生成学習を行うDecoder系で結局分類や要約・翻訳もできるようになっている。画像や音声の生成AIも進化して、Decoder系の深層生成学習つまり生成AIが隆盛を極めている。

みたいな中でざっくり生成AI≒深層生成学習についての本です!

LLM(大規模言語モデル)

前の節で説明した通り、LLMが全て生成AIではないですが、事実上生成AIの中でのLLMの本。

書名 内容
大規模言語モデルは新たな知能か ChatGPTが変えた世界
  • 大規模言語モデルがこんな流行るとは!
  • 雨後の筍のように便乗本が出ていますがほとんどは消えます。この記事を読むような方は本質を
  • 難しいのですが、PFNの岡野原さんが分かりやすい解説書を出してくれました
大規模言語モデル入門
  • transformersライブラリを用いてコーディングしながら大規模言語モデルの理論と実装の両方を体験できる嬉しい本
  • 基本Google Colaboratoryの無料枠で実行可能
  • 『IT Text 自然言語処理の基礎』下記のような目次で、大規模言語モデルを一通り学べる

    第1章はじめに(transformersを使って自然言語処理を解いてみよう)
    第2章 Transformer
    第3章 大規模言語モデルの基礎
    第4章大規模言語モデルの進展
    第5章 大規模言語モデルのファインチューニング
    第6章 固有表現認識
    第7章 要約生成
    第8章 文埋め込み
    第9章 質問応答

大規模言語モデル入門Ⅱ〜生成型LLMの実装と評価
  • 改訂版ではなく続編
  • IIになるとGoogle Colaboratoryの無料枠では無理で有料枠が必要な処理が多め
  • 第10章 性能評価
    第11章 指示チューニング
    第12章 選好チューニング
    第13章 RAG
    第14章 分散並列学習

直感 LLM ハンズオンで動かして学ぶ大規模言語モデル入門
  • 概ね「大規模言語モデル入門I, II」と被っています
  • 本書の方が新しいぶんライブラリの新しいバージョンに対応していいかも

プロンプトエンジニアリング

ユーザ系「プロンプト」を越えて、もっと本格的なプロンプトエンジニアリングや、コーディングのためのプロンプト、あるいはRAGやエージェントなどの構築を見越したプロンプトと他ツールの連携APIなどにも踏み込む場合の本です。

画像生成

業務でほとんど関係ないので、知見薄ですが、画像に特化した内容も最低限は知っておこうと思いまして。

冒頭に記載の通り業務上扱っておらず、関心も低めなため手薄です。ここが一番類書が多いですかね。
類書いくつか読んでますが、最低限の知識は持っておこうという場合に外せないだろうなという本らです。ご容赦。

アプリ開発プラットフォーム

RAG・エージェント

書名 内容
LangChainとLangGraphによるRAG・AIエージェント[実践]入門
  • 類書が非常に多いですし、用途やライブラリにもよるでしょう。LangChainを最低限しておくという意味での選書
  • ただ使い方だけの類書はたくさんありますが、これも技術評論社と評判ということで選んで、読んだ結果類書と1レベル違うかなというところ
現場で活用するためのAIエージェント実践入門
  • 「欲しくても買えないどこでも品切れ」の方で有名になりましたが、リフローKindle版が出ました
  • 類書ですとエージェントの安直な作り方のみですが、本書は「エージェントとは何か」から入ってますので帯の「プロになるための一冊」ではないでしょうか

RAG関連

書名 内容
はじめての知識グラフ構築ガイド
  • LLMでもRAGの本ではありません!
  • RAGの本がまだなかった頃に見つけましたが、知識グラフについての概説書です
  • RAGの本はLLMとの連携については詳しいのですが、知識グラフ側の解説が薄いので補強の意味
検索システム 実務者のための開発改善ガイドブック
  • LLMでもRAGの本ではありません!
  • X記事で検索系のエンジニアの方が「RAGの検索部分は従来の検索エンジンのノウハウが重要なのだが、それがすっかり忘れられてプロンプトで無理をしている例が多い」という内容を投稿なさっているのを見て、検索についてのノウハウを得ておこうと




Source link

関連記事

コメント

この記事へのコメントはありません。