『Python Data Science Handbook』(英語の無料オンライン版あり)

Modified: | Tags: 本・書籍, Python, pandas, NumPy, Matplotlib, scikit-learn, 機械学習

『Python Data Science Handbook』は、Pythonにおけるデータサイエンスの主要なライブラリである、

  • NumPy
  • pandas
  • Matplotlib
  • scikit-learn

について、基本的な内容がよくまとまっている良書。

文字通り、ハンドブック(手引書)として最適な一冊だと思う。入門書としてもリファレンスとしても優秀。Amazon.comのレビューでもかなりの高評価を得ている。

NumPy, pandasについては、numpy.ndarraypandas.DataFrameといったそれぞれのライブラリ特有の型でのデータの処理・操作方法が基礎から説明されている。

Matplotlibによるビジュアライゼーション、scikit-learnによる機械学習については、使い方の説明はもちろん以下のような具体例が豊富なビジュアル(グラフ)とともに示されている。

  • Matplotlib
    • 折れ線グラフ、散布図、ヒストグラム、3Dグラフなど
  • scikit-learn
    • ナイーブベイズ分類器、サポートベクターマシン、ランダムフォレスト、k近傍法など

特にMatplotlibはよく使う割にまとまった入門書が少ないので、本書は貴重な存在。クセのない英語で読みやすい。

(2018/05/27追記)
日本語版が発売された。定価4,536円。

かなりおすすめ。

『Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習』。

無料オンライン版あり

ありがたいことに原著(英語版)は全文がオンラインで公開されている。図表もそのまま載ってる。

Jupyter Notebook.ipynb形式のサンプルも公開されている。コードだけでなく本文も図表もすべて含まれている。以下のレポジトリのnotebooksに節ごとに分かれたファイルがある。

GitHub上で各.ipynbファイルを開くとキレイにレンダリングして表示される。

モバイルにはKindle版がオススメ

上述のようにオンラインですべての内容が無料で読めるので基本的にはそれだけで事足りると思うが、もし移動中にスマホでも読みたいという場合はKindle版をオススメしたい。

Kindle版は固定レイアウトではなくリフロー。メモやハイライト、辞書などの機能も使える。

PCのブラウザだと、例えばMacの場合は単語を3本指タップすると辞書を表示できるが、Kindle版ならモバイルでも単語選択で辞書を表示できる。

英文を読むときに辞書はかなり便利。

お値段もKindle版は3000円弱と普通の技術書レベル。日本語版単行本(定価4,536円)よりも安い。

関連カテゴリー

関連記事