『Python Data Science Handbook』(英語の無料オンライン版あり)
『Python Data Science Handbook』は、Pythonにおけるデータサイエンスの主要なライブラリである、
- NumPy
- pandas
- Matplotlib
- scikit-learn
について、基本的な内容がよくまとまっている良書。
文字通り、ハンドブック(手引書)として最適な一冊だと思う。入門書としてもリファレンスとしても優秀。Amazon.comのレビューでもかなりの高評価を得ている。
NumPy, pandasについては、numpy.ndarray
やpandas.DataFrame
といったそれぞれのライブラリ特有の型でのデータの処理・操作方法が基礎から説明されている。
Matplotlibによるビジュアライゼーション、scikit-learnによる機械学習については、使い方の説明はもちろん以下のような具体例が豊富なビジュアル(グラフ)とともに示されている。
- Matplotlib
- 折れ線グラフ、散布図、ヒストグラム、3Dグラフなど
- scikit-learn
- ナイーブベイズ分類器、サポートベクターマシン、ランダムフォレスト、k近傍法など
特にMatplotlibはよく使う割にまとまった入門書が少ないので、本書は貴重な存在。クセのない英語で読みやすい。
(2018/05/27追記)
日本語版が発売された。定価4,536円。
かなりおすすめ。
『Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習』。
オライリージャパン
売り上げランキング: 13,168
無料オンライン版あり
ありがたいことに原著(英語版)は全文がオンラインで公開されている。図表もそのまま載ってる。
Jupyter Notebook.ipynb
形式のサンプルも公開されている。コードだけでなく本文も図表もすべて含まれている。以下のレポジトリのnotebooks
に節ごとに分かれたファイルがある。
GitHub上で各.ipynb
ファイルを開くとキレイにレンダリングして表示される。
モバイルにはKindle版がオススメ
上述のようにオンラインですべての内容が無料で読めるので基本的にはそれだけで事足りると思うが、もし移動中にスマホでも読みたいという場合はKindle版をオススメしたい。
Kindle版は固定レイアウトではなくリフロー。メモやハイライト、辞書などの機能も使える。
PCのブラウザだと、例えばMacの場合は単語を3本指タップすると辞書を表示できるが、Kindle版ならモバイルでも単語選択で辞書を表示できる。
英文を読むときに辞書はかなり便利。
お値段もKindle版は3000円弱と普通の技術書レベル。日本語版単行本(定価4,536円)よりも安い。