- Home
- Python
- pandas
pandas
まとめ
記事
- pandas.DataFrameの構造とその作成方法
- pandasで行数、列数、全要素数(サイズ)を取得
- pandasでCSV/TSVファイル読み込み(read_csv, read_table)
- pandasでCSVファイルの書き込み・追記(to_csv)
- pandasでExcelファイル(xlsx, xls)の読み込み(read_excel)
- pandasでExcelファイル(xlsx, xls)の書き込み(to_excel)
- pandas.DataFrameをJSON文字列・ファイルに変換・保存(to_json)
- pandasでJSON文字列・ファイルを読み込み(read_json)
- pandasのjson_normalizeで辞書のリストをDataFrameに変換
- pandas.DataFrame, SeriesとNumPy配列ndarrayを相互に変換
- pandas.DataFrame, SeriesとPythonのリストを相互に変換
- pandas.DataFrame, Seriesを辞書に変換(to_dict)
- pandasのデータ型dtype一覧とastypeによる変換(キャスト)
- pandasで任意の位置の値を取得・変更するat, iat, loc, iloc
- pandasのインデックス指定で行・列を抽出
- pandas.DataFrameの行を条件で抽出するquery
- pandasで複数条件のAND, OR, NOTから行を抽出(選択)
- pandas.DataFrameから特定の型の列を抽出・除外するselect_dtypes
- pandas.DataFrameの行・列を行名・列名の条件で抽出するfilter
- pandas.DataFrameに列や行を追加(assign, appendなど)
- pandas.DataFrameを結合するmerge, join(列・インデックス基準)
- pandas.DataFrameの行・列を指定して削除するdrop
- pandas.DataFrame, Seriesを連結するconcat
- pandas.DataFrameの行名・列名の変更
- pandas.DataFrame, Seriesの要素の値を置換するreplace
- pandasにおける欠損値(nan, None, pd.NA)
- pandasで欠損値NaNが含まれているか判定、個数をカウント
- pandasで欠損値NaNを削除(除外)するdropna
- pandasで欠損値NaNを置換(穴埋め)するfillna
- pandasで欠損値NaNを含む行・列を抽出
- pandasで欠損値NaNを前後の値から補間するinterpolate
- pandasで要素・行・列に関数を適用するmap, apply, applymap
- pandas.DataFrameのforループ処理(イテレーション)
- pandasで特定の条件を満たす要素数をカウント(全体、行・列ごと)
- pandas.DataFrameの複数の列の文字列を結合して新たな列を生成
- pandasで特定の文字列を含む行を抽出(完全一致、部分一致)
- pandasの文字列を区切り文字や正規表現で複数の列に分割
- pandasの文字列メソッドで置換や空白削除などの処理を行う
- pandas.DataFrameの行と列を入れ替える(転置)
- pandasでユニークな要素の数・頻度(出現回数)をカウント
- pandasのgroupby()でグルーピングし統計量を算出
- pandas.DataFrame, Seriesをソートするsort_values, sort_index
- pandas.DataFrame, Seriesの先頭・末尾の行を返すheadとtail
- pandasの行・列をランダムサンプリング(抽出)するsample
- pandas.DataFrame, Seriesの行をシャッフル
- pandas.DataFrame, Seriesのインデックスを振り直すreset_index
- pandas.DataFrameの列をインデックス(行名)に割り当てるset_index
- pandas.DataFrame, Seriesの重複した行を抽出・削除
- pandas.DataFrame, Seriesが空か判定するempty
- pandasのMultiIndexから任意の行・列を選択、抽出
- pandasのMultiindexの指定・追加・解除・ソート・レベル変更
- pandasのMultiindexで階層ごとの統計量・サンプル数を算出
- pandasでクリップボードの中身をDataFrameとして取得するread_clipboard
- pandas.DataFrameをクリップボードにコピーするto_clipboard
- pandas.Seriesのmapメソッドで列の要素を置換
- pandasのcrosstabでクロス集計(カテゴリ毎の出現回数・頻度を算出)
- pandasのピボットテーブルでカテゴリ毎の統計量などを算出
- pandasの文字列から正規表現で抽出して新たな列を生成
- pandasのバージョンを確認(pd.show_versions)
- pandasのcut, qcut関数でビニング処理(ビン分割)
- pandasで条件に応じて値を置換(where, mask)
- pandasで行・列ごとの最頻値を取得するmode
- pandasのdescribeで各列の要約統計量(平均、標準偏差など)を取得
- pandasの要素としてリストを格納し処理
- pandasでstack, unstack, pivotを使ってデータを整形
- pandasで四捨五入・偶数丸め・切り捨て・切り上げ
- pandasで文字列と数値を相互変換、書式変更
- pandasの表示設定変更(小数点以下桁数、有効数字、最大行数・列数など)
- pandasのオプション設定を確認・変更する方法
- pandasで文字列にスライスを適用して任意の位置・長さの部分を抽出
- pandas.Seriesのインデックスと値を入れ替え(スワップ)
- pandas.DataFrameの行番号、列番号を取得
- pandasで最大値・最小値の行名・列名を取得するidxmax, idxmin
- pandas.DataFrame, Seriesを順位付けするrank
- pandas.DataFrame, Seriesをpickleで保存、読み込み(to_pickle, read_pickle)
- pandasで分位数・パーセンタイルを取得するquantile
- pandasで中央値を取得するmedian
- pandas.DataFrameにおけるビューとコピー
- pandas.DataFrameとSeriesを相互に変換
- pandasでn個の最大値・最小値を取得(nlargest, nsmallest)
- pandasのagg(), aggregate()の使い方
- pandasで累積和・累積積(cumsum, cumprod, cummax, cummin)
- pandasで欠損値NaNを除外(削除)・置換(穴埋め)・抽出
- pandasのplotメソッドでグラフを作成しデータを可視化
- pandasからNumPyの関数などを使う方法(pd.np)
- pandas.DataFrameの各列間の相関係数を算出、ヒートマップで可視化
- pandasのSettingWithCopyWarningの対処法
- pandas-datareaderで株価や人口のデータを取得
- Python, pandasでwebページの表(htmlのtable)をスクレイピング
- pandasでカテゴリ変数をダミー変数に変換(get_dummies)
- pandas, Matplotlib(mplfinance)でローソク足チャートを作成
- pandas.DataFrame, Seriesを時系列データとして処理
- pandasで時系列データの曜日や月、四半期、年ごとの合計や平均を算出
- pandasの時系列データにおける頻度(引数freq)の指定方法
- pandasで時系列データをリサンプリングするresample, asfreq
- pandasで窓関数を適用するrollingを使って移動平均などを算出
- pandasで行・列の差分・変化率を取得するdiff, pct_change
- pandasでデータを行・列(縦・横)方向にずらすshift
- pandasの時系列データのタイムゾーンを処理(tz_convert, tz_localize)
- pandasで時系列データのOHLC(四本値)を算出・ダウンサンプリング
- pandas.DataFrameの行・列を任意の順に並べ替えるreindex
- pandasで時系列データから時刻を指定して行を抽出
- pandasで日付・時間の列を処理(文字列変換、年月日抽出など)
- Pythonでメソッドチェーンを改行して書く
- Python, pandasで任意の順番にソート(ソート順を指定)
- NumPy, pandasのValueError: The truth value ... is ambiguousの対処法
- pandas参考書『Pythonによるデータ分析入門』の注意点
- pandas参考書『Python for Data Analysis, 2nd Edition』
- 『Python Data Science Handbook』(英語の無料オンライン版あり)
- Pythonのリストと配列とnumpy.ndarrayの違いと使い分け
- Pythonで正規化・標準化(リスト、NumPy配列、pandas.DataFrame)
- Python, pandas, seabornでペアプロット図(散布図行列)を作成
- Python, pandas, seabornでヒートマップを作成
- Python, SciPyでトリム平均を算出(ndarray, DataFrame)
- 『Pythonデータサイエンスハンドブック』は良書(NumPy, pandasほか)
関連カテゴリー