.groupby()について

`.groupby()`は、Pandasライブラリのデータフレーム(DataFrame)オブジェクトで使用される強力な操作です。データを特定のキーまたはキーの組み合わせでグループ化することができます。その後、グループごとに集計、統計、変換などの操作を行うことができます。
`.groupby()`の基本的な構文は次のようになります:
“`python
grouped = df.groupby(key)
“`
ここで、`df`はグループ化したいデータフレームオブジェクトであり、`key`はグループ化の基準となる列名、列のリスト、またはキーの配列です。
`.groupby()`の結果は、グループごとのデータをまとめた`GroupBy`オブジェクトとなります。このオブジェクトを使用してさまざまな操作を行うことができます。
一般的な`.groupby()`の操作:
1. 集約関数の適用: `.sum()`、`.mean()`、`.median()`、`.min()`、`.max()`、`.size()`などの集約関数を使用して、グループごとの集計を行います。
“`python
grouped.sum()  # グループごとの合計値
grouped.mean()  # グループごとの平均値
grouped.min()  # グループごとの最小値
“`
2. カスタム関数の適用: `.agg()`メソッドを使用して、グループごとに異なる集計関数を適用することもできます。
“`python
grouped.agg({‘column_name’: ‘sum’, ‘another_column’: ‘mean’})  # グループごとに異なる列の集計
“`
3. 複数のキーによるグループ化: 複数の列名をリストとして渡すことで、複数のキーによるグループ化も可能です。
“`python
grouped = df.groupby([‘column1’, ‘column2’])
“`
4. 複数の操作の組み合わせ: 複数の操作を連鎖的に組み合わせることができます。
“`python
grouped.sum().mean()  # グループごとの合計値を計算した後、その平均値を求める
“`
これらは一部の基本的な`.groupby()`の操作例です。`.groupby()`を使用すると、データのグループ化と集計に関する柔軟な操作が可能になります。詳細な使用方法については、Pandasの公式ドキュメントを参照することをお勧めします。

コメント

タイトルとURLをコピーしました