English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

Pandas可視化

    Pandas ビジュアル化操作の例

基本的なプロット:プロット

SeriesとDataFrame上のこの機能は、matplotlibライブラリのplot()メソッドのシンプルなラッパーに過ぎません。

 import pandas as pd
 import numpy as np
 df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('1/1/2000',
    periods=10), columns=list('ABCD'))
 df.plot()

以下の結果が得られます:

インデックスが日付で構成されている場合、gct().autofmt_xdate()が呼び出され、x軸のフォーマットが上図のように行われます。
xとyキーワードを使用して、一列と別の列の関係を描画できます。

デフォルトの線グラフ以外に、様々なプロットスタイルを使用することができます。これらのメソッドはplot()のkindキーワードパラメータとして提供されます。これには、以下のようなものがあります:

棒グラム ヒストグラム 箱形図 面積図 散点図 円グラフ

棒グラム

以下に、条形図の作成方法を見てみましょう:

 import pandas as pd
 import numpy as np
 df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])
 df.plot.bar()

以下の結果が得られます:

スタックされた棒グラフを生成します。設定可能です。 stacked=True

import pandas as pd
 df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])
 df.plot.bar(stacked=True)

以下の結果が得られます:

水平棒グラフを取得するには、barhメソッドを使用できます:

import pandas as pd
 import numpy as np
 df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])
 df.plot.barh(stacked=True)

以下の結果が得られます:

ヒストグラム

plot.hist()メソッドを使用してヒストグラムを描画できます。指定可能な数を設定できます。

import pandas as pd
 import numpy as np
 df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
 np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
 df.plot.hist(bins=20)

以下の結果が得られます:

各列に異なるヒストグラムを描画するために以下のコードを使用できます:

import pandas as pd
 import numpy as np
 df=pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
 np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
 df.diff.hist(bins=20)

以下の結果が得られます:

箱形図

Series.box.plot()とDataFrame.box.plot()またはDataFrame.boxplot()を呼び出して、各列の値の分布を可視化するためのBoxplotを描画することができます。
例えば、これは箱線図で、[0,}1)における一つのランダム変数の10観測値の5つの試験です。

import pandas as pd
 import numpy as np
 df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
 df.plot.box()

以下の結果が得られます:

面積図

面積図を作成するにはSeries.plot.area()またはDataFrame.plot.area()メソッドを使用できます。

import pandas as pd
 import numpy as np
 df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
 df.plot.area()

以下の結果が得られます:

散点図

散点図を作成するにはDataFrame.plot.scatter()メソッドを使用できます。

import pandas as pd
 import numpy as np
 df = pd.DataFrame(np.random.rand(50, 4), columns=['a', 'b', 'c', 'd'])
 df.plot.scatter(x='a', y='b')

以下の結果が得られます:

円グラフ

ピエチャを作成するにはDataFrame.plot.pie()メソッドを使用できます。

import pandas as pd
 import numpy as np
 df = pd.DataFrame(3 * np.random.rand(4), index=['a', 'b', 'c', 'd'], columns=['x'])
 df.plot.pie(subplots=True)

以下の結果が得られます: