案内する

astropy.stats.bootstrap(data, bootnum=100, samples=None, bootfunc=None)[ソース]

Numpy配列に対してブートリサンプリングを行う.

Bootstrap再サンプリングは、サンプル推定の信頼区間を理解するために使用される。この関数は、置換後に再サンプリングされたデータセットのバージョン(“case bootstrapping”)を返す。これらすべては,関数または統計によって値の分布を生成することができ,その後,その分布を用いて信頼区間を見つけることができる.

パラメータ
dataNdarray

N-D配列.ブート再サンプルは、第1のインデックス上で実行されるので、第1のインデックスは、ブートすべき関連情報にアクセスすべきである。

bootnum形が整っていて、オプションです

誘導再サンプリング数

samples形が整っていて、オプションです

各再サンプリングにおけるサンプリング数。デフォルト設定 None サンプルをデータポイントの数に設定する

bootfunc関数、オプション

関数は、再サンプリングされたデータを減少させる。各ブート再サンプリングは、この関数を通過して結果を返す。もし…。 None ブートデータが戻ります

返品
bootNdarray

BootfuncがNONEであれば,行ごとにデータのブートリサンプリングである.Bootfuncが指定されていれば,列はbootfuncの出力に対応する.

実例.

2回の再サンプリングの配列を取得する:

>>> from astropy.stats import bootstrap
>>> import numpy as np
>>> from astropy.utils import NumpyRNGContext
>>> bootarr = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 0])
>>> with NumpyRNGContext(1):
...     bootresult = bootstrap(bootarr, 2)
...
>>> bootresult  
array([[6., 9., 0., 6., 1., 1., 2., 8., 7., 0.],
       [3., 5., 6., 3., 5., 3., 5., 8., 8., 0.]])
>>> bootresult.shape
(2, 10)

配列に関する統計情報を取得する

>>> with NumpyRNGContext(1):
...     bootresult = bootstrap(bootarr, 2, bootfunc=np.mean)
...
>>> bootresult  
array([4. , 4.6])

配列上で2つの出力を持つ統計情報を取得する

>>> test_statistic = lambda x: (np.sum(x), np.mean(x))
>>> with NumpyRNGContext(1):
...     bootresult = bootstrap(bootarr, 3, bootfunc=test_statistic)
>>> bootresult  
array([[40. ,  4. ],
       [46. ,  4.6],
       [35. ,  3.5]])
>>> bootresult.shape
(3, 2)

配列上に2つの出力がある統計情報を取得し,1番目の出力のみを保持する.

>>> bootfunc = lambda x:test_statistic(x)[0]
>>> with NumpyRNGContext(1):
...     bootresult = bootstrap(bootarr, 3, bootfunc=bootfunc)
...
>>> bootresult  
array([40., 46., 35.])
>>> bootresult.shape
(3,)