Регрессия гауссовского процесса: значение стандартного отклонения

В следующем коде о регрессии гауссовского процесса (GPR):

from sklearn.datasets import make_friedman2
from sklearn.gaussian_process import GaussianProcessRegressor
from sklearn.gaussian_process.kernels import DotProduct, WhiteKernel

X, y = make_friedman2(n_samples=500, noise=0, random_state=0)

kernel = DotProduct() + WhiteKernel()
gpr = GaussianProcessRegressor(kernel=kernel, random_state=0).fit(X, y)

print gpr.score(X, y)
print gpr.predict(X[:2,:], return_std=True) 

Что означает "стандартное отклонение", полученное из: gpr.predict(X[:2,:], return_std=True)?

Например, если я сравниваю георадар с регрессией опорных векторов (SVR), его нет в методе predict. Когда я использую алгоритм SVR, я обычно получаю стандартную ошибку перекрестной проверки.

Я использую его в байесовской оптимизации, поэтому мне нужно знать источник стандартной ошибки.


person maicon    schedule 24.04.2019    source источник


Ответы (1)


Гауссовские процессы являются байесовскими, и поэтому подобранная регрессия приводит к распределение по возможным параметрам. Затем это позволяет вычислить прогнозное распределение, а не просто точечные оценки. Установка аргумента return_std=True приводит к тому, что метод возвращает стандартные отклонения, связанные с каждой точкой запроса. Они обеспечивают теоретические границы прогнозов, основанные на силе предоставленных доказательств (обучающих данных).

Перекрестная проверка обычно используется, когда невозможно точно выполнить такие аналитические расчеты. Ключевым преимуществом методов гауссовского процесса является их управляемость.

person merv    schedule 24.04.2019