Я знаю об основных типах данных и о том, что типы с плавающей запятой (float, double) не могут точно содержать некоторые числа.
Однако при переносе некоторого кода из Matlab в Python (Numpy) я обнаружил некоторые существенные различия в вычислениях, и я думаю, что он возвращается к точности.
Возьмите следующий код, нормализующий по оси z 500-мерный вектор, только первые два элемента которого имеют ненулевое значение.
Матлаб:
Z = repmat(0,500,1); Z(1)=3;Z(2)=1;
Za = (Z-repmat(mean(Z),500,1)) ./ repmat(std(Z),500,1);
Za(1)
>>> 21.1694
Питон:
from numpy import zeros,mean,std
Z = zeros((500,))
Z[0] = 3
Z[1] = 1
Za = (Z - mean(Z)) / std(Z)
print Za[0]
>>> 21.1905669677
Помимо того, что форматирование показывает немного больше цифр в Python, разница огромная (имхо), более 0,02
И Python, и Matlab используют 64-битный тип данных (афаик). Python использует «numpy.float64» и «двойной» Matlab.
Почему такая огромная разница? Какой из них более правильный?