Я думаю, что то, что вы описали, больше похоже на разницу между оптимизацией для разных шаблонов доступа (последовательный, пакетный или произвольный доступ), чем на разницу между пропускной способностью и задержкой в самом чистом смысле.
Когда я думаю о системе с высокой задержкой, я не думаю о том, к какой записи я обращаюсь, а скорее о том, что доступ к любой записи вообще имеет высокие накладные расходы. Доступ даже к первому байту файла из HDFS может занять около секунды или больше.
Если вы более склонны к количественной оценке, вы можете представить себе общее время, необходимое для доступа к нескольким записям N, как T(N)=aN+b
. Здесь a
обозначает пропускную способность, а b
обозначает задержку. В такой системе, как HDFS, N часто бывает настолько большим, что b
становится неактуальным, и выгодны компромиссы в пользу низкого a
. Сравните это с хранилищем данных с малой задержкой, где часто каждое чтение обращается только к одной записи, а затем оптимизация для низкого b
лучше.
С учетом сказанного, ваше утверждение не неверно; это определенно верно, и часто бывает, что хранилища пакетного доступа имеют высокую задержку и высокую пропускную способность, тогда как хранилища произвольного доступа имеют низкую задержку и низкую пропускную способность, но это не всегда так.
person
Joe K
schedule
23.05.2013