Мисля, че това, което описахте, прилича повече на разликата между оптимизиране за различни модели на достъп (последователен, партиден срещу произволен достъп), отколкото разликата между пропускателна способност и латентност в най-чистия смисъл.
Когато мисля за система с висока латентност, не мисля за това кой запис имам достъп, а по-скоро, че достъпът до какъвто и да е запис изобщо има високи режийни разходи. Достъпът дори само до първия байт на файл от HDFS може да отнеме около секунда или повече.
Ако сте по-склонни към количествените показатели, можете да помислите за общото време, необходимо за достъп до редица записи N като T(N)=aN+b
. Тук a
представлява пропускателна способност, а b
представлява латентност. При система като HDFS, N често е толкова голямо, че b
става неуместно и компромисите в полза на ниско a
са от полза. Сравнете това с хранилище на данни с ниска латентност, където често всяко четене има достъп само до един запис и след това оптимизирането за ниско b
е по-добро.
С това казано, вашето твърдение не е неправилно; това определено е вярно и често се случва магазините за партиден достъп да имат висока латентност и висока пропускателна способност, докато магазините с произволен достъп имат ниско забавяне и ниска пропускателна способност, но това не винаги е така.
person
Joe K
schedule
23.05.2013