Как мога да получа резюме на страницата с помощта на Java?

Искам да получа следната информация за уеб страница:

  • TTFB
  • Време за зареждане на страницата
  • Ресурси (css, js, img ...) време за зареждане

Задължително условие: цялата тази информация трябва да бъде получена в една заявка. Някой има ли решение на този проблем на Java?


person jonua    schedule 13.07.2015    source източник
comment
Прочетете и обработете регистрационните файлове на уеб сървъра, може би.   -  person Gilbert Le Blanc    schedule 13.07.2015
comment
@Puh, това е въпросът. Какво трябва да заредите страница, която ще получи данните?   -  person jonua    schedule 13.07.2015
comment
@GilbertLeBlanc, трябва да получа тези данни програмно.   -  person jonua    schedule 13.07.2015
comment
Добре, тъй като сте използвали Java тага, използвайте BufferedReader, за да прочетете регистрационните файлове на уеб сървъра.   -  person Gilbert Le Blanc    schedule 13.07.2015
comment
@GilbertLeBlanc, не използвам уеб сървър. Използвам JavaSE. Може ли да има външен софтуер, позволяващ получаването на тези данни? Или друг начин, без използване на сървърни регистрационни файлове?   -  person jonua    schedule 13.07.2015
comment
Предполагам, че можете да използвате класа URLConnection за получаване на уеб страница и HtmlUnit за обработка на уеб страницата.   -  person Gilbert Le Blanc    schedule 13.07.2015


Отговори (1)


TTFB: отворен сокет към сървъра. което ви дава латентността на мрежата + времето за отваряне на сокета. чрез този сокет трябва да изпратите http заявка. Моментът, в който ще получите http заглавка - ще бъде вашият TTFB... но... както казах - съдържа латентност на мрежата, също така можете да получите отговор за пренасочване или надграждане на протокол или wte. Така че трябва да анализирате това.

Време за зареждане на страницата ако получите 200 отговора на предишния етап - просто заредете всички данни...

Време за зареждане на ресурси (css, js, img ...) на този етап ще измервате не производителността на уеб сървърите и латентността на мрежата, но и вашата. трябва да анализирате получения html, да намерите всички връзки към ресурси и да повторите първата стъпка (отворен сокет) или да ги изтеглите чрез httpClient или smt друг...

също трябва да помните за http/2, gzip...

person Puh    schedule 13.07.2015