Я пытаюсь создать веб-скраппер, который, например, собирает новостные статьи с Reuters.com. Я хочу получить название и дату. Я знаю, что в конечном итоге мне нужно будет просто извлечь исходный код из каждого адреса, а затем проанализировать HTML, используя что-то вроде JSoup.
У меня вопрос: как я могу убедиться, что делаю это для каждой новостной статьи на Reuters.com? Как я узнаю, что нашел все адреса reuters.com? Есть ли API, которые могут помочь мне в этом?