Търсите div, идентифициран от "rechapta_image"
: ![въведете описание на изображението тук](https://i.stack.imgur.com/Aagaz.png)
След това извлечете атрибута src
на елемента img вътре в този div.
За да направите това, можете да изберете лесен начин, базиран на операции с низове, или да използвате библиотека за анализ на HTML като JSoup.
Ето пример за такъв URL адрес за извлечение:
http://www.google.com/recaptcha/api/image?c=03AHJ_VutGj3wvhGoQGxu6FUnG3uOWJdyB2RpSb2N5v9AQJyakMy1kKMPeDoRfADhjAj5rLqekuOzXe3cRChnA_sEN7PL68em4pI_kE3wFKUhhkqFF9jQzKJerX__InwD_DB0Ox1mKQmZVRl97yuSL62tZhYyhSqtuIta-3n0KvytB9QqSn8nXgw8
Всъщност изглежда, че кутията chapta е iframe. Така че потърсете iframe с src низ, съдържащ "chapta". Пример за такъв iframe:
<iframe src="http://www.google.com/recaptcha/api/noscriptk=6LeyFroSAAAAAJTmR7CLZ5an7pcsS5eJ3wEoWHhJ"
height="300" width="500" frameborder="0"></iframe><br/>
Така че, след като извлечете този URL, използвайте JSoup отново, за да намерите URL адреса на изображението. Извлечената страница има следната част:
![въведете описание на изображението тук](https://i.stack.imgur.com/1jxhh.png)
Така че, потърсете централен елемент и извадете img елемента от него.
person
Martijn Courteaux
schedule
15.07.2013