Я просто хочу получить источник веб-страницы на языке java, и я просто хочу получить этот контент с правильным типом кодировки. Я могу получить содержимое веб-страницы до сих пор. Но для некоторых веб-страниц содержание содержит абсурдные символы. Поэтому мне нужно определить кодировку этой веб-страницы.
Согласно моим небольшим исследованиям, я обнаружил, что для этого есть библиотека jChardet. Но я не мог импортировать его в свой проект. Кто-нибудь может мне помочь?
Кстати, приведенный ниже код — это код для чтения содержимого веб-страницы.
StringBuilder builder = new StringBuilder();
InputStream is = fURL.openStream();
BufferedReader buffer = null;
buffer = new BufferedReader(new InputStreamReader(is, encodingType));
int byteRead;
while ((byteRead = buffer.read()) != -1) {
builder.append((char) byteRead);
}
buffer.close();
return builder;