Есть ли у любого браузера проблема с URL-кодировкой UTF-8 в ссылках

Наш сайт только что выпустил новую версию, и теперь страницы имеют Unicode в URL-адресе. Я вижу, что Rails правильно экранировал URL-адрес этих символов UTF-8 при рендеринге тегов привязки.

/regions/%E4%B8%AD%E5%BD%B0%E6%8A%95/

Однако я все еще вижу много трафика с неправильно закодированными URL-адресами:

/regions/%A4%A4%B9%FC%A7%EB/

Судя по всему, это тот же адрес, но закодированный не в UTF-8, а затем url экранирован.

Вопрос

Мне интересно, есть ли какой-нибудь старый браузер, который будет принимать правильно экранированный URL-адрес, распаковывать его, чтобы получить UTF-8, кодировать его в какой-либо другой кодировке, а затем экранировать URL-адрес при запросе сервера?

Иначе я не знаю, как объяснить этот трафик.


person lulalala    schedule 19.08.2012    source источник
comment
Эта первая ссылка... Если я расшифрую ее как UTF8, она будет отображаться как /regions/中彰??/. Это вообще правильный URL? Потому что кажется, что это недопустимый текст UTF8.   -  person Jay    schedule 19.08.2012
comment
@Jay Да, здесь он правильно декодирует (даже третий символ). Требуется поддержка восточноазиатских языков.   -  person lulalala    schedule 19.08.2012
comment
Этот второй URL был закодирован с использованием Big5 (традиционный китайский). Я могу только предположить, что веб-браузер специально создан для китайской ОС Windows, но не обрабатывает URL-адреса должным образом. Вы можете настроить веб-трекер, который будет получать информацию о веб-браузере.   -  person Jay    schedule 19.08.2012


Ответы (1)


Я тестировал в Internet Explorer 6 и 7. Я также тестировал параметр «Всегда отправлять URL-адреса в формате UTF-8». Ни одна из комбинаций не вызвала некорректно закодированный запрос.

Я предполагаю, что это был какой-то поисковый робот, который обрабатывает декодирование, но не кодирование.

person lulalala    schedule 04.12.2012