Есть ли правильный способ обнаружить символы в кодировке Windows-1251
?
IMO, в отличие от многобайтовых собственных символов, Windows-1251
является 8-битной кодировкой символов, поэтому его невозможно отличить от других 8-битных собственных символов, таких как latin1
. Если я ошибаюсь, поправьте меня.
Первая подсказка для меня - locale
, я беру все символы non-ascii
как Windows-1251
, если локаль ru
.
Есть ли способы лучше?
ОБНОВИТЬ:
Вот контекст моего вопроса, в информации ID3
файлов MP3 есть некоторые Windows-1251
закодированные символы, мне нужно обнаружить Windows-1251
закодированные символы, а затем преобразовать их в UTF-16 с помощью icu4c
, иначе эти Windows-1251
закодированные символы будут представлены нечитаемыми в моей системе (Android
). Думаю, у некоторых из вас есть способы получше.