отображать персидский текст utf-8, использовать код категоризации текста weka

Я новичок в java. Я хочу преобразовать свой текстовый файл в формат ARFF, но мои тексты на персидском языке, и NetBeans не может отобразить их в хорошем формате (формат utf-8) в этой теме:

http://weka.wikispaces.com/Text+categorization+with+Weka#UTF-8

сказал, что я должен запустить это:

java -Dfile.encoding=utf-8 -classpath ...

но я хочу использовать эту команду в своем коде. Я не знаю, как мне запустить java в команде. Может ли кто-нибудь сказать мне, как мне сделать эту строку в моем коде?

заранее спасибо


person MSepehr    schedule 09.12.2013    source источник


Ответы (1)


Не используйте Weka, поскольку вы уже используете NetBeans, лучше изменить конфигурацию NetBeans на UTF-8.

  1. Откройте папку etc внутри каталога Netbeans (путь, по которому вы установили NetBeans). Отредактируйте netbeans.conf с помощью Блокнота или любого текстового редактора.

  2. Найдите это поле: netbeans_default_options add Если оно уже присутствует, измените его на
    -J-Dfile.encoding=UTF-8

  3. В противном случае добавьте новую строку в конец файла:

    netbeans_default_options="-J-Dfile.encoding=UTF-8"
    
  4. Перезапустите NetBeans.
person Infinite Recursion    schedule 09.12.2013