Какво трябва да знам, за да работя с UTF-8 в моята C програма?

Имам C програма, която сега трябва да поддържа UTF-8 знаци. Какво трябва да знам, за да го изпълня? Винаги съм чувал колко проблематично е да се справя с него в C/C++ среда. Защо точно е проблематично? Как се различава от обикновения C символ, също и неговия размер? Мога ли да го направя без помощ от операционната система, на чист C и пак да го направя преносим? какво друго трябваше да попитам, но не го попитах? това, което търся за изпълнение, е: Знаците са име с ударения (като френската дума: résumé), което трябва да прочета и да поставя в таблица със символи и след това да ги търся и отпечатвам от файл. Това е част от анализа на моя конфигурационен файл (много подобен на .ini)


person The Mask    schedule 25.01.2014    source източник


Отговори (2)


Има една страхотна статия, написана от Джоел Сполски, един от създателите на Stack Overflow.

Абсолютният минимум, който всеки разработчик на софтуер абсолютно, несъмнено трябва да знае за Unicode и наборите от знаци (без извинения!)

Отделно от това, може да искате да поискате някои други въпроси и отговори по тази тема, като Обработка на специални знаци в C (кодиране UTF-8).

Както е цитирано в гореспоменатите въпроси и отговори, Съвети за използване на Unicode с C/C++ може да ви дадат основите .

person jweyrich    schedule 25.01.2014

Две добри връзки, които използвах в миналото:

The-Basics -of-UTF8

четене-unicode-utf-8 -by-hand-in-c

Валтер

person γηράσκω δ' αεί πο    schedule 25.01.2014