Как мога да използвам уникод символи в HTML ключови думи?

Мета секцията на HTML документи може да съдържа секция с ключови думи.

<!DOCTYPE html>
<html>
    <head>
        <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
        <meta name="description" content="under construction" />
        <meta name="keywords"
          content="..." />

Могат ли да се използват уникод символи в този раздел (т.е. \u00B0)? Ако да как?


person Jérôme Verstrynge    schedule 23.12.2011    source източник
comment
Като странична бележка, <!DOCTYPE html> е HTML5 doctype. Предпочитаният HTML5 начин за деклариране на набора от знаци на документа е да се използва <meta charset="..."> вместо <meta http-equiv="text/html; charset=...">.   -  person Remy Lebeau    schedule 24.12.2011


Отговори (2)


Всички знаци, които поставяте в HTML документ, независимо дали в стойности на атрибути или другаде, като Unicode знаци. Ако кодирането на знаците на вашия документ е UTF-8, както декларира вашият пример (но тогава е по-добре да е кодирано UTF-8!), можете да въведете всякакви знаци, като знака за градус (°), директно там. Как ще направите това зависи от вашата среда за създаване. Като алтернатива можете да използвате препратка към знак (like &#xb0;) или, за някои знаци, препратка към обект (like &deg;).

Но ° не е HTML нотация. Това е просто поредица от шест знака. Има специално значение в JavaScript, но не и в HTML. Съответната HTML нотация е &#xb0;.

Търсачките вероятно ще игнорират специални символи като знака за степен в ключовите думи. Но не е задължително; Забелязано е, че Google е чувствителен към тях в някои специални ситуации. (Не за знака за степен в момента, изглежда.)

В таговете <meta name=description ...> специалните символи може да са подходящи, ако търсачките използват тяхното съдържание, когато конструират описанието на страницата за списъците с резултати от търсенето. Такива неща все още се случват, макар и по-рядко от преди.

person Jukka K. Korpela    schedule 23.12.2011

Тъй като неанглийски уебсайтове, които използват Unicode за основното си съдържание, също ще използват Unicode за своите метаданни, разумно е да се предположи, че важните инструменти, които обработват HTML метаданни, ще могат да се справят с това в UTF-8.

Също така имайте предвид, че (поне исторически) мета тагът keywords е предназначен да съдържа термини, които хората биха могли да търсят. Вашият пример \00B0 е знакът за градуси; в този случай изглежда по-вероятно хората да търсят думата градуси, отколкото символа. Поради широкомащабна злоупотреба с метаданни за ключови думи, много търсачки (включително Google) ги игнорира за класиране в търсенето.

И така, в обобщение, мисля, че е безопасно да се използват метаданни за ключова дума Unicode. Но това вероятно няма да подобри класирането на вашия сайт при търсене за тези термини.

person Matthew Strawbridge    schedule 23.12.2011
comment
Този съвет от W3C е фокусиран върху контролните кодове и други подобни, а не върху стандартните знаци за печат. - person Quentin; 23.12.2011
comment
Благодаря @Quentin. Съгласен съм и редактирах отговора си, за да премахна тази част. Мисля, че останалото все още важи. - person Matthew Strawbridge; 23.12.2011