Я только что узнал о Schema.org. Я хотел бы использовать его на своих веб-страницах. Я думаю, что до сих пор у меня было очень общее и запутанное представление о Schema.org, но, к сожалению, прямо сейчас я не могу позволить себе время, чтобы углубиться в него и узнать больше, чтобы иметь возможность использовать его правильно и немедленно< /em> на страницах, которые я создаю прямо сейчас.
Итак, вот моя проблема:
Я преобразовал огромную 670-страничную книгу (с большим количеством фотографий в дополнение к тексту) в страницы HTML5. Книга представляет собой PDF-файл. Я разбил его на 23 фрагмента, а затем преобразовал эти фрагменты в равное количество файлов HTML5, используя бесплатный/пробный конвертер (преобразование PDF в HTML5+SVG). Эти файлы HTML5 не имеют видимых зависимостей/внешних ресурсов, как обычные HTML-страницы (особенно со встроенными изображениями, JS, CSS и т. д.). Кроме того, помимо изображений из исходного PDF-файла, исходный текст PDF-файла также был преобразован в формат изображения «svg» вместо текста — и, я думаю, встроен или закодирован в HTML-файлы. Но я не вижу никаких внешних зависимых файлов, они кажутся самодостаточными с большим количеством кода. Другими словами, кажется, что все содержание книги содержится только в этих HTML-файлах. Я не знаком с такими файлами HTML и не уверен, возможно ли это, или я что-то здесь упускаю из-за недостатка знаний.
В любом случае, теперь внутри исходных кодов этих HTML-файлов я хотел бы сообщить поисковым системам (и другим заинтересованным сторонам, если таковые имеются) максимально удобным для Google способом, используя Microdata или JSON-LD, что —
Этот файл (отдельные фрагменты файла HTML5) является частью или фрагментом (не обязательно «главой») (isPartOf? PublicationIssue?) «Книги» или «Электронной книги» (той же книги или электронной книги). Здесь есть и другие подобные файлы, и вместе они составляют целую книгу.
Основное содержание книги (следовательно, отдельных HTML-файлов) в основном представлено в формате изображений, вероятно, SVG+XML. -- bookFormat/BookFormatType/ImageObject/associatedMedia/MediaObject/coding/encodesCreativeWork/codingFormat? (Хотя я так понимаю, что конвертер должен добавлять извлеченный текстовый файл или просто извлеченный текст для облегчения поиска, но я не могу этого найти.)
Добавьте: количество страниц всей книги (не отдельных фрагментов или html-файлов), about, sameAs (для основного сайта), description.
Моя проблема в том, что я не уверен (исходя из своих нынешних знаний), какие типы и свойства Schema.org выбрать для моего контекста, как описано выше, как правильно и лаконично написать его с правильным/допустимым синтаксисом и где его разместить внутри исходный код файлов HTML. Содержимое файлов кажется мне беспорядочным и почти не поддающимся расшифровке кодом, очень редко разбавленным небольшим количеством исходного текста. Мне кажется, что все шрифты, тексты и изображения оригинала здесь закодированы в одном месте. Которые для меня почти неразличимы. Итак, моя идея состоит в том, чтобы начать с тега body
с микроданными и инкапсулировать все остальное в один или два div
или span
. Нет необходимости идентифицировать элементы отдельно.
Вот и все! Кто-нибудь может помочь?
ОБНОВЛЕНИЕ НА ОСНОВЕ ОТВЕТА UNOR
Вот код, на котором, я думаю, я остановлюсь (остаются некоторые вопросы):
Для размещения на странице оглавления (с названием книги в качестве заголовка) книги/электронной книги, которая также будет страницей входа: --
<script type="application/ld+json"> { "@context": "http://schema.org/", "@id": "http://example.com/Archaeological_Heritage_Of_India.html#book", "@type": "Book", "name": "Archaeological Heritage of India", "bookFormat": {"@id": "http://schema.org/EBook"}, "inLanguage": "en", "genre": "Archaeological Heritage" **/* OR "genre": "http://vocab.getty.edu/aat/300054328" */** } </script>
Для размещения на остальных страницах книги (т.е. в отдельных отдельных html-файлах):
<script type="application/ld+json"> { "@context": "http://schema.org/", "isPartOf": "http://example.com/Archaeological_Heritage_Of_India.html#book" } </script>
Что я хотел бы знать, если это полностью правильно?
Кроме того, как я могу и должен включить contentLocation
в это (в № 1) - чтобы указать географический предел или фокус основного содержания книги? Как насчет следующего:
"contentLocation": "India" /* OR - the ISO 3166-1 alpha-2 country code: "IN" ?