Справочники по символам и сущностям

Ссылки на символы и сущности позволяют включать данные в XML-документ, ссылаясь на них, вместо того чтобы вводить символы в документ напрямую. Такой способ удобно применять в следующих ситуациях.

  • Символы нельзя ввести в документ напрямую, так как они будут интерпретироваться как разметка.

  • Символы нельзя ввести в документ напрямую из-за ограничений устройства ввода.

  • Невозможна надежная передача символов через процессор, ограниченный однобайтными символами.

  • Символьная строка или фрагмент документа часто повторяются и могут быть сокращены.

Для представления содержимого в XML используются числовые или синтаксические конструкции, начинающиеся с символа амперсанда (&) и заканчивающиеся точкой с запятой (;).

Ссылки на символы позволяют вставлять символы Юникода, для которых в качестве кодовой точки Юникода задан числовой код. Кодовые точки можно задавать либо в десятичном, либо в шестнадцатеричном представлении.

  • & #value;
    Синтаксис, используемый для десятичных ссылок.
  • &# xvalue;
    Синтаксис, используемый для шестнадцатеричных ссылок.

Например, чтобы вставить символ евро, который до сих пор отсутствует на многих клавиатурах, можно вставить в документ ссылку € или €.

В следующей таблице перечислены пять встроенных сущностей для символов, используемых в XML-разметке.

Сущность Ссылка на сущность Значение

lt

<

< (меньше чем)

gt

&gt;

> (больше чем)

amp

&amp;

& (амперсанд)

apos

&apos;

' (апостроф или одиночная кавычка)

quot

&quot;

" (двойная кавычка)

В ситуациях, когда символ может привести к ошибочной интерпретации структуры документа средством синтаксического анализа XML, используйте сущность вместо ввода символа. Ссылки на сущности &apos; и &quot; чаще всего используются в значениях атрибутов.

Например, чтобы написать «Me&You», используйте Me&amp;You. Чтобы написать «a<b», используйте a&lt;b. Чтобы написать «b>c», используйте b&gt;c.

Можно определить собственные сущности, как HTML определяет набор сущностей для использования в HTML. Значение &ap не распознается как HTML-файл. Для преобразования в HTML нужно использовать $#.....

При работе с определением типа документа (DTD), определяющим сущности, можно ссылаться на эти сущности в содержимом документа, используя следующий синтаксис:

&entityName;