Справочники по символам и сущностям
Ссылки на символы и сущности позволяют включать данные в XML-документ, ссылаясь на них, вместо того чтобы вводить символы в документ напрямую. Такой способ удобно применять в следующих ситуациях.
Символы нельзя ввести в документ напрямую, так как они будут интерпретироваться как разметка.
Символы нельзя ввести в документ напрямую из-за ограничений устройства ввода.
Невозможна надежная передача символов через процессор, ограниченный однобайтными символами.
Символьная строка или фрагмент документа часто повторяются и могут быть сокращены.
Для представления содержимого в XML используются числовые или синтаксические конструкции, начинающиеся с символа амперсанда (&) и заканчивающиеся точкой с запятой (;).
Ссылки на символы позволяют вставлять символы Юникода, для которых в качестве кодовой точки Юникода задан числовой код. Кодовые точки можно задавать либо в десятичном, либо в шестнадцатеричном представлении.
- & #value;
Синтаксис, используемый для десятичных ссылок.
- &# xvalue;
Синтаксис, используемый для шестнадцатеричных ссылок.
Например, чтобы вставить символ евро, который до сих пор отсутствует на многих клавиатурах, можно вставить в документ ссылку €
или €
.
В следующей таблице перечислены пять встроенных сущностей для символов, используемых в XML-разметке.
Сущность | Ссылка на сущность | Значение |
---|---|---|
lt |
< |
< (меньше чем) |
gt |
> |
> (больше чем) |
amp |
& |
& (амперсанд) |
apos |
' |
' (апостроф или одиночная кавычка) |
quot |
" |
" (двойная кавычка) |
В ситуациях, когда символ может привести к ошибочной интерпретации структуры документа средством синтаксического анализа XML, используйте сущность вместо ввода символа. Ссылки на сущности '
и "
чаще всего используются в значениях атрибутов.
Например, чтобы написать «Me&You», используйте Me&You
. Чтобы написать «a<b», используйте a<b
. Чтобы написать «b>c», используйте b>c
.
Можно определить собственные сущности, как HTML определяет набор сущностей для использования в HTML. Значение &ap
не распознается как HTML-файл. Для преобразования в HTML нужно использовать $#....
.
При работе с определением типа документа (DTD), определяющим сущности, можно ссылаться на эти сущности в содержимом документа, используя следующий синтаксис:
&entityName;