Расширяемый язык разметки XML 1. Введение. Расширяемый язык разметки Extensible Markup Language, аббревиатура XML описывает класс объектов XML document, а также частично описывает работу компьютерных программ, обрабатывающих объекты с данными, реализующими этот класс. XML это прикладной уровень или усеченная форма SGML, Стандартного Обобщенного языка разметки. По своему построению, XML документ является полноценным SGML документом. XML документы состоят из единиц размещения, называемых сущностями, которые содержат разобранные или неразобранные данные. Разобранные данные состоят из набора символов, часть которых образуют символьные данные, часть разметку. Разметка образует описание схемы размещения и логической структуры документа. Язык XML дает механизм создания ограничений для указанной схемы размещения и логической структуры. Председательствует в группе Jon Bosak из Sun Microsystems, принимающий также активное участие в работе группы XML Special Interest Group ранее известной как SGML Working Group, которая тоже была сформирована W3. C. Список членов XML Working Group представлен в Приложении. Связь группы с W3. C обеспечивает Dan Connolly. При разработке языка XML ставились следующие задачи XML должен быть пригоден для непосредственного использования в. При построении определений и описании функций XML процессора используются термины из следующего перечня может may. В противном случае имеет место ошибка. За исключением начала логической строки и строковых литералов. Формы, заключенные в обратные кавычки и различные скобки также. Инструкция pass ничего не делает и может быть полезна там, где инструкция требуется. Требуется Строковый Литерал Но Не Найдена Открывающая Кавычка' title='Требуется Строковый Литерал Но Не Найдена Открывающая Кавычка' />Программное обеспечение, отвечающее требованиям спецификации, может обнаруживать такую ошибку, сообщать о ней и обрабатывать ее. После обнаружения фатальной ошибки процессор может продолжить обработку данных с тем, чтобы найти остальные ошибки и, возможно, сообщить о них приложению. Помогая обрабатывать ошибки, процессор может предоставить приложению доступ к необработанным материалам исходного документа символьным данным и разметке. После обнаружения фатальной ошибки процессор должен приостановить нормальную обработку данных то есть, он должен прекратить передачу приложению символьных данных и сведений о логической структуре документа обычным образом. Сокращение Штата Военных Комиссариатов Цво на этой странице. Если это сделано, пользователю должна быть предоставлена возможность разрешать или запрещать описанные действия. Нарушение ограничения корректности классифицируется как ошибка, о которой по выбору пользователя должны сообщать проверяющие XML процессоры. Нарушение ограничения корректности классифицируется как фатальная ошибка. Символы с несколькими возможными представлениями в ISOIEC 1. Преобразование регистра не производится. Корректный XML документ также может стать действительным, если отвечает некоторым дополнительным ограничениям. Физически документ состоит из элементов, называемых сущностями. Любая сущность может ссылаться на другие сущности, обеспечивая их включение в данный документ. Документ начинается с. С логической точки зрения, документ строится из деклараций, элементов, комментариев, ссылок на символ и инструкций обработки. Все они размечаются в документе явным образом. Логические и физические структуры должны иметь корректную вложенность, как было описано в главе 4. Корректные разобранные сущности. Корректные XML документы. Тип не найден или не является константой периода компиляции s. Можно присваивать значения переменным, но не другим значениям. Совпадение только в начале строки, то есть тоже, что, но не зависит от флага MULTILINE Z. Литерал элемент данных, значение которого не изменяется, но в отли чие от констант он не. Проще говоря, элементы, маркируемые начальными и конечными тэгами, должны быть вложены друг в друга правильным образом. В таком случае об элементе P говорят как о родителе элемента C, а элемент C называют непосредственным потомком элемента P. Допустимы символы табуляции, возврата каретки, конца строки, а также разрешенные символы из наборов Unicode и ISOIEC 1. Последние версии указанных стандартов, актуальные на момент подготовки данного документа, перечислены в Приложении A. Нормативные ссылки. Перечисленные стандарты могут быть дополнены новыми символами в ходе обновления или при написании для них новых редакций. Соответственно, XML процессоры должны принимать любой символ из диапазона, указанного для Char. Все XML процессоры должны иметь возможность работать с кодировками UTF 8 и UTF 1. Механизм для указания используемой кодировки и подключения новых кодировок обсуждается позднее в главе 4. Кодирование символов в сущностях. Общие синтаксические конструкции. В данной главе определяются некоторые символы, широко используемые в грамматике XML. S пробельный символ, white space состоит из одного или нескольких символов пробела x. Пробельный символ. Буквы состоят из алфавитных, слоговых и идеографических символов. Полное определение конкретных символов из каждого класса дается в Приложении B Классы символов. Поэтому авторам не следует использовать символ двоеточия в именах XML, если это не связано с обращением к пространству имен. Вместе с тем, сами XML процессоры должны воспринимать двоеточие в имени как обычный символ. Nmtoken лексема имени это произвольное сочетание символов имени. Строковые данные, или литералы literals, применяются для указания содержимого внутренних сущностей Entity. Value, значений атрибутов Att. Value и внешних идентификаторов System. Literal. Заметим, что идентификатор System. Literal может быть обработан без проверки разметки. Литералы. Если же эти символы потребовались в документе где либо еще, их следует маскировать, воспользовавшись для этого либо соответствующей числовой ссылкой на символ numeric character reference, либо строками. Правая угловая скобка может быть представлена в виде строки. Кроме того, если правая угловая скобка в содержимом элемента попадает в комбинацию символов. Символьные данные в секции CDATA это любая строка символов, которая не содержит закрывающего ограничителя секции CDATA комбинации символов. Комментаций может также появляться в тех местах декларации типа документа, где это разрешено грамматикой. Комментарии не относятся к символьным данным документа, однако XML процессоры могут но не обязаны передавать приложению текст полученных комментариев. Для сохранения совместимости, в комментарии не следует пользоваться комбинацей символов. Поэтому следующий пример корректным уже не будет. Адреса с названиями. Для формального декларирования адресата инструкции PI может использоваться механизм нотаций XML. Ссылки на сущность параметра в инструкциях обработки не распознаются. Секции CDATA. Секция CDATA начинается со строки. Поэтому все символы левой угловой скобки и амперсанта могут предстать здесь в своем обычном текстовом виде. Эти символы не нужно да и невозможно маскировать с помощью комбинаций. Секции CDATA не могут быть вложенными. Пример секции CDATA, в которой строки. Если в документе используется значение. Выбор номера для тех версий спецификации XML, которые последуют за. Поскольку появление новых версий не исключается, то принятие упомянутой схемы нумерации позволило бы реализовать автоматическое распознавание версии, которое должно стать необходимым. Если получен документ с меткой о версии, которую процессор не в состоянии поддерживать, последний может сигнализировать об ошибке. Задачей разметки XML документа должно быть описание схемы его размещения и логической структуры, а также связывание пар атрибут значение с их логической структурой. XML предоставляет механизм для определения логических ограничений для логической структуры и формирования предопределенных единиц размещения декларацию типа документа. Такую грамматику называют декларацией типа документа, или DTD document type definition. Декларация типа документа может ссылаться на внешний набор, который также содержит декларацию разметки специальный тип внешняя сущность, может содержать свой внутренний набор деклараций разметки, а может сочетать оба варианта.