XML-data bases - resume 5

XML-базы данных - резюме 5

18 апреля 2005/

Фотография с концерта в ФИАНе - из видео ….

Похоже применения XML технологии повсеместны - это и удобно, и наглядно. Заботимся о своем и чужом удобстве, а вычислительные проблемы оставляем специалистам - как это все хорошо организовать. Пишут, что сделать парсер XML (т.е. анализатор XML) не так просто (разбор древовидных структур требует много ресурсов), и поэтому есть проблемы с применением парсера на клиентской машине.

Выборки из базы данных тоже хорошо и естественно получать в XML виде, а не просто как строки информации, хотя разница на первый взгляд небольшая. И класть в базу - тоже прямо XML документы. Выбирать - по каким то признакам этих документов. А для этого нужен уже XPATH - язык для описания путей в этих документах.

То есть XML схема задает базу данных - естественно рассматривать базу со структурой дерева. А сейчас широко используются - реляционные базы. Еще один круг проблем ….В реляционных базах - нормализация, как это все ложится на древовидные XML структуры? В http://xml.apache.org/xindice/ положенные в нее документы, т.е. давать им уникальные цифровые имена, по которым эти документы из базы можно доставать.

Или создаем базу данных по одному XML документу -спецификации можно указать в атрибутах - и все дела (но это похоже на схему!) Двухуровневый XML-файл (два вложения) без сложной структуры определяет таблицу - автоматически. Есть ли системы, такое обеспечивающие? Наверное нет - делается в общем случае ...

Как в такой базе хранятся XML файлы - остается за кадром. Наше удобство, удобство пользования - взял, положил, сделал запрос - а база сама разбирается. В простых случаях нетрудно такой интерфейс с базой данных (реляционной) самому написать, но хорошо, когда такие базы уже есть - они уже упоминались на этих страничках. Но насколько они простые в использовании, особенно учитывая, что использовать их мы будем по минимуму (хотя - аппетит приходит во время еды…)

Apache Xindice http://xml.apache.org/xindice/

DOMSafeXML http://80.69.68.250/doc/DSXProgrammersReference/index.html

Из документации к последней системе:

A special feature of DOMSafeXML is the availability of number sequences. Number sequences can be used to generate unique ID's for XML documents. This mechanism can be compared to the AutoNumber functionality of other databases.

The server includes a xml-stylesheet engine to transform documents. The style sheet is processed with respect to changes made to the XML document during the transaction. It is not necessary for you to serialize the XML document first. You can modify the document, transform it with XSL, and then discard all changes without any disk access!

Cacoon, AxKit http://www.axkit.org - системы без баз данных, трансформации XML документов и пр.

18 April

On our need of XML-data bases ... Text in Russian/ Photographs from concert in FIAN …

Сайт управляется системой uCoz