Tecnologia ABCD Library

ABC do ABCD

Base de dados ISIS

Bases de dados ISIS são arquivos em que as informações contidas nos registros numerados (MFN’s ou Master File Numbers) com valores (na maior parte textual) armazenadas em campos com uma “tag” (ou identificador numérico) e subcampos (com um identificador de um caractere). Subcampos, campos e registros são todos de tamanho variável e “ocorrências variáveis” variando de 0 (ausente) a qualquer número maior que zero ocorrências, com um máximo dependendo da tecnologia ISIS utilizada, mas na nova geração (em J-ISIS e ISIS NBP), sem limite.

Os registros são estruturalmente descritos em um ‘cabeçalho’ para cada registro em si, em vez do cabeçalho de tabela usual em bases de dados relacionais. Ao fazer assim, ISIS reflete mais o conceito de que cada registro sendo um “documento” por si com a sua própria estrutura de “documento” de fato, como por exemplo, livros, artigos ou páginas web. Por isso, preferimos chamar ISIS uma “base de dados documental”, no qual os documentos são armazenados como um registro com estrutura e tamanho variáveis. Isto evita estruturas complicadas de estruturas relacionais “normalizadas”, que são muito eficientes no armazenamento de dados altamente estruturados, mas nem tanto para dados textuais semi-estruturados.

Isto significa que os registros podem ser bastante polimórficos, ou seja, estruturalmente diferentes com quaisquer combinações de campos. Em princípio ISIS pode manipular registros bibliográficos, juntamente com os dados do usuário e dados transacionais (por exemplo, empréstimos) em uma única base de dados, mas por causa de capacidades “semi-relacionais” (recuperação rápida de qualquer parte de um registro em qualquer base de dados, o ISIS, em tempo de execução, ou seja, pela Linguagem de Formatação, criando a saída sem a necessidade de dispor destas “relações” a serem pré-definidas) aplicações ISIS normalmente irão utilizar poucas bases de dados, por exemplo, no ABCD apenas 3 ou 4 bases de dados (uma para as entidades bibliográficas, uma para os usuários, uma para as transações e, possivelmente, uma para itens) podem possibilitar rodar uma biblioteca completa.

Na tecnologia ISIS “clássica” todos os registros de tamanho variável (com (sub-) campos contendo os valores) são armazenados em um arquivo “Master” (.MST) e as posições de registros são mantidas no arquivo de “Referência Cruzada” (.XRF), que pode ser visto como um índice normal de “primeira ordem” dos registros na base de dados. Registros novos e mesmo registros apenas editados são sempre anexados ao final do arquivo mestre e as referências no XRF são atualizadas de acordo, necessitando às vezes alguma “compactação” pela eliminação (de versões) de registros excluídos e/ou inativos.

Todos os valores especificados por uma “Tabela de Seleção de Campo” (que usa a Linguagem de Formatação, permitindo, portanto, definição muito flexível e poderosa de elementos selecionados), são incluídos em um “Arquivo Invertido” de árvore B, que pode ser visto como um “dicionário” de termos com o “endereço” exato (Registro, tag do campo, ocorrência, posição dentro de ocorrência) associado. Isto permite recuperação muito eficiente, incluindo bases de texto integral, de qualquer elemento definido como sendo “recuperável”. ISIS foi um dos primeiros a oferecer bases de dados de texto integral, que se tornou popular somente décadas mais tarde. Este “Arquivo Invertido” (ou IF) tem várias componentes (com nodos arquivos N01/.N02 e folhas arquivos .L01/L02) para uma organização eficiente  – porque, em determinadas aplicações com indexação intensivas o IF pode ser ainda maior do que o arquivo da base de dados em si!

Então, tipicamente bases de dados ISIS contém cerca de 10 arquivos: um MST com XRF, os Arquivos Invertidos Árvore B e algumas tabelas de definição para os campos, os dados do formulário de entrada e de indexação. Tudo isso está mudando com as novas tecnologias de bases de dados introduzidas em 2009 com, por exemplo, J-ISIS: usa Berkeley DB, um tipo de armazenamento diferente em arquivos separados com as definições incorporadas nos principais arquivos de dados. Mas basicamente o conceito de pares “tag-valor” (um identificador e um conteúdo), em que é aplicada uma poderosa Linguagem de Formatação, baseada em campos, e acrescido de indexação de texto integral, continuam a ser o núcleo de bases de dados ISIS.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *