IFLOAD – Saída

Utilitários CISIS

O arquivo invertido consiste de seis arquivos físicos, cinco dos quais contêm o dicionário de termos recuperáveis (organizados como uma árvore B*) e o sexto contém a lista de postings associados com cada termo. Para efeitos de otimizar o armazenamento em disco, são mantidos duas árvores B* (estrutura de dados que permite armazenar informação classificada) separadas, uma para termos de até 10 caracteres e outro para termos de miss de 10 caracteres e até um máximo de 30 caracteres. Ambas as árvores B* estão estruturadas como páginas de tamanho fixo, com chaves completadas com espaços em branco à direita. Pode-se obter uma otimização de espaço de disco adicional, usando o Programa Utilitário do CISIS MYZ (capítulo 21), que comprime o dicionário do arquivo
invertido para cada uma das árvores B*, como indicado a seguir:

myz ifn 1 ifn_z tell=10
myz ifn 2 ifn_z tell=10

O dicionário do arquivo invertido resultante ifn_z está composto pelos arquivos ifn_z.cnt, ifn_z.n01, ifn_z.l01, ifn_z.n02 y ifn_z.l02. Depois de executados os comandos o arquivo ifn.ifp deverá ser renomeado como ifn_z.ifp, onde ifn_z é a versão comprimida do arquivo invertido inf.

 

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *