Top 6 modelos de organização de arquivos (com diagrama)

Este artigo lança luz sobre os seis principais modelos de organização de arquivos. Os modelos são: 1. Organização do arquivo de acesso cumulativo 2. Organização do arquivo de acesso sequencial 3. Organização do arquivo de acesso indexado (invertido) 4. Organização do arquivo de acesso seqüencial indexado 5. Organização do arquivo de acesso direto 6. Organização do arquivo de acesso com anel múltiplo.

Organização do Arquivo de Acesso ao Arquivo Modelo # 1. Organização do Arquivo:

Arquivo de pilha contém um conjunto de registros em nenhuma ordem particular.

Os registros são armazenados conforme eles chegam.

Eles não seguem nenhuma sequência específica de valores de atributos.

Esse método de armazenamento de registros é adotado quando não é possível organizar os registros em nenhuma ordem lógica, quando os campos do registro não são bem definidos e o uso exato do arquivo não pode ser antecipado.

Geralmente, os arquivos são criados nesse modo digitando os documentos na ordem em que chegam. A pilha assim criada pode ser então organizada em outra feita.

O local de um registro em um arquivo de pilha pode ser feito pesquisando sequencialmente os registros até que o valor desejado do atributo de chave seja atingido. A adição de novos registros em um arquivo de pilha é muito simples. Novos registros são adicionados no final do arquivo.

Alterações e exclusões de registros no arquivo de pilha armazenados em mídia de acesso aleatório podem ser feitas localizando o registro e alterando seu conteúdo ou sinalizando o registro para indicar que o registro foi invalidado. O arquivo pode ser reorganizado periodicamente para remover os buracos criados pela exclusão de registros. No entanto, a atualização do arquivo de pilha em mídia de acesso seqüencial pode ser feita apenas criando um novo arquivo.

Organização do Arquivo Modelo # 2. Organização do Arquivo de Acesso Sequencial:

Na organização sequencial, as ocorrências de registro são referenciadas na ordem em que são armazenadas fisicamente. Os dados armazenados em cartões e fitas são necessariamente armazenados sequencialmente. Dispositivos de acesso direto, como discos, podem ser, mas não são necessariamente referenciados sequencialmente.

Às vezes, o processamento é feito melhor através do acesso seqüencial, mesmo quando dispositivos de acesso direto são usados. Tal é o caso quando muitos registros de um arquivo devem ser acessados ​​para satisfazer uma solicitação de dados.

Em um arquivo seqüencial, os registros são mantidos na seqüência lógica de seus valores de chave primária. O processamento de um arquivo seqüencial é conceitualmente simples, mas ineficiente para acesso aleatório. No entanto, se o acesso ao arquivo for estritamente seqüencial, um arquivo seqüencial será adequado. Um arquivo seqüencial pode ser armazenado em um dispositivo de armazenamento seqüencial, como uma fita magnética.

Em uma atualização de arquivo sequencial, os registros de transação estão na mesma sequência do arquivo mestre. Registros de ambos os arquivos são combinados com base em um registro por vez, resultando em um arquivo mestre atualizado, conforme mostrado na fig. 16, 1.

Vantagens / Méritos:

1. Erros nos arquivos permanecem localizados.

2. Carregar um registro requer apenas a chave de registro.

3. Simples de entender a abordagem.

4. Fácil de organizar, manter e entender.

5. Mídia e dispositivo de entrada / saída (E / S) relativamente baratos podem ser usados.

6. Os arquivos podem ser relativamente fáceis de reconstruir, uma vez que uma boa medida de backup embutido geralmente está disponível.

7. Eficiente e econômico se a taxa de atividade, ou seja, a proporção de registros de arquivos a serem processados ​​for alta.

Deméritos / Desvantagens:

1. As transações devem ser classificadas e colocadas em sequência antes do processamento.

2. A redundância de 'dados' é tipicamente alta, já que os mesmos dados podem ser armazenados em vários arquivos seqüenciados em chaves diferentes.

3. Inquéritos aleatórios são praticamente impossíveis de lidar.

4. A pontualidade dos dados no arquivo se deteriora enquanto os lotes estão sendo acumulados.

5. Todo o arquivo deve ser processado mesmo quando a taxa de atividade é muito baixa.

6. Este método é adequado para os pequenos registros. Se o registro for muito grande, muito tempo será gasto na organização do arquivo.

Organização do Arquivo Modelo nº 3. Organização do Arquivo de Acesso Indexado (invertido):

Na organização de arquivos invertidos, um índice é mantido para cada atributo-chave do registro. O arquivo de índice contém o valor do atributo-chave seguido pelos endereços de todos os registros no arquivo principal com o mesmo valor do atributo-chave.

No exemplo de informações de pessoal para vários professores, o arquivo principal contém os registros de seis professores, como segue:

O arquivo de índice para o atributo-chave, qualificação educacional, conteria:

Pós-graduação 1, 4, 6

Pós-graduação 2, 3 Ph.D. 5

E isso para o assunto de atributo chave ensinado conteria:

Economia 6

Hindi 1

História 2, 5

Física 2, 4

O arquivo principal não precisa conter os valores dos atributos para os quais os índices foram mantidos, uma vez que já estão contidos no arquivo de índice. O arquivo principal também pode não estar em nenhuma sequência específica. Pode ser apenas um arquivo de pilha.

A organização de arquivos invertidos requer três tipos de arquivos a serem mantidos, o arquivo principal, os arquivos de diretório e os arquivos de índice. O arquivo de diretório contém o valor dos atributos-chave e o ponteiro para o primeiro registro no arquivo de índice, onde estão contidos os endereços de todos os registros no arquivo principal com esse valor do atributo-chave. Existe um arquivo de diretório para cada atributo-chave.

O arquivo invertido é muito útil, onde a lista de registros com valores especificados do atributo-chave é necessária. Por exemplo, queremos ter uma lista de todos os professores postados no distrito de Lucknow ou todos aqueles que ensinam física. A adição de registros no arquivo principal pode ser feita no final do arquivo, uma vez que não é mantida em nenhuma sequência.

No entanto, entradas correspondentes devem ser feitas em todos os arquivos de índice para os atributos-chave do registro. Alterações nos principais atributos do registro e exclusões também terão que ser acompanhadas por alterações correspondentes nos arquivos de índice. A manutenção de arquivos de índice, portanto, pode ser muito demorada.

Organização do Arquivo Modelo # 4. Organização do Arquivo de Acesso Sequencial Indexado:

A recuperação de um registro de um arquivo seqüencial, em média, requer acesso a metade dos registros no arquivo, tornando essas consultas não apenas ineficientes, mas muito demoradas para arquivos grandes. Para melhorar o tempo de resposta da consulta de um arquivo seqüencial, um tipo de técnica de indexação pode ser adicionado.

Um índice é um conjunto de pares. A indexação associa um conjunto de quantidades ordenadas, que geralmente são menores em número ou suas propriedades, fornecem um mecanismo para uma pesquisa mais rápida. O objetivo da indexação é acelerar o processo de pesquisa. Índices criados a partir de um conjunto seqüencial (ou classificado) de chaves primárias são referidos como índices sequenciais.

Embora os índices e os blocos de dados sejam mantidos juntos fisicamente, nós os distinguimos logicamente. Usaremos o termo arquivo de índice para descrever os índices e o arquivo de dados para se referir aos registros de dados. O índice é geralmente pequeno o suficiente para ser lido na memória do processador.

Um arquivo seqüencial (para classificados em chaves primárias) que é indexado é chamado de tamanho seqüencial do índice. O índice fornece acesso aleatório aos registros, enquanto a natureza seqüencial do arquivo fornece fácil acesso aos registros subsequentes, bem como ao processamento sequencial. Um recurso adicional deste sistema de arquivos é a área de overflow. Esse recurso fornece espaço adicional para adição de registro sem precisar da criação de um novo arquivo.

Méritos / Vantagens:

1. Permite acesso rápido aos registros de maneira relativamente eficiente quando essa atividade é uma pequena fração da carga de trabalho.

2. Permite o uso eficiente e econômico de técnicas de processamento sequenciais quando a taxa de atividade é alta.

Deméritos / desvantagens:

1. Menos eficiente no uso de espaço de armazenamento do que algumas outras alternativas.

2. Recursos de hardware e software relativamente caros são necessários.

3. Recuperação lenta em comparação com o acesso aleatório, pois a pesquisa do índice requer tempo.

Organização do Arquivo Modelo # 5. Organização do Arquivo de Acesso Direto:

O acesso sequencial a índices é adequado para os dados de estoque do comprador, pois seu arquivo deve ser acessado de forma sequencial e direta, e a atualização é feita periodicamente até que as informações de minuto não sejam necessárias. Muitos aplicativos, por outro lado, exigem recuperação de tempo e atualização de linha para manter as informações mais atualizadas possíveis.

Corretores, por exemplo, precisam de rápida atualização e recuperação de dados de preços de ações. As companhias aéreas exigem rápida atualização e recuperação de dados de passageiros, e os caixas automáticos exigem acesso rápido aos registros bancários.

O acesso direto a arquivos indexados de método de acesso seqüencial (ISAM) grandes é retardado pelo fato de que os índices e talvez as áreas de overflow devem ser pesquisadas antes que o registro desejado possa ser transferido para a memória principal. Ainda pior atualização de (ISAM), arquivos é retardada pela necessidade de atualizar índices e ponteiros e transferir registros de áreas primárias para estouro.

O método de acesso direto foi desenvolvido para satisfazer a necessidade de atualizar e recuperar dados rapidamente. Nesta abordagem, um algoritmo é usado para calcular o endereço de um registro. O valor da chave primária é a entrada para o algoritmo e o endereço do bloco do registro é a saída.

Para implementar a abordagem, uma parte do espaço de armazenamento é reservada para o arquivo. Esse espaço deve ser grande o suficiente para conter o arquivo e alguma margem de crescimento. Em seguida, é criado um algoritmo que gera o endereço apropriado para uma determinada chave primária.

O algoritmo é comumente chamado de algoritmo de hashing e o método de acesso direto é chamado de acesso com hash. O processo de conversão de valores de chave primária em endereços é chamado de transformação de chave para endereço.

Mais de um registro lógico geralmente se encaixa em um bloco, então podemos pensar na área de armazenamento reservado como sendo dividida em slots de registro numerados sequencialmente de 1 a n. Esses números seqüenciais são chamados de números de registro relativos, ponteiros relativos ou endereços relativos, porque indicam a posição do registro em relação ao início do arquivo.

Méritos / Vantagens:

1. As transações não precisam ser classificadas.

2. Diferentes discos ou unidades de disco não são necessários para atualizar registros, pois os registros existentes podem ser alterados sobrescrevendo-os.

3. Também é possível processar registros de arquivos diretos sequencialmente em uma sequência de chave de registro.

4. Uma organização de arquivos diretos é mais adequada para aplicações on-line interativas, como sistemas de reservas de linhas aéreas ou ferroviárias, facilidades de caixa em aplicações bancárias, etc.

5. O acesso imediato aos registros para fins de atualização é possível.

6. Consultas aleatórias que são muito freqüentes em situações de negócios podem ser facilmente tratadas.

Deméritos / desvantagens:

1. Pode ser menos eficiente no uso do espaço de armazenamento do que o arquivo organizado seqüencialmente.

2. Recursos caros de hardware e software são necessários.

3. Complexidade relativa da programação.

4. O design do sistema em torno dele é complexo e caro.

5. Os dados podem ser apagados acidentalmente ou até mesmo escritos, a menos que sejam tomadas precauções especiais.

6. Medidas especiais de segurança são necessárias para arquivos diretos on-line acessíveis a partir de várias estações.

7. A atualização de arquivos (registros de adição e exclusão) é mais difícil em comparação com arquivos sequenciais.

8. Registros na linha podem ser expressos para os riscos de perda de precisão e uma quebra de segurança Procedimentos especiais de backup e reconstrução devem ser estabelecidos.

Organização do Arquivo Modelo # 6. Organização de Arquivo de Acesso Multi-Ring:

Onde a lista de registros com valores de atributos de chave específicos é desejada com frequência, os arquivos de vários anéis são muito úteis. Por exemplo, gostaríamos de ter a lista de professores que ensinam física ou a lista de professores postados no distrito de Lucknow ou a lista de professores que se aposentam em um determinado ano. Nesta organização de arquivos, todos os registros com um valor de atributo de chave especificado são alterados juntos.

O arquivo de diretório, como o da organização de arquivos invertidos, contém o ponteiro para o primeiro registro com o valor do atributo de chave especificado - o primeiro registro contém o endereço do segundo registro na cadeia e o segundo contém o endereço do terceiro registro quando o último registro na cadeia contém o ponteiro para o primeiro registro, diz-se que os registros formam um anel.

Vários desses anéis para diferentes valores de atributos-chave e para diferentes atributos podem ser formados. O diretório fornece ponto de entrada para os anéis.