Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/47724

TítuloRODA-in: a generic tool for the mass creation of submission information packages
Outro(s) título(s)RODA-in: ferramenta genérica para a criação em massa de pacotes de informação de submissão
Autor(es)Pereira, André Diogo Ribeiro Assunção
Orientador(es)Ramalho, José Carlos
Faria, Luís
Data25-Nov-2016
Resumo(s)Digital preservation is the sum of activities necessary to ensure the long-term access to digital information. The OAIS standard(ISO, 2012a) was developed in order to ease the communication between the various entities involved in the preservation of digital objects and regulate the long-lasting storage of digital information. The preservation process begins when the producer creates Submission Information Packages (SIP) and uploads them to the archive’s repository. To create these packages, the producer must choose which files to archive and provide extra information (metadata) to describe and to allow finding the information. As the production of digital content increases exponentially, the creation of SIP by current methods can be too onerous and even unfeasible. This work focuses on creating a semi-automatic way of producing SIPs by employing a simple and well-defined workflow. Using the file system as the source of content, the producer defines aggregation and metadata association rules and specify how the SIPs are created. The application that was developed to support this work, RODA-in, was designed to be able to create thousands of SIPs with gigabytes of data in an easy to use way. Additionally, it has multiple features that ease the work of the producer, such as metadata templating and mass edition.
A preservação digital define-se pelo conjunto das atividades necessárias para garantir o acesso a longo prazo à informação digital. A norma OAIS(ISO, 2012a) foi desenvolvida para facilitar a comunicação entre as várias entidades envolvidas na preservação de objetos digitais e regular o armazenamento duradouro da informação digital. O processo de preservação começa quando o produtor cria Pacotes de Informação de Submissão (SIP) e os envia para um repositório de um arquivo. Para criar estes pacotes, o produtor tem que escolher os ficheiros que pretende arquivar e fornecer informação extra (metadados) para descrever e permitir a descoberta da informação. Uma vez que a produção de conteúdo digital tem vindo a crescer exponencialmente, a criação de SIP pelos métodos atuais pode ser demasiado oneroso ou mesmo impraticável. Este trabalho foca-se na criação de uma forma semi-automática the produzir SIPs empregando um workflow simples e bem definido. Usando o sistema de ficheiros como fonte do conteúdo, o Produtor define regras de agregação e de associação de metadados que especificam como os SIPs são criados. A aplicação que foi desenvolvida para suportar este trabalho, RODA-in, foi desenhada para ser capaz de criar milhares de SIPs com gigabytes de dados e para ser de fácil utilização. Adicionalmente, possui múltiplas funcionalidades que facilitam o trabalho do Produtor, como por exemplo a criação de metadados a partir de um modelo ou a edição em massa de metadados.
TipoDissertação de mestrado
DescriçãoDissertação de mestrado em Engenharia Informática (área de especialização em Processamento de Linguagens e Conhecimento)
URIhttps://hdl.handle.net/1822/47724
AcessoAcesso aberto
Aparece nas coleções:BUM - Dissertações de Mestrado
DI - Dissertações de Mestrado
KEEPS - Dissertações de mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
André Diogo Ribeiro Assunção Pereira.pdfTese1,23 MBAdobe PDFVer/Abrir

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID