Utilize este identificador para referenciar este registo:
https://hdl.handle.net/1822/48577
Título: | Automated watch for digital preservation |
Outro(s) título(s): | Automatização da vigilância de preservação digital |
Autor(es): | Faria, Luís Francisco da Cunha Cardoso de |
Orientador(es): | Ramalho, José Carlos Ferreira, José Miguel Araújo |
Data: | 28-Set-2017 |
Resumo(s): | The current extensive growth of digitally created documents is an obvious effect of the global tendency towards the
digital technology. Replacing paper with digital documents has become a common activity in all kinds of public
institutions and businesses, on which many already completely eradicated the use of paper and other analogue media.
European policies, such as eGovernment, urge for the public administration to cease the use of analogue media and
provide all services and documentation in digital form.
But documents in digital form are much more perishable than their paper counterparts and it is not obvious for the
users that keeping a digital document accessible for several decades is a very different task than safekeeping paperbased
documents. Furthermore, some aspects that a user will consider maintained when keeping the physical form
of the paper do not behave the same way when the information is in digital form. Authenticity is one of these aspects,
and it is crucial in some domains where the information has no value to be kept if the power to serve as evidence is
lost. The digital preservation field tries to tackle all these problems.
The main problem in digital preservation relates with the ever-changing technological environment with which the documents
must be compatible to be accessible by users. Part of the solution must include the detection of these changes
by continuously monitoring the documents, their users, and the technological, organisational, financial, legal, social
and even political environment, to detect preservation threats. However, the volume and heterogeneity of documents
make manual monitoring of all relevant aspects of the world infeasible. Moreover, current practice is limited to monitoring
influencers of a very reduced set of domains, specifically file format obsolescence, ignoring others that might
introduce threats.
This work focuses on creating automatic and systematic ways to monitor the environment on a wide set of domains
and provide a valuable input for digital preservation threat detection and assessment. It does so by inquiring the
community about their view on the preservation threat importance and the methods used to effectively detect and
monitor the threats. Then, an approach for automatic threat detection is laid out and implemented, focusing on the
most important and neglected threats. Finally, the approach is validated against real world problems, proving to be a
successful approach for scalable and automatic preservation watch. O elevado crescimento do número de documentos criados digitalmente nos últimos anos, é um claro efeito da atual tendência global para a utilização da tecnologia digital. A substituição do papel pelo formato digital nas instituições e empresas tornou-se comum, sendo certo que algumas delas erradicaram já a utilização do papel e outros suportes analógicos do seu quotidiano. As políticas europeias que têm vindo a ser adotadas — tal como o Governo Eletrónico — incentivam a administração pública a abandonar a utilização de suportes analógicos, substituindo-os pelo formato digital, tendo as entidades públicas passado a prestar os seus serviços e a disponibilizar a documentação de forma eletrónica. Todavia, os documentos em formato digital são mais efémeros que os seus análogos em papel, não sendo, contudo, óbvio para o utilizador comum que a preservação de um documento digital por dezenas de anos seja uma tarefa muito diferente da conservação de documentos em papel. Na verdade, algumas características que o utilizador comum considera implicitamente preservadas ao conservar a forma física do papel, não permanecem do mesmo modo quando a informação é mantida em formato digital: a autenticidade é uma dessas características, sendo crucial nos domínios em que o valor da informação é proporcional ao seu valor probatório. O principal problema da preservação digital prende-se com a volatilidade do ambiente tecnológico e com o qual os documentos necessitam de manter compatibilidade. Parte da solução deverá passar pela monitorização destas mudanças, através da vigilância contínua dos documentos, dos seus utilizadores e também do ambiente tecnológico, organizacional, financeiro, legal, social e até político, de modo a detetar quais as ameaças à preservação dos documentos. Contudo, o volume e heterogeneidade dos documentos digitais tornam impraticável a monitorização de todos os fatores externos relevantes para a preservação digital. Aliás, atualmente a monitorização é limitada à análise de influências pertencentes a um conjunto reduzido de domínios, especialmente ligados à obsolescência de formatos, ignorando outros que podem revelar ameaças à preservação dos documentos. O presente trabalho dedica-se ao estudo de mecanismos sistemáticos e automáticos de monitorização do ambiente num conjunto alargado de domínios e de modo a fornecer a informação necessária para a deteção e avaliação das ameaças à preservação digital. Primeiramente, a comunidade é inquirida sobre a sua perspetiva quanto à importância das várias ameaças à preservação digital e quais os métodos utilizados para detetar se tais ameaças afetam o conteúdo digital. De seguida, é apresentada uma nova abordagem para deteção automática de ameaças à preservação do conteúdo digital, focalizada nas ameaças mais importantes e negligenciadas. Finalmente, a nova abordagem é validada perante cenários reais, provando, assim, ser uma proposta viável de monitorização automática para a preservação digital. |
Tipo: | Tese de doutoramento |
Descrição: | Doctorate Thesis (Doctoral Program on Informatics) |
URI: | https://hdl.handle.net/1822/48577 |
Acesso: | Acesso aberto |
Aparece nas coleções: | KEEPS - Teses de doutoramento |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Luis Francisco da Cunha Cardoso de Faria.pdf | 6,51 MB | Adobe PDF | Ver/Abrir |