IMPLANTAÇÃO DE TECNOLOGIA DE DATA WAREHOUSE EM BIBLIOTECAS COM USO DE TECNOLOGIA ADEQUADA

Autor(es): 

Érico Santos - Orientador: Prof. Francisco José Espósito Aranha

Ano: 

2000

[INTRODUÇÃO] Com o crescimento da distribuição de informações pela Internet e da publicação eletrônica de documentos, o conceito tradicional de bibliotecas como um local físico para armazenagem de informações deve evoluir para um conceito de portal. É importante que a biblioteca mantenha foco nos usuários, procurando entender suas necessidades e manter um relacionamento com os mesmos. Para isso é necessário adquirir um conhecimento dos usuários. Exemplos de técnicas para estudar o seu comportamento são cooperação indireta e link analysis (técnicas de data mining). A proposta dessa pesquisa é a definição de um data mart (extensível para um data warehouse) para bibliotecas como forma de dar suporte à aplicação de técnicas de data mining que pressuponham o acesso aos dados de circulação do acervo (ver item 1.3 para uma explicação dos termos data mart e data warehouse). [METODOLOGIA] Foi conduzido um projeto piloto de implantação de um data mart de circulação do acervo da biblioteca Karl A. Boedecker para dar suporte a um sistema de recomendações (Aranha, manuscrito). O estudo foi baseado na exploração do histórico de transações de circulação do acervo na biblioteca realizadas no período de 1º de março a 19 de julho de 1999. A base de dados inicial contém cerca de 22.500 transações (entre empréstimos, renovações e devoluções de itens) envolvendo 1.688 usuários e 4.362 itens do acervo da biblioteca. O projeto piloto pode ser dividido em: modelagem dimensional dos dados da biblioteca, com a definição do data mart, as dimensões e tabela fato; agregação de valor aos dados com o uso de técnicas de data mining; projeto e desenvolvimento do back room (processos de extração, transformação e carga) e implementação do front room (ferramentas para análise e exploração dos dados). [RESULTADOS] Foi implementado um data mart de circulação do acervo da biblioteca. Na tabela fato, cada registro corresponde a uma transação que está associada a um dia, um item do acervo, um usuário, um tipo de transação e um registro de auditoria. Essas são as dimensões. Em face do volume reduzido de dados, esse data mart pode perfeitamente ser gerenciado em uma plataforma pequena com resultados satisfatórios. Foi proposta na pesquisa a implementação por etapas de forma a permitir um baixo investimento inicial no projeto como um todo. A partir do data mart foi implementada uma rotina de tratamento dos dados de forma a gerar listas de recomendação para os usuários. Essas listas de recomendação foram disponibilizadas para cada usuário que realizou algum empréstimo na biblioteca no período estudado. Foram também testadas ferramentas para back room (tratamento prévio dos dados) e front room (análise e exploração dos dados e resultados). [CONCLUSÃO] A pesquisa comprovou a viabilidade de um modelo de data mart para circulação do acervo de bibliotecas e o uso desse data mart para dar suporte a estudos de data mining ou simples visualização dos dados. Foi testada também uma abordagem para que o modelo receba os resultados de um estudo de cooperação indireta. Foram testadas algumas técnicas de implantação desse tipo de tecnologia, entre elas a implantação de dois data marts compondo uma "via" com as dimensões. A pesquisa desenvolveu também algumas abordagens para adotar uma solução "tecnologicamente adequada", de forma a viabilizar projetos com baixo orçamento. Essas abordagens têm por objetivo tornar a implantação do sistema progressiva, reduzindo o custo inicial do projeto e permitindo que ele cresça à medida do necessário.

Departamento: 

IMQ

Anexos: