AlbiBooks: chatboot

Abstract

O AlbiBooks é um projeto desenvolvido em duas fases, que visa desenvolver um chatbot inteligente para interação com a base de dados de uma biblioteca. O objetivo principal é democratizar o acesso aos serviços bibliotecários e torná-lo mais eficiente, permitindo consultas e recomendações de livros de forma prática e intuitiva. Na primeira fase (Projeto I), foi realizada uma revisão sistemática da literatura, com base na metodologia PRISMA, centrada na aplicação de chatbots em bibliotecas. A nível técnico, foi implementado um pipeline do tipo Retrieval-Augmented Generation(RAG), com testes realizados sobre três modelos de linguagem locais: DistilGPT2, Llama-2-13b-chat-hf e Zephyr-7b-beta. Na segunda fase (Projeto II), o sistema foi reestruturado através do uso de modelos de linguagem acessíveis via API (como o Gemini), e um novo modelo de embeddings(mistral-embed). Foi também introduzido um dataset recolhido por web scraping, e a arquitetura do pipeline foi otimizada para melhorar o desempenho e a escalabilidade. O relatório descreve esta evolução, os testes realizados e a comparação entre as abordagens adotadas
Abstract: AlbiBooks is a two-phase project aimed at developing an intelligent chatbot for interacting with a library database. The main objective is to democratize access to library services and make them more efficient by enabling users to search and receive book recommendations in a practical and intuitive manner.In the first phase (Project I), a systematic literature review was carried out using the PRISMA methodology, focusing on the application of chatbots in libraries. On a technical level, a Retrieval-Augmented Generation (RAG) pipeline was implemented and tested using three local language models: DistilGPT2, Llama-2-13b-chat-hf, and Zephyr-7b-beta. In the second phase (Project II), the system was restructured through the use of API-based language models (such as Gemini) and a new embedding model (mistral embed). A dataset was also introduced via web scraping, and the pipeline architecture was optimized to improve performance and scalability. This report presents the project’s evolution, the tests carried out, and a comparison between the two approaches.

Description

Keywords

Chatbot, Inteligência artificial, Retrieval-augmented generation (RAG), Large language model (LLM), Biblioteca, Artificial intelligence, Libraries

Citation

DUARTE, Ana Margarida Pereira ; PEREIRA, Gabriel de Santana (2025) - AlbiBooks : chatbot. Castelo Branco : IPCB. EST. 113 p. Relatório do Trabalho de Fim de Curso de Informática e Multimédia