Dettaglio incarico o sussidio
Tematica: Il progetto di ricerca intende potenziare una pipeline RAG preesistente per il recupero intelligente diarticoli scientifici, valutandone il comportamento su corpora molto più estesi al fine di comprendere lascalabilità delle prestazioni e dei costi computazionali. L’espansione del dataset permetterà un confrontosistematico tra metodi di ricerca esatta e tecniche approximate nearest neighbor, indispensabile quando ilnumero di documenti cresce verso centinaia di migliaia o milioni di unità. La ricerca esplorerà modelli diembedding più avanzati e specifici per il dominio scientifico, come SPECTER2, E5 adattati o SciBERT sottopostoa fine-tuning. Verranno inoltre valutate tecniche ibride che combinano segnali densi e sparsi, integrando BM25con un re-ranker leggero per migliorare il top-k senza incrementi significativi di latenza. Nell’implementazionedella pipeline di elaborazione è richiesta una struttura modulare del software. Responsabile scientifico: prof. ANTONELLO RIZZI
o
.