Nel seminario verrà presentato il progetto di ricerca FIRB "Piattaforma di servizi integrati per l'accesso semantico e plurilingue ai contenuti culturali italiani nel web", il cui obiettivo principale è l'elaborazione di strumenti di selezione e classificazione dei contenuti relativi ai domini della Linguistica, dell'Arte e della Letteratura.
Dopo una panoramica generale sul progetto di ricerca verranno presentate in dettaglio le fasi dell'estrazione terminologica automatica e della successiva validazione, operata dagli esperti di settore. Verrà mostrato il procedimento dell'estrazione terminologica a partire da corpora testuali di dominio e verrà illustrata una proposta di classificazione delle unità lessicali estratte, sulla base dei concetti di "termine", "quasi-termine" e "non termine".
Verranno infine illustrate le prospettive di ricerca, con particolare riferimento alla costruzione di una base di conoscenza per ciascun dominio a partire dalle liste di termini validati.