Cerca nel sito per parola chiave

rapporti - Deliverable

Risultati di un’analisi dei documenti prodotti nell’ambito della Ricerca di Sistema finalizzata alla produzione di un lessico di dominio

rapporti - Deliverable

Risultati di un’analisi dei documenti prodotti nell’ambito della Ricerca di Sistema finalizzata alla produzione di un lessico di dominio

Recently updated on Aprile 7th, 2021 at 12:36 pm

Nell’ambito del progetto DIFFONDI, che prevede la realizzazione di un portale finalizzato alla pubblicazione su Internet dei risultati della RICERCA DI SISTEMA, in particolare nella loro forma documentale, è stato avviato all’inizio del 2001 il sottoprogetto KNOWMAN per sviluppare nuove funzionalità di Knowledge Management al fine di assicurare l’agevole reperimento delle informazioni contenute nella documentazione suddetta. In quest’ambito è stato realizzato un GLOSSARIO contenente le definizioni dei vocaboli tecnici e normativi con la loro spiegazione, se il caso con supporti multimediali, in modo da rendere i documenti più facilmente fruibili nonché direttamente reperibili tramite opportuni rinvii. Questo strumento quindi non solo consente di interpretare in modo corretto i documenti ma permette inoltre la ricerca di quelli attinenti ad una particolare voce od argomento, fornendo nello stesso tempo utili indicazioni sulla nomenclatura tecnica e normativa. È evidente come fosse fin da subito naturale porsi il problema, oltre che del caricamento iniziale, dell’aggiornamento nel tempo soprattutto a fronte di nuovi contributi documentali forniti da altri operatori che dovessero affacciarsi nel campo della Ricerca sul Sistema Elettrico con il conseguente allargamento del dominio terminologico. La soluzione più immediata è parsa la sperimentazione di strumenti che consentissero il caricamento, il più possibile automatico, dei lemmi che si trovano referenziati ed in alcuni casi anche definiti nei documenti stessi della RICERCA DI SISTEMA, vale a dire, in sintesi, la costruzione assistita di una base terminologica di un dominio. A tale proposito si è avviata una collaborazione con il Laboratorio d’Intelligenza Artificiale dell’Università di Roma “Tor Vergata” avente come scopo la costruzione di una risorsa terminologica (o database terminologico) su di un dominio conoscitivo costituito da oltre 2400 documenti per una mole di 3.5 GB Sono state applicare tecniche d’apprendimento semiautomatico utilizzando risorse già progettate, sperimentate e pubblicate 1 su altri domini, opportunamente adattate per produrre una risorsa finale contenente circa 5.000 termini con i loro esempi d’uso. Questo processo ha comportato il passaggio tra le seguenti fasi: �‰ individuazione del modello esteso della base documentale e produzione di una prima lista di termini,

�‰ validazione manuale della prima versione della risorsa, �‰ seconda analisi del modello esteso e produzione della lista finale di termini, che verranno meglio dettagliate nei capitoli seguenti. 1 Vedi Bibliografia

Progetti

Commenti