Con queste nuove tecnologie ha assunto un ruolo sempre più rilevante l’elaborazione del dato a partire da documenti di vario tipo, dunque anche e soprattutto in formato non strutturato. Se ciò è vero per la necessità di addestramento di questi modelli, è altrettanto vero rispetto alle diverse modalità di utilizzo e tipologie di elaborazione che risultano abilitate da questi strumenti.
ChatGPT ha dimostrato per primo la potenza dei Large Language Models (LLM), grazie alla loro capacità di comprendere e rispondere coerentemente agli input testuali. Inizialmente utilizzato per scopi ludici ed esplorativi, con funzionalità come traduzione, sintesi, formattazione ed interpretazione del linguaggio naturale, ha portato rapidamente all’implementazione di funzionalità avanzate, come il supporto nella generazione e interpretazione del codice (copilot), al tool calling e alla definizione di agenti, sfruttando sia la generazione di testo sia componenti applicativi integrati.
Grazie a queste nuove capacità o nuovi utilizzi dei modelli, l’intelligenza artificiale sta trovando sempre più utilizzo anche in contesti enterprise, non solo per gli scopi analitici e predittivi legati al Machine Learning, ma anche e soprattutto per portare efficientamento in diversi processi aziendali utilizzando la Generative AI.
Di seguito vengono descritti due degli ambiti di utilizzo più impiegati:
In entrambi questi esempi possiamo utilizzare come input il dato nella sua forma non strutturata.
Il primo esempio abilita la raccolta automatica di informazioni a partire da una serie di documenti che le organizzazioni nel tempo hanno raccolto, ma per i quali la metadatazione e la conversione in dato strutturato dovevano avvenire manualmente, o al più con euristiche fortemente basate sulla struttura dei documenti stessi.
Il secondo esempio invece è ciò che sta alla base dei moderni chatbot. Viene utilizzata la capacità dei LLM di generare testi in linguaggio naturale e di mantenere una conversazione di qualità con gli utenti, dando la possibilità a questi chatbot di interagire con la base documentale di cui hanno bisogno per rispondere puntualmente alle domande. Ovviamente è possibile utilizzare questa metodologia anche con il dato strutturato, ad esempio facendo generare al modello una query SQL coerente con la richiesta espressa dall’utente, e dunque recuperare dati in formato strutturato. Il vero valore si ha però combinando le due funzionalità.
In generale possiamo affermare che il dato non strutturato sta assumendo sempre più rilevanza: da un lato i nuovi strumenti dell’intelligenza artificiale permettono di facilitarne l’impiego e di ricondurlo ad una forma strutturata, che rientra dunque all’interno dei processi di utilizzo più tradizionali; dall’altro questa tipologia di dato serve a questi nuovi strumenti sia per il loro addestramento, sia in ambiti di utilizzo che portano reale valore alle organizzazioni.
Come per tutte le discipline che rientrano all’interno del Data Management, anche questi nuovi utilizzi dell’intelligenza artificiale devono essere controllati e devono rientrare all’interno di un processo di Data Governance definito a livello organizzativo.