Una piattaforma per l’analisi di contenuti online ha potenziato le proprie funzionalità grazie a una soluzione basata su Natural Language Processing, knowledge graph interattivo e un assistente virtuale AI, semplificando l’esplorazione di migliaia di testi e migliorando la qualità degli insight estratti.
Success case
AI generativa per analizzare contenuti web non strutturati
Il cliente è una realtà specializzata nella cybersecurity e nella protezione delle informazioni strategiche, attiva nello sviluppo di tecnologie per la sicurezza digitale, l’analisi dei dati testuali e il supporto alle decisioni in contesti ad alta complessità. Gestisce una piattaforma proprietaria progettata per raccogliere, organizzare e consultare grandi volumi di contenuti testuali provenienti dal web, al fine di monitorare fenomeni rilevanti e anticipare potenziali minacce.
il Contesto
L’innesco del cambiamento
Ogni giorno la piattaforma del Cliente acquisiva migliaia di articoli, report, comunicazioni e documenti pubblici. Tuttavia, l’eterogeneità dei formati, la mancanza di struttura semantica e la ridondanza dei contenuti compromettevano la capacità degli analisti di accedere rapidamente alle informazioni davvero rilevanti, rallentando le attività di monitoraggio e valutazione del rischio.
Il bisogno era evidente: potenziare la piattaforma con strumenti intelligenti capaci di estrarre automaticamente entità e concetti, riconoscere relazioni tra informazioni complesse e migliorare la qualità delle risposte. L’obiettivo? Ridurre il rumore informativo, aumentare la precisione delle analisi e semplificare il lavoro umano nei processi di cybersecurity e intelligence informativa.
la soluzione
Come abbiamo trasformato la piattaforma in uno strumento intelligente
Un motore NLP su misura per analizzare testi non strutturati
Per rispondere alle esigenze del cliente, abbiamo progettato una soluzione modulare e scalabile, integrando tecnologie avanzate di Natural Language Processing (NLP), AI generativa e knowledge graph in un’unica architettura distribuita.
Il cuore del sistema è un motore NLP personalizzato, in grado di analizzare contenuti testuali non strutturati per estrarre entità, concetti chiave e relazioni semantiche, rendendo le informazioni immediatamente fruibili e organizzate secondo logiche di significato.
Le informazioni estratte vengono organizzate in un knowledge graph interattivo, che consente agli analisti di navigare visivamente le connessioni tra eventi, organizzazioni, persone e luoghi. Questa mappa semantica rende evidenti correlazioni e pattern altrimenti nascosti, sbloccando nuovi livelli di insight.
Per rendere l’esperienza più intuitiva ed efficiente, è stato integrato un assistente virtuale basato su AI generativa, capace di comprendere richieste formulate in linguaggio naturale e interrogare la piattaforma in tempo reale.
Questo consente agli utenti di ottenere risposte mirate a domande complesse senza dover navigare manualmente tra documenti, aumentando la velocità e la qualità dell’analisi.
La soluzione è stata sviluppata secondo un’architettura a microservizi containerizzati, con orchestrazione dinamica dei flussi NLP e possibilità di estensione a nuovi domini informativi. Questa configurazione garantisce aggiornabilità continua, adattabilità ai contesti di cybersecurity e una facile integrazione con altri strumenti di analisi già in uso.
Elementi di innovazione
Classificazione semantica automatica su larga scala
Integrazione tra NLP, grafo semantico e interfaccia AI conversazionale
Architettura distribuita e modulare per analisi continue
Stack tecnologico & dominio AI
Tecnologia al servizio del risultato
AI Domain
NLP | Generative AI | Knowledge Graphs | Computer Vision
Tecnologie
Python | Meta-Llama | Apache Airflow | Docker | Transformers | Yolo
Modelli
Modelli LLM per analisi testuale e NLP | Rete semantica costruita ad hoc
Framework/Stack
Architettura a microservizi containerizzata con orchestrazione Airflow
I risultati
Impatto, numeri, valore
Dati, insight e velocità: un nuovo modo di fare ricerca
Benefici chiave:
- Riduzione significativa del tempo di ricerca e analisi
- Miglioramento della qualità delle analisi e della pertinenza dei risultati
- Esperienza utente radicalmente migliorata grazie alla conversazione in linguaggio naturale
- Capacità di navigare i contenuti secondo logiche semantiche