Analisi Video Deep Learning a Bordo Macchina

Analisi Video Deep Learning a Bordo Macchina

Analisi video, IDL aylook e algoritmi deep learning.

photo_2020-06-09_20-56-36

 

Belli vero?

È veramente un peccato che i nostri amici pelosi siano un problema per i nostri impianti di videosorveglianza intelligente. Sembra proprio che provino un immenso piacere a far scattare sensori e a farsi riconoscere come intrusi.
Perché il mio impianto ultra tecnologico che ho appena acquistato deve svegliarmi in piena notte quando il cane viene colpito da un attacco di fame improvvisa?
Ecco che mi tocca scegliere tra il mio amico peloso e l’impianto che ho appena installato… ma per fortuna la tecnologia ha fatto passi da gigante e posso tenerli entrambi.

I semplici “motion detect” fanno parte della storia ormai: i ricercatori di anteklab hanno implementato un potente algoritmo di analisi video basato su deep learning. Con IDL aylook si può attivare l’analisi video in scenari complessi e ridurre drasticamente la probabilità di falsi allarmi, così i nostri amici pelosi possono vivere in santa pace… e noi pure!

In questo articolo cercheremo di fare chiarezza sulla differenza tra intelligenza artificiale, reti neurali, algoritmi di deep learning e di machine learning. Parleremo di analisi video tradizionale, prendendo come esempio l’analisi video avanzata di aylook e vedremo le differenze con IDL aylook

AI Revolution

L’era in cui ci troviamo viene definita “ai revolution” da numerosi esperti: “rivoluzione dell’intelligenza artificiale”.

L’Intelligenza artificiale (AI – Artificial Intelligence) è una vasta materia di studio che riguarda tutte quelle macchine che hanno per obiettivo la simulazione di uno o più processi mentali dell’essere umano.

I problemi che mira a risolvere sono:

    • Ricerca e pianificazione
    • Rappresentazione e organizzazione della conoscenza
    • Percezione
    • Movimento e destrezza
    • Elaborazione del Linguaggio Naturale
    • Apprendimento (Learning)
    •  Intelligenza Generale

Fino ad oggi la videoanalisi veniva affrontata con l’approccio classico della percezione, lo vedremo poco più avanti, parlando di Analisi Video Avanzata.

Negli ultimi anni tuttavia ci si sta allontanando dai metodi classici, lasciando spazio a tecniche di apprendimento automatico, che si stanno rivelando capaci di sostituire, con risultati sistematicamente superiori, le tecnologie di “percezione”.

La grande differenza tra era digitale e era dell’intelligenza artificiale è che non ci si basa più su programmi con regole scelte dai programmatori. Si usano modelli matematici fatti da reti neurali, che permettono alla macchina di “imparare” a risolvere i problemi che le vengono posti innanzi.

Analisi Video in aylook

“L’analisi del contenuto video (video content analytics, VCA) è la capacità di analizzare automaticamente il video per rilevare e determinare eventi temporali e spaziali”

Analisi del contenuto video – (Wikipedia)

L’analisi video è quindi una diramazione di un mondo più grande, che è l’intelligenza artificiale.

Oggi, nel mondo della videosorveglianza, siamo abituati a vedere algoritmi di computer vision per il riconoscimento degli oggetti in movimento: generalmente parliamo di attraversamento linea, rilevazione di affollamento, aree di interesse.

Per tutte queste analisi si usano diverse tecniche, ma di solito ci si basa su analisi delle differenze o del flusso ottico dei pixel.

IDL aylook in funzione

L’analisi video avanzata di aylook si basa sullo studio delle differenze rispetto al background: viene stimato l’aspetto dello sfondo fisso e se i valori dei pixel della nuova immagine deviano da quelli dello sfondo, vengono ritenuti “interessanti”.

Gli ammassi di pixel interessanti vicini tra loro vengono chiamati blob. Di questi blob si può studiare la dimensione, posizione sullo schermo, velocità. Tenendo in considerazione la prospettiva, possiamo capire se i blob hanno le caratteristiche di un umano, di un riflesso, delle foglie di una pianta o di un animale.

Come? Sfruttando operazioni base di image processing.
Il collo di bottiglia di algoritmi di questo tipo sta quindi sulla tecnica di rilevamento, perché il “blob” di un cane alano che cammina verso la telecamera, assomiglia parecchio a quello di un umano e può generare falsi allarmi.

L’analisi IDL aylook risolve il problema dell’animale utilizzando un algoritmo di Learning, per essere precisi, utilizza un classificatore Deep Learning.

Non si basa più sul blob in movimento, ma usa una Rete Neurale per effettuare un’analisi profonda dei contenuti della scena  (deep recognition).

In ordine si parte dall’immagine ricevuta dalla telecamera e vengono rilevate:

      • Caratteristiche semplici: bordi, spigoli e aree colorate;
      • Combinazioni di queste caratteristiche semplici: forme geometriche;
      • Combinazioni di queste forme geometriche: parti degli oggetti
      • Combinazioni di queste parti degli oggetti: gli oggetti stessi
      • Etc, etc…

Ogni volta che si aggiunge un livello di “profondità” (combinazione di “qualcosa”) si possono riconoscere oggetti e forme sempre più complesse: cani, gatti, persone, veicoli, siepi etc.

L’obiettivo è scansionare l’immagine per scoprire quali sono i suoi contenuti: il sole, le nuvole. le montagne, il cervello (neural network) in questo momento non conosce il concetto di sole, nuvola e montagna, glielo dobbiamo insegnare.

A questo punto abbiamo un algoritmo di deep recognition, ovvero “riconoscimento profondo”.

Quando diventa deep learning?

Diventa deep learning nel momento in cui ho un dataset di immagini (con relativi risultati da trovare) e chiedo alla macchina di sfruttarlo per trovare il modo ottimale di individuare spigoli, forme geometriche, parti degli oggetti, combinazioni di parti.

Mostriamo alla neural network un grande numero di esempi, con i relativi risultati da trovare. L’algoritmo machine learning fa in modo che la neural network impari a riconoscere i pattern caratteristici del sole, delle nuvole e delle montagne

Al termine di questa operazione, si dice che la Rete Neurale è stata allenata: adesso è in grado di stimare un risultato da sola.

Ora la neural network è allenata su tantissime immagini di panorami, la prossima volta che le verrà dato in pasto un panorama da analizzare, riconoscerà che ci sono montagne e nuvole, ma che il sole non si vede.

Es: “persona di dimensioni 60x30px in coordinata x=238, y=150”.

Per un un algoritmo di deep learning, una persona e un alano sono profondamente diversi tra loro, tanto quanto una persona è diversa da una siepe. È proprio questo il motivo per cui la probabilità di falsi allarmi viene abbattuta drasticamente e aumenta l’affidabilità della rivelazione.

Per ulteriori articoli informativi di questo tipo ti invitiamo a rimanere in contatto con noi, iscrivendoti alla
pagina Facebook di aylook

Limitazioni di qualunque analisi video deep learning.

Potenza di calcolo

Le Neural Networks devono eseguire un carico sostanziale di conti specifici (chiamate convoluzioni e calcoli tensoriali) che occupano facilmente tutta la potenza di calcolo di una regolare CPU. Per questo si utilizzano processori dedicati, progettati per eseguire tali operazioni. (es. Google Coral TPU, Nvidia Tensor Core, Intel Movidius e Nervana, etc.)

Dataset

Le capacità dell’algoritmo sono limitate dagli esempi a disposizione in fase di allenamento. Un pavone potrebbe non essere riconosciuto tra gli animali, se non era presente nel dataset!

Se la libreria di esempi dovesse contenere esclusivamente immagini di telecamere montate a bolla e che guardassero verso l’orizzonte, nel caso in cui quest’ultima venisse montata storta o inquadrasse il pavimento, l’algoritmo potrebbe non riconoscere le persone in modo affidabile.

E’ fondamentale conoscere i presupposti del funzionamento dell’algoritmo per progettare ed installare un impianto fatto a regola d’arte, perché un’immagine pulita, che inquadra correttamente la scena migliorerà le prestazioni dell’analisi video.

Gli installatori e i system integrator certificati aylook EBI hanno seguito un corso che include, tra l’altro, nozioni di deep learning relative al funzionamento di IDL aylook.

Vantaggi di aylook IDL

Tecnologia in evoluzione e aggiornamenti software

Gli aylook abilitati per IDL montano già l’hardware adatto per versioni future dell’algoritmo, perciò con dei semplici aggiornamenti software sarà possibile “rendere più intelligenti” le telecamere di sicurezza senza intervenire in nessun punto dell’impianto!

Come le automobili Tesla, un aylook con l’hardware adatto per IDL può essere aggiornato da remoto!

Correzione prospettica

IDL aylook non è solo un classificatore. In questo algoritmo abbiamo mantenuto i punti di forza dell’algoritmo precedente: la correzione prospettica ci permette di controllare che gli oggetti rilevati rientrino nelle dimensioni corrette, che non si muovano troppo velocemente o troppo lentamente e che si trovino nell’area di interesse abbastanza a lungo per essere classificati come allarme.

Questa è la vera forza del motore IDL. È un ibrido che combina decenni di esperienza nel mondo dell’analisi video classica e le potenti tecnologie emergenti. Tanti usano algoritmi di Deep Learning, noi lo miglioriamo rendendolo specifico per la videosorveglianza.

Non è sufficiente sapere se c’è un umano nell’inquadratura, devo controllare che si trovi nell’area di interesse, devo valutare il suo tempo di permanenza, devo capire se sta solo transitando. In poche parole: devo capire se è un pericolo oppure no.

Chi utilizza già i nostri sistemi, tra l’altro, noterà che l’interfaccia di impostazione dell’analisi è rimasta identica a quella dell’analisi video avanzata:

      1. Imposta la prospettiva
      2. Disegna le aree di interesse
      3. Salva le impostazioni

Fare il passaggio da una all’altra è quindi rapido e indolore.

Sei un installatore o system integrator e vuoi scoprire come sfruttare queste tecnologie per potenziare i tuoi impianti?
Pitbull di aylook in versione originale
Pitbull di aylook rigenerato da un algoritmo deep learning su deepdreamgenerator.com
Ibrido tra illustrazione classica e quella generata da un algoritmo basato su deep learning. Pitbull IDL?
IDL aylook è ibrido: usa tecniche di computer vision classiche assieme a tecnologie deep learning

Perché usare sistemi di analisi video?

Esistono numerosi tipi di sensori: volumetrici, sismici, inerziali, fotocellule, barriere a microonde etc.

La domanda sorge lecita: perché utilizzare l’analisi video invece dei sensori specializzati?
La risposta ovviamente è dipende! L’analisi video può anche non essere sempre l’opzione migliore.

Le telecamere vanno montate comunque

La prima ragione può essere la minimizzazione dei cablaggi e dei lavori da fare per l’installazione. Nella maggior parte dei casi non ho necessità di fare grandi lavori di cablaggio  per installare telecamere, il che potrebbe non essere il caso per l’installazione di barriere perimetrali.

In ogni caso servono telecamere per verificare gli allarmi. Perché non farle diventare sensori?

Il sensore installato rimarrà sempre com’è, la telecamera può diventare più intelligente.

Il sensore classico, una volta installato, viene sfruttato per il 100% della propria tecnologia. Con il passare del tempo invecchia e la sua efficacia non può che rimanere la stessa o, al limite, peggiorare.

Le possibilità di sviluppo software per una telecamera sono infinite: un sensore, in fin dei conti, non è altro che un’immagine 1×1 pixel (un pixel molto grande) e fornisce quindi 1 informazione alla volta. Un’immagine da 8 Megapixel racchiude 8 milioni di informazioni che aspettano di essere analizzate, è quindi chiaro che lo spazio per lo sviluppo sia maggiore.

Perchè usare l’uno o l’altro quando si possono usare insieme?

Con aylook usare sensori o analisi video non presuppone di scegliere l’uno o l’altro. Grazie al motore di azioni possiamo far lavorare centrale e videoanalisi in sinergia.

“Se si allarma il sensore del vialetto e la telecamera dell’ingresso percepisce un movimento, fai scattare l’allarme”.

Vogliamo usare le uscite programmabili della centrale allarmi?

“Se l’analisi video o il volumetrico esterno rilevano un movimento, accendi l’irrigazione per 10 minuti in giardino.”

Quantomeno questo intrusore si prenderà un po’ di acqua fresca!

Scopri di più

Sei un installatore o system integrator di sistemi di sicurezza?

Il team di aylook ti invita a sfruttare il tempo che hai a disposizione per scoprire e approfondire l’ambiente di soluzioni integrate aylook.

Partecipa gratuitamente ai nostri webinar formativi!

2 risposte a “Analisi Video Deep Learning a Bordo Macchina”

  1. Sicuramente l’analisi video a questi livelli, è di grande supporto ai sistemi di antintrusione elevando il grado di sicurezza a livelli mai visti prima. Vorrei però fosse sempre specificato che le due cose vanno in sinergia e non che una sostituisce l’altra. Come sempre uniti si vince.

    1. Quando le due cose lavorano insieme si possono sempre raggiungere risultati superiori, che si tratti di aumentata ridondanza o di aumentata sensibilità del sistema. “Perché accontentarsi di uno quando si possono usare entrambi in sinergia?”. O ancora, tornando indietro, per quale motivo gli impianti di antintrusione dovrebbero essere indipendenti da quelli di videosorveglianza?

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *