banner

L'AI Dahua promossa a pieni voti nei test KITTI di segmentazione semantica

2019-04-281068

Dahua Technology si è piazzata al primo posto nel KITTI Semantic Segmentation Evaluation, infrangendo anche il record mondiale, grazie al proprio algoritmo deep-learning di segmentazione semantica delle immagini; un risultato straordinario se si considera l’altissimo livello dei competitor: aziende AI e istituti di ricerca accademica di prima fascia.



Per raggiungere questo obiettivo abbiamo istituito centri di calcolo e raccolta dati per lo sviluppo di algoritmi su vasta scala, focalizzati sulla ricerca e la commercializzazione di diversi domini. I primi frutti si sono visti nel 2017, quando ci siamo classificati primi nei test di Scene Flow, Optical Flow e Text Recognition Detection. Lo scorso anno abbiamo prevalso nelle “discipline” 2D Vehicle Object Detection Evaluation, MOT Tracking e Pedestrian Re-identification mentre nei primi mesi del 2019 ci siamo imposti nella competizione internazionale Case Segmentation Evaluation. Il recente successo ottenuto nel campo della segmentazione semantica attesta, ancora una volta, il nostro impegno nei confronti dell’innovazione.


Sui test KITTI

La suite KITTI Vision è una piattaforma di test atta a valutare le performance dei nuovi algoritmi di machine-vision, con un focus sui sistemi di guida automatizzata. Fondata a Chicago dal Karlsruhe Institute of Technology e dal Toyota Technological Institute, è la prima e più rinomata nella sua categoria.


I test KITTI collaudano molteplici parametri dei sistemi machine-vision (stereo, flusso ottico, odometria, rilevamento oggetti, tracking, etc...) sottoponendo gli algoritmi a simulazioni complesse e sempre differenti: dalle piccole vie di campagna alle più affollate strade extra-urbane, ogni scenario coinvolge fino a 45 tra pedoni e veicoli, con vari livelli di sovrapposizione.


Sulla segmentazione semantica

La segmentazione semantica è la capacità di un algoritmo di classificare correttamente ogni pixel di una determinata immagine nella categoria di appartenenza; è alla base di ogni tecnologia machine-vision e svolge un ruolo fondamentale nelle applicazioni di guida autonoma e realtà virtuale.


Nei test KITTI di segmentazione semantica gli algoritmi vengono in primo luogo sottoposti a un training di apprendimento molto limitato, composto da meno di duecento frammenti di dati. Elaborando le informazioni ricavate gli algoritmi devono poi essere in grado di catalogare correttamente, nei sample di video e immagini su cui vengono testati, diciannove diversi tipi di oggetti tra cui pedoni, vegetazione, veicoli ed edifici.


Per prepararsi al meglio a questo test, Dahua ha riunito in un unico algoritmo il top della tecnologia nei campi della classificazione immagini, della segmentazione a target singolo e full-pixel, del migration-learning e dell’apprendimento incrementale, massimizzando la precisione e costruendo un meccanismo globale basato su funzionalità multi-posizione e multi-canale.