Inteligența artificială de la Google descrie fotografii cu o precizie de 94%
Inteligența artificială creată de Google pentru a recunoaște fotografii face progrese uimitoare, ajungând la o precizie de 94% în cele mai recente teste.
Mulți dintre noi cunoaștem deja beneficiile pe care inteligența artificială de recunoaștere a fotografiilor de la Google le-a adus prin intermediul Google Photos. Aplicația folosește o versiune destul de simplă a algoritmului pentru a identifica fotografii ce conțin câini, pisici, mâncare sau chiar persoane.
Cu toate acestea, compania lucrează la posibilități de recunoaștere a fotografiilor mult mai avansate, iar cele mai noi rezultate au fost dezvăluite recent publicului.
Echipa din spatele Google Brain arată că rezultatele de acuratețe au ajuns acum la 93,9%. Acum doi ani, în 2014, testele făcute au avut la bază modelul de clasificare de imagini Inception V1, iar acesta avea o precizie de 89,6%. Poate că o creștere de 5% nu pare prea mult, dar când vine vorba de a replica limbajul uman natural, în cazul de față pentru a descrie o fotografie, progresul este imens, relatează androidauthority.com.
Imaginea de mai sus arată progresele care s-au făcut între 2014 și 2016. Sistemul nu este doar mult mai bun în ceea ce privește identificarea obiectelor, dar a devenit și mai bun în a descrie particularități ale acestora, precum culoarea sau acțiunea desfășurată în fotografie.
Inception V3 este atât de eficient nu doar pentru că identifică elemente individuale dintr-o fotografie, dar și pentru că reușește să le pună în relație, în funcție de ce descoperă.
”De exemplu, un model de clasificare a imaginii îți va spune că ai un câine, o minge și gazon într-o fotografie, dar o descriere naturală a fotografiei îți va putea relata și ce culoare are mingea, dar și în ce ipostază se află câinele față de aceasta”, transmite Chris Shallue, inginer software în echipa Google Brain.
Rezultatele au fost atinse după ce echipe mari de indivizi au creat descrieri pentru sute de mii de fotografii, textele fiind introduse apoi în TensorFlow. Deși algoritmul se bazează pe texte create de oameni dacă imaginile sunt suficient de similare, poate crea și descrieri proprii, atunci când i se prezintă ceva nou.