Google piedāvā bezmaksas metadatu kopas ar dažu kadru dziļu AI un mašīnmācīšanās algoritmiem ātrai un efektīvai attēlu klasifikācijai TensorFlow un PyTorch

Tech / Google piedāvā bezmaksas metadatu kopas ar dažu kadru dziļu AI un mašīnmācīšanās algoritmiem ātrai un efektīvai attēlu klasifikācijai TensorFlow un PyTorch 2 minūtes lasīts

Google Pixel 5?



Google ir paziņoja par vairāku datu kopu pieejamību kas sastāv no daudzveidīgiem, bet ierobežotiem dabiskiem attēliem. Meklēšanas gigants ir pārliecināts, ka publiski pieejamie dati palielinās tempu Mašīnmācība un mākslīgais intelekts vienlaikus samazinot laiku, kas vajadzīgs AI modeļu apmācībai ar minimālu datu daudzumu. Google jauno iniciatīvu sauc par “Bezmaksas metadatu kopām”, kas palīdzēs AI modeļiem “mācīties”, izmantojot mazāk datu. Uzņēmuma ‘Few-Shot AI’ ir optimizēts, lai nodrošinātu, ka AI apgūst jaunas klases tikai no dažiem reprezentatīviem attēliem.

Saprotot nepieciešamību ātri apmācīt AI un mašīnmācīšanās modeļus ar mazāk datu kopām, Google ir laidis klajā ‘Meta-Dataset’ - nelielu attēlu kolekciju, kurai vajadzētu palīdzēt samazināt algoritmu precizitātes uzlabošanai nepieciešamo datu apjomu. Uzņēmums apgalvo, ka, izmantojot dažu kadru attēlu klasifikācijas paņēmienus, AI un ML modeļi gūs vienādu ieskatu no daudz mazāk reprezentatīvu attēlu.



Google AI paziņo metadatu kopu: datu kopu datu kopa dažu kadru apguvei:

Dziļa mācīšanās AI un mašīnmācībai jau labu laiku ir pieaugusi eksponenciāli. Tomēr pamatprasība ir augstas kvalitātes datu pieejamība, turklāt pārāk lielos apjomos. Lielu daudzumu manuāli anotētu apmācības datu bieži ir grūti sagādāt, un dažkārt tas var būt arī neuzticams. Izprotot lielu datu kopu riskus, Google ir paziņojis par metadatu kopu pieejamību.



Caur “ Metadatu kopa: datu kopu datu kopa, lai mācītos mācīties no dažiem piemēriem ”(Prezentēts plkst ICLR 2020 ), Google ir piedāvājis plaša mēroga un daudzveidīgu etalonu dažādu attēlu klasifikācijas modeļu kompetences mērīšanai reālistiskā un izaicinošā dažu kadru iestatījumā, piedāvājot sistēmu, kurā var izpētīt vairākus svarīgus dažu kadru klasifikācijas aspektus. Būtībā Google piedāvā 10 publiski pieejamas un bez maksas izmantot dabisko attēlu datu kopas. Šīs datu kopas veido ImageNet, CUB-200-2011, Fungi, ar roku rakstītas rakstzīmes un doodles. Kods ir publiski un ietver a piezīmju grāmatiņa kas parāda, kā metadatu kopu var izmantot TensorFlow un PyTorch .



Dažu metienu klasifikācija pārsniedz standarta apmācības un dziļas mācīšanās modeļi . Pārbaudes laikā jāveic vispārināšana uz pilnīgi jaunām klasēm. Citiem vārdiem sakot, testēšanas laikā izmantotie attēli nebija redzami apmācībā. Dažu šāvienu klasifikācijā treniņu komplektā ir klases, kas pilnībā atšķiras no tām, kas parādīsies testa laikā. Katrā testa uzdevumā ir a atbalsta komplekts no dažiem apzīmētiem attēliem, no kuriem modelis var uzzināt par jaunajām klasēm un sašķeltību vaicājumu kopa piemērus, kurus pēc tam modelim tiek lūgts klasificēt.

Metadatu kopa ir liela sastāvdaļa, kurā modelis pēta vispārinājumu pilnīgi jaunām datu kopām , no kuras treniņā nebija redzami nevienas klases attēli. Tas papildus smagajam vispārināšanas izaicinājumam jaunām klasēm, kas raksturīgs dažu kadru mācību iestatījumam.

Kā metadatu kopa palīdz padziļināti apgūt AI un mašīnmācīšanās modeļus?

Meta-Dataset ir līdz šim lielākais organizētais etalons starpdatu kopai, dažu kadru attēlu klasifikācijai. Tas arī ievieš izlases algoritmu dažāda rakstura un grūtības pakāpes uzdevumu ģenerēšanai, mainot katra uzdevuma nodarbību skaitu, pieejamo piemēru skaitu katrā klasē, ieviešot klases nelīdzsvarotību un dažām datu kopām mainot līdzības pakāpi starp katra uzdevuma klases.



Metadatu kopa patiešām rada jaunus izaicinājumus dažu kadru klasifikācijai. Google pētījumi joprojām ir provizoriski, un tam ir daudz pamatu. Tomēr meklēšanas gigants apgalvoja, ka pētnieki piedzīvo panākumus. Daži no ievērojamākajiem piemēriem ir gudri izstrādāta izmantošana uzdevums kondicionēšana , izsmalcinātāks hiperparametru regulēšana , uz metabāzes ”, Kas apvieno pirmsmācības un metaapmācības un visbeidzot izmantošanas priekšrocības funkciju izvēle specializēties universālai pārstāvībai katram uzdevumam.

Tagi google