
Brian Curtis
0
2048
180
AI se vratio.
Prvi put nakon 1980-ih, istraživači umjetne inteligencije ostvaruju opipljiv napredak u teškim problemima, a ljudi opet počinju ozbiljno govoriti o jakom AI. U međuvremenu, naš sve više upravljani podacima započeo je utrku u naoružanju između kompanija koje žele unovčiti novu inteligenciju, posebno u mobilnom prostoru.
Dva titana koja predvode paket su Google i Microsoft. Prva bitka? Nazvana je nova domena umjetne inteligencije “Duboko učenje.”
Pa tko pobjeđuje?
Google mozak
Googleova istraživačka nastojanja usredotočena su na projekt nazvan "Google mozak". Google Brain proizvod je čuvenog / tajnog Googleovog laboratorija za istraživanje 'Google X', koji je odgovoran za projekte snimljene na mjesecu s malim izgledom uspjeha, ali s vrlo velikim potencijalom. Ostali Googleovi proizvodi uključuju Project Loon, internetsku inicijativu sa balonom i Googleov automobil za auto-vožnju Evo kako ćemo doći do svijeta ispunjenog automobilima bez vozača Evo kako ćemo doći do svijeta ispunjenog vozilima bez vozača. mučan, opasan i zahtjevan zadatak. Može li se jednog dana automatizirati Googleova tehnologija automobila bez vozača? .
Google Brain je ogromna inicijativa za strojno učenje koja je prvenstveno usmjerena na obradu slika, ali s puno širim ambicijama. Projekt je pokrenuo profesor Stanforda Andrew Ng, stručnjak za strojno učenje koji je od tada napustio projekt kako bi radio za Baidu, najveću kinesku tražilicu.
Google ima dugu povijest umiješanosti u AI istraživanje. Matthew Zeiler, generalni direktor strojarskog vizualnog pokretanja, i pripravnik koji je radio na Google Brain-u to smatra ovako:
“Google zapravo nije pretraživačka tvrtka. To je tvrtka za strojno učenje [...] Sve u tvrtki doista pokreće strojno učenje.”
Cilj projekta je pronaći načine za poboljšanje algoritama dubokog učenja za izgradnju neuronskih mreža koje mogu pronaći dublje i smislenije obrasce u podacima koristeći manju moć obrade. U tom cilju, Google agresivno kupuje talente za duboko učenje, ostvarujući akvizicije koje uključuju 500 milijuna USD kupovinu AI startup DeepMind.
DeepMind je bio dovoljno zabrinut zbog aplikacije svoje tehnologije zbog koje su prisilili Google da stvori etičku ploču osmišljenu kako bi spriječio njihov softver da uništi svijet. Evo zašto znanstvenici misle da bi vas trebalo brinuti zbog umjetne inteligencije. Evo zašto znanstvenici misle da biste trebali brinuti zbog umjetne inteligencije Mislite li da je umjetna inteligencija opasna? Da li AI može predstavljati ozbiljan rizik za ljudski rod. Ovo su neki od razloga zbog kojih biste mogli biti zabrinuti. , DeepMind tek treba objaviti svoj prvi proizvod, ali tvrtka je zaposlila značajan dio svih svjetskih stručnjaka za duboko učenje. Do danas, njihov jedini javni demonstrator ove tehnologije bila je igračka AI koja je stvarno, stvarno dobra u Atari.
Kako je duboko učenje relativno novo područje, nije imalo vremena proizvesti veliku generaciju stručnjaka. Kao rezultat, vrlo je mali broj ljudi koji imaju stručnost u tom području, a to znači da je moguće ostvariti značajnu prednost na terenu zapošljavanjem svih uključenih.
Google Brain se do sada primjenjivao na Androidovu značajku prepoznavanja glasa i automatsko katalogiziranje slika StreetView identificirajući važne značajke poput adresa. Rani test bio je poznati eksperiment s mačkama, u kojem je Google mreža dubokog učenja automatski naučila prepoznavati mačke u Youtube videozapisima s većom brzinom točnosti od prethodnog stanja. U svom radu na temu, Google je to ocijenio ovako:
“Suprotno onome što se čini da je intuicija široko rasprostranjena, naši eksperimentalni rezultati otkrivaju da je moguće trenirati detektor lica bez da se etiketiraju slike kao da sadrže lice ili ne […] Mreža je osjetljiva na koncepte visoke razine poput mačja lica i ljudska tijela. Počevši s ovim naučenim značajkama, obučili smo ga da dobijemo 15,8 posto točnosti u prepoznavanju 20 000 kategorija objekata, što je skok od 70 posto relativno poboljšanje u odnosu na prethodno stanje vrhunskih [mreža].”
Na kraju bi Google volio da to rade i njegovi algoritmi za duboko učenje… zapravo, gotovo sve. Snažne AI platforme poput Watson-a iz IBM-a oslanjaju se na ove vrste algoritama strojnog učenja na niskoj razini, a poboljšanja na ovom pročelju čine da čitavo polje AI bude mnogo moćnije.
Buduća verzija Google Nowa, koju pokreće Google Brain, mogla bi prepoznati i govor i slike i pružiti inteligentan uvid u te podatke kako bi korisnici lakše donijeli pametnije odluke. Googleov mozak mogao bi poboljšati sve, od rezultata pretraživanja do Google Translatea.
Microsoft Adam
Microsoftov pristup dubokom učenju rata bio je malo drugačiji. Umjesto da kupi stručnjake za duboko učenje za pročišćavanje svojih algoritama, Microsoft se fokusirao na poboljšanje implementacije i pronalaženje boljih načina za usporedbu algoritama koji se koriste u vlak algoritmi dubokog učenja.
Ovaj projekt se zove “Microsoft Adam.” Njihove tehnike smanjuju suvišne račune, udvostručujući kvalitetu rezultata dok koriste manje procesora za njihovo dobivanje. To je dovelo do impresivnih tehničkih dostignuća, uključujući mrežu koja može prepoznati pojedine pasmine pasa s fotografija s velikom točnošću.
Microsoft opisuje projekt ovako:
Cilj Projekta Adam je omogućiti softveru da vizualno prepozna bilo koji objekt. To je visoki poredak, s obzirom na ogromnu neuronsku mrežu u ljudskom mozgu, koja omogućuje takve vrste udruživanja pomoću trilijuna veza. […] Korišćenjem 30 puta manje strojeva od ostalih sustava, [internetski podaci] korišteni su za treniranje neuronske mreže do više od dvije milijarde veza. Ova skalabilna infrastruktura dvostruko je preciznija u prepoznavanju objekata i 50 puta je brža od ostalih sustava.
Očigledna primjena ove tehnologije nalazi se u Cortani, novom Microsoftovom novom virtualnom pomoćniku Kako je Cortana postala "druga žena" u mom životu Kako je Cortana postala "druga žena" u mom životu Pojavila se jednog dana i promijenila moj život. Ona točno zna što mi treba i ima zloban smisao za humor. Malo je čudo da sam pao na čari Cortane. , nadahnut AI likom u Halu. Cortana, namijenjena nadmetanju sa Siri, može učiniti nekoliko pametnih stvari, koristeći sofisticirane tehnike prepoznavanja govora.
Cilj dizajna je izgraditi pomoćnika s prirodnijom interakcijom i može izvoditi širi niz korisnih zadataka za korisnika, što bi duboko učenje moglo pomoći u ogromnoj mjeri.
Microsoftova poboljšanja u stražnjem dijelu dubokog učenja impresivna su i dovela su do toga da aplikacije prethodno nisu moguće.
Kako djeluje duboko učenje
Da bismo malo bolje razumjeli problem, uzmimo malo vremena za razumijevanje ove nove tehnologije. Duboko učenje je tehnika za izradu inteligentnog softvera, često primjenjivanog na neuronskim mrežama. Izgrađuje velike, korisne mreže slojevito pojednostavljujuće neuronske mreže zajedno, svaki pronalazeći obrasce u izlazu svog prethodnika. Da biste razumjeli zašto je to korisno, važno je pogledati što je došlo prije dubokog učenja.
Backpropagiranje neuronskih mreža
Temeljna struktura neuronske mreže zapravo je prilično jednostavna. Svaki 'neuron' je maleni čvor koji uzima ulaz i koristi interna pravila da odluči kada treba “vatra” (proizvesti izlaz). Ulazi koji se hrane u svaki neuron imaju “utezi” - množitelji koji kontroliraju je li signal pozitivan ili negativan i koliko je jak.
Spajanjem ovih neurona zajedno možete izgraditi mrežu koja oponaša bilo koji algoritam. Svoj ulaz u ulazne neurone unosite kao binarne vrijednosti, a mjerite vrijednost paljenja izlaznih neurona da biste dobili izlaz. Kao takav, trik za neuronske mreže bilo koje vrste je uzeti mrežu i pronaći skup utega koji najbolje odgovara funkciji koja vas zanima.
Povratno širenje, algoritam koji se koristi za osposobljavanje mreže na temelju podataka, vrlo je jednostavan: pokrećete mrežu slučajnim utezima, a zatim pokušavate klasificirati podatke s poznatim odgovorima. Kad mreža nije u redu, provjerite zašto nije u redu (stvarajući manji ili veći izlaz od cilja) i upotrebljavate te informacije za pomicanje utega u korisnijem smjeru.
Mrežući to iznova i iznova za mnoge podatkovne točke uči ispravno klasificirati sve vaše podatkovne točke i, nadamo se, generalizirati nove podatkovne točke. Ključni uvid u algoritam povratnog širenja je da možete premjestiti podatke o pogrešci natrag kroz mrežu, mijenjajući svaki sloj na temelju promjena koje ste napravili na posljednjem sloju, omogućujući vam izgradnju mreža nekoliko slojeva duboko, što može razumjeti složenije obrasce.
Backprop je 1974. godine izumio Geoffrey Hinton, a imao je izvanredan učinak čineći neuronske mreže korisnim za široke aplikacije prvi put u povijesti. Trivijalne neuronske mreže postoje od 50-ih godina, a izvorno su implementirane s mehaničkim, motoričkim neuronima.
Drugi način razmišljanja o algoritmu backprop-a je kao istraživač pejzaža mogućih rješenja. Svaka težina neurona još je jedan smjer u kojem može istraživati, a za većinu neuronskih mreža njih je na tisuće. Mreža može upotrijebiti svoje informacije o pogreškama da vidi u kojem smjeru treba da se kreće i kako dalje kako bi se smanjila greška.
Sve započinje slučajnom točkom, i neprestano savjetujući sa svojim kompasom za greške, kreće se nizbrdo u smjeru manje pogrešaka, na kraju se smjestivši na dnu najbliže doline: najbolje moguće rješenje.
Pa zašto onda ne koristimo povratno širenje za sve? Pa, backprop ima nekoliko problema.
Najozbiljniji problem naziva se "nestajući problem s gradijentom". U osnovi, što premještate podatke o pogrešci natrag kroz mrežu, oni postaju manje značajni svaki put kad se vratite na sloj. Pokušaj izgradnje vrlo dubokih neuronskih mreža s povratnom razmnožavanjem ne uspijeva, jer informacije o pogrešci neće moći prodrijeti dovoljno duboko u mrežu da biste obučili niže razine na koristan način.
Drugi, manje ozbiljan problem je taj što se neuronske mreže konvergiraju samo u lokalne optime: često se uhvate u maloj dolini i propuste dublja, bolja rješenja koja nisu u blizini njihove slučajne polazne točke. Pa, kako riješiti ove probleme?
Mreže dubokih uvjerenja
Mreže dubokog vjerovanja su rješenje za oba ova problema, a oslanjaju se na ideju o izgradnji mreža koje već imaju uvid u strukturu problema, a zatim ih dorađuju daljnjim pokušajima. Ovo je oblik dubokog učenja i onaj koji zajednički koriste i Google i Microsoft.
Tehnika je jednostavna, a temelji se na svojevrsnoj mreži koja se zove a “Stroj s ograničenim Boltzmanom” ili “RBM”, koja se oslanja na ono što je poznato kao nenadzirano učenje.
Ograničeni Boltzmanovi strojevi, ukratko, mreže su koje jednostavno pokušavaju komprimirati podatke koje daju, umjesto da ih pokušavaju eksplicitno klasificirati prema informacijama o treningu. RBM-ovi uzimaju zbirku podatkovnih točaka i osposobljavaju se prema njihovoj sposobnosti reprodukcije tih podataka iz memorije.
Postavljanjem RBM-a manjim od zbroja svih podataka za koje tražite da kodiraju, naterate RBM da nauči strukturne pravilnosti podataka kako bi ih pohranio na manje prostora. Ovo učenje duboke strukture omogućuje mreži generaliziranje: Ako uvježbate RBM za reprodukciju tisuću slika mačaka, tada možete u njega umetnuti novu sliku - i gledajući koliko energetska mreža postaje rezultat, možete shvatiti je li nova slika sadržavala mačku ili ne.
Pravila učenja za RBM nalikuju funkciji stvarnih neurona u mozgu na važne načine na koje drugi algoritmi (poput povratne širenja) ne djeluju. Kao rezultat toga, oni će možda morati naučiti istraživače o tome kako ljudski um djeluje na strojeve koji razmišljaju: Šta nas neuroznanost i umjetna inteligencija mogu naučiti o strojevima koji razmišljaju o svijesti: čemu nas neuroznanost i umjetna inteligencija mogu podučiti o svjesnosti Mogu li graditi umjetno inteligentne strojeve i softver podučava nas o djelovanju svijesti i o prirodi samog ljudskog uma? .
Još jedna značajna značajka RBM-a je ta što postoje “konstruktivan”, što znači da se mogu kretati i obrnuto, radeći unatrag od značajke visoke razine da bi stvorili imaginarne ulaze koji sadrže tu značajku. Taj se proces zove “sanjanje.”
Pa zašto je ovo korisno za duboko učenje? Pa, Boltzmanove mašine imaju ozbiljne probleme s skaliranjem - što dublje pokušate napraviti ih, dulje je potrebno za treniranje mreže.
Ključni uvid u mreže dubokih uvjerenja je da možete složiti dvoslojne RBM-ove zajedno, svaki obučen kako bi pronašao strukturu na izlazu svog prethodnika. To je brzo i vodi do mreže koja može razumjeti komplicirane, apstraktne značajke podataka.
U zadatku za prepoznavanje slike prvi bi sloj mogao naučiti vidjeti linije i uglove, a drugi sloj može naučiti vidjeti kombinacije onih linija koje čine značajke poput očiju i nosa. Treći sloj može kombinirati te značajke i naučiti prepoznati lice. Pretvaranjem ove mreže u povratno širenje možete poboljšati samo one značajke koje se odnose na kategorije koje vas zanimaju.
Na puno je načina ovo jednostavno popravljanje backpropagationa: omogućava povratak “varati” počevši s gomilom informacija o problemu koji pokušava riješiti. To pomaže mreži da dosegne bolje minimume, a osigurava da su najniže razine mreže obučene i raditi nešto korisno. To je to.
S druge strane, metode dubokog učenja proizvele su dramatična poboljšanja u brzini i preciznosti strojnog učenja i gotovo su jednodušno odgovorne za brzo poboljšavanje softvera za govor i tekst u posljednjih nekoliko godina.
Utrka za Canny Računala
Možete vidjeti zašto je sve ovo korisno. Što dublje možete izgraditi mreže, to su veći i apstraktniji pojmovi koje mreža može naučiti.
Želite znati je li e-pošta neželjena pošta ili ne? Za pametne neželjene pošte to je teško. Morate zapravo pročitati e-poštu i razumjeti neke namjere koje stoje iza nje - pokušajte vidjeti postoji li odnos između pošiljatelja i primatelja i utvrdite namjere primatelja. Sve to morate učiniti na temelju bezbojnih nizova slova, od kojih većina opisuje koncepte i događaje o kojima računalo ništa ne zna.
To se od svakoga puno traži.
Da su vas zamolili da naučite prepoznati neželjenu poštu na jeziku na kojem već niste govorili, dali samo neke pozitivne i negativne primjere, učinili biste vrlo loše - i imate ljudski mozak. Za računalo je problem bio gotovo nemoguć, sve do nedavno. To su vrste uvida koje duboko učenje može imati, a postaće nevjerojatno moćno.
Upravo je Microsoft ovu utrku za dlaku pobijedio. Dugoročno? To je bilo tko nagađanje.
Slikovni krediti: “AI računala“, napisao Simon Liu, “Bullfrog“, autor Brunop, “Kompas Vrh“, od airguy1988, “Slobodnije nego besplatno,” od opensource.com