Što su Markovi lanci? 5 Nifty Reals koristi

  • Gabriel Brooks
  • 0
  • 1248
  • 185
Oglas

Možda ste čuli taj izraz “Markov lanac” prije, ali osim ako niste uzeli nekoliko predavanja o teoriji vjerojatnosti ili algoritmima računalne znanosti Kako naučiti programiranje bez svih stresa Kako naučiti programiranje bez ikakvog stresa Možda ste se odlučili baviti programiranjem, bilo za karijeru ili samo hobi. Sjajno! Ali možda se počinjete osjećati preplavljeno. Nije tako sjajno. Evo pomoći da vam olakša putovanje. , vjerojatno ne znate što su, kako rade i zašto su toliko važni.

Pojam Markov lanac je an “ispod haube” koncept, što znači da zapravo ne trebate znati što su kako biste od njih imali koristi. Ipak, svakako možete imati koristi od razumijevanja načina na koji rade. Jednostavni su, ali korisni na tako mnogo načina.

Dakle, ovdje je tečaj rušenja - sve što trebate znati o Markovim lancima sažetim u jedinstveni, probavljivi članak. Ako želite još dublje istražiti, isprobajte tečaj besplatne teorije informacija na Khan Academy (i uzmite u obzir i druge web stranice o online tečajevima. 8 najboljih web stranica za besplatne tečajeve online koledža 8 najboljih web stranica za besplatne tečajeve na mreži Ovdje su neke od najboljih web lokacija za besplatne online tečajeve.).

Markovi lanci 101

Recimo da želite predvidjeti kakvo će vrijeme biti sutra. Istinito predviđanje - vrsta koju provode stručnjaci meteorolozi. 7 najboljih besplatnih vremenskih aplikacija za Android 7 najboljih besplatnih vremenskih aplikacija za Android Ove besplatne vremenske aplikacije pomoći će vam da ostanete iznad vrha vremena pomoću svog Android uređaja. - uključivalo bi stotine, pa čak i tisuće različitih varijabli koje se stalno mijenjaju. Vremenske sustave nevjerojatno su složeni i nemoguće je modelirati, barem za laike poput vas i mene. Ali problem možemo pojednostaviti pomoću procjena vjerojatnosti.

Zamislite da ste imali pristup vremenskim podacima od trideset godina. Krenite na početku, primjećujući da je prvi dan bio sunčan. Nastavite, primjećujući da je i 2. dan bio sunčan, ali 3. dan oblačan, zatim je 4. dan bio kišovit, što je 5. dana dovelo grmljavinu, a zatim 6. dan sunčano i vedro nebo.

U idealnom slučaju bili biste detaljniji, opredijelili bi se za analizu iz sata u sat umjesto analize svakodnevnog, ali ovo je samo primjer za ilustraciju koncepta, pa imajte na sebi!

To radite tijekom čitavog skupa podataka od 30 godina (što bi bilo sramno 11.000 dana) i izračunavate vjerojatnost kakvog će biti sutrašnje vrijeme na temelju današnjeg vremena. Na primjer, ako je danas sunčano, onda:

  • 50-postotna vjerojatnost da će sutra ponovo biti sunčano.
  • 30-postotna vjerojatnost da će sutra biti oblačno.
  • 20-postotna vjerojatnost da će sutra biti kišno.

Sada ponovite ovo za svako moguće vremensko stanje. Ako je danas oblačno, kakve su šanse da će sutra biti sunčano, kišno, maglovito, grmljavinsko nevrijeme, tuča, tornada itd.? Vrlo brzo imate cijeli sustav vjerojatnosti koji možete upotrijebiti za predviđanje ne samo sutrašnjeg vremena, već i sutrašnjeg vremena i sljedećeg dana.

Prijelazne države

To je suština markovskog lanca. Imate pojedina stanja (u ovom slučaju vremenske uvjete) u kojima svaka država može prijeći u druga stanja (npr. Sunčani dani mogu prelaziti u oblačne dane) i ti se prijelazi temelje na vjerojatnostima. Ako želite predvidjeti kakvo bi moglo biti vrijeme u jednom tjednu, možete istražiti različite vjerojatnosti u sljedećih sedam dana i vidjeti koje su najvjerojatnije. Dakle, jedan Markov “lanac”.

Tko je Markov? Bio je ruski matematičar koji je došao do čitave ideje o jednoj državi koja vodi izravno u drugu državu na temelju određene vjerojatnosti, gdje niti jedan drugi faktor ne utječe na tranzicijsku šansu. U osnovi je izumio lanac Markov, otuda i ime.

Kako se lakovi Markov koriste u stvarnom svijetu

Obzirom na objašnjenje, istražimo neke stvarne aplikacije gdje nam dobro dolaze. Možda se iznenadite kad saznate da ste čitavo vrijeme koristili Markove lance bez da ste to znali!

Generacija imena

Jeste li ikad sudjelovali u stolnim igrama, MMORPG igrama ili čak pisanju fikcije? Možda ste se mučili zbog imenovanja svojih znakova (barem u jednom ili drugom trenutku) - a kad vam se jednostavno nije moglo sjetiti imena koje vam se sviđa, vjerojatno ste posegnuli za internetskim generatorom imena Stvorite novi pseudonim s Najbolji generatori imena na mreži [Čudan i divan web] Stvorite novi pseudonim s najboljim mrežnim generatorima imena [Čudan i divan web] Vaše je ime dosadno. Srećom, možete krenuti putem interneta i odabrati novi pseudonim koristeći jedan od bezbrojnih generatora imena koji su dostupni na Internetzu. .

Jeste li se ikad zapitali kako funkcioniraju ti generatori imena? Kako se ispostavilo, mnogi od njih koriste Markove lance, što ga čini jednim od najčešće korištenih rješenja. (Postoje i drugi algoritmi koji su jednako učinkoviti, naravno!)

Sve što trebate je zbirka pisama u kojima svako slovo sadrži popis mogućih naknadnih pisama s vjerojatnostima. Tako, na primjer, pismo “M” ima 60 posto šanse da dovede do pisma “” i 40 posto šansi da dovede do pisma “ja”. Učinite to za hrpu drugih slova, a zatim pokrenite algoritam. Boom, imaš ime koje ima smisla! (Uglavnom, svejedno.)

Google PageRank

Jedna od zanimljivih implikacija Markovske teorije lanca je da kako se duljina lanca povećava (tj. Povećava se broj prijelaza države), vjerojatnost da sletite u neko stanje konvertira se na fiksni broj, a ta vjerojatnost nije ovisna o mjestu započnete u sustavu.

To je izuzetno zanimljivo kada čitav svjetski web mislite kao Markov sustav u kojem je svaka web stranica stanje, a veze između web stranica su prijelazi s vjerojatnostima. Ovaj teorem u osnovi to govori bez obzira na koju web stranicu pokrenete, vaša šansa za slijetanje na određenu web stranicu X je fiksna vjerojatnost, pod pretpostavkom da “Dugo vrijeme” surfanja.

Kreditna slika: 345Kai putem Wikimedije

I to je osnova kako Google rangira web stranice. Zapravo je algoritam PageRank modificirani (čitaj: napredniji) oblik algoritma Markov lanac.

Što je veći “fiksna vjerojatnost” dolaska na određenu web stranicu, veći je PageRank. To je zato što veća fiksna vjerojatnost podrazumijeva da web stranica ima puno dolaznih veza s drugih web stranica - a Google pretpostavlja da ako web stranica ima puno dolaznih veza, onda ona mora biti vrijedna. Što više dolaznih veza, to je vrjednije.

Složenije je od toga, naravno, ali ima smisla. Zašto web lokacija poput About.com ima veći prioritet na stranicama rezultata pretraživanja? Jer ispada da korisnici teže dolaze tamo dok surfaju webom. Zanimljivo je, zar ne?

Upisivanje predviđanja riječi

Mobilni telefoni već desetljećima predviđaju prediktivno tipkanje, ali možete li pogoditi kako su ta predviđanja napravljena? Koristite li Android (alternativne mogućnosti tipkovnice Koja je najbolja alternativna tipkovnica za Android? Koja je najbolja alternativna tipkovnica za Android? Pogledajmo neke od najboljih tipkovnica u Trgovini Play i stavimo ih na testiranje.) ili iOS (alternativne mogućnosti tipkovnice 9 Alternativne tipkovnice za iOS da biste lakše ili više zabavljali tipkanje 9 Alternativne tipkovnice za iOS da bi vam olakšalo kucanje ili zabavnije bilo kad je Apple konačno prestao djelovati poput roditelja s previše zaštite i uveo treće tipkovnice, svi su otišli na tipkovnicu, ludo.), postoji dobra šansa da vaša odabrana aplikacija koristi Markove lance.

Zbog toga se aplikacije tipkovnice pitaju mogu li prikupljati podatke o vašim navikama tipkanja. Na primjer, u Google tipkovnici postoji postavka koja se zove Dijelite isječke koja pita da “podijelite isječke onoga što i kako upišete u Googleove aplikacije kako biste poboljšali Google tipkovnicu”. U suštini, vaše se riječi analiziraju i uključuju u vjerojatnost lančanog sustava Markov.

To je razlog zašto aplikacije za tipkovnicu često sadrže tri ili više opcija, obično redoslijedom kojih je najmanje vjerojatno. Ne može se znati što ste namjeravali upisati sljedeće, ali ispravno je češće nego ne.

Subreddit simulacija

Ako nikada niste koristili Reddit, preporučujemo vam da barem pogledate ovaj fascinantni eksperiment nazvan / r / SubredditSimulator.

Jednostavno rečeno, Subreddit Simulator uzima ogroman komad SVIH komentara i naslova objavljenih u brojnim Redditovim zajednicama, a zatim analizira tekst po riječ svake riječi. Koristeći ove podatke, on generira vjerojatnost od riječi do riječi - zatim koristi te vjerojatnosti da bi generirali naslove i komentare ispočetka..

Jedan zanimljiv sloj ovog eksperimenta je taj što komentare i naslove kategorizira zajednica iz koje su podaci došli, pa se vrste komentara i naslova generirani skupom podataka o / r / hrani neovisno razlikuju od komentara, a naslovi generiraju prema / r / nogometni skup podataka.

A najsmješniji - ili možda najviše uznemirujući - dio svega toga je da se generirani komentari i naslovi često ne mogu razlikovati od onih koje stvaraju stvarni ljudi. Apsolutno je fascinantno.

Znate li za kakvu drugu cool upotrebu za Markove lance? Imate li još pitanja na koja trebate odgovoriti? Javite nam u komentaru u nastavku!




Još ne komentari

O modernoj tehnologiji, jednostavnoj i pristupačnoj.
Vaš vodič u svijetu moderne tehnologije. Naučite kako koristiti tehnologije i uređaje koji nas okružuju svaki dan i naučite kako otkriti zanimljivosti na Internetu.