UMĚLÁ INTELIGENCE GOOGLE „ALPHA GO ZERO“ PRÁVĚ STISKLA RESET, JAK SE UČIT

Pamatujete (nejasně), jak jste se naučili chodit, mluvit, jezdit na kole nebo řídit? Bylo to špinavé a plné chyb, ale dovednosti, které jste se tak naučili, zůstaly. Mimo živé systémy bylo náročné strukturovat dostatečně silné algoritmy, které by umožňovaly přijímat „zkušenosti ze skutečného života“ a vyvíjet lepivé a přizpůsobivé chování pro umělou inteligenci.

Alpha Go Zero to prostě udělal.

„Začíná to z čistého štítu a spočítává se jen pro sebe, pouze ze hry sebe sama a bez jakýchkoli lidských znalostí nebo jakýchkoli lidských údajů, rysů či příkladů či zásahu člověka. Objevuje, jak hrát hru Go od prvních principů, “říká profesor DeepMind David Silver.

AI má několik iterací, každá chytřejší a schopnější než ta předchozí. Předchozí verze používala obrovskou databázi předchozích her spolu s řadou algoritmů, které ji směřovaly k vítězství. Tento přístup vedl k porážce úřadujícího mistra světa profesionálního hráče Go. V pokeru AI Libratus nedávno stáhl z nejlepších světových hráčů pokeru téměř 2 miliony dolarů, a to i tím, že se místo lidských her učí prostřednictvím vlastního hraní.

Hillary miluji nebo vyjmenujte věk

Nyní v této nejnovější verzi Alpha Go učil program umělé inteligence sám jak hrát Go - bez lidského pozadí.

Spuštěním milionů herních simulací proti sobě trvalo 40 dní, než se naučila - od nuly - jak překonat svoji vlastní verzi mistra světa. To se skutečně mění, a to nejen pro Go, ale také pro objevování nových znalostí. Jak přesná nebo úplná je vaše odbornost v doméně? Tady je mnoho více k objevování, je to, co nám tento fascinující experiment v učení s Alpha Go Zero říká.

„Myšlenkou Alpha Go není jít ven a porazit lidi, ale ve skutečnosti objevit, co to znamená dělat vědu - aby se program dokázal sám od sebe naučit, co jsou znalosti,“ uvádí Silver v příspěvku na YouTube o úspěch.

Tým Alpha Go Zero Deep Mind tomu říká první princip učení „tabula rasa“ (prázdná břidlice).

„Pokud toho dosáhnete tabula rasa učení, máte agenta, který může být transplantován z hry Go do jakékoli jiné domény, a specifika hry, ve které se nacházíte, vymyslíte algoritmus, který je tak obecný, že ho lze použít kdekoli, 'říká . To je provokativní nápad, když rozšíříte koncept. Jen si pomyslete, co bychom mohli udělat se sadou silných, učících se algoritmů, které by mohly systematicky řešit těžké problémy a učit se rychleji než kolektivní znalosti naší civilizace. . . ve dnech, ne desetiletích.

s kým chodí Sidney Crosby

Prozatím je velkým přínosem to, že „na algoritmech záleží mnohem víc než na dostupných počítačích nebo datech,“ řekl Silver. To samo o sobě mění hru v tom, jak přistupujeme k rozšiřování známého světa. Zatímco Alpha Go běží na hardwaru asi 25 milionů dolarů - není to zrovna lehký systém - víte, že guru AI již dlouho pracují na vytváření čistších a lepších datových sad. Dnes je mnoho velkých datových souborů považováno za příliš hlučné - plné špatných dat - na přesné školení umělé inteligence. Pokud se AI učí z dat a data jsou špatná, nenaučí se. Velký problém.

Co kdybyste nepotřebovali čistá data, ale jen zkušenosti a umělá inteligence by se mohla sama trénovat?

To je vzrušující úspěch v Alpha Go Zero. I když je to ve světě her založeném na pravidlech, má velké důsledky pro každé odvětví fungující na základě fyzikálních pravidel - myslete na chemii, dopravu, biologii, farmakologii, cestování, logistiku a výrobu. Pokud dokážeme navrhnout pravidla tak flexibilní, že mohou fungovat na základě širších zkušeností a tak směrových, že vždy vytvoří silnější dovednosti - jako Alpha Go Zero -, je možné dosáhnout umělé inteligence, která řídí systémy. Tyto systémy by nepotřebovaly žádná vnější data, neměly by problémy s čištěním dat a nepotřebovaly by žádné zpomalení typu člověk ve smyčce. To je částečně důvod, proč mateřská společnost Google, Alphabet, vsadila společnost na umělou inteligenci a investuje do umělé inteligence rychlým tempem. (Amazon také investuje do umělé inteligence, jako je její nejnovější akvizice AI BodyLabs.)

jak vysoká je holly frazier

Profesor Deep Mind David Silver říká: „Skutečnost, že jsme viděli, jak program dosahuje vysokých výkonů ... by měla znamenat, že nyní můžeme začít řešit některé z nejnáročnějších a nejúčinnějších problémů lidstva.“

Tento příspěvek byl aktualizován, aby bylo objasněno, že AI Libratus nedávno porazil špičkové hráče pokeru pomocí strategie, která zahrnuje spíše vlastní hru než data zadaná člověkem.