
Problem wielorękiego bandyty
Wyobraź sobie, że jesteś w Las Vegas, w swoim ulubionym kasynie. Znajdujesz się w pomieszczeniu zawierającym pięć automatów do gry 🎰 W przypadku każdego z nich gra jest taka sama: stawiasz określoną sumę pieniędzy, powiedzmy 1 dolara, pociągasz za ramię, a wtedy maszyna albo odbiera Twoje pieniądze, albo zwraca dwa razy więcej pieniędzy (...) Powiedzmy, że jeśli maszyna zabierze Twoje pieniądze, Twoja nagroda wynosi –1, a jeśli maszyna zwróci Ci dwa razy więcej pieniędzy, Twoja nagroda to +1.
Jak widać, zaczynasz już definiować środowisko sztucznej inteligencji, co, przypomnę, jest absolutnie fundamentalne podczas rozwiązywania problemu z użyciem AI. Jak dotąd sztucznej inteligencji nie ma, ale wkrótce nadejdzie. Zawsze zaczynasz od zdefiniowania środowiska.
Zdefiniowałeś nagrody; później zdefiniujesz stany (wejścia) i akcje (wyjścia). Powiedzmy, że teraz, wciąż w trakcie definiowania środowiska, w jakiś sposób wiesz, że w przypadku jednej z tych maszyn prawdopodobieństwo, że da ci premię +1, gdy pociągniesz ją za ramię, jest większe. Nie ma znaczenia, skąd znasz te informacje, ale musi to być część założeń dotyczących problemu. Zapewniam Cię, że to założenie jest zawsze naturalnie weryfikowane w realnych problemach biznesowych wspomnianych powyżej, do których można zastosować problem wielorękiego bandyty.
Twoim celem, podobnie jak w każdym środowisku sztucznej inteligencji, jest zdobycie jak najwyższej nagrody w czasie gry. Załóżmy, że zamierzasz postawić łącznie 1000 dolarów, co oznacza, że za każdym razem zamierzasz postawić 1 dolara 1000 razy, przez pociągnięcie za ramię któregokolwiek z tych pięciu automatów do gry. Pytanie brzmi:
Jaka powinna być Twoja strategia, aby po rozegraniu 1000 kolejek uzyskać maksymalną ilość pieniędzy?
Pierwszym krokiem Twojej strategii musi być ustalenie, który z pięciu automatów ma, w minimalnej liczbie gier, największą szansę na jedną nagrodę. Innymi słowy, musisz szybko znaleźć automat z najwyższym wskaźnikiem sukcesu. Następnie, gdy tylko to zrozumiesz, po prostu musisz grać dalej na tym najbardziej udanym automacie.
Znalezienie najlepszego automatu do gry nie jest trudne; jedną prostą strategią może być zagranie 100 razy na każdym z tych pięciu automatów do gry, a na koniec sprawdzenie, który z nich wyrzucił więcej pieniędzy. Statystycznie daje to dużą szansę na znalezienie najbardziejhojnego automatu.
Całe wyzwanie jest „szybkie”. Najtrudniejsze jest znalezienie najlepszego automatu w minimalnej liczbie prób. Tutaj do gry wkracza Twój pierwszy model AI 👇
Powyższy fragment pochodzi z książki "Sztuczna inteligencja. Błyskawiczne wprowadzenie do uczenia maszynowego, uczenia ze wzmocnieniem i uczenia głębokiego" 🧠

To kompletny przewodnik po świecie sztucznej inteligencji. Znajdziesz w nim przejrzyście wyłożone podstawy i bardziej zaawansowane zagadnienia. Zabierzesz się do tworzenia systemów AI wykorzystujących uczenie ze wzmacnianiem oraz głębokie uczenie. Krok po kroku wykonasz pięć praktycznych projektów (nie tylko problem jednorękiego bandyty!) 🦾
Czytaj i dowiedz, jak zbudować inteligentne oprogramowanie przy użyciu najlepszych i najprostszych narzędzi do programowania AI. Co ważne, aby w pełni z niej skorzystać, nie musisz posiadać umiejętności programowania.
Książka tygodnia 50% taniej❗
NOWOŚĆ 🆕

🧠⌨ Książka przyda Ci się jeśli chcesz wejść w świat uczenia maszynowego.
Lektura to minimum teorii, a proces nauki ułatwiają liczne przykłady i ćwiczenia. Dzięki temu przyswoisz niezbędne pojęcia i nauczysz się korzystać z gotowych platform produkcyjnych Pythona: Scikit-Learn, Keras i TensorFlow.
W tym wydaniu pokazano różnorodne techniki, od prostej regresji liniowej aż po głębokie sieci neuronowe!