Hej!
Interesujesz się zagadnieniami z dziedziny uczenia maszynowego? Jeśli tak, to czy wiesz, że wśród wielu narzędzi służących do implementacji algorytmów uczenia maszynowego najpopularniejszy okazuje się Python? 🧠
Znajomość tego języka oraz jego bibliotek umożliwi Ci sprawne tworzenie systemów uczących się 📈
Jednak byś mógł uzyskać spektakularne wyniki konieczne są ćwiczenia i praktyka w samodzielnym rozwiązywaniu problemów.
Przyjrzyjmy się kwestii prognozowania kliknięć w reklamie internetowej ⬇

Reklama internetowa to branża warta miliardy dolarów. Reklamy są publikowane w różnych formatach, m.in. w postaci banerów składających się z tekstu, obrazów, obiektów flash oraz treści multimedialnych, takich jak audio i wideo. Reklamodawcy i agencje, aby dotrzeć do potencjalnych klientów i dostarczyć im treści, umieszczają reklamy w różnych witrynach internetowych, a nawet w aplikacjach mobilnych w całym internecie.
Reklama internetowa jest jednym z najszerszych obszarów zastosowań uczenia maszynowego. Oczywiście reklamodawcy i konsumenci są żywotnie zainteresowani dobrze ukierunkowanymi reklamami. Od 20 lat modele uczenia maszynowego są wykorzystywane na szeroką skalę do prognozowania skuteczności ukierunkowanych reklam, tj. wyliczania prawdopodobieństwa, że odbiorca z określonej grupy wiekowej będzie zainteresowany danym produktem, że klient o określonych dochodach kupi produkt po obejrzeniu reklamy, że osoba często odwiedzająca witrynę sportową poświęci więcej czasu na obejrzenie reklamy itd. Najczęściej stosowaną miarą skuteczności reklamy jest współczynnik klikalności (ang. click-through rate, CTR), czyli stosunek kliknięć do łącznej liczby wyświetleń danej reklamy. Im wyższa jego wartość, tym lepiej ukierunkowana jest reklama i tym bardziej skuteczna kampania internetowa.
Prognozowaniu kliknięć reklam towarzyszą zarówno potęga, jak i wyzwania urządzenia maszynowego. Prognozowanie polega głównie na binarnym klasyfikowaniu, czy określona reklama na danej stronie (lub w danej aplikacji) zostanie kliknięta przez danego użytkownika. Wykorzystuje się przy tym trzy następujące aspekty predykcyjne:
🔸 treść reklamy i zawartą w niej informację (kategoria, położenie, tekst, format itp.)
🔸 treść strony i informacje o jej właścicielu (kategoria, kontekst, domena itp.)
🔸 informacje o użytkowniku (wiek, płeć, zawód, dochody, zainteresowania historia przeglądania stron, wykorzystywane urządzenie itp.)
Załóżmy, że pracujesz w agencji obsługującej kilku klientów i Twoim zadaniem jest prezentowanie właściwych reklam odpowiednim odbiorcom. Przyjmijmy też, że masz zbiór danych wyodrębniony z milionów rekordów z kampanii przeprowadzonych miesiąc temu. (...) Musisz opracować model klasyfikacyjny, który nauczy się tych reklam i będzie prognozował ich skuteczność w przyszłości.
Jak opracować taki model?