ODBIERZ TWÓJ BONUS :: »

Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II Peter Bruce, Andrew Bruce, Peter Gedeck

(ebook) (audiobook) (audiobook)
Autorzy:
Peter Bruce, Andrew Bruce, Peter Gedeck
Wydawnictwo:
Helion
Wydawnictwo:
Helion
Ocena:
4.3/6  Opinie: 8
Stron:
296
Druk:
oprawa miękka
Dostępne formaty:
     PDF
     ePub
     Mobi
Czytaj fragment
Książka
52,20 zł 87,00 zł (-40%)
52,20 zł najniższa cena z 30 dni

Dodaj do koszyka Wysyłamy w 24h

Ebook
43,50 zł 87,00 zł (-50%)
43,50 zł najniższa cena z 30 dni

Dodaj do koszyka lub Kup na prezent Kup 1-kliknięciem

Przenieś na półkę

Do przechowalni

Do przechowalni

Powiadom o dostępności audiobooka »

Czego się nauczysz?

  • Przeprowadzania eksploracyjnej analizy danych przy użyciu R i Pythona
  • Obliczania miar położenia i rozproszenia danych
  • Wykrywania i interpretowania wartości odstających w zbiorach danych
  • Analizowania rozkładów danych i korzystania z histogramów, boxplotów oraz wykresów gęstości
  • Szacowania błędu próbkowania i stosowania centralnego twierdzenia granicznego
  • Przeprowadzania prób bootstrapowych i obliczania przedziałów ufności
  • Rozróżniania i stosowania różnych rozkładów statystycznych (normalny, t-Studenta, chi-kwadrat, Poissona)
  • Projektowania eksperymentów statystycznych i wykonywania testów A/B
  • Testowania hipotez, interpretowania p-wartości oraz oceny istotności statystycznej
  • Wykorzystywania testów t, ANOVA, testów chi-kwadrat i testów permutacyjnych
  • Budowania modeli regresji liniowej i wielorakiej oraz oceny ich dopasowania
  • Przeprowadzania diagnostyki regresji i wykrywania współliniowości, wartości odstających i heteroskedastyczności
  • Tworzenia i ewaluacji modeli klasyfikacyjnych (naive Bayes, regresja logistyczna, analiza dyskryminacyjna)
  • Analizowania macierzy błędów, krzywych ROC oraz radzenia sobie z niezbilansowanymi danymi
  • Stosowania algorytmów uczenia maszynowego, takich jak KNN, drzewa decyzyjne, lasy losowe i boosting
  • Wykonywania analizy głównych składowych, klasteryzacji (K-średnich, hierarchicznej, mieszanej) oraz pracy z danymi mieszanymi

Metody statystyczne są kluczowym narzędziem w data science, mimo to niewielu analityków danych zdobyło wykształcenie w ich zakresie. Może im to utrudniać uzyskiwanie dobrych efektów. Zrozumienie praktycznych zasad statystyki okazuje się ważne również dla programistów R i Pythona, którzy tworzą rozwiązania dla data science. Kursy podstaw statystyki rzadko jednak uwzględniają tę perspektywę, a większość podręczników do statystyki w ogóle nie zajmuje się narzędziami wywodzącymi się z informatyki.

To drugie wydanie popularnego podręcznika statystyki przeznaczonego dla analityków danych. Uzupełniono je o obszerne przykłady w Pythonie oraz wyjaśnienie, jak stosować poszczególne metody statystyczne w problemach data science, a także jak ich nie używać. Skoncentrowano się też na tych zagadnieniach statystyki, które odgrywają istotną rolę w data science. Wyjaśniono, które koncepcje są ważne i przydatne z tej perspektywy, a które mniej istotne i dlaczego. Co ważne, poszczególne koncepcje i zagadnienia praktyczne przedstawiono w sposób przyswajalny i zrozumiały również dla osób nienawykłych do posługiwania się statystyką na co dzień.

W książce między innymi:

  • analiza eksploracyjna we wstępnym badaniu danych
  • próby losowe a jakość dużych zbiorów danych
  • podstawy planowania eksperymentów
  • regresja w szacowaniu wyników i wykrywaniu anomalii
  • statystyczne uczenie maszynowe
  • uczenie nienadzorowane a znaczenie danych niesklasyfikowanych

Statystyka: klasyczne narzędzia w najnowszych technologiach!

Wybrane bestsellery

O autorach książki

Peter Bruce jest ekspertem w dziedzinie nauczania statystyki. Prowadzi Institute for Statistics Education, gdzie oferuje setki kursów skierowanych między innymi do naukowców. 
 

Dr Andrew Bruce jest głównym analitykiem w Amazonie. Od trzydziestu lat zajmuje się statystyką i nauką o danych, opracowując rozwiązania problemów z wielu branż. 
 

Dr Peter Gedeck jest badaczem w Collaborative Drug Discovery. Tworzy algorytmy uczenia maszynowego do przewidywania właściwości substancji stanowiących potencjalne leki. 

Zobacz pozostałe książki z serii

Helion - inne książki

Najczęściej zadawane pytania (FAQ)
1. Czy książka zawiera praktyczne przykłady kodu w językach R i Python?
Tak, książka prezentuje szczegółowe przykłady kodu zarówno w R, jak i w Pythonie, co ułatwia zastosowanie omawianych metod statystycznych w praktyce data science.
2. Jakie zagadnienia statystyki są omawiane w tej książce?
Książka obejmuje 50 kluczowych zagadnień, w tym analizę eksploracyjną, rozkłady danych, testowanie hipotez, regresję, klasyfikację, uczenie maszynowe oraz metody nienadzorowane, ze szczególnym naciskiem na ich zastosowanie w data science.
3. Czy do korzystania z książki potrzebna jest zaawansowana znajomość statystyki?
Nie, książka została napisana w przystępny sposób, z myślą o osobach, które nie mają formalnego wykształcenia statystycznego - wyjaśnia kluczowe pojęcia krok po kroku i zawiera liczne przykłady.
4. Czy książka jest odpowiednia dla osób uczących się samodzielnie?
Tak, podręcznik jest świetnym wyborem do samodzielnej nauki - zawiera czytelne wyjaśnienia, praktyczne zadania oraz przykłady kodu, które można od razu wykorzystać w praktyce.
5. Czy książka pomoże mi zrozumieć, jak unikać typowych błędów w analizie danych?
Tak, autor zwraca uwagę nie tylko na poprawne wykorzystanie metod statystycznych, ale również omawia najczęstsze pułapki i błędy, pomagając ich unikać w codziennej pracy z danymi.
6. Czy znajdę tu informacje o najnowszych narzędziach i technikach wykorzystywanych w data science?
Tak, książka omawia zarówno klasyczne narzędzia statystyczne, jak i ich nowoczesne zastosowania w kontekście data science, w tym uczenie maszynowe, algorytmy klasyfikacji czy klasteryzację.
7. W jakiej formie dostępna jest książka?
Książka dostępna jest w wersji drukowanej oraz jako e-book, co pozwala wybrać najwygodniejszą formę nauki.
8. Czy książka zawiera przykłady dotyczące rzeczywistych danych?
Tak, wiele przykładów opiera się na autentycznych zbiorach danych i realnych problemach analitycznych, co pozwala lepiej zrozumieć praktyczne zastosowanie statystyki w data science.

Zamknij

Przenieś na półkę
Dodano produkt na półkę
Usunięto produkt z półki
Przeniesiono produkt do archiwum
Przeniesiono produkt do biblioteki
Proszę czekać...
ajax-loader

Zamknij

Wybierz metodę płatności

Książka
52,20 zł
Dodaj do koszyka
Ebook
43,50 zł
Dodaj do koszyka
Zamknij Pobierz aplikację mobilną Ebookpoint