Opis
Nauka o danych, znana również pod nazwą data science, jest stosunkowo nową, interdyscyplinarną dziedziną, zajmującą się różnymi technikami analizy danych, ich implementacją i wykorzystywaniem do różnych celów. Zalety nauki o danych doceniają specjaliści z wielu branż: analitycy biznesowi, statystycy, architekci oprogramowania i osoby zajmujące się sztuczną inteligencją. Tak naprawdę ta dziedzina nie koncentruje się na kodowaniu i bazach danych, ale raczej na metodach wyłuskiwania z danych najróżniejszych cennych informacji. Wartość tej wiedzy niejednokrotnie okazuje się ogromna.
Niniejsza książka jest przystępnym wprowadzeniem do nauki o danych. Jest przeznaczona dla osób, które chcą stosować techniki analizy danych w biznesie. Te techniki, opisane na podstawie praktycznych przypadków, to m.in. optymalizacja, prognozowanie i symulacja, a także sztuczna inteligencja, teoria grafów, analiza skupień i wykrywanie anomalii. Dzięki tej książce nie tylko zrozumiesz zasady analizowania danych, ale także nauczysz się wybierać technikę właściwą do rozwiązania danego problemu. Poznasz też techniki pracy z prototypami. Co ciekawe, niemal wszystkie opisane tu metody zostały zaprezentowane w arkuszu kalkulacyjnym.
W książce opisano m.in.
optymalizację za pomocą programowania liniowego i całkowitoliczbowego
szereg czasowy, wykrywanie trendów i wahań sezonowych
przewidywanie za pomocą wygładzania wykładniczego
metodę symulacji Monte Carlo
test Tukeya i lokalne czynniki odstające
język R — zaawansowane techniki analizy danych
Wyciśnij z danych każdą kroplę wiedzy!
O autorze
John W. Foreman — jest głównym analitykiem danych w MailChimp.com. Udziela również porad dotyczących analizy danych takim podmiotom jak Coca-Cola czy Intercontinental Hotels, a także oraz amerykańskim agendom rządowym, włączając w to DoD, IRS, DHS i FBI. Często wygłasza prelekcje o rozwiązaniach analitycznych w biznesie.