Ta książka opisuje ważne idee z różnych dziedzin, takich jak medycyna, biologia, finanse i marketing, w ramach wspólnych ram koncepcyjnych.. Chociaż podejście jest statystyczne, nacisk kładzie się na koncepcje, a nie na matematykę.. Podano wiele przykładów, z liberalnym użyciem grafiki kolorowej.. Jest to cenne źródło dla statystyków i każdego zainteresowanego eksploracją danych w nauce lub przemyśle.. Książka obejmuje szeroki zakres tematów, od uczenia nadzorowanego (prognoza) do uczenia nienadzorowanego. Wiele tematów obejmuje sieci neuronowe, maszyny wektorów nośnych, drzewa klasyfikacyjne i boosting---pierwsze kompleksowe omówienie tego tematu w jakiejkolwiek książce.
To główne nowe wydanie zawiera wiele tematów nieomówionych w oryginalnym, w tym modele graficzne, lasy losowe, metody zespołowe, regresję najmniejszego kąta i algorytmy ścieżki dla lasso, faktoryzację macierzy nieujemnej i klastrowanie spektralne.. Jest też rozdział o metodach dla danych „szerokich” (p większe niż n), w tym testowanie wielokrotne i wskaźniki fałszywych odkryć.
o autorze
Trevor Hastie, Robert Tibshirani i Jerome Friedman są profesorami statystyki na Uniwersytecie Stanforda. Są wybitnymi badaczami w tej dziedzinie: Hastie i Tibshirani opracowali uogólnione modele addytywne i napisali popularną książkę o tym tytule.. Hastie współtworzył znaczną część oprogramowania i środowiska modelowania statystycznego w R/S-PLUS oraz wynalazł krzywe i powierzchnie główne.. Tibshirani zaproponował lasso i jest współautorem bardzo udanego An Introduction to the Bootstrap.