Machine learning, Python i data science. Wprowadzenie.pdf
(
3947 KB
)
Pobierz
•
Kup książkę
•
Poleć książkę
•
Oceń książkę
•
Księgarnia internetowa
•
Lubię to! » Nasza społeczność
Spis treści
Przedmowa ........................................................................................................................... 7
1. Wprowadzenie .......................................................................................................... 13
Dlaczego uczenie maszynowe?
Problemy, które może rozwiązać uczenie maszynowe
Znajomość zadania i znajomość danych
Dlaczego Python?
scikit-learn
Instalacja scikit-learn
Podstawowe biblioteki i narzędzia
Jupyter Notebook
NumPy
SciPy
matplotlib
pandas
mglearn
Python 2 a Python 3
Wersje użyte w tej książce
Pierwsza aplikacja: klasyfikacja gatunków irysa
Zapoznaj się z danymi
Sprawdzanie osiągnięcia sukcesu: dane treningowe i testowe
Najpierw najważniejsze: zapoznaj się z danymi
Budowa pierwszego modelu: k-najbliżsi sąsiedzi
Przewidywania
Ocena modelu
Podsumowanie i przegląd
13
14
16
17
17
17
18
18
19
19
20
21
22
22
23
24
25
27
28
30
31
32
32
3
Kup książkę
Poleć książkę
2. Nadzorowane uczenie maszynowe ............................................................................ 35
Klasyfikacja i regresja
Uogólnianie, nadmierne dopasowanie i niedopasowanie
Relacja złożoności modelu do rozmiaru zestawu danych
Nadzorowane algorytmy uczenia maszynowego
Przykładowe zestawy danych
k-najbliższych sąsiadów
Modele liniowe
Naiwne klasyfikatory Bayesa
Drzewa decyzyjne
Zespoły drzew decyzyjnych
Maszyny wektorów nośnych
Sieci neuronowe (głębokie uczenie)
Szacunki niepewności na podstawie klasyfikatorów
Funkcja decyzyjna
Prognozy prawdopodobieństw
Niepewność w klasyfikacji wieloklasowej
Podsumowanie i przegląd
35
36
38
39
39
43
50
69
70
81
88
98
109
110
112
114
116
3. Uczenie nienadzorowane i przetwarzanie wstępne .................................................. 119
Rodzaje nienadzorowanego uczenia maszynowego
Wyzwania związane z uczeniem nienadzorowanym
Przetwarzanie wstępne i skalowanie
Różne rodzaje przetwarzania wstępnego
Zastosowanie transformacji danych
Skalowanie danych treningowych i testowych w ten sam sposób
Wpływ przetwarzania wstępnego na uczenie nadzorowane
Redukcja wymiarowości, wyodrębnianie cech i wielorakie uczenie
Analiza głównych komponentów (PCA)
Nieujemna faktoryzacja macierzy (NMF)
Manifold learning z t-SNE
Grupowanie
Grupowanie k-średnich
Grupowanie aglomeracyjne
DBSCAN
Porównanie i ocena algorytmów grupowania
Podsumowanie metod grupowania
Podsumowanie i przegląd
119
120
120
121
122
124
126
127
127
140
146
150
150
160
164
168
181
181
4
|
Spis treści
Poleć książkę
Kup książkę
4. Reprezentacja danych i cechy inżynierskie ................................................................183
Zmienne kategorialne
Kodowanie jeden-z-N (zmienne fikcyjne)
Liczby mogą kodować zmienne kategorialne
Dzielenie, dyskretyzacja, modele liniowe i drzewa
Interakcje i wielomiany
Jednowymiarowe transformacje nieliniowe
Automatyczny wybór cechy
Statystyki jednoczynnikowe
Wybór cechy na podstawie modelu
Iteracyjny wybór cech
Wykorzystanie wiedzy eksperckiej
Podsumowanie i przegląd
184
185
189
190
194
200
203
203
205
206
208
215
5. Ocena i doskonalenie modelu ...................................................................................217
Walidacja krzyżowa
Walidacja krzyżowa w scikit-learn
Korzyści z walidacji krzyżowej
Stratyfikowana k-krotna walidacja krzyżowa i inne strategie
Przeszukiwanie siatki
Proste przeszukiwanie siatki
Nadmierne dopasowanie parametrów i zestaw walidacyjny
Przeszukiwanie siatki z walidacją krzyżową
Wskaźniki oceny i punktacja
Pamiętaj o celu
Metryki klasyfikacji binarnej
Metryki klasyfikacji wieloklasowej
Metryki regresji
Używanie metryk oceny w wyborze modelu
Podsumowanie i przegląd
218
218
219
220
225
226
226
228
238
239
239
257
260
260
262
6. Łańcuchy algorytmów i potoki ..................................................................................263
Wybór parametrów z przetwarzaniem wstępnym
Tworzenie potoków
Używanie potoków w przeszukiwaniu siatki
Ogólny interfejs potoku
Wygodne tworzenie potoków za pomocą funkcji make_pipeline
Dostęp do atrybutów kroku
Dostęp do atrybutów klasy GridSearchCV
Kroki przetwarzania wstępnego przeszukiwania siatki i parametry modelu
Przeszukiwanie siatki modeli
Podsumowanie i przegląd
Spis treści
Kup książkę
|
264
265
266
269
270
271
271
273
275
276
5
Poleć książkę
Plik z chomika:
NorkaCzytelnika
Inne pliki z tego folderu:
40 algorytmów, które powinien znać każdy programista. Nauka implementacji algorytmów w Pythonie.pdf
(4108 KB)
Algorytmy Data Science. Siedmiodniowy przewodnik. Wydanie II.pdf
(4601 KB)
Algorytmy dla bystrzaków.pdf
(2441 KB)
Black Hat Python. Język Python dla hakerów i pentesterów. Wydanie II.pdf
(6101 KB)
Advanced Python Guide.pdf
(552 KB)
Inne foldery tego chomika:
3ds max
Access
Acrobat
Administracja
Aforyzmy myśli przysłowia
Zgłoś jeśli
naruszono regulamin