[Udemy] Maryna Tkachenko - Ds Pro (2021)

Π§Π΅ΠΌΡ Π²Ρ Π½Π°ΡΡΠΈΡΠ΅ΡΡ
1. ΠΠ·ΡΡΠ΅Π½ΠΈΠ΅ Π±Π°Π·ΠΎΠ²ΠΎΠ³ΠΎ Python
ΠΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΠ΅, ΠΊΠΎΠ½ΡΡΠ°Π½ΡΡ, ΡΠΊΠ°Π»ΡΡΠ½ΡΠ΅ ΡΠΈΠΏΡ Π΄Π°Π½Π½ΡΡ , ΠΊΠΎΠ»Π»Π΅ΠΊΡΠΈΠΈ (ΡΠΎΡΡΠ°Π²Π½ΡΠ΅ ΡΠΈΠΏΡ Π΄Π°Π½Π½ΡΡ ), ΠΎΠΏΠ΅ΡΠ°ΡΠΎΡΡ, ΡΡΠ½ΠΊΡΠΈΠΈ, ΠΌΠΎΠ΄ΡΠ»ΠΈ, Π²ΡΠ²ΠΎΠ΄ Π΄Π°Π½Π½ΡΡ , ΠΈΠ½ΠΊΠ°ΠΏΡΡΠ»ΡΡΠΈΡ, Π½Π°ΡΠ»Π΅Π΄ΠΎΠ²Π°Π½ΠΈΠ΅, ΠΏΠΎΠ»ΠΈΠΌΠΎΡΡΠΈΠ·ΠΌ
2. Π‘Π±ΠΎΡ Π΄Π°Π½Π½ΡΡ ΡΡΠ΅Π΄ΡΡΠ²Π°ΠΌΠΈ Python (ΠΌΠΎΠ΄ΡΠ»ΠΈ re, bs4 )
Π Π°Π±ΠΎΡΠ° Ρ ΡΠ΅Π³ΡΠ»ΡΡΠ½ΡΠΌΠΈ Π²ΡΡΠ°ΠΆΠ΅Π½ΠΈΡΠΌΠΈ, ΡΠΈΠ½ΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈΠΉ Π°Π½Π°Π»ΠΈΠ·Π°ΡΠΎΡ HTML/XML ΡΠ΅ΠΊΡΡΠ° Beautiful Soup
3. Π Π°Π±ΠΎΡΠ° Ρ ΡΠ°Π±Π»ΠΈΡΠ°ΠΌΠΈ Π΄Π°Π½Π½ΡΡ ΡΡΠ΅Π΄ΡΡΠ²Π°ΠΌΠΈ Python (ΠΌΠΎΠ΄ΡΠ»Ρ pandas)
ΠΡΠ±ΠΎΡ ΠΈ ΡΠΎΡΡΠΈΡΠΎΠ²ΠΊΠ° Π΄Π°Π½Π½ΡΡ ΡΠ°Π±Π»ΠΈΡ, ΡΠΏΡΠ°Π²Π»Π΅Π½ΠΈΠ΅ ΠΎΡΡΡΡΡΡΠ²ΡΡΡΠΈΠΌΠΈ Π΄Π°Π½Π½ΡΠΌΠΈ ΡΠ°Π±Π»ΠΈΡ, ΡΡΠ΅Π½ΠΈΠ΅ ΠΈ Π·Π°ΠΏΠΈΡΡ ΡΠ°Π±Π»ΠΈΡ, Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΡ Π΄Π°Π½Π½ΡΡ ΡΠ°Π±Π»ΠΈΡ
4. ΠΠ΅Π³Π»ΡΠ±ΠΎΠΊΠΎΠ΅ ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠ΅ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠ΅ ΡΡΠ΅Π΄ΡΡΠ²Π°ΠΌΠΈ Python (ΠΌΠΎΠ΄ΡΠ»Ρ sklearn)
ΠΠ΅ΡΠΎΠ΄Ρ:
- ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ (ΠΏΠ΅ΡΡΠ΅ΠΏΡΡΠΎΠ½, ΠΌΠ½ΠΎΠ³ΠΎΡΠ»ΠΎΠΉΠ½ΡΠΉ ΠΏΠ΅ΡΡΠ΅ΠΏΡΡΠΎΠ½, ΠΌΠ°ΡΠΈΠ½Π° ΠΎΠΏΠΎΡΠ½ΡΡ Π²Π΅ΠΊΡΠΎΡΠΎΠ² ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ, Π»ΠΈΠ½Π΅ΠΉΠ½ΡΠΉ Π΄ΠΈΡΠΊΡΠΈΠΌΠΈΠ½Π°Π½ΡΠ½ΡΠΉ Π°Π½Π°Π»ΠΈΠ· (LDA), Π»ΠΎΠ³ΠΈΡΡΠΈΡΠ΅ΡΠΊΠ°Ρ ΡΠ΅Π³ΡΠ΅ΡΡΠΈΡ, Π½Π°ΠΈΠ²Π½ΡΠΉ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΎΡ ΠΠ°ΠΉΠ΅ΡΠ°, ΡΠ΅ΡΠ°ΡΡΠΈΠ΅ Π΄Π΅ΡΠ΅Π²ΡΡ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ, ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΎΡ Π±Π»ΠΈΠΆΠ°ΠΉΡΠΈΡ ΡΠΎΡΠ΅Π΄Π΅ΠΉ, Π°Π½ΡΠ°ΠΌΠ±Π»ΠΈ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΎΡΠΎΠ²),
- Π°ΠΏΠΏΡΠΎΠΊΡΠΈΠΌΠ°ΡΠΈΠΈ (ΡΠ΅Π³ΡΠ΅ΡΡΠΈΡ Π½Π°ΠΈΠΌΠ΅Π½ΡΡΠΈΡ ΠΊΠ²Π°Π΄ΡΠ°ΡΠΎΠ² (OLS), ΡΠ΅Π³ΡΠ΅ΡΡΠΈΡ LASSO, ΡΠ΅Π³ΡΠ΅ΡΡΠΈΡ Ridge, ΡΠ΅Π³ΡΠ΅ΡΡΠΈΡ ElasticNet, ΡΠ΅Π³ΡΠ΅ΡΡΠΈΡ Π½Π°ΠΈΠΌΠ΅Π½ΡΡΠ΅Π³ΠΎ ΡΠ³Π»Π° (LAR), ΡΠ΅Π³ΡΠ΅ΡΡΠΈΡ ΠΠ°ΠΉΠ΅ΡΠ°, ΠΎΠ±ΠΎΠ±ΡΠ΅Π½Π½Π°Ρ Π»ΠΈΠ½Π΅ΠΉΠ½Π°Ρ ΡΠ΅Π³ΡΠ΅ΡΡΠΈΡ (GLR), ΠΌΠ°ΡΠΈΠ½Π° ΠΎΠΏΠΎΡΠ½ΡΡ Π²Π΅ΠΊΡΠΎΡΠΎΠ² Π°ΠΏΠΏΡΠΎΠΊΡΠΈΠΌΠ°ΡΠΈΠΈ , ΡΠ΅ΡΠ°ΡΡΠΈΠ΅ Π΄Π΅ΡΠ΅Π²ΡΡ Π°ΠΏΠΏΡΠΎΠΊΡΠΈΠΌΠ°ΡΠΈΠΈ, Π°ΠΏΠΏΡΠΎΠΊΡΠΈΠΌΠ°ΡΠΎΡ Π±Π»ΠΈΠΆΠ°ΠΉΡΠΈΡ ΡΠΎΡΠ΅Π΄Π΅ΠΉ, Π°Π½ΡΠ°ΠΌΠ±Π»ΠΈ Π°ΠΏΠΏΡΠΎΠΊΡΠΈΠΌΠ°ΡΠΎΡΠΎΠ²),
- ΠΊΠ»Π°ΡΡΠ΅ΡΠΈΠ·Π°ΡΠΈΠΈ (Π°Π»Π³ΠΎΡΠΈΡΠΌΡ ΡΠ΅Π½ΡΡΠΎΠΈΠ΄Π½ΡΠ΅ (K-ΡΡΠ΅Π΄Π½ΠΈΡ , ΡΠ΄Π²ΠΈΠ³Π° ΡΡΠ΅Π΄Π½Π΅Π³ΠΎ Π·Π½Π°ΡΠ΅Π½ΠΈΡ), ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΡΠΌΠ΅ΡΠΈ (EM), ΠΏΠ»ΠΎΡΠ½ΠΎΡΡΠ½ΡΠ΅ (DBSCAN, OPTICS), ΡΠΏΠ΅ΠΊΡΡΠ°Π»ΡΠ½ΡΠ΅, ΠΈΠ΅ΡΠ°ΡΡ ΠΈΡΠ΅ΡΠΊΠΈΠ΅),
- ΠΎΠ±Π½Π°ΡΡΠΆΠ΅Π½ΠΈΡ ΡΠ»ΡΡΠ°ΠΉΠ½ΡΡ Π²ΡΠ±ΡΠΎΡΠΎΠ² (ΠΎΠ΄Π½ΠΎΠΊΠ»Π°ΡΡΠΎΠ²Π°Ρ ΠΌΠ°ΡΠΈΠ½Π° ΠΎΠΏΠΎΡΠ½ΡΡ Π²Π΅ΠΊΡΠΎΡΠΎΠ² (one-class SVM), ΠΈΠ·ΠΎΠ»ΠΈΡΠΎΠ²Π°Π½Π½ΡΠΉ Π»Π΅Ρ, ΠΌΠΈΠ½ΠΈΠΌΠ°Π»ΡΠ½ΡΠΉ ΠΊΠΎΠ²Π°ΡΠΈΠ°ΡΠΈΠΎΠ½Π½ΡΠΉ ΠΎΠΏΡΠ΅Π΄Π΅Π»ΠΈΡΠ΅Π»Ρ (MCD), ΡΠ°ΠΊΡΠΎΡ Π»ΠΎΠΊΠ°Π»ΡΠ½ΡΡ Π²ΡΠ±ΡΠΎΡΠΎΠ² (LOF)),
- Π²ΠΎΡΡΡΠ°Π½ΠΎΠ²Π»Π΅Π½ΠΈΡ Π΄Π°Π½Π½ΡΡ (ΠΎΠ³ΡΠ°Π½ΠΈΡΠ΅Π½Π½Π°Ρ ΠΌΠ°ΡΠΈΠ½Π° ΠΠΎΠ»ΡΡΠΌΠ°Π½Π°),
- Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠ³ΠΎ ΡΠ½ΠΈΠΆΠ΅Π½ΠΈΡ ΡΠ°Π·ΠΌΠ΅ΡΠ½ΠΎΡΡΠΈ Π΄Π°Π½Π½ΡΡ (Π°Π½Π°Π»ΠΈΠ· Π³Π»Π°Π²Π½ΡΡ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ (PCA), ΡΠ°Π·Π»ΠΎΠΆΠ΅Π½ΠΈΠ΅ ΠΏΠΎ ΡΠΈΠ½Π³ΡΠ»ΡΡΠ½ΡΠΌ Π·Π½Π°ΡΠ΅Π½ΠΈΡΠΌ (SVD), ΡΠ°ΠΊΡΠΎΡΠ½ΡΠΉ Π°Π½Π°Π»ΠΈΠ·, Π°Π½Π°Π»ΠΈΠ· Π½Π΅Π·Π°Π²ΠΈΡΠΈΠΌΡΡ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ (ICA), ΡΠ°ΠΊΡΠΎΡΠΈΠ·Π°ΡΠΈΡ Π½Π΅ΠΎΡΡΠΈΡΠ°ΡΠ΅Π»ΡΠ½ΠΎΠΉ ΠΌΠ°ΡΡΠΈΡΡ (NMF), Π»ΠΈΠ½Π΅ΠΉΠ½ΡΠΉ Π΄ΠΈΡΠΊΡΠΈΠΌΠΈΠ½Π°Π½ΡΠ½ΡΠΉ Π°Π½Π°Π»ΠΈΠ· (LDA), Π°Π½Π°Π»ΠΈΠ· Π±Π»ΠΈΠΆΠ°ΠΉΡΠΈΡ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ (NCA)),
- Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠ³ΠΎ ΡΠ½ΠΈΠΆΠ΅Π½ΠΈΡ ΡΠ°Π·ΠΌΠ΅ΡΠ½ΠΎΡΡΠΈ Π΄Π°Π½Π½ΡΡ (Isomap, Π»ΠΎΠΊΠ°Π»ΡΠ½ΠΎΠ΅ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠ΅ Π²ΠΊΠ»Π°Π΄ΡΠ²Π°Π½ΠΈΠ΅ (LLE), ΡΠΏΠ΅ΠΊΡΡΠ°Π»ΡΠ½ΠΎΠ΅ Π²ΠΊΠ»Π°Π΄ΡΠ²Π°Π½ΠΈΠ΅, Π²ΡΡΠ°Π²Π½ΠΈΠ²Π°Π½ΠΈΠ΅ Π»ΠΎΠΊΠ°Π»ΡΠ½ΠΎΠ³ΠΎ ΠΊΠ°ΡΠ°ΡΠ΅Π»ΡΠ½ΠΎΠ³ΠΎ ΠΏΡΠΎΡΡΡΠ°Π½ΡΡΠ²Π° (LTSA), ΠΌΠ½ΠΎΠ³ΠΎΠΌΠ΅ΡΠ½ΠΎΠ΅ ΡΠΊΠ°Π»ΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ (MDS), t-SNE),
- Π²ΡΠ±ΠΎΡΠ° ΠΏΡΠΈΠ·Π½Π°ΠΊΠΎΠ² (Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ Π½Π°ΠΈΠΌΠ΅Π½ΡΡΠ΅ΠΉ Π΄ΠΈΡΠΏΠ΅ΡΡΠΈΠΈ, Ρ ΠΈ-ΠΊΠ²Π°Π΄ΡΠ°Ρ, F-Π·Π½Π°ΡΠ΅Π½ΠΈΡ, Π²Π·Π°ΠΈΠΌΠ½ΠΎΠΉ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ)
5. ΠΠ»ΡΠ±ΠΎΠΊΠΎΠ΅ ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠ΅ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠ΅ ΡΡΠ΅Π΄ΡΡΠ²Π°ΠΌΠΈ Python (ΠΏΠΎΠ΄ΠΌΠΎΠ΄ΡΠ»Ρ keras ΠΌΠΎΠ΄ΡΠ»Ρ tensorflow)
Π‘ΠΎΠ·Π΄Π°Π½ΠΈΠ΅ ΠΈΡΠΊΡΡΡΡΠ²Π΅Π½Π½ΡΡ Π½Π΅ΠΉΡΠΎΠ½Π½ΡΡ ΡΠ΅ΡΠ΅ΠΉ (ΠΌΠ½ΠΎΠ³ΠΎΡΠ»ΠΎΠΉΠ½ΡΠΉ ΠΏΠ΅ΡΡΠ΅ΠΏΡΡΠΎΠ½ (MLP), ΠΊΠ°ΡΠΊΠ°Π΄Π½Π°Ρ Π½Π΅ΠΉΡΠΎΡΠ΅ΡΡ ΠΏΡΡΠΌΠΎΠ³ΠΎ ΡΠ°ΡΠΏΡΠΎΡΡΡΠ°Π½Π΅Π½ΠΈΡ (CFNN), Π°Π²ΡΠΎΡΠ½ΠΊΠΎΠ΄Π΅Ρ, ΡΠ»ΡΠ·ΠΎΠ²ΡΠΉ ΡΠ΅ΠΊΡΡΡΠ΅Π½ΡΠ½ΡΠΉ Π±Π»ΠΎΠΊ (GRU), Π΄ΠΎΠ»Π³Π°Ρ ΠΊΡΠ°ΡΠΊΠΎΡΡΠΎΡΠ½Π°Ρ ΠΏΠ°ΠΌΡΡΡ (LSTM), ΡΠ²Π΅ΡΡΠΎΡΠ½Π°Ρ Π½Π΅ΠΉΡΠΎΡΠ΅ΡΡ (CNN)) Π΄Π»Ρ Π·Π°Π΄Π°Ρ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ, Π°ΠΏΠΏΡΠΎΠΊΡΠΈΠΌΠ°ΡΠΈΠΈ, Π²ΠΎΡΡΡΠ°Π½ΠΎΠ²Π»Π΅Π½ΠΈΡ Π΄Π°Π½Π½ΡΡ
ΠΠ»Ρ ΠΊΠΎΠ³ΠΎ ΡΡΠΎΡ ΠΊΡΡΡ:

Π§Π΅ΠΌΡ Π²Ρ Π½Π°ΡΡΠΈΡΠ΅ΡΡ
- ΠΠ·ΡΡΠ΅Π½ΠΈΠ΅ Π±Π°Π·ΠΎΠ²ΠΎΠ³ΠΎ Python
- Π‘Π±ΠΎΡ Π΄Π°Π½Π½ΡΡ ΡΡΠ΅Π΄ΡΡΠ²Π°ΠΌΠΈ Python (ΠΌΠΎΠ΄ΡΠ»ΠΈ re (ΡΠ°Π±ΠΎΡΠ° Ρ ΡΠ΅Π³ΡΠ»ΡΡΠ½ΡΠΌΠΈ Π²ΡΡΠ°ΠΆΠ΅Π½ΠΈΡΠΌΠΈ), bs4 (ΡΠΈΠ½ΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈΠΉ Π°Π½Π°Π»ΠΈΠ·Π°ΡΠΎΡ HTML/XML ΡΠ΅ΠΊΡΡΠ° Beautiful Soup))
- Π Π°Π±ΠΎΡΠ° Ρ ΡΠ°Π±Π»ΠΈΡΠ°ΠΌΠΈ ΡΡΠ΅Π΄ΡΡΠ²Π°ΠΌΠΈ Python (ΠΌΠΎΠ΄ΡΠ»Ρ pandas)
- ΠΠ΅Π³Π»ΡΠ±ΠΎΠΊΠΎΠ΅ ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠ΅ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠ΅ ΡΡΠ΅Π΄ΡΡΠ²Π°ΠΌΠΈ Python (ΠΌΠΎΠ΄ΡΠ»Ρ sklearn)
- ΠΠ»ΡΠ±ΠΎΠΊΠΎΠ΅ ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠ΅ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠ΅ ΡΡΠ΅Π΄ΡΡΠ²Π°ΠΌΠΈ Python (ΠΏΠΎΠ΄ΠΌΠΎΠ΄ΡΠ»Ρ keras ΠΌΠΎΠ΄ΡΠ»Ρ tensorflow)
- ΠΠ°Π²ΡΠΊΠΈ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠΈΡΠΎΠ²Π°Π½ΠΈΡ Π½Π΅ ΠΎΠ±ΡΠ·Π°ΡΠ΅Π»ΡΠ½Ρ, ΠΏΠΎΡΠΊΠΎΠ»ΡΠΊΡ Π² ΠΊΡΡΡΠ΅ Π΅ΡΡΡ Π²ΡΡ Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΠΎΠ΅
1. ΠΠ·ΡΡΠ΅Π½ΠΈΠ΅ Π±Π°Π·ΠΎΠ²ΠΎΠ³ΠΎ Python
ΠΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΠ΅, ΠΊΠΎΠ½ΡΡΠ°Π½ΡΡ, ΡΠΊΠ°Π»ΡΡΠ½ΡΠ΅ ΡΠΈΠΏΡ Π΄Π°Π½Π½ΡΡ , ΠΊΠΎΠ»Π»Π΅ΠΊΡΠΈΠΈ (ΡΠΎΡΡΠ°Π²Π½ΡΠ΅ ΡΠΈΠΏΡ Π΄Π°Π½Π½ΡΡ ), ΠΎΠΏΠ΅ΡΠ°ΡΠΎΡΡ, ΡΡΠ½ΠΊΡΠΈΠΈ, ΠΌΠΎΠ΄ΡΠ»ΠΈ, Π²ΡΠ²ΠΎΠ΄ Π΄Π°Π½Π½ΡΡ , ΠΈΠ½ΠΊΠ°ΠΏΡΡΠ»ΡΡΠΈΡ, Π½Π°ΡΠ»Π΅Π΄ΠΎΠ²Π°Π½ΠΈΠ΅, ΠΏΠΎΠ»ΠΈΠΌΠΎΡΡΠΈΠ·ΠΌ
2. Π‘Π±ΠΎΡ Π΄Π°Π½Π½ΡΡ ΡΡΠ΅Π΄ΡΡΠ²Π°ΠΌΠΈ Python (ΠΌΠΎΠ΄ΡΠ»ΠΈ re, bs4 )
Π Π°Π±ΠΎΡΠ° Ρ ΡΠ΅Π³ΡΠ»ΡΡΠ½ΡΠΌΠΈ Π²ΡΡΠ°ΠΆΠ΅Π½ΠΈΡΠΌΠΈ, ΡΠΈΠ½ΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈΠΉ Π°Π½Π°Π»ΠΈΠ·Π°ΡΠΎΡ HTML/XML ΡΠ΅ΠΊΡΡΠ° Beautiful Soup
3. Π Π°Π±ΠΎΡΠ° Ρ ΡΠ°Π±Π»ΠΈΡΠ°ΠΌΠΈ Π΄Π°Π½Π½ΡΡ ΡΡΠ΅Π΄ΡΡΠ²Π°ΠΌΠΈ Python (ΠΌΠΎΠ΄ΡΠ»Ρ pandas)
ΠΡΠ±ΠΎΡ ΠΈ ΡΠΎΡΡΠΈΡΠΎΠ²ΠΊΠ° Π΄Π°Π½Π½ΡΡ ΡΠ°Π±Π»ΠΈΡ, ΡΠΏΡΠ°Π²Π»Π΅Π½ΠΈΠ΅ ΠΎΡΡΡΡΡΡΠ²ΡΡΡΠΈΠΌΠΈ Π΄Π°Π½Π½ΡΠΌΠΈ ΡΠ°Π±Π»ΠΈΡ, ΡΡΠ΅Π½ΠΈΠ΅ ΠΈ Π·Π°ΠΏΠΈΡΡ ΡΠ°Π±Π»ΠΈΡ, Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΡ Π΄Π°Π½Π½ΡΡ ΡΠ°Π±Π»ΠΈΡ
4. ΠΠ΅Π³Π»ΡΠ±ΠΎΠΊΠΎΠ΅ ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠ΅ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠ΅ ΡΡΠ΅Π΄ΡΡΠ²Π°ΠΌΠΈ Python (ΠΌΠΎΠ΄ΡΠ»Ρ sklearn)
ΠΠ΅ΡΠΎΠ΄Ρ:
- ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ (ΠΏΠ΅ΡΡΠ΅ΠΏΡΡΠΎΠ½, ΠΌΠ½ΠΎΠ³ΠΎΡΠ»ΠΎΠΉΠ½ΡΠΉ ΠΏΠ΅ΡΡΠ΅ΠΏΡΡΠΎΠ½, ΠΌΠ°ΡΠΈΠ½Π° ΠΎΠΏΠΎΡΠ½ΡΡ Π²Π΅ΠΊΡΠΎΡΠΎΠ² ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ, Π»ΠΈΠ½Π΅ΠΉΠ½ΡΠΉ Π΄ΠΈΡΠΊΡΠΈΠΌΠΈΠ½Π°Π½ΡΠ½ΡΠΉ Π°Π½Π°Π»ΠΈΠ· (LDA), Π»ΠΎΠ³ΠΈΡΡΠΈΡΠ΅ΡΠΊΠ°Ρ ΡΠ΅Π³ΡΠ΅ΡΡΠΈΡ, Π½Π°ΠΈΠ²Π½ΡΠΉ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΎΡ ΠΠ°ΠΉΠ΅ΡΠ°, ΡΠ΅ΡΠ°ΡΡΠΈΠ΅ Π΄Π΅ΡΠ΅Π²ΡΡ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ, ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΎΡ Π±Π»ΠΈΠΆΠ°ΠΉΡΠΈΡ ΡΠΎΡΠ΅Π΄Π΅ΠΉ, Π°Π½ΡΠ°ΠΌΠ±Π»ΠΈ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΎΡΠΎΠ²),
- Π°ΠΏΠΏΡΠΎΠΊΡΠΈΠΌΠ°ΡΠΈΠΈ (ΡΠ΅Π³ΡΠ΅ΡΡΠΈΡ Π½Π°ΠΈΠΌΠ΅Π½ΡΡΠΈΡ ΠΊΠ²Π°Π΄ΡΠ°ΡΠΎΠ² (OLS), ΡΠ΅Π³ΡΠ΅ΡΡΠΈΡ LASSO, ΡΠ΅Π³ΡΠ΅ΡΡΠΈΡ Ridge, ΡΠ΅Π³ΡΠ΅ΡΡΠΈΡ ElasticNet, ΡΠ΅Π³ΡΠ΅ΡΡΠΈΡ Π½Π°ΠΈΠΌΠ΅Π½ΡΡΠ΅Π³ΠΎ ΡΠ³Π»Π° (LAR), ΡΠ΅Π³ΡΠ΅ΡΡΠΈΡ ΠΠ°ΠΉΠ΅ΡΠ°, ΠΎΠ±ΠΎΠ±ΡΠ΅Π½Π½Π°Ρ Π»ΠΈΠ½Π΅ΠΉΠ½Π°Ρ ΡΠ΅Π³ΡΠ΅ΡΡΠΈΡ (GLR), ΠΌΠ°ΡΠΈΠ½Π° ΠΎΠΏΠΎΡΠ½ΡΡ Π²Π΅ΠΊΡΠΎΡΠΎΠ² Π°ΠΏΠΏΡΠΎΠΊΡΠΈΠΌΠ°ΡΠΈΠΈ , ΡΠ΅ΡΠ°ΡΡΠΈΠ΅ Π΄Π΅ΡΠ΅Π²ΡΡ Π°ΠΏΠΏΡΠΎΠΊΡΠΈΠΌΠ°ΡΠΈΠΈ, Π°ΠΏΠΏΡΠΎΠΊΡΠΈΠΌΠ°ΡΠΎΡ Π±Π»ΠΈΠΆΠ°ΠΉΡΠΈΡ ΡΠΎΡΠ΅Π΄Π΅ΠΉ, Π°Π½ΡΠ°ΠΌΠ±Π»ΠΈ Π°ΠΏΠΏΡΠΎΠΊΡΠΈΠΌΠ°ΡΠΎΡΠΎΠ²),
- ΠΊΠ»Π°ΡΡΠ΅ΡΠΈΠ·Π°ΡΠΈΠΈ (Π°Π»Π³ΠΎΡΠΈΡΠΌΡ ΡΠ΅Π½ΡΡΠΎΠΈΠ΄Π½ΡΠ΅ (K-ΡΡΠ΅Π΄Π½ΠΈΡ , ΡΠ΄Π²ΠΈΠ³Π° ΡΡΠ΅Π΄Π½Π΅Π³ΠΎ Π·Π½Π°ΡΠ΅Π½ΠΈΡ), ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΡΠΌΠ΅ΡΠΈ (EM), ΠΏΠ»ΠΎΡΠ½ΠΎΡΡΠ½ΡΠ΅ (DBSCAN, OPTICS), ΡΠΏΠ΅ΠΊΡΡΠ°Π»ΡΠ½ΡΠ΅, ΠΈΠ΅ΡΠ°ΡΡ ΠΈΡΠ΅ΡΠΊΠΈΠ΅),
- ΠΎΠ±Π½Π°ΡΡΠΆΠ΅Π½ΠΈΡ ΡΠ»ΡΡΠ°ΠΉΠ½ΡΡ Π²ΡΠ±ΡΠΎΡΠΎΠ² (ΠΎΠ΄Π½ΠΎΠΊΠ»Π°ΡΡΠΎΠ²Π°Ρ ΠΌΠ°ΡΠΈΠ½Π° ΠΎΠΏΠΎΡΠ½ΡΡ Π²Π΅ΠΊΡΠΎΡΠΎΠ² (one-class SVM), ΠΈΠ·ΠΎΠ»ΠΈΡΠΎΠ²Π°Π½Π½ΡΠΉ Π»Π΅Ρ, ΠΌΠΈΠ½ΠΈΠΌΠ°Π»ΡΠ½ΡΠΉ ΠΊΠΎΠ²Π°ΡΠΈΠ°ΡΠΈΠΎΠ½Π½ΡΠΉ ΠΎΠΏΡΠ΅Π΄Π΅Π»ΠΈΡΠ΅Π»Ρ (MCD), ΡΠ°ΠΊΡΠΎΡ Π»ΠΎΠΊΠ°Π»ΡΠ½ΡΡ Π²ΡΠ±ΡΠΎΡΠΎΠ² (LOF)),
- Π²ΠΎΡΡΡΠ°Π½ΠΎΠ²Π»Π΅Π½ΠΈΡ Π΄Π°Π½Π½ΡΡ (ΠΎΠ³ΡΠ°Π½ΠΈΡΠ΅Π½Π½Π°Ρ ΠΌΠ°ΡΠΈΠ½Π° ΠΠΎΠ»ΡΡΠΌΠ°Π½Π°),
- Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠ³ΠΎ ΡΠ½ΠΈΠΆΠ΅Π½ΠΈΡ ΡΠ°Π·ΠΌΠ΅ΡΠ½ΠΎΡΡΠΈ Π΄Π°Π½Π½ΡΡ (Π°Π½Π°Π»ΠΈΠ· Π³Π»Π°Π²Π½ΡΡ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ (PCA), ΡΠ°Π·Π»ΠΎΠΆΠ΅Π½ΠΈΠ΅ ΠΏΠΎ ΡΠΈΠ½Π³ΡΠ»ΡΡΠ½ΡΠΌ Π·Π½Π°ΡΠ΅Π½ΠΈΡΠΌ (SVD), ΡΠ°ΠΊΡΠΎΡΠ½ΡΠΉ Π°Π½Π°Π»ΠΈΠ·, Π°Π½Π°Π»ΠΈΠ· Π½Π΅Π·Π°Π²ΠΈΡΠΈΠΌΡΡ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ (ICA), ΡΠ°ΠΊΡΠΎΡΠΈΠ·Π°ΡΠΈΡ Π½Π΅ΠΎΡΡΠΈΡΠ°ΡΠ΅Π»ΡΠ½ΠΎΠΉ ΠΌΠ°ΡΡΠΈΡΡ (NMF), Π»ΠΈΠ½Π΅ΠΉΠ½ΡΠΉ Π΄ΠΈΡΠΊΡΠΈΠΌΠΈΠ½Π°Π½ΡΠ½ΡΠΉ Π°Π½Π°Π»ΠΈΠ· (LDA), Π°Π½Π°Π»ΠΈΠ· Π±Π»ΠΈΠΆΠ°ΠΉΡΠΈΡ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ (NCA)),
- Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠ³ΠΎ ΡΠ½ΠΈΠΆΠ΅Π½ΠΈΡ ΡΠ°Π·ΠΌΠ΅ΡΠ½ΠΎΡΡΠΈ Π΄Π°Π½Π½ΡΡ (Isomap, Π»ΠΎΠΊΠ°Π»ΡΠ½ΠΎΠ΅ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠ΅ Π²ΠΊΠ»Π°Π΄ΡΠ²Π°Π½ΠΈΠ΅ (LLE), ΡΠΏΠ΅ΠΊΡΡΠ°Π»ΡΠ½ΠΎΠ΅ Π²ΠΊΠ»Π°Π΄ΡΠ²Π°Π½ΠΈΠ΅, Π²ΡΡΠ°Π²Π½ΠΈΠ²Π°Π½ΠΈΠ΅ Π»ΠΎΠΊΠ°Π»ΡΠ½ΠΎΠ³ΠΎ ΠΊΠ°ΡΠ°ΡΠ΅Π»ΡΠ½ΠΎΠ³ΠΎ ΠΏΡΠΎΡΡΡΠ°Π½ΡΡΠ²Π° (LTSA), ΠΌΠ½ΠΎΠ³ΠΎΠΌΠ΅ΡΠ½ΠΎΠ΅ ΡΠΊΠ°Π»ΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ (MDS), t-SNE),
- Π²ΡΠ±ΠΎΡΠ° ΠΏΡΠΈΠ·Π½Π°ΠΊΠΎΠ² (Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ Π½Π°ΠΈΠΌΠ΅Π½ΡΡΠ΅ΠΉ Π΄ΠΈΡΠΏΠ΅ΡΡΠΈΠΈ, Ρ ΠΈ-ΠΊΠ²Π°Π΄ΡΠ°Ρ, F-Π·Π½Π°ΡΠ΅Π½ΠΈΡ, Π²Π·Π°ΠΈΠΌΠ½ΠΎΠΉ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ)
5. ΠΠ»ΡΠ±ΠΎΠΊΠΎΠ΅ ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠ΅ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠ΅ ΡΡΠ΅Π΄ΡΡΠ²Π°ΠΌΠΈ Python (ΠΏΠΎΠ΄ΠΌΠΎΠ΄ΡΠ»Ρ keras ΠΌΠΎΠ΄ΡΠ»Ρ tensorflow)
Π‘ΠΎΠ·Π΄Π°Π½ΠΈΠ΅ ΠΈΡΠΊΡΡΡΡΠ²Π΅Π½Π½ΡΡ Π½Π΅ΠΉΡΠΎΠ½Π½ΡΡ ΡΠ΅ΡΠ΅ΠΉ (ΠΌΠ½ΠΎΠ³ΠΎΡΠ»ΠΎΠΉΠ½ΡΠΉ ΠΏΠ΅ΡΡΠ΅ΠΏΡΡΠΎΠ½ (MLP), ΠΊΠ°ΡΠΊΠ°Π΄Π½Π°Ρ Π½Π΅ΠΉΡΠΎΡΠ΅ΡΡ ΠΏΡΡΠΌΠΎΠ³ΠΎ ΡΠ°ΡΠΏΡΠΎΡΡΡΠ°Π½Π΅Π½ΠΈΡ (CFNN), Π°Π²ΡΠΎΡΠ½ΠΊΠΎΠ΄Π΅Ρ, ΡΠ»ΡΠ·ΠΎΠ²ΡΠΉ ΡΠ΅ΠΊΡΡΡΠ΅Π½ΡΠ½ΡΠΉ Π±Π»ΠΎΠΊ (GRU), Π΄ΠΎΠ»Π³Π°Ρ ΠΊΡΠ°ΡΠΊΠΎΡΡΠΎΡΠ½Π°Ρ ΠΏΠ°ΠΌΡΡΡ (LSTM), ΡΠ²Π΅ΡΡΠΎΡΠ½Π°Ρ Π½Π΅ΠΉΡΠΎΡΠ΅ΡΡ (CNN)) Π΄Π»Ρ Π·Π°Π΄Π°Ρ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ, Π°ΠΏΠΏΡΠΎΠΊΡΠΈΠΌΠ°ΡΠΈΠΈ, Π²ΠΎΡΡΡΠ°Π½ΠΎΠ²Π»Π΅Π½ΠΈΡ Π΄Π°Π½Π½ΡΡ
ΠΠ»Ρ ΠΊΠΎΠ³ΠΎ ΡΡΠΎΡ ΠΊΡΡΡ:
- Π Π°Π·ΡΠ°Π±ΠΎΡΡΠΈΠΊΠΈ Π·Π°ΠΈΠ½ΡΠ΅ΡΠ΅ΡΠΎΠ²Π°Π½Π½ΡΠ΅ Π² ΠΈΠ·ΡΡΠ΅Π½ΠΈΠΈ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠ°ΡΠΈΡ Π½Π°ΡΠΊΠΈ ΠΎ Π΄Π°Π½Π½ΡΡ (Data Science)
Π‘ΠΊΡΡΡΠΎΠ΅ ΡΠΎΠ΄Π΅ΡΠΆΠΈΠΌΠΎΠ΅. ΠΠ°ΠΌ Π½ΡΠΆΠ½ΠΎ Π²ΠΎΠΉΡΠΈ ΠΈΠ»ΠΈ Π·Π°ΡΠ΅Π³ΠΈΡΡΡΠΈΡΠΎΠ²Π°ΡΡΡΡ.
Π‘ΠΠΠ§ΠΠ’Π¬Π‘ΠΊΡΡΡΠΎΠ΅ ΡΠΎΠ΄Π΅ΡΠΆΠΈΠΌΠΎΠ΅. ΠΠ°ΠΌ Π½ΡΠΆΠ½ΠΎ Π²ΠΎΠΉΡΠΈ ΠΈΠ»ΠΈ Π·Π°ΡΠ΅Π³ΠΈΡΡΡΠΈΡΠΎΠ²Π°ΡΡΡΡ.
ΠΠΎΡΠ»Π΅Π΄Π½Π΅Π΅ ΡΠ΅Π΄Π°ΠΊΡΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅ΡΠ°ΡΠΎΡΠΎΠΌ: