www.eprace.edu.pl »
sztuczna-inteligencja »
Wstęp do metod ekstrakcji danych » Proces drążenia danych
Proces drążenia danych
Drążenie danych należy uważać za proces iteracyjno-adaptacyjny. Analitycy z takich firm jak DaimlerChrysler, SPSS i NCR stworzyli ogólnie dostępny standardowy proces dopasowania eksploracji danych do ogólnej strategii rozwiązywania problemów komórki biznesowej lub badawczej. Proces ten nazywa się CRISP-DM i przedstawiony jest na rysunku 2.1 .
Rysunek 2.1: Iteracyjno-adaptacyjny proces CRISP-DM
Źródło: [4]
Etapy procesu CRISP-DM
Proces CRISP-DM dzieli się na sześć etapów, które nie koniecznie muszą być wykonywane jednorazowo. Nieraz zdarza się, że przejście do następnego etapu lub cofnięcie się, jest uwarunkowane wynikiem końcowym aktualnego etapu procesu CRISP-DM [21, 22].
- Zrozumienie uwarunkowań badawczych:
- jasne sformułowanie celów i wymagań projektu,
- stworzenie wstępnego planu działania.
- Zrozumienie danych:
- wykorzystanie wstępnej analizy danych, mającej na celu zaznajomienie się z danymi i odkrycie pierwszych korelacji,
- ocena jakości danych.
- Przygotowanie danych:
- przygotowanie ze wstępnie, surowych danych ostatecznego zbioru danych,
- wybór zmiennych objaśniających,
- normalizacja danych.
- Modelowanie:
- wybór i zastosowanie odpowiednich technik modelowania danych.
- Ewaluacja:
- ocena modelu lub modeli, otrzymanych na etapie modelowania, pod względem jakości i efektywności danych,
- ustalenie, czy model rzeczywiście spełnia wszystkie założenia z etapu I.
- Wdrożenie:
- wykorzystanie stworzonych modeli.
komentarze