www.eprace.edu.pl » sztuczna-inteligencja » Znaczenie poprawnej normalizacji danych » Przykład błędnego użycia formuły normalizacyjnej

Przykład błędnego użycia formuły normalizacyjnej

W podrozdziałach 3.1 oraz 3.2 pokazana została teoria normalizacji zmiennych. Niniejszy podrozdział, ma za zadanie pokazać w praktyce różnice pomiędzy źle znormalizowanymi danymi, a danymi które zostały w poprawny sposób znormalizowane.

Niekiedy zdarza się, że przyjmiemy błędne założenia odnośnie normalizacji danych, należy wówczas zdać sobie sprawę, że normalizując dane wejściowe na kilka sposobów tą samą funkcją, nie zawsze otrzyma się identyczne dane wyjściowe.

Przyjmijmy, że mamy macierz przedstawiającą szeregi czasowe,
(3.7)

którą chcemy znormalizować do pewnego zakresu, powiedzmy [-100; 100]. Dokonując normalizacji po kolumnach, otrzymamy następującą macierz:
(3.8)

a z kolei dokonując normalizacji po wierszach, dostajemy macierz:
(3.9)

co z kolei spełnia w tym wypadku równanie: A = norm(A) odnośnie zakresu [-100; 100]. Jak zostało pokazane, normalizację należy przeprowadzać ostrożnie i z głową, inaczej dane mogą nie odpowiadać stanowi realnemu.

Ważne jest, aby pamiętać kiedy używać normalizacji po kolumnach a kiedy normalizacji po wierszach. Normalizacji po kolumnach, używa się tylko i wyłącznie w takim wypadku gdy mamy doczynienia z wieloma parametrami (statystykami). Przykładowo, pierwszą kolumnę (parametr) macierzy można interpretować jako długość kielicha kwiatu Irysa, a drugą kolumnę jako szerokość płatka kwiatu Irysa. Musimy wówczas znormalizować każdy parametr oddzielnie.

Inaczej postępujemy gdy mamy doczynienia z ciągiem czasowym. Macierz ciągów czasowych zbudowana jest z tzw. okien czasowych gdzie nie ma parametrów. Można powiedzieć, że każdy wektor jest swoistym parametrem macierzy tak więc, należy go znormalizować.

Normalizacje 3.8 oraz 3.9 zostały dokonane za pomocą funkcji normLiniowa, która realizuje normalizację za pomocą funkcji f(x) = ax + b.

komentarze

Copyright © 2008-2010 EPrace oraz autorzy prac.