Jak Działa Amplifikacja Drgań: Faza, Piramidy
i Nauka Dostrzegania Ruchu
VibraVizja® produkuje wzmocnione filmy, w których drgania powierzchni przy wybranych częstotliwościach stają się widoczne dla ludzkiego oka. Ten artykuł wyjaśnia krok po kroku, w jaki sposób algorytm to osiąga — od pierwszej transformacji matematycznej każdej klatki wideo do końcowego zrekonstruowanego obrazu. Nie jest wymagana wcześniejsza znajomość przetwarzania obrazów.
Większość narzędzi do pomiaru drgań produkuje liczbę: ogólny poziom, widmo, trend w czasie. VibraVizja® produkuje coś innego — film, w którym ruch każdej widocznej powierzchni został wzmocniony do stopnia umożliwiającego jego percepcję przez ludzkie oko, przy wybranych przez użytkownika częstotliwościach. Wynik inżynierski jest znajomy: widmo częstotliwościowe, częstotliwość rezonansowa, operacyjny kształt ugięcia. Różnica polega na tym, że wszystkie te informacje są wyodrębniane z nagrania wideo, bez kontaktu, i rozpoznawane przestrzennie w całym polu widzenia.
Metoda ta nosi nazwę fazowej amplifikacji ruchu w wideo. Opiera się na fundamentalnych pracach Wadhwy, Rubinsteina, Duranda i Freemana z MIT opublikowanych w 2013 roku oraz na transformacie complex steerable pyramid Simoncellego opracowanej na początku lat 90. Kluczowa obserwacja tych badań — którą algorytm VibraVizja® stosuje do przemysłowej diagnostyki drganiowej — jest następująca: zamiast śledzić zmiany jasności pikseli w czasie, co wzmacnia szum równie agresywnie jak sygnał, algorytm śledzi zmiany fazy lokalnych struktur obrazu. Faza okazuje się znacznie bardziej odpornym sygnałem do pomiaru przemieszczenia.
'Jasność piksela mówi Ci, jak wygląda powierzchnia. Faza mówi, gdzie się ona znajduje. Jeśli chcesz mierzyć ruch, faza jest właściwym sygnałem do śledzenia.'
Krok 1 — Dekompozycja Obrazu
Każda klatka wideo jest najpierw transformowana za pomocą struktury zwanej complex steerable pyramid. Można o niej myśleć jak o banku przestrzennie dostrojonych filtrów stosowanych jednocześnie w wielu skalach i wielu orientacjach. Koncepcyjnie jest podobna do banku filtrów oktawowych w analizie akustycznej: podobnie jak bank filtrów akustycznych rozdziela dźwięk na pasma częstotliwości, steerable pyramid rozdziela obraz na pasma częstotliwości przestrzennych — ale w dwóch wymiarach, uchwycając zarówno skalę (od drobnych szczegółów do grubej struktury), jak i orientację (poziomą, ukośną, pionową).
Szczególna użyteczność tej piramidy polega na tym, że jej filtry występują w parach kwadraturowych — filtr parzysty (podobny do cosinus) i filtr nieparzysty (podobny do sinus) przy tej samej skali i orientacji. Połączenie wyników tych dwóch filtrów w każdym miejscu pikselowym daje zespoloną liczbę. Ta liczba zespolona ma dwa składniki niosące fundamentalnie różne informacje: jej moduł opisuje, jak silnie dany wzorzec przestrzenny jest obecny w danym miejscu; jej faza opisuje, gdzie ten wzorzec jest pozycjonowany w przestrzeni. To właśnie faza interesuje algorytm.
Krok 2 — Dlaczego Faza Koduje Ruch
Związek między fazą a przemieszczeniem wynika z dobrze ugruntowanego wyniku przetwarzania sygnałów zwanego twierdzeniem Fouriera o przesunięciu. Stwierdza ono, że przesunięcie sygnału w przestrzeni jest równoważne dodaniu liniowej rampy do jego fazy w przestrzeni częstotliwości. W prostych słowach: jeśli wzorzec uchwycony przez filtr przy danej skali i orientacji przesuwa się o małą odległość, faza odpowiedniego współczynnika complex pyramid zmienia się o wartość proporcjonalną do tej odległości. Pomiar zmiany fazy jest równoważny pomiarowi przemieszczenia — bez obliczania przepływu optycznego i bez wyraźnego śledzenia żadnego punktu.
Praktyczna konsekwencja jest istotna. Współczynniki piramidy mogą wykryć ruch znacznie mniejszy niż jeden piksel obrazu. Przemieszczenia ułamka piksela — odpowiadające fizycznym ruchom powierzchni rzędu dziesiątek mikrometrów przy normalnych odległościach roboczych — powodują mierzalne zmiany fazy w podpasmach piramidy. To jest subpikselowa czułość, która umożliwia amplifikację drgań, które są absolutnie niewidoczne w surowym nagraniu wideo.
Krok 3 — Budowanie Widma Drgań
Po obliczeniu dekompozycji piramidy dla każdej klatki wideo algorytm dysponuje szeregiem czasowym wartości fazy w każdym miejscu przestrzennym, dla każdej skali i orientacji w piramidzie. Powierzchnia drgająca z częstotliwością 25 Hz produkuje szereg czasowy fazy oscylujący z częstotliwością 25 Hz. Amplituda tej oscylacji w dziedzinie fazy jest proporcjonalna do amplitudy fizycznego przemieszczenia powierzchni w danym punkcie.
Aby zidentyfikować, jakie częstotliwości są obecne w ruchu, algorytm stosuje Szybką Transformatę Fouriera (FFT) do każdego z tych szeregów czasowych fazy — dokładnie tę samą FFT, którą analityk drgań stosuje do sygnału czasowego z akcelerometru. Wynikiem jest widmo drgań, ale takie, które istnieje jednocześnie w każdym pikselu. To jest rozdzielczość przestrzenna, której punktowy czujnik fundamentalnie nie może zapewnić: nie jedno widmo na punkt pomiarowy, lecz ciągła przestrzenna mapa zawartości częstotliwościowej drgań w całym polu widzenia.
Krok 4 — Wybór Pasma Częstotliwości
Mając pełne widmo ruchu dostępne przestrzennie, algorytm stosuje filtr pasmowoprzepustowy czasowy do szeregów czasowych fazy w każdym miejscu. Analityk wybiera zakres częstotliwości — na przykład 10 Hz do 50 Hz dla pierwszej i drugiej harmonicznej maszyny, albo wąskie pasmo wokół znanego piku rezonansowego. Filtr tłumi zmiany fazy poza tym zakresem: wolnoczęstotliwościowy dryf strukturalny, ruch ciała sztywnego i szum wysokoczęstotliwościowy są usuwane. Pozostaje sygnał fazy odpowiadający wyłącznie ruchowi przy częstotliwościach będących przedmiotem zainteresowania.
Ten krok bezpośrednio odpowiada klasycznej analizie drganiowej. Wybór pasma częstotliwości w dziedzinie fazy jest tą samą operacją co koncentracja na określonym regionie widma akcelerometru. Różnica polega na tym, że filtr działa jednocześnie na każdy piksel pola przestrzennego, zachowując pełny strukturalny rozkład energii drganiowej przy wybranych częstotliwościach.
Krok 5 — Amplifikacja Fazy
Po wyizolowaniu przefiltrowanego sygnału fazy w każdym pikselu i podpasmie, algorytm mnoży odchylenia fazy przez współczynnik wzmocnienia — zazwyczaj między 10 a 100, w zależności od wielkości ruchu i jakości nagrania wideo. Ponieważ przesunięcie fazy jest proporcjonalne do przemieszczenia przestrzennego, pomnożenie fazy przez współczynnik 50 daje film, w którym cały ruch przy wybranych częstotliwościach wydaje się 50 razy większy niż w rzeczywistości.
Tu właśnie kluczowa staje się przewaga nad metodami szumowymi podejścia opartego na fazie. W surowym nagraniu wideo szum objawia się jako losowe fluktuacje jasności. W dziedzinie fazy szum ten jest niespójny: nie ma preferowanego kierunku ani systematycznej struktury czasowej. Fizyczne drgania natomiast produkują spójne zmiany fazy, które powtarzają się z częstotliwością drgań. Gdy stosuje się współczynnik wzmocnienia, spójny sygnał drganiowy rośnie proporcjonalnie, podczas gdy niespójny szum nie kumuluje się w ten sam sposób. Dlatego amplifikacja oparta na fazie obsługuje współczynniki ×30 do ×100 bez poważnej degradacji szumowej, która zniszczyłaby każdą metodę opartą na bezpośrednim wzmacnianiu różnic jasności.
Krok 6 — Rekonstrukcja
Po zmodyfikowaniu fazy algorytm stosuje odwrotną complex steerable pyramid: składa wszystkie podpasma — z wzmocnioną fazą przy wybranych częstotliwościach i niezmodyfikowaną amplitudą i fazą wszędzie indziej — z powrotem w kompletną klatkę wideo. Odbywa się to niezależnie dla każdej klatki. Wynikiem jest film, który w dużej mierze wygląda jak oryginalna scena, z tym że ruchy przy wybranym pasmie częstotliwości są przestrzennie wzmocnione i wyraźnie widoczne. Kolory, tekstury i statyczna struktura są zachowane.
Jednym z udoskonaleń w implementacji VibraVizja® jest ważone amplitudą przestrzenne wygładzenie sygnału fazy przed krokiem amplifikacji. W obszarach obrazu, gdzie amplituda podpasma piramidy jest niska — na przykład równomiernie oświetlona gładka powierzchnia bez przestrzennej tekstury — oszacowanie fazy jest z natury zaszumione. Ważenie fazy przestrzennie przez lokalną amplitudę podpasma przed amplifikacją tłumi te zawodne oszacowania bez poświęcania rozdzielczości przestrzennej w obszarach o teksturze. Wynikiem jest czystszy wzmocniony obraz, szczególnie w obszarach sceny o niskim kontraście.
Dlaczego Ma To Znaczenie dla Diagnostyki Drganiowej
Inżynierska wartość algorytmu wynika bezpośrednio z jego właściwości. Ponieważ przemieszczenie jest zakodowane w fazie, pomiar jest wrażliwy na ruch subpikselowy: drgania strukturalne zbyt małe, aby kamera mogła je zobaczyć, mogą być wykryte i wzmocnione. Ponieważ filtr czasowy działa w tej samej dziedzinie częstotliwości co klasyczna analiza drganiowa, wynik jest natychmiast interpretowalny: wzmocniony film przy częstotliwości rezonansowej jest operacyjnym kształtem ugięcia struktury przy tej częstotliwości — bez oprzyrządowania, bez modelu elementów skończonych i bez sieci akcelerometrów, która byłaby potrzebna do odtworzenia go z pomiarów punktowych.
Ponieważ metoda jest bezkontaktowa i oparta na kamerze, rozpoznaje drgania przestrzennie w całym polu widzenia w jednym nagraniu: każda widoczna powierzchnia, każdy punkt połączenia, każdy odcinek rury lub elementu konstrukcji, jednocześnie. Przestrzenny obraz, który czujniki punktowe mogą jedynie przybliżać, jest uchwycony w całości. To jest to, co sprawia, że amplifikacja drgań jest uzupełnieniem monitorowania opartego na akcelerometrach, a nie konkurentem — akcelerometry zapewniają ciągłe, wysokoczęstotliwościowe, rozpoznawalne w czasie dane w stałych punktach; amplifikacja drgań zapewnia kontekst przestrzenny, który łączy te punkty i ujawnia, jak struktura porusza się między nimi.
Zobacz Algorytm Zastosowany do Twoich Urządzeń
Sesja pomiarowa VibraVizja® dostarcza wzmocniony film, zawartość częstotliwościową drgań w każdym punkcie przestrzennym i operacyjne kształty ugięcia przy wybranych częstotliwościach — z jednego nagrania kamerowego, bez kontaktu.
Zamów Bezpłatny Próbny Pomiar na Miejscu