Przetwarzanie SygnałówAnaliza Oparta na FazieAlgorytm 9 kwietnia 2026

Jak Działa Amplifikacja Drgań: Faza, Piramidy
i Nauka Dostrzegania Ruchu

VibraVizja® produkuje wzmocnione filmy, w których drgania powierzchni przy wybranych częstotliwościach stają się widoczne dla ludzkiego oka. Ten artykuł wyjaśnia krok po kroku, w jaki sposób algorytm to osiąga — od pierwszej transformacji matematycznej każdej klatki wideo do końcowego zrekonstruowanego obrazu. Nie jest wymagana wcześniejsza znajomość przetwarzania obrazów.

Santiago Pighin

Główny Naukowiec · VibraVizja®

Większość narzędzi do pomiaru drgań produkuje liczbę: ogólny poziom, widmo, trend w czasie. VibraVizja® produkuje coś innego — film, w którym ruch każdej widocznej powierzchni został wzmocniony do stopnia umożliwiającego jego percepcję przez ludzkie oko, przy wybranych przez użytkownika częstotliwościach. Wynik inżynierski jest znajomy: widmo częstotliwościowe, częstotliwość rezonansowa, operacyjny kształt ugięcia. Różnica polega na tym, że wszystkie te informacje są wyodrębniane z nagrania wideo, bez kontaktu, i rozpoznawane przestrzennie w całym polu widzenia.

Metoda ta nosi nazwę fazowej amplifikacji ruchu w wideo. Opiera się na fundamentalnych pracach Wadhwy, Rubinsteina, Duranda i Freemana z MIT opublikowanych w 2013 roku oraz na transformacie complex steerable pyramid Simoncellego opracowanej na początku lat 90. Kluczowa obserwacja tych badań — którą algorytm VibraVizja® stosuje do przemysłowej diagnostyki drganiowej — jest następująca: algorytm śledzi zmiany fazy lokalnych struktur obrazu. Faza okazuje się odpornym sygnałem do pomiaru przemieszczenia.

'Faza mówi, gdzie znajdują się lokalne struktury. Jeśli chcesz mierzyć ruch, faza jest właściwym sygnałem do śledzenia.'

The five-step pipeline: each frame is decomposed, phase is tracked and transformed, filtered to the frequency band of interest, amplified, then reconstructed

Krok 1 — Dekompozycja Obrazu

Każda klatka wideo jest najpierw transformowana za pomocą struktury zwanej complex steerable pyramid. Można o niej myśleć jak o banku przestrzennie dostrojonych filtrów stosowanych jednocześnie w wielu skalach i wielu orientacjach. Koncepcyjnie jest podobna do banku filtrów oktawowych w analizie akustycznej: podobnie jak bank filtrów akustycznych rozdziela dźwięk na pasma częstotliwości, steerable pyramid rozdziela obraz na pasma częstotliwości przestrzennych — ale w dwóch wymiarach, uchwycając zarówno skalę (od drobnych szczegółów do grubej struktury), jak i orientację (poziomą, ukośną, pionową).

Krok 2 — Dlaczego Faza Koduje Ruch

Związek między fazą a przemieszczeniem wynika z dobrze ugruntowanego wyniku przetwarzania sygnałów zwanego twierdzeniem Fouriera o przesunięciu. Stwierdza ono, że przesunięcie sygnału w przestrzeni jest równoważne dodaniu stałej do jego fazy w przestrzeni częstotliwości. W prostych słowach: jeśli wzorzec uchwycony przez filtr przy danej skali i orientacji przesuwa się o małą odległość, faza odpowiedniego współczynnika complex pyramid zmienia się o wartość proporcjonalną do tej odległości. Pomiar zmiany fazy jest równoważny pomiarowi przemieszczenia — bez obliczania przepływu optycznego i bez wyraźnego śledzenia żadnego punktu.

Praktyczna konsekwencja jest istotna. Współczynniki piramidy mogą wykryć ruch znacznie mniejszy niż jeden piksel obrazu. Przemieszczenia ułamka piksela — odpowiadające fizycznym ruchom powierzchni rzędu dziesiątek mikrometrów przy normalnych odległościach roboczych — powodują mierzalne zmiany fazy w podpasmach piramidy. To jest subpikselowa czułość, która umożliwia amplifikację drgań, które są absolutnie niewidoczne w surowym nagraniu wideo.

Krok 3 — Budowanie Widma Drgań

Po obliczeniu dekompozycji piramidy dla każdej klatki wideo algorytm dysponuje szeregiem czasowym wartości fazy w każdym miejscu przestrzennym, dla każdej skali i orientacji w piramidzie. Powierzchnia drgająca z częstotliwością 25 Hz produkuje szereg czasowy fazy oscylujący z częstotliwością 25 Hz. Amplituda tej oscylacji w dziedzinie fazy jest związana z amplitudą fizycznego przemieszczenia powierzchni w danym punkcie.

Aby zidentyfikować, jakie częstotliwości są obecne w ruchu, algorytm stosuje Szybką Transformatę Fouriera (FFT) do każdego z tych szeregów czasowych fazy — dokładnie tę samą FFT, którą analityk drgań stosuje do sygnału czasowego z akcelerometru. Wynikiem jest widmo drgań, ale takie, które istnieje jednocześnie w każdym pikselu. To jest rozdzielczość przestrzenna, której punktowy czujnik fundamentalnie nie może zapewnić: nie jedno widmo na punkt pomiarowy, lecz przestrzenna mapa zawartości częstotliwościowej drgań w całym polu widzenia.

Krok 4 — Wybór Pasma Częstotliwości

Mając pełne widmo ruchu dostępne, algorytm stosuje filtr pasmowoprzepustowy czasowy do szeregów czasowych fazy w każdym miejscu. Analityk wybiera zakres częstotliwości — na przykład 10 Hz do 50 Hz dla pierwszej i drugiej harmonicznej maszyny, albo wąskie pasmo wokół znanego piku rezonansowego. Filtr tłumi zmiany fazy poza tym zakresem: wolnoczęstotliwościowy dryf strukturalny, ruch ciała sztywnego i szum wysokoczęstotliwościowy są usuwane. Pozostaje sygnał fazy odpowiadający wyłącznie ruchowi przy częstotliwościach będących przedmiotem zainteresowania.

Ten krok bezpośrednio odpowiada klasycznej analizie drganiowej. Wybór pasma częstotliwości w dziedzinie fazy jest tą samą operacją co koncentracja na określonym regionie widma akcelerometru. Różnica polega na tym, że filtr działa jednocześnie na każdy piksel pola przestrzennego, zachowując pełny strukturalny rozkład energii drganiowej przy wybranych częstotliwościach.

Krok 5 — Amplifikacja Fazy

Po wyizolowaniu przefiltrowanego sygnału fazy w każdym pikselu i podpasmie, algorytm mnoży odchylenia fazy przez współczynnik wzmocnienia — zazwyczaj między 10 a 100, w zależności od wielkości ruchu i jakości nagrania wideo. Ponieważ przesunięcie fazy jest związane z przemieszczeniem przestrzennym, pomnożenie fazy przez współczynnik daje film, w którym cały ruch przy wybranych częstotliwościach jest większy niż w rzeczywistości.

Tu właśnie kluczowa staje się przewaga szumowa podejścia opartego na fazie. W surowym nagraniu wideo szum objawia się jako losowe fluktuacje jasności. W dziedzinie fazy szum ten jest niespójny: nie ma preferowanego kierunku ani systematycznej struktury czasowej. Fizyczne drgania natomiast produkują spójne zmiany fazy, które powtarzają się z częstotliwością drgań. Gdy stosowany jest filtr czasowy, niespójna składowa jest silnie tłumiona, więc współczynnik wzmocnienia wzmacnia tylko spójną składową sygnału drganiowego. Dlatego amplifikacja oparta na fazie obsługuje współczynniki ×30 do ×100 bez poważnej degradacji szumowej.

Physical vibration produces coherent phase oscillations that grow with amplification — image noise is incoherent in phase and can be attenuated. This allows amplification factors of ×50 or more without noise dominating the output.

Krok 6 — Rekonstrukcja

Po zmodyfikowaniu fazy algorytm stosuje odwrotną complex steerable pyramid: składa wszystkie podpasma — z wzmocnioną fazą przy wybranych częstotliwościach i niezmodyfikowaną amplitudą — z powrotem w kompletną klatkę wideo. Odbywa się to niezależnie dla każdej klatki. Wynikiem jest film, który w dużej mierze wygląda jak oryginalna scena, z tym że ruchy przy wybranym pasmie częstotliwości są przestrzennie wzmocnione i wyraźnie widoczne. Kolory, tekstury i statyczna struktura są zachowane.

Jednym z udoskonaleń w powyższej implementacji jest ważone amplitudą przestrzenne wygładzenie sygnału fazy przed krokiem amplifikacji. W obszarach obrazu, gdzie amplituda podpasma piramidy jest niska — na przykład równomiernie oświetlona gładka powierzchnia bez przestrzennej tekstury — oszacowanie fazy jest z natury zaszumione. Ważenie fazy przestrzennie przez lokalną amplitudę podpasma przed amplifikacją tłumi te zawodne oszacowania bez poświęcania rozdzielczości przestrzennej w obszarach o teksturze. Wynikiem jest czystszy wzmocniony obraz, szczególnie w obszarach sceny o niskim kontraście.

Dlaczego Ma To Znaczenie dla Diagnostyki Drganiowej

Inżynierska wartość algorytmu wynika bezpośrednio z jego właściwości. Ponieważ algorytm jest wrażliwy na ruch subpikselowy, drgania strukturalne zbyt małe, aby były widoczne gołym okiem, mogą być wykryte i wzmocnione. Ponieważ filtr czasowy działa w tej samej dziedzinie częstotliwości co klasyczna analiza drganiowa, wynik jest natychmiast interpretowalny: wzmocniony film przy częstotliwości rezonansowej jest operacyjnym kształtem ugięcia struktury przy tej częstotliwości — bez oprzyrządowania, bez modelu elementów skończonych i bez sieci akcelerometrów, która byłaby potrzebna do odtworzenia go z pomiarów punktowych.

Ponieważ metoda jest bezkontaktowa i oparta na kamerze, rozpoznaje drgania przestrzennie w całym polu widzenia w jednym nagraniu: każda widoczna powierzchnia, każdy punkt połączenia, każdy odcinek rury lub elementu konstrukcji, jednocześnie. Przestrzenny obraz, który czujniki punktowe mogą jedynie próbkować w dyskretnych miejscach, jest uchwycony całkowicie. To jest to, co sprawia, że amplifikacja drgań jest uzupełnieniem monitorowania opartego na akcelerometrach, a nie konkurentem — akcelerometry zapewniają wysokoczęstotliwościowe, rozpoznawalne w czasie dane w stałych punktach; amplifikacja drgań zapewnia kontekst przestrzenny, który łączy te punkty i ujawnia, jak struktura porusza się między nimi.

Zobacz Algorytm Zastosowany do Twoich Urządzeń

Sesja pomiarowa VibraVizja® dostarcza wzmocniony film, zawartość częstotliwościową drgań w każdym punkcie przestrzennym i operacyjne kształty ugięcia przy wybranych częstotliwościach — z jednego nagrania kamerowego, bez kontaktu.

Zamów Bezpłatny Próbny Pomiar na Miejscu

Jak Działa Amplifikacja Drgań: Faza, Piramidyi Nauka Dostrzegania Ruchu