Outliers and Their Impact on Metrics
12 min czytania
Understand how one big trade can mislead your statistics and learn proper techniques for handling outliers in your performance data.
12 min czytania
Understand how one big trade can mislead your statistics and learn proper techniques for handling outliers in your performance data.
Outlier to transakcja na tyle odległa od centrum Twojego rozkładu, że dominuje nad nieodpornymi statystykami: średnią, wariancją i wskaźnikiem Sharpe'a. Jedna szczęśliwa wygrana — albo jedna ogromna strata — może odwrócić znak edge'u na małej próbie. Ta lekcja pokazuje, jak zdefiniować, wykrywać i traktować outliery, nie usuwając przy tym tych transakcji, które dla niektórych systemów stanowią całą zyskowność.
Wymagania wstępne: Wariancja i odchylenie standardowe, Skośność i kurtoza. Kurtoza mówi Ci, czy Twój rozkład zwrotów ma takie grube ogony, w których outliery są normą — przeczytaj tę lekcję najpierw, jeśli pojęcie "grubego ogona" nie jest jeszcze intuicyjne.
Twój dziennik mówi:
Wygląda świetnie. Ale chwila…
Jedna transakcja to wygrana +15R typu black swan. Wszystko inne oscyluje średnio wokół +1,2R.
Teraz Twoje liczby Cię okłamują. Nie dlatego, że zrobiłeś coś źle — ale dlatego, że pozwalasz outlierowi definiować Twój system.
Ten artykuł pokazuje, jak identyfikować, izolować i odpowiedzialnie uwzględniać ekstremalne transakcje, które zniekształcają Twoje statystyki.
Outlier to transakcja na tyle odległa od centrum, że nieproporcjonalnie przesuwa nieodporne metryki (średnia, wariancja, Sharpe).
W tradingu:
| Metoda | Reguła | Zakłada normalność? | Odporna? |
|---|---|---|---|
| Z-score | |z| > 3 | Tak | Nie |
| MAD | |x − mediana| > 3·1,4826·MAD | Nie | Tak |
| Płoty Tukeya | poza [Q1 − 1,5·IQR, Q3 + 1,5·IQR] | Nie | Tak |
Wybierz jedną i stosuj konsekwentnie. Odporne metryki (mediana, MAD, średnia ucinana) absorbują outliery; nieodporne dają się ciągnąć. Reguła oparta na MAD (Huber, 1981; Leys i in., 2013) to akademicki standard; płoty Tukeya (Tukey, 1977) łatwiej policzyć ręcznie.
| Metryka | Co się dzieje |
|---|---|
| EV (wartość oczekiwana) | Zostaje zawyżona przez ogromną wygraną |
| Profit Factor | Przechyla się w stronę zyskowności |
| Stosunek R:R | Wygląda wyżej niż jest powtarzalny |
| Sharpe/Sortino | Zawyżony przez ten sam outlier, który zawyża EV — w liczniku mają tę samą nieodporną średnią |
| Krzywa kapitału | Dostaje nagły skok — maskując niespójność |
Kluczowe rozróżnienie, którego tabela nie pokazuje: każda powyższa metryka jest nieodporna. Wszystkie zbudowane są na średniej (lub na wariancji, która jest średnią z kwadratów odchyleń). Istnieją odporne odpowiedniki:
| Statystyka | Odporna na outliery? | Co Ci mówi | Najlepsza dla |
|---|---|---|---|
| Średnia | Nie | Średni wynik | Rozkłady symetryczne |
| Mediana | Tak | Typowy wynik | Skośne serie zwrotów |
| Średnia ucinana 10% | Tak | Średnia ignorująca skrajności | Stabilne EV na małych próbach |
| Średnia winsoryzowana | Tak | Średnia z przyciętymi ogonami | Wskaźniki typu Sharpe, w których ogony zawyżają też mianownik |
Jeden outlier może ukryć 20 złych transakcji — zwłaszcza przy małych próbach.
Ten sam system, ten sam edge (lub jego brak) — jedna transakcja zmieniła znak. Dlatego EV na małej próbie jest bezwartościowe bez towarzyszącej liczby z usuniętym outlierem.
Raportuj EV na oba sposoby — z outlierem i bez — ale rozumiej, która wartość kłamie. Dla systemu mean-reverting +18R to zwykle los na loterii i ucięte EV (−0,083R) jest bliższe prawdy. Dla strategii trend-following lub wypukłej +18R jest dokładnie tym, za co płacisz wszystkimi małymi stratami; ucinanie raportuje system, który nie istnieje. Najpierw sklasyfikuj swoją strategię, potem zdecyduj, któremu obrazowi zaufać.
Zatrzymaj się, zanim go usuniesz. Slippage −4R na newsach może być incydentem albo pierwszą próbką z grubego ogona rozkładu strat, którego Twój backtest nie uwzględnił. Usunięcie tej transakcji sprawia, że drawdown wygląda mniejszy, a Sharpe większy — to dokładnie kłamstwo, którego chcesz uniknąć. Zbadaj przyczynę przed uznaniem tego za szum: jeśli to powtarzalne ryzyko strukturalne (stała ekspozycja na newsy, zawsze cienka liquidity na zamknięciu), należy do raportowanych liczb.
Zanim zaczniesz je wykrywać, zdecyduj, co znaczą dla Twojego systemu:
Ta decyzja przesądza, czy sygnał degradacji edge'u odczytujesz z metryki surowej, czy uciętej.
Procedura od początku do końca:
Rozstęp międzykwartylowy (IQR) to metoda statystyczna do identyfikacji outlierów w danych — mierzy "środkowe 50%" Twoich wyników.
IQR = Q3 – Q1
Posortowane wyniki transakcji (w R):
[–2R, –1,5R, –1R, 0,5R, 1R, 1,2R, 1,4R, 1,8R, 4,5R]
Oblicz granice:
A zatem:
Możesz teraz tagować te transakcje w swoim dzienniku lub tworzyć przefiltrowane raporty, by mierzyć swój system z outlierami i bez nich.
Jeśli Twoja mediana wygranej wynosi 1,2R, wszystko powyżej 3,6R jest kandydatem do oznaczenia. Procedura: otaguj transakcję w dzienniku jako outlier-candidate, przelicz EV / PF / Sharpe z nią i bez, potem zdecyduj na podstawie klasy strategii (trend-follower: zostaw, mean-reverter: zbadaj przyczynę). Krok wykrywania histogramem ma znacznie więcej sensu, gdy masz już zinternalizowane skośność i kurtozę — kurtoza to formalna miara tego, jak często powinny pojawiać się ekstremalne transakcje.
Dwie odporne techniki, które warto nazwać:
| Technika | Mechanizm | Rozmiar próby zachowany? | Wpływ na średnią | Wpływ na wariancję |
|---|---|---|---|---|
| Trimming (usuń górne/dolne k%) | Usunięcie | Nie | Ciągnięta w stronę mediany | Zmniejszona |
| Winsoryzacja (cap na k-tym percentylu) | Zastąpienie | Tak | Ciągnięta w stronę mediany | Zmniejszona (mniej niż przy trim) |
To daje Ci:
"To był setup na +12R — ale zdarza się tylko 1 na 100 transakcji." → Nie oczekuj tego ani nie modeluj na podstawie takiej wygranej. Śledź to osobno. Spadek częstotliwości takich rzadkich wygranych w czasie to jeden z objawów opisanych w lekcji o degradacji edge'u.
W swoim dzienniku:
Utwórz przefiltrowany widok:
Transakcji zgodnych z zasadami strategii
Bez nadmiernego ryzyka
Bez outlierów
Mierz:
EV
Drawdown
Sharpe/Sortino
Win rate
To są Twoje statystyki podłogi — jak wygląda system pozbawiony szczęścia i katastrofy. Czy podłoga, czy surowa liczba jest prawdziwszym opisem, zależy od klasy strategii. Dla trend-followera surowa liczba jest realna; dla mean-revertera prawdziwa jest podłoga.
Outlier to transakcja na tyle odległa od centrum Twojego rozkładu zwrotów, że nieproporcjonalnie przesuwa nieodporne metryki, takie jak średnia, wariancja czy wskaźnik Sharpe'a. Uzasadnione progi: |z| > 3, |x − mediana| > 3·1,4826·MAD, lub poza płotami Tukeya [Q1 − 1,5·IQR, Q3 + 1,5·IQR].
Posortuj zwroty transakcji, znajdź Q1 (25. percentyl) i Q3 (75. percentyl), oblicz IQR = Q3 − Q1 i oznacz każdą transakcję poniżej Q1 − 1,5·IQR lub powyżej Q3 + 1,5·IQR. Płoty Tukeya 1,5·IQR to standardowa reguła z eksploracyjnej analizy danych (Tukey, 1977).
To zależy od klasy strategii. Dla systemów mean-reverting i scalpingu outliery to zwykle szum (slippage, newsy) i ucięta metryka jest uczciwsza. Dla strategii trend-following, breakout i wypukłych outliery z prawego ogona SĄ edge'em — usunięcie ich opisuje system, którego sam byś nie tradował. Zawsze raportuj metryki na oba sposoby i oznacz, która z nich jest kłamstwem dla Twojej strategii.
Trimming usuwa w całości górne i dolne k% obserwacji, redukując rozmiar próby. Winsoryzacja zastępuje te skrajne wartości wartością k-tego percentyla, zachowując rozmiar próby i całkowitą wagę. Winsoryzuj, gdy chcesz przytłumić wpływ ogonów na wskaźniki typu Sharpe; ucinaj (trim), gdy chcesz mieć czysty punkt odniesienia do porównania z surową liczbą.
Jedna świetna transakcja nie tworzy systemu. Jedna katastrofalna transakcja nie psuje systemu — chyba że jej na to pozwolisz.
Outliery to nie błędy w danych. To albo edge, za który dostajesz zapłatę, albo ryzyko, o którym zapomniałeś, że je bierzesz. Zadanie nie polega na ich usuwaniu — polega na tym, by wiedzieć, czym jest każdy z nich, i raportować metryki na oba sposoby, żeby nigdy przypadkiem nie okłamać samego siebie.
Dlaczego to ważne dla następnej lekcji: wskaźniki Sharpe'a i Sortino są oba zbudowane na nieodpornej średniej w liczniku. Jeden outlier rusza je tak samo mocno jak rusza EV — a większość nagłówkowych liczb Sharpe'a, którymi rzucają traderzy, jest po cichu zawyżona dokładnie przez te transakcje, które ta lekcja każe Ci oznaczać.