Prawo wielkich liczb i centralne twierdzenie graniczne
11 min czytania
Dlaczego twoja przewaga ujawnia się tylko po wielu transakcjach i co to mówi o twoim horyzoncie czasowym.
11 min czytania
Dlaczego twoja przewaga ujawnia się tylko po wielu transakcjach i co to mówi o twoim horyzoncie czasowym.
10 transakcji nie powie ci, czy masz edge, czy powoli wykrwawiasz konto. Większość detalistów rezygnuje, modyfikuje system albo zwiększa pozycję na długo przed tym, zanim zbierze dane potrzebne do oceny. Ta lekcja pokazuje, kiedy realnie można zaufać własnym liczbom.
Prawo wielkich liczb (Law of Large Numbers, LLN) to statystyczna zasada mówiąca, że wraz ze wzrostem liczby niezależnych prób średnia z próby zbiega do prawdziwej wartości oczekiwanej (EV). W tradingu oznacza to, że twój prawdziwy edge ujawnia się dopiero po setkach transakcji — nie po dziesięciu.
Wielu traderów wpada w tę pułapkę:
"Mam 3 wygrane z rzędu — mój system działa!" "Zaliczyłem 6 stratnych transakcji z rzędu — system jest zepsuty!"
Tyle że te reakcje ignorują coś kluczowego — i są tak powszechne, że Kahneman i Tversky nazwali to zjawisko "wiarą w prawo małych liczb" (Psychological Bulletin, 1971):
Wyniki strategii stają się znaczące dopiero po osiągnięciu wystarczająco dużej próby.
To właśnie prawo wielkich liczb — i wyjaśnia ono:
W rachunku prawdopodobieństwa:
Wraz ze wzrostem liczby prób średni wynik zbliża się do prawdziwej wartości oczekiwanej.
W tradingu:
Do tego momentu — widzisz głównie losowość.
Konkretnie: 60-procentowy edge zmierzony na 10 transakcjach ma 95-procentowy przedział ufności (CI) wynoszący mniej więcej [26%, 88%]. Te same dane są spójne zarówno z systemem na poziomie rzutu monetą, jak i z systemem klasy światowej. 10 transakcji naprawdę niczego nie dowodzi.
Uwaga na pułapkę: LLN mówi, że długoterminowe średnie zbiegają do prawdziwej wartości oczekiwanej. Nie mówi, że krótkoterminowe serie się "korygują". Wiara w to, że po 6 stratach z rzędu wygrana jest "należna", to paradoks hazardzisty (gambler's fallacy) — przeciwieństwo LLN. Każda transakcja jest niezależna; przeszłość niczego ci nie jest winna.
| Pojęcie | Co naprawdę mówi | Czego NIE mówi |
|---|---|---|
| Prawo wielkich liczb (LLN) | Długoterminowa średnia → prawdziwa wartość oczekiwana | Serie się same korygują |
| Centralne twierdzenie graniczne (CLT) | Rozkład średniej z próby staje się normalny przy dużym n | Pojedyncze wyniki są normalne |
| Paradoks hazardzisty | (Fałszywe przekonanie) przeszłe serie wymuszają odwrócenie w przyszłości | To NIE jest realna zasada |
| Wielkość próby | Co ci mówi |
|---|---|
| 10–20 | Szum. Statystycznie bez znaczenia |
| 50 | Wczesny sygnał kierunkowy |
| 100 | Minimum dla pewności co do win rate/EV |
| 200–300 | Rozsądne potwierdzenie odporności |
| 500+ | Mocny dowód długoterminowej spójności |
Wielkość próby potrzebna, by z 95% pewnością stwierdzić, że win rate > 50%:
| Zaobserwowany win rate | Potrzebne transakcje |
|---|---|
| 52% | ~2 700 |
| 55% | ~270 |
| 60% | ~60 |
| 65% | ~25 |
52-procentowy edge wygląda na papierze niewinnie, a jego potwierdzenie zajmuje lata transakcji.
Im większa wariancja i skośność w twoim systemie → tym większa wymagana próba.
Intuicja wokół wariancji: przy n transakcjach błąd standardowy zmierzonego win rate wynosi √(p(1−p)/n). Dla n=10 i prawdziwego p=0,5 to ok. 0,16 — co oznacza, że "prawdziwy 50-procentowy system" rutynowo pokaże 30%–70% na 10 transakcjach. Wariancja maleje powoli: dopiero 100 transakcji sprowadza błąd standardowy do ok. 0,05.
Wyobraź sobie taką strategię:
Ale logujesz tylko 10 transakcji:
Możesz zrezygnować przy transakcji #6 — nigdy nie docierając do edge'u, który ujawniłby się dopiero przy transakcji #100.
Przedział ufności pokazuje prawdopodobny zakres, w którym leży twoja prawdziwa skuteczność, na podstawie próby.
Przykład:
To znaczy:
Masz 95% pewności, że twój prawdziwy win rate mieści się gdzieś między 35% a 55%.
Im więcej transakcji zalogujesz, tym węższy staje się ten zakres — i tym bardziej stabilne stają się twoje metryki.
Szerokość CI maleje jak 1/√n. Podwojenie próby zawęża przedział tylko o ok. 1,41×. By zmniejszyć CI o połowę, potrzeba 4× więcej transakcji. Przejście ze 100 na 400 transakcji daje więc 2× ostrzejsze oszacowanie, a nie 4×.
Aby obliczyć 95-procentowy przedział ufności dla twojego win rate:
CI = p ± z · √[ p(1 − p) / n ] (Wald — szybki, ale niedoszacowuje przy małym n lub p blisko 0/1)
Gdzie:
p = zaobserwowany win rate (jako liczba dziesiętna)z = z-score dla poziomu ufności (dla 95%, z ≈ 1,96)n = liczba transakcjiWzoru Walda używaj tylko, gdy n · p · (1 − p) ≥ 5. Poniżej tego progu (małe próby lub skrajne win rate) wybieraj przedział Wilsona (Wilson score interval), który zachowuje dobrą kalibrację nawet przy n=20. Wald jest wygodny; Wilson jest poprawny.
Wykonałeś 100 transakcji, z czego 45 było zyskownych.
p = 0,45n = 100z = 1,96Podstaw do wzoru:
CI = 0.45 ± 1.96 × √[ (0.45 × 0.55) / 100 ]
CI = 0.45 ± 1.96 × √(0.2475 / 100)
CI = 0.45 ± 1.96 × 0.0497
CI = 0.45 ± 0.0974
Przedział ufności = [0,3526, 0,5474] lub [35,3%, 54,7%]
To oznacza:
Masz 95% pewności, że twój prawdziwy win rate mieści się między 35,3% a 54,7%.
Im więcej transakcji dodasz (większe n), tym węższy staje się twój przedział ufności — i tym bardziej precyzyjny staje się pomiar twojego systemu.
Przedziały ufności możesz też stosować do innych metryk, takich jak:
Tylko konsekwentne, pełne logowanie pozwala:
Zamiast oceniać transakcja po transakcji, patrz na:
Strategia, która daje +0,4R w 100 transakcjach, jest prawdopodobnie lepsza niż ta, która daje +3R w 10.
Wielu traderów:
…po zaledwie 5–20 transakcjach.
Optymalizujesz pod szum — nie pod prawdę.
Co gorsza: każda znacząca modyfikacja resetuje n do zera. Trader, który "dostosowuje" system co 20 transakcji, w każdym cyklu prowadzi inną strategię i nigdy nie zbierze próby na tyle dużej, by LLN miało dla którejkolwiek z nich znaczenie.
Poczekaj na sensowną próbę. Następnie oceń ją z pomocą:
Prawo wielkich liczb (LLN) mówi, że wraz ze wzrostem liczby niezależnych prób średnia z próby zbiega do prawdziwej wartości oczekiwanej. W tradingu twój prawdziwy edge — prawdziwy win rate, średnie R lub EV — staje się widoczny dopiero po setkach transakcji, nie po dziesięciu.
Zależy od wielkości twojego edge. By z 95% pewnością stwierdzić, że win rate jest powyżej 50%, potrzebujesz ok. 270 transakcji dla systemu 55-procentowego, ale ok. 2 700 dla systemu 52-procentowego. Poniżej n=100 CI jest zbyt szeroki, by odróżnić edge od szumu.
Nie — to przeciwieństwa. LLN mówi o tym, że długoterminowe średnie zbiegają do prawdziwej wartości oczekiwanej. Paradoks hazardzisty to fałszywe przekonanie, że krótkoterminowe serie muszą "skorygować się" przy następnej transakcji. Każda transakcja jest niezależna; przeszłość niczego ci nie jest winna.
Błąd standardowy proporcji skaluje się jak √(p(1−p)/n), więc przedział ufności zawęża się jak 1/√n. Podwojenie próby zawęża go tylko o ok. 1,41×. By zmniejszyć niepewność o połowę, potrzebujesz 4× więcej danych.
Przy n=10 95-procentowy przedział ufności wokół zaobserwowanego 60-procentowego win rate to mniej więcej [26%, 88%]. Ten zakres jest spójny zarówno z systemem na poziomie rzutu monetą, jak i z systemem klasy światowej. Przy tak dużej wariancji 10 transakcji nie pozwala odróżnić prawdziwego edge od szczęścia.
Wyniki tradingu są zwodnicze — chyba że dasz matematyce wystarczająco dużo czasu, by przemówiła.
Prawo wielkich liczb przypomina ci:
Dobrzy traderzy myślą w kategoriach serii. Handlują przez szum, prowadzą dziennik konsekwentnie i podejmują decyzje dopiero wtedy, gdy matematyka jest wystarczająco głośna, by ją usłyszeć.