Co zrobić z klasterami obserwacji?

Od pewnego czasu Bespoke jest dla mnie jednym ze źródeł pomysłów na analizy inwestycyjne.

Na przykład, w poniedziałek na blogu Bespoke opublikowano zestawienie sesji, w których główny indeks hiszpańskiej giełdy (IBEX 35) obsunął się przynajmniej o 5% od dziennych maksimów. Taka sytuacja (event) zdarzyła się na IBEX 35 w poniedziałek – po otwarciu 6% powyżej piątkowego zamknięcia (bailout hiszpańskich banków!) indeks obsunął się i zakończył dzień ‘na minusie’ (bailout niewiele zmienia). Takie zachowanie rynku intuicyjnie wygląda na oznakę jego słabości, prawda?

Sprawdziłem jak zachowywał się hiszpański rynek 15 sesji po wystąpieniu takiej sytuacji. Wybrałem dwa warianty:

  • indeks spada o co najmniej 5% od dziennych szczytów
  • indeks spada o co najmniej 5% od dziennych szczytów, które były przynajmniej 2% powyżej wcześniejszego zamknięcia

Badanie objęło okres od 2000 do 2012 roku. Zwracam uwagę na niewielką liczbę obserwacji (17 dla I wariantu i 5 dla II wariantu). ART to any random time.

Badanie to opisuję by zwrócić uwagę interesujący szczegół. Jeśli spojrzycie na zestawienie Bespoke do dostrzeżecie, że poszczególne eventy tworzą skupiska (klastery). Trzy miały miejsce pomiędzy 4 a 10 sierpnia 2011 roku, kolejne 3 pomiędzy 4 a 14 maja 2010 roku, kolejne 3 pomiędzy 8 a 22 października 2008 roku (w tym 8 i 9 października).

Jeśli przeprowadzający badanie zainteresowany byłby zachowaniem rynku jedynie na następnej sesji po evencie to ich skupiska nie stanowiłyby problemu. Jeśli jednak badanie obejmuje dłuższy okres (15 czy 60 sesji po evencie) to badane okresy będą się pokrywać. Tym samym jedno skupisko eventów, obejmujące de facto jedną sytuację na rynku, może wpłynąć na wynik badania.

W trzecim wariancie wyeliminowałem więc eventy, które nastąpiły w okresie 5 sesji (tygodnia) od poprzedniego. Kluczowe pytanie brzmi: czy takie działanie ma sens?

W przypadku niektórych analiz, możemy w naturalny sposób ‘pozbyć’ się skupisk eventów. Na przykład, badając zachowanie kursu po spadku ceny poniżej ważnej średniej kroczącej możemy zapisać warunek, że interesują nas te sytuacje, w których przecięcie średniej nastąpiło po dłuższym przebywaniu ceny powyżej średniej. W ten sposób wyeliminujemy sytuacje, w których rynek ‘walczy’ ze średnią (jednego dnia zamyka się poniżej, by w kolejnym zamknąć się wyżej, by za kilka dni znów spaść poniżej średniej).

Na przykład, wykres S&P 500 spadał poniżej 200 sesyjnej średniej kroczącej (wielu analityków przywiązuje dużą wagę do tego wydarzenia) 28 i 30 grudnia 2011, 7 i 10 lipca 2009, 11 i 14 (oraz 27) grudnia 2007 roku. Moim zdaniem traktowanie każdego z tych zdarzeń jako osobnej obserwacji byłoby błędem. Chętnie jednak poznam odmienne opinie w tej sprawie.

Stworzyłem regułę, że eventy w moich badaniach muszą być o siebie o tyle oddalone ile czasu po evencie obejmuje badanie. Jeśli badam zachowanie rynku 20 sesji (miesiąc) po evencie to eventy muszą być rozdzielone co najmniej 20 sesjami. Jaka jest Wasza opinia w tej technicznej kwestii?

[Głosów:0    Średnia:0/5]

26 Komentarzy

  1. Darkh

    Poniewaz niedawno kodowalem podobne zdarzenia na SP (-10% od szczytu w ciagu dwoch miesiecy), kilka slow..

    Zdefiniowanie eventu tak jak na bespoke (wnosze po datach) nie ma oczywiscie sensu.. nie pierwszy raz zreszta poszli na latwizne. Poza wymienionymi przez T. sposobami mozna jeszcze zablokowac sygnal zdarzenia na czas trwania badania (ale spowoduje to zmienna ilosc obserwacji dla kolejnych dni i bardziej przypomina system a nie badanie zachowania rynku).. moim zdaniem najlepsze jest “naturalne eliminowanie klastrow” a jak w tym wypadku by to wygladalo ?

    W momencie zdarzenia najlepiej byloby zablokowac wszystkie sygnaly do momentu wyjsca ceny na nowe szczyty (nowe szczyty wogole albo np 52 week high)

    ot pare zdan dla dobra dyskusji 😉

    1. trystero (Post autora)

      @ Darkh

      Definicja eventu Bespoke jest o tyle chybiona, że wrzuca do jednego worka typowe spadkowe sesje paniki i dosyć specyficzne, emocjonalne sesje gdzie początkowa euforia zamienia się w znużenie a potem panikę. Dlatego zrobiłem wersję z maksimum na 2% powyżej poprzedniego zamknięcia.

      Stąd już zresztą blisko do zakodowania spadającej gwiazdy…

      W przypadku takich obsunięć intraday nie mam jednak pomysłu na naturalne eliminowanie skupisk i w grę wchodzi reguła z okresem badania. W przypadku 10% od szczytu podany pomysł blokowania wydaje się naturalny. Z eventem Bespoke pomysłów nie mam.

  2. Darkh

    ups nie doczytalem (jak to w ciagu dnia czesto bywa :D)

  3. Wasilewski

    Wydaje się że eliminowanie klasterów jest jak najbardziej sensowne, więcej, nie czynienie tego byłoby błędem. Zastanawiam się jednak, czy i jakie znaczenie ma decyzja, które eventy eliminować. Czyli jeśli mamy event 7 i 10 lipca, to powinniśmy badać zachowanie kursu 15 dni po 7 czy 15 dni po 10 lipca?

    O ile dobrze zrozumiałem, Ty wybierasz 7 lipca i stoi za tym sporo argumentów, chyba więcej niż za wybraniem 10… jednak myślę że warto zastanowić się chwilę nad tą kwestią.

    1. trystero (Post autora)

      @ Wasilewski

      O ile dobrze zrozumiałem, Ty wybierasz 7 lipca i stoi za tym sporo argumentów, chyba więcej niż za wybraniem 10… jednak myślę że warto zastanowić się chwilę nad tą kwestią.

      W sumie jest tylko jeden argument by badać pierwszy event w klasterze. Jeśli badanie okaże się sensowne i będziesz chciał otwierać pozycję na evencie w przyszłości to siłą rzeczy będziesz otwierał na pierwszym evencie w potencjalnym skupisku, bo przecież nie będziesz wiedział, czy to pojedynczy event czy zaraz będą następne. Dlatego jak robię badanie pod strategie to zostawiam pierwsze eventy.

  4. Darkh

    ok ok to moze intra-spadek po raz pierwszy od x dni, albo y razy w ciagu x dni, albo y razy po sobie.. albo, albo, albo 😀

  5. kkk

    klastry,a nie klastery

    1. trystero (Post autora)
  6. kkk

    @Trystero:
    a po ile w aptece sa plastery ?
    🙂

    1. trystero (Post autora)

      @ kkk

      Zechciałeś zapoznać się z treścią odnośnika, który podałem?

  7. kkk

    Trystero, ja nie bede czekal az ludzie zajmujacy sie jezykiem zaakceptuja ze ludzie uzywaja slowa plastry a nie plastery

    jezeli chcesz czekac to twoja sprawa

    1. trystero (Post autora)

      @ kkk

      Poczekaj, bo chcę to dobrze zrozumieć. Wyśmiewasz się ze mnie ponieważ stosuję pisownię zalecaną przez słownik ortograficzny. Wytknąłeś mi błąd. Pokazałem Ci, że użyta przeze mnie forma jest prawidłowa. Podałem nawet odnośnik do poradni językowej. Ty się ze mnie wyśmiewasz.

      Rozumiem, że nie zamierzasz także czekać aż ludzie zajmujący się językiem zaakceptują rozpoczynanie zdań z małej litery i brak kropek na ich końcu.

      Mimo to, uznałeś za stosowne wytknąć mi błąd językowy. Uważasz, że Ty masz rację a ja przywiązuje zbyt dużą wagę do zdania autorytetów.

      To jest właśnie Internet 🙂

  8. blackswan

    nie znam się na języku polskim…
    Powiedziawszy to, nie spotkałem w całym swoim życiu nikogo, kto odmieniałby “klastery”. W branży w której siedzę i w której jednym z najważniejszych zagadnień jest “volatility clustering” wszyscy mówią “klastry”, “klastrowanie” itd.

    W matematyce używa się słowa “klastry” a nie “klastery”.
    W statystyce używa się słowa “klastry”, a nie “klastery”
    W chemii, z tego co mi wiadomo, jest inaczej.

    Ps. co do treści całego tekstu, to weź sobie trystero poczytaj publikację Mandelbrota z 1963.

    Filtrowanie klastrów to jakiś nonsens. To jest tak jak wchodzenie do pokoju w którym jest różowy słoń na sterydach i udawanie, że go nie ma. Da się, to pewne, tylko że czemu ma to służyć?

    słowa klucze do wyszukiwarki google

    scale invariance
    volatility clustering
    Pareto stable distribution
    infinite second moment
    complex networks clustering

    no i w ogólę:

    network theory, complex systems theory itd

    autorzy: Barabasi, Sornette, Mandelbrot

    jak się pisze o statystyce, to wypadałoby ją zrozumieć.
    w przeciwnym wypadku chłopaki, odradzam trejding w oparciu o te metody.

    make love, not war

    całusy dla wszystkich!

  9. kkk

    @blackswan ++
    jakbym spotkal kogos kto by powiedzial “klastery” to bym na niego spojrzal jak na jakiegos odmienca

    kilka lat temu pisalem prace mgr o klasteryzacji i skoro lingwisci przez tyle czasu nie posuneli sie do przodu w tej kwestii to nie rokuje to najlepiej 🙂

  10. blackswan

    @kkk

    z czego pisałeś magisterkę? teoria sieci czy coś w ten deseń?

  11. kkk

    jak widzisz zaczynam zdania z malej litery i nie koncze ich kropka

    niech to bedzie odpowiedzia na Twoje pytanie 🙂

    jak by w encyklopedii napisali zebys skoczyl z wiezowca to tez bys to zrobil ?

    1. trystero (Post autora)

      @ kkk

      Najpiękniejsze w tej historii jest to, że Ty naprawdę jesteś przekonany, że ja robię z siebie głupka tylko dlatego, że napisałem coś zgodnie z obowiązującymi zasadami pisowni.

      To nie jest tak, że ja Ci zwróciłem uwagę, że napisałeś coś niezgodnie z zasadami a Ty odpowiedziałeś, że taki jest zwyczaj językowy i czujesz się komfortowo z tą, słownikowo niepoprawną, pisownią. To nie jest tak, że ja Cię atakuję i zmuszam do pisania zgodnie z zasadami pisowni.

      Ty mnie atakujesz, próbujesz ośmieszać bo nie chcę łamać zasad poprawnej pisowni.

      W tej sytuacji pozwolę sobie zakończyć dyskusję 🙂

  12. Bogdan

    Moim zdaniem nie należy eliminować clusterów. Rozumiem rozróżnienie między badaniem zachowania rynku a systemem transakcyjnym, ale w obu przypadkach eliminowanie clusters byłoby tożsame z upiększaniem rzeczywistości.
    Np. mamy taki klaster : w ciągu miesiąca kurs 10 razy przebija średnią ruchomą. System oparty na przebiciu średniej dałby fatalne wyniki. Gdybyśmy wzięli tylko jeden cluster (pierwszy, drugi, środkowy, ostatni) a reszty nie bralibyśmy pod uwagę, wyniki systemu byłyby o niebo lepsze.

    1. trystero (Post autora)

      @ Bogdan, Darkh

      Użyłem słowa klaster w znaczeniu skupisko, nagromadzenie.

      @ Bogdan

      Np. mamy taki klaster : w ciągu miesiąca kurs 10 razy przebija średnią ruchomą

      No i jeśli badasz zachowanie rynku po przebiciu MA to nie eliminuj. Ale równie dobrze możesz wprowadzić filtr i badać co się dzieje gdy kurs przebija MA po dłuższym przebywaniu nad tą średnią. Wtedy potraktujesz ten event jako potwierdzenie trendu spadkowego i sygnał do zajęcia pozycji.

      Dlatego ja i Darkh chcemy eliminować klastery w ten sposób by eksploracja w ogóle nam ich nie wyrzucała 🙂

  13. lesserwisser

    @ Trystero

    “Ty naprawdę jesteś przekonany, że ja robię z siebie głupka tylko dlatego, że napisałem coś zgodnie z obowiązującymi zasadami pisowni.”

    Trystero, nie tyle ty ile może ten językowy poradnikowiec (nota bene u mnie link nie działa). Tak więc niestety bardziej jesteś w błędzie niz masz rację.

    Otóż w muzyce, informatyce, statystyce, fizyce – termin klaster odmieniany jest zgodnie jako klastrowy, od wielu wielu lat.

    Podobnie jak odmienia się słowa plaster, pilaster, kataster, raster, nie ma więc powodu aby odmieniać słowo klaster inaczej – odmiennie.

    Natomiast wariant odmiany “klasterowy”, występuje jedynie w medycynie na oznaczenie napadowego bólu głowy, zwanego m.in. inaczej erytroprozopalgią.

    Ktoś kiedyś błędnie to odmienił, wprowadzając tłumaczenie tego angielskiego terminu, i tak się jakoś błędnie przyjęło w medycznym światku, i już zostało.

    PS

    Natomiast jak czytam niektóre napadowe komentarze, to dostaję
    klasterowej migreny Siwaka, czyli mnie po prostu łeb nap…….

    Bo, klasterowy ból głowy należy do grupy idiopatycznych bólów. 🙂

  14. lesserwisser

    Sorrki, własnie mnie córka skorygowała, że w muzyce przyjęło się mówić raczej klasterowy (???)?, zaś żona mówi, że w chemii na zgrupowania cząstek mówi się klastery a nie klastry – stąd odmiana oczywiście klasterowy.

  15. lesserwisser

    Kla(j)st(e)r -owania cd.

    Zerkłem do nieocenionej Poradnika językowej PWN, no i okazuje się, że słowo klaster – wystepuję też u nas jako rodzaj żeński – klastera (stąd i klasterowy).

    http://poradnia.pwn.pl/lista.php?id=873

    Zacytuję mądrę podsumowanie, profesora Mirosława Bańko (językoznawca i leksykograf):

    “Nie sprawdzaliśmy, czy informatycy i użytkownicy komputerów częściej piszą o klastrach niż o klasterach. Jeśli zwyczaj językowy jest zróżnicowany, należałoby uszanować oba sposoby odmiany i oba podawać w słownikach.”

    PS

    W statystyce – musi klastrowy od klastra.

  16. Darkh

    @ Bogdan

    “Moim zdaniem nie należy eliminować clusterów… Np. mamy taki klaster : w ciągu miesiąca kurs 10 razy przebija średnią ruchomą.”

    tylko po co badac przebicia sredniej ruchomej i ceny ? jesli np mozna zbadac: zachowanie wykresu po pierwszym od co najmniej 3 miesiecy zamknieciu ceny ponizej SMA200 na duzym jednosesyjnym spadku (<-2%) co niedawno mialo miejsce na SP, i o to mi chodzilo gdy pisalem o "naturalnym eliminowaniu plasterow" (w tym kontekscie badanie z bespoke nie jest najszczesliwsze)

    co na mysli mial T. i Maciwoda jeden jedyny slownik PWN raczy wiedziec 😉

  17. gared

    Zupełnie poza dyskusją.

    @ blackswan

    “W branży w której siedzę i w której jednym z najważniejszych zagadnień jest „volatility clustering” wszyscy mówią „klastry”, „klastrowanie” itd.”

    Jesteś ekonometrykiem? Mogę z ciekawości spytać gdzie pracujesz? – jakiś bank, GUS?
    Moje dość bezpośrednie pytanie wynika z faktu, że zawsze zastanawiałem się, gdzie w biznesie można wykorzystać wiedzę na temat modelowania GARCH, ARMA itp.

    dostać po ekonometrii? Siedzisz w GUSie, w banku jakimś? jak mniemam związaną z modelowaniem

  18. blackswan

    @gared

    wyślij mi maila na priv
    greysw4n na gmail.com

    jou

  19. Bogdan

    @ darkh

    W przypadku (cytuję zachowując sens):
    “zachowania wykresu po pierwszym od co najmniej 3 miesiecy zamknieciu ceny ponizej SMA200 na duzym jednosesyjnym spadku (<-2%) co niedawno mialo miejsce na SP"
    w ogóle nie ma mowy o żadnym klastrze (nagromadzeniu). Kolejne wydarzenie "pierwsze od co najmniej 3 miesięcy" może pojawić się po co najmniej trzech miesiącach, więc nie ma mowy o zbiciach, klast(e)rach, nagromadzeniach ;).

    A jeśli już eliminować, to można i tak: za sygnał przebicie uznawać dopiero wtedy, gdy – np. – kurs utrzyma się pod średnią przez co najmniej 10 okresów.

    @ lesserwisser

    Chapeaux bas za minikompendium wiedzy!

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Proszę podać wartość CAPTCHA: *