Friday, 20 October 2017

Svm Trading System


Handel med SVMs Performance. For å få en følelse av SVM-ytelse i handel, kjører jeg forskjellige oppsett på SP 500 historiske data fra 50-tallet. Hovedmotivet bak å bruke dette tiåret var å bestemme hvilke parametere som skal variere og hva som skal holdes stabilt før du kjører de viktigste tester Behandle det som en prøve i prøven for å unngå ytterligere overmontering Først ytelseskartet. SP 500 Trading Performance. Very nice Ved å bruke de 5 forsinkede daglige avkastningene, vises tilsvarende ytelse til ARMA GARCH-strategien, som jeg fant svært lovende Hvis du lurer på hvorfor jeg er så spent på dette faktum, er det fordi her er vi i det området der ARMA GARCH er best, og likevel viser SVMs sammenlignbare resultater. Statistikken er også imponerende. Mens jeg skrev dette innlegget fant jeg en annen innsats å bruke SVMs i trading av Quantum Financier Hans tilnærming bruker RSI av forskjellig lengde som input til SVM, men det bruker også klassifiseringskort returneringen til to verdier, kort eller lang i stedet for regresjon siden jeg planla å prøv klassifiseringen uansett, hans innlegg inspirerte meg til å implementere det og kjøre en ekstra sammenligning, regresjon vs klassifisering. SP 500 SVM Trading Regression vs Classification. What kan jeg si at de begge synes å fungere perfekt Som en leser foreslått i kommentarene, gjør klassifiseringen viser mer konsekvente avkastninger. Ved bordet ble klassifiseringen redusert i halvparten av den maksimale drawdownen, men interessant, det forbedret ikke Sharpe-forholdet betydelig. Ingenting avgjørende her, men det var et raskt løp av det raskeste når det gjelder løpestrategier. Det er fortsatt en lang liste over emner å utforske, bare for å gi deg en ide, i ingen bestemt rekkefølge. Legg til andre funksjoner. Mest sett tenker du å legge til noen Fed-relaterte serier, går disse dataene tilbake til 1960, så det kommer snart. Prøv andre svm parametere andre regressjoner, andre klassifikasjoner, andre ganger, osv. Dette er mer som en stabilitetstest. Prøv andre feilfunksjoner Standard er å bruke den gjennomsnittlige kvadratfeilen, men i tilfelle regres Sion, hvorfor ikke bruk Sharpe Ratio in-sample Regresjonssaken er enklere, siden vi har den faktiske avkastningen, kontrollerer inngangen til. Prøv lengre perioder i stedet for dager Ukentlig er en start, men ideelt sett vil jeg gjerne implementere to eller tre dagers perioder. Vari loopback perioden. Bruk flere klasser med klassifisering av store dager, middels dager etc. Dette vil ta tid Som alltid er tilbakemeldinger og kommentarer velkommen.1 Har du Sharpe-forhold for SVM-regresjon vs SVM-klassifisering Ved å øye på diagrammet, klassifiserer ser ut til å gi bedre risikojustert avkastning.2 Har du hørt om Caret-pakken Det ser ut til å ha innarbeidet mye av arbeidet jeg ser deg bruke i din eksisterende kode En annen stor fordel er at du enkelt kan bytte ML learning algo f. eks. neurale nettverk uten å måtte rekonstruere alt. Veldig interessant blogg. 1 Godt poeng, det kuttet drawdownen, men ikke Sharpe-forholdet jeg har oppdatert innlegget 2 Takk for at du tok opp Caret-pakken, dette er andre gang jeg hører om det, så om tid for å se nærmere på. Ser ganske lovende ut, absolutt mye å lære av det. Dere deler koden Resultatene er veldig imponerende. Jeg prøver å bygge en SVM-klassifikator som gjør noe lignende, men jeg vil bruke flere parametere enn prissetting Selv om det kanskje ikke er så nyttig, fordi det ser ut til at prisene alene gir forutsigbar verdi, takk. Jeg planlegger også å bruke mer enn bare priser, men den typen data er ikke tilgjengelig for 50-tallet. Generelt er 50-tallet på SP 500 er ganske forutsigbare. Flere komplekse modeller vil sannsynligvis være nødvendig. Kontroller forrige innlegg i serien, det er en kobling til koden jeg brukte basert på e1071-pakken. Siden jeg postet koden, flyttet jeg til caret-pakken som gir en enhetlig grensesnitt til mange modeller Ser bra ut så langt også. Søker bra, takk for at du deler All the best. Jeg prøver også å bruke SVM-SVR for å forutsi nær pris på aksjene, dvs. indeksverdi som CAC40 DJ etc. Min ide er veldig enkel og enkelt, jeg laster ned dataene på en megler nettside, jeg har fått tilgang til 3 år med disse dataene Svaret er nærverdien av indeksen, jeg antar at funksjonene i forrige dag har innvirkning på nærverdien av de neste dagene, dvs. høyeste verdi minste verdi åpning verdi for mandag er funksjoner for å forutsi, for å forklare sluttverdien av tirsdag, bygger jeg datasettet min med disse forutsetningene, så jeg bruker funksjonen med lag1, selvfølgelig kan jeg legge til andre funksjoner som lag2, lag3 Jeg legger et utvalg av datastrukturen her. openinglag1 highestlag1 smallestlag1 avsluttende responsvolum lag1 3950 59 3959 2 3936 33 4013 97 589818.Finalt har jeg et 764 datasett, alt datasettet jeg bruker til å trene svr, og jeg forutsier de neste dagene som nevnt ovenfor. Mine spørsmål er hvordan kan jeg forutsi for eksempel de neste 5 dagene Er min datastruktur riktig. Ikke fornøyd med den rullende prognosen i svmComputeForecasts Se hva det gjør for modellenPeriod uker for eksempel. Et alternativ er å gjøre ukentlige prognoser rett foran. Med andre ord, oppsummerer t han data inn i uker eller tre fire dagers biter, og ring svmComputeForecasts ved bruk av dager på dette settet. Hver prediksjon gjelder for hele perioden. Så vidt jeg vet kan man ikke bare gjøre en fem dagers forutgående probabilistisk prediksjon med SVMs dette kan gjøres med ARMA teknikker. Hop dette hjelper Ivan. Jeg har nyter innleggene dine og har et spørsmål jeg lurte på hva slags forbedring du fant når du flyttet fra den enkle ARMA-modellen til ARMA-GARCH-modellen. Har du testet noen andre rullende vindu treningsparametre Også fant du at den korte siden gjorde mye av en forskjell, det vil si det er mye bedre eller verre enn lenge bare. Han tok opp noen av disse spørsmålene i et senere innlegg. Legge til mer statistikk til ARMA GARCH opplæringen er sikkert på listen min, men det vil ta tid Man kan gjøre all denne analysen ved å bruke indikatoren sammen med GSPC fra Yahoo. Indikatoren er allerede justert. Det er ikke nødvendig å lagre. Meget imponerende. Men har du prøvd å bruke tilfeldig skog som det hevder å være superio r til SVM da det tillater implisitte ikke-lineære effekter og samspillsvilkår blant de eksogene variablene. Det spretter også ned den eksogene variabelen til de viktigste spillerne, og det er ganske fort også, spesielt med datasettet. Og takk for den tidligere svar En ting jeg er litt forvirret om er at på ARMA GARCH innlegget du nevner 18 87 CAGR og BH ser ut til å være ca 7 CAGR fra eyeballing diagrammet. I tabellen ovenfor viser du, 30 88 og 15 4 for ARMA GARCH og BH, henholdsvis Er det en annen tidsramme, eller mangler jeg noe, takk igjen. Oppgradering med støttevektormaskiner SVM. Til slutt har alle stjernene rettet opp, og jeg kan trygt bruke litt tid på back-testing av nye handelssystemer og Support Vector Maskiner SVM er det nye leketøyet som skal holde meg opptatt en stund. SVM er et velkjent verktøy fra området overvåket maskinlæring og de brukes både til klassifisering og regresjon. For mer informasjon, se litteraturen. Det er s Jeg synes at den mest intuitive søknaden om handel er regresjon, så la oss starte med å bygge en SVM-regresjonsmodell. Etter vår erfaring med ARMA GARCH-modeller, vil vi begynne å prøve å prognostisere avkastning, i stedet for priser På samme måte i våre første tester , vil vi bare bruke avkastningen fra de foregående 5 dagene som funksjonene som bestemmer retur for en bestemt dag. Vi starter med 500 dager som treningssettet. I flere matematiske termer har treningssettene N funksjoner for hver av dem har vi M-prøver. Vi har også M-svar. Gi en rekke funksjonsverdier, den venstre matrisen, SVM er utdannet til å produsere responsverdien. I vårt spesifikke eksempel har vi fem kolonnefunksjoner, hver kolonne som svarer til avkastningen med et annet lag fra 1 til 5 Vi har 500 prøver og de tilsvarende svarene. Når SVM er utdannet på dette settet, kan vi begynne å mate det med sett med fem funksjoner, som svarer til avkastningen for de fem foregående dagene, og SVM vil gi oss svaret, som er den forventede avkastningen. Etter at du har trent SVM på de foregående 500 dagene, vil vi bruke avkastningen for dagene 500, 499, 498, 497 og 496. Disse er våre som inngang for å få tak i Den forventede avkastningen for dag 501. Fra alle pakkene som er tilgjengelige i R, bestemte jeg meg for å velge e1071-pakken. Et nært annet valg var kernelab-pakken, som jeg fortsatt planlegger å prøve i fremtiden. Så prøvde jeg noen strategier Først jeg prøvde noe som ligner ARMA GARCH-tilnærmingen, de forsinkede avkastningene fra de fem foregående dagene, jeg var ganske overrasket over å se denne strategien utfører bedre enn ARMA GARCH, dette er hjemlandet til ARMA GARCH, og jeg ville vært ganske glad bare med sammenlignbare Nedenfor prøvde jeg de samme fem funksjonene, men prøvde å velge det beste delsettet. Utvalget ble gjort med en grådig tilnærming, startende med 0 funksjoner og interaktivt å legge til funksjonen som minimerer feilen best. Denne tilnærmingen imp Jeg prøvde en annen tilnærming med omtrent et dusin funksjoner. Funksjonene inkluderte avkastning over en annen tidsperiode 1-dagers, 2-dagers, 5-dagers, etc, noen statistikk betyr, median, sd, etc og volum Jeg brukte den samme grådige tilnærmingen til å velge funksjoner. Dette siste systemet viste også en veldig god ytelse, men det tok et stykke tid å løpe. Tid til å avslutte dette innlegget, må resultatene for back-testing vente til du kan spille med full kildekoden selv Her er et eksempel på å bruke det. Han i Windows virker ikke på grunn av multicore-problem En ting som jeg ikke forstår, reflekteres i dette til rader av kode datasettet data data data index rets. Etter min mening er det mer effektivt å slå sammen serien smth like. mydtret - og å ha bare ett argument for objektiv til å ringe i stedet for 2. Interessant arbeid, takk Mike. Argh, Windows Jeg bruker det sjeldent nylig Ganske overrasket, siden parallellen pakken er en del av basen R distribusjonen nå forhåpentligvis Det vil bli adressert snart. I mellomtiden, hva med å ikke bruke parallell utførelse Også det finnes andre pakker som gir parallell kjøring, men det ville være mer arbeid. Du har rett om sammenslåingen Jeg lurer fortsatt på hvorfor jeg gjorde det på denne måten denne gangen. Jeg m mottar feil Nå er feilen data svmFeatures tt, c 1,2 Feil i objekt skævhet ikke funnet. Men når jeg lager dataobjekt manuelt, mottar jeg feil i prediksjon svmComputeOneForecast - funksjon relatert til dimensjoner og sampling cross. It er vanskelig for meg å feilsøke . Skjønnhet kommer fra PerformanceAnalytics-pakken, som du trenger å installere fra CRAN, legger til, krever PerformanceAnalytics som den første linjen i svmFeatures bør adressere det første problemet. Nå er feilen i k 21, juster høyre lengde på dimnames 2 ikke lik størrelsesgraden det ser ut til at i Windows-koden trenger mange endringer. Jeg mente aldri at koden skulle brukes direkte til nå, men jeg var bare å gi utdrag, men jeg er overrasket over at R på Windows er så stygg. Ikke sikker på hva sy vårt mål, men for å analysere strategienes ytelse, kan du bruke indikatorserien som allerede er beregnet. Det er bare ren akademisk interesse på SVM. Jeg pleide å jobbe med klynger, PCA og jeg er nysgjerrig på hvordan SVM gjør det samme arbeidet i Windows mye feil er relatert til objekter med datoer som xts er eller datarammer UNIX er bedre, men alle meglere gir API for windows Noen av dem i Java og bare dette vi kan bruke fra UNIX Jeg liker ikke vinnarkarriere, men det er vane allerede og jeg har ikke tid til å endre OS. Jeg prøvde det bare på Windows 7, 64 bit, R versjon 2 15 2 Jeg får en advarsel fra svmFeatures, som jeg vet hvordan å fikse å ringe sd på et xts zooobjekt, gjør interessant konvertering til en matrise, men ingen problemer Running. Thanks Jeg skal prøve Et spørsmål hvis du ikke har noe imot Hvorfor bruker du få med funksjonen cetSymboler fra quantmod-pakken Jeg bruker samtaleversjon Eksempel SPY - getSymbols SPY, FALSE Du har mye å beregne og få forbruket minne og tar tid å skaffe objekter navn som en streng var. Den samme feilen jeg bruker R 2 15 1 Men jeg er overrasket over dette resultatet før samtalehode data.1 funksjon, liste karakter, pakke NULL, NULL, 2 verbose getOption verbose, envir 3 4 fileExt - funksjon x 5 db - grepl gz bz2 xz, x 6 ans-sub, x. Det ser ut til at data er reservert ord Og nå vet jeg ikke hva som skal fungere som funksjon. En sanntidsklynging og SVM-basert prisvolatilitet prediksjon for optimal trading strategy. Subhabrata Choudhury a, 1.Subhajyoti Ghosh b, 2.Arnab Bhattacharya c. Kiran Jude Fernandes d, 3, 4.Manoj Kumar Tiwari e,, 5.a Institutt for Metallurgisk Materialteknikk, Indisk Institutt for Teknologi Kharagpur, Kharagpur 721302, India. b Department of Ocean Engineering og Naval Architecture, Indian Institute of Technology Kharagpur, Kharagpur 721302, India. c University of Pittsburgh, Pittsburgh, PA 15213, USA. d Avdeling for ledelse, Durham University Business School, Mill Hill Lane, Durham University, Durham DH1 3LB, Storbritannia. e Departme nt i industriell ingeniørfag og ledelse Indisk institutt for teknologi, Kharagpur 721302, India. Mottatt 17. oktober 2012 Revisert 22. juli 2013 Godkjent 10. oktober 2013 Tilgjengelig online 29. oktober 2013 Kommunisert av Bijaya Ketan Panigrahi. Optimal portefølje er valgt ved hjelp av en to-trinns klyngesystem på et lager av stocks. The fremtidige priser er prognosert ved hjelp av støtte vektor machine. A kort sikt trading strategi er formulert basert på predictions. A test simulering realisert et overskudd på 1 5 over 15 dager. Finans avkastning på investeringer og bevegelse av markedsindikatorer er Ferdig med usikkerhet og et svært volatilt miljø som eksisterer i det globale markedet. Egenkapitalmarkedene er sterkt påvirket av uforutsigbarhet på markedet og å opprettholde en sunn diversifisert portefølje med minimumsrisiko er utvilsomt avgjørende for enhver investering i slike eiendeler. Effektiv pris - og volatilitetsprediksjon kan sterkt påvirke løpet av investeringsstrategien med hensyn til en slik portefølje av egenkapitalinstrumenter I dette papiret er en ny SOM-basert hybrid clusteringsteknikk integrert med støttevektoregresjon for porteføljevalg og nøyaktige pris - og volatilitetsspådommer som blir grunnlaget for den spesielle handelsstrategien som er vedtatt for porteføljen. Forskningen vurderer de 102 største bestandene av NSE aksjemarkedet India identifiserer sett av beste porteføljer som en investor kan opprettholde for risikoreduksjon og høy lønnsomhet Kort sikt aksjehandel strategi og resultatindikatorer er utviklet for å vurdere validiteten av prognosene med hensyn til faktiske scenarier. Stock market. Self-Organizing Maps. Trading strategy. Support vector machine. Table 1 Fig 2 Fig 3 Fig 4 Fig 5.Table 3 Fig 6.Table 4 Fig 7.Subhabrata Choudhury for tiden forfølge sin Bachelor of Technology grad i metallurgisk og materialteknologi ved Indian Institute of Technology Kharagpur, India og er i siste år Hans nåværende forskningsinteresse omfatter Data Mining, Operations Forskning, Maskinlæring og deres søknader i finans og stålindustri. Subhajyoti Ghosh er en fjerdeårsstudentstudent i Indisk Institutt for Teknologi Kharagpur, India som inngår i det femårige toprogrammet B Tech og M Tech i Ocean Engineering and Naval Architecture. Hans nåværende forskning fokuserer på Operations Research, Financial Markets og Scheduling. Arnab Bhattacharya er for tiden en doktorand i Operations Research ved University of Pittsburgh, USA. Han fullførte det femårige toårige programmet B Tech og M Tech i industriell ingeniørfag og ledelse ved Indian Institute of Teknologi Kharagpur, India i 2011 Hans forskningsområder inkluderer Operations Research og Data Mining. Kiran Jude Fernandes er forskningsdirektør og leder av Operations Management Group på York Management School, Storbritannia. Han er også en av hovedforskerne på det tverrfaglige York Center for komplekse systemer analyse YCCSA han har en doktorgrad i drift ledelse og Systemer fra University of Warwick en mastergradsstudent MS fra James Worth Bagley College of Engineering ved Mississippi State University MSU og en Bachelor of Engineering Hons grad i produksjon fra Waltech Hans forskning fokuserer på modellering av komplekse sosiale og forretningsdomener ved hjelp av et komplekst systemperspektiv. Manoj Kumar Tiwari er professor i Institutt for industriell ingeniørfag og ledelse i Indian Institute of Technology Kharagpur, India. Han er en assosiert redaktør av tidsskrifter som inkluderer IEEE Transaksjoner på SMC Part A Systems and Humans, International Journal of System Science Journal of Decision Support System Han har mer enn 200 publikasjoner i ulike internasjonale tidsskrifter og konferanser. Hans forskningsinteresser er beslutningsstøttemodeller, planlegging, planlegging og kontrollproblemer i produksjonssystemet, Supply Chain Network. Tilsvarende forfatter Tel 91 3222 283 746. Copyright 2013 Elsevier BV Alle rettigheter reservert. Citing artikler.

No comments:

Post a Comment