Saturday 21 October 2017

Gtis Forex Datenabbau


Backtesting Data Mining Backtesting Data Mining In diesem Artikel werfen Sie einen Blick auf zwei verwandte Praktiken, die weithin von Händlern wie Backtesting und Data Mining verwendet werden. Dies sind Techniken, die mächtig und wertvoll sind, wenn wir sie richtig verwenden, aber Händler oft missbrauchen sie. Daher auch gut erforschen zwei häufige Fallstricke dieser Techniken, wie die multiple Hypothese Problem und Overfitting bekannt und wie man diese Fallstricke zu überwinden. Backtesting ist nur der Prozess der Verwendung von historischen Daten, um die Leistung von einigen Trading-Strategie zu testen. Backtesting beginnt in der Regel mit einer Strategie, die wir testen möchten, zum Beispiel den Kauf GBPUSD, wenn es über den 20-Tage gleitenden Durchschnitt und den Verkauf überquert, wenn es unter diesem Durchschnitt überschreitet. Jetzt könnten wir diese Strategie testen, indem wir beobachten, was der Markt voranschreitet, aber das würde lange dauern. Deshalb verwenden wir bereits vorhandene historische Daten. Aber warten Sie, warten Sie höre ich Sie sagen. Könnten Sie nicht betrügen oder zumindest voreingenommen, weil Sie bereits wissen, was passiert in der Vergangenheit Das ist definitiv ein Anliegen, so dass ein gültiger Backtest wird ein, in dem wir arent vertraut mit den historischen Daten. Wir können dies durch die Wahl zufälliger Zeitperioden oder durch die Auswahl von vielen verschiedenen Zeitperioden, in denen die Durchführung der Prüfung. Jetzt kann ich hören, eine andere Gruppe von Ihnen sagen, Aber alle, dass historische Daten nur sitzen dort warten, analysiert werden ist verlockend ist es nicht Vielleicht gibt es tiefe Geheimnisse in der Daten nur darauf warten, dass Geeks wie wir es zu entdecken. Wäre es so falsch für uns, diese historischen Daten zuerst zu untersuchen, sie zu analysieren und zu sehen, ob wir in ihnen verborgene Muster finden können. Dieses Argument ist auch gültig, aber es führt uns in ein Gebiet voller Gefahr. Die Welt von Data Mining Data Mining beinhaltet das Durchsuchen von Daten, um Muster zu lokalisieren und mögliche Korrelationen zwischen Variablen zu finden. In dem obigen Beispiel, in dem die 20-tägige gleitende Durchschnittsstrategie involviert ist, haben wir gerade diesen speziellen Indikator aus dem Blauen herausgefunden, aber wir hatten keine Ahnung, welche Art von Strategie wir testen wollten. Wir konnten unsere historischen Daten auf GBPUSD durchsuchen, um zu sehen, wie sich der Preis verhielt, nachdem er viele verschiedene gleitende Durchschnitte überschritten hatte. Wir konnten die Kursbewegungen auch auf viele andere Indikatoren prüfen und sehen, welche den großen Kursbewegungen entsprechen. Das Thema Data Mining kann umstritten sein, weil, wie ich oben diskutiert, es scheint ein bisschen wie Betrug oder Blick nach vorne in die Daten. Ist Data Mining eine gültige wissenschaftliche Technik Einerseits bedeutet die wissenschaftliche Methode, dass sie zuerst eine Hypothese machen und dann gegen unsere Daten testen sollten, aber andererseits erscheint es sinnvoll, einige Daten erst zu erforschen, um sie zu erforschen Schlagen eine Hypothese vor. Also, was ist richtig Wir können uns die Schritte in der wissenschaftlichen Methode für einen Hinweis auf die Quelle der Verwirrung. Der Prozess sieht im Allgemeinen so aus: Beobachtung (Daten) Hypothese Vorhersage Experiment (Daten) Beachten Sie, dass wir mit Daten sowohl während der Beobachtung und Experiment Stufen befassen können. Also beide Ansichten sind richtig. Wir müssen Daten verwenden, um eine vernünftige Hypothese zu erstellen, aber wir testen auch diese Hypothese anhand von Daten. Der Trick ist einfach, um sicherzustellen, dass die beiden Sätze von Daten sind nicht die gleichen Wir dürfen nie testen unsere Hypothese mit dem gleichen Satz von Daten, die wir verwendet, um unsere Hypothese. Mit anderen Worten, wenn Sie Data Mining verwenden, um mit Strategien Ideen, stellen Sie sicher, dass Sie einen anderen Satz von Daten, um Backtest Ideen. Nun wenden wir unsere Aufmerksamkeit auf die wichtigsten Fallstricke bei der Verwendung von Data Mining und Backtesting falsch. Das allgemeine Problem ist als Über-Optimierung bekannt und ich bevorzuge es, dieses Problem in zwei verschiedene Typen zu brechen. Dies sind die mehrfache Hypothese Problem und Overfitting. In gewissem Sinne sind sie entgegengesetzte Wege, den gleichen Fehler zu machen. Das Mehrfachhypothesenproblem beinhaltet die Auswahl vieler einfacher Hypothesen, während das Overfitting die Schaffung einer sehr komplexen Hypothese beinhaltet. Das Problem der multiplen Hypothese Um zu sehen, wie dieses Problem auftaucht, gehen wir zurück zu unserem Beispiel, wo wir die 20-tägige gleitende Durchschnittsstrategie getestet haben. Nehmen wir an, dass wir die Strategie gegen zehn Jahre historischer Marktdaten zurücktesten und lo und schauen, was die Ergebnisse sind nicht sehr ermutigend. Doch wie wir sind rau und stürmisch Händler, entscheiden wir, nicht so schnell aufzugeben. Was ist mit einem zehn Tage gleitenden Durchschnitt Das könnte ein bisschen besser, so können Backtest es Wir führen einen anderen Backtest und wir finden, dass die Ergebnisse noch arent stellar, aber theyre ein bisschen besser als die 20-Tage-Ergebnisse. Wir entscheiden, ein wenig zu erkunden und führen Sie ähnliche Tests mit 5-Tage und 30-Tage gleitenden Durchschnitten. Schließlich kommt es zu uns, dass wir eigentlich nur jeden einzelnen gleitenden Durchschnitt bis zu einem gewissen Punkt testen und sehen können, wie sie alle ausführen. So testen wir die 2-Tages-, 3-Tages-, 4-Tage-, und so weiter, bis hin zu den 50-Tage gleitenden Durchschnitt. Nun sicherlich einige dieser Mittelwerte werden schlecht durchführen und andere werden ziemlich gut durchführen, aber es muss eine von ihnen, die die absolut beste ist. Zum Beispiel können wir feststellen, dass die 32-Tage gleitenden Durchschnitt erwies sich als die beste Performer in diesem besonderen Zeitraum von zehn Jahren. Bedeutet dies, dass es etwas Besonderes über die 32-Tage-Durchschnitt, und dass wir zuversichtlich sein, dass es gut in der Zukunft werden Leider viele Händler davon ausgehen, dass dies der Fall sein, und sie nur aufhören, ihre Analyse an dieser Stelle, denke, dass Sie haben etwas Tiefes entdeckt. Sie sind in die Multiple Hypothesis Problem Fallstricke gefallen. Das Problem ist, dass es überhaupt nichts ungewöhnliches oder signifikantes über die Tatsache, dass einige durchschnittlich als die besten. Schließlich haben wir fast fünfzig von ihnen gegen die gleichen Daten getestet, so dass wir erwarten, ein paar gute Performer, nur zufällig zu finden. Es bedeutet nicht, theres etwas Besonderes über die bestimmten gleitenden Durchschnitt, dass in diesem Fall gewonnen. Das Problem entsteht, weil wir mehrere Hypothesen getestet haben, bis wir eine gefunden haben, die funktionierte, anstatt eine einzelne Hypothese zu wählen und sie zu testen. Heres eine gute klassische Analogie. Wir könnten mit einer einzigen Hypothese wie Scott ist groß auf spiegelnde Köpfe auf einer Münze. Daraus können wir eine Vorhersage erstellen, die besagt: Wenn die Hypothese wahr ist, wird Scott in der Lage sein, 10 Köpfe in einer Reihe zu schlagen. Dann können wir ein einfaches Experiment durchführen, um diese Hypothese zu testen. Wenn ich 10 Köpfe in einer Reihe Flip kann tatsächlich nicht beweisen, die Hypothese. Allerdings, wenn ich nicht erreichen kann dieses Kunststück es definitiv widerlegt die Hypothese. Wenn wir wiederholte Versuche machen, die der Hypothese nicht widersprechen, so wächst unser Vertrauen in seine Wahrheit. Das ist der richtige Weg, es zu tun. Aber was wäre, wenn wir mit 1.000 Hypothesen aufgerechnet hätten, anstatt nur der eine über mich, der ein guter Münzflipper war. Wir könnten die gleiche Hypothese über 1.000 verschiedene Menschen machen. Ich, Ed, Cindy, Bill, Sam, etc. Ok, jetzt können Sie testen unsere mehrere Hypothesen. Wir bitten alle 1000 Personen um eine Münze zu spiegeln. Es wird wahrscheinlich etwa 500, die Köpfe Kopf. Alle anderen können nach Hause gehen. Jetzt fragen wir die 500 Leute, um wieder zu kippen, und dieses Mal werden 250 Köpfe umdrehen. Auf der dritten Flip-Flop etwa 125 Menschen Klappen, auf der vierten etwa 63 Personen sind links, und auf der fünften Flip gibt es etwa 32. Diese 32 Menschen sind alle ziemlich erstaunlich arent sie Sie alle spiegeln fünf Köpfe in einer Reihe Wenn wir fünf schlagen Mehrmals und eliminieren die Hälfte der Menschen jedes Mal im Durchschnitt, werden wir am Ende mit 16, dann 8, dann 4, dann 2 und schließlich eine Person links, wer hat zehn Köpfe in einer Reihe gespielt. Seine Bill Bill ist ein fantabulous Flipper von Münzen Oder ist er Well wir wirklich nicht wissen, und das ist der Punkt. Bill kann unseren Wettbewerb aus reiner Chance gewonnen haben, oder er kann sehr wohl der beste Flipper der Köpfe dieser Seite der Andromeda-Galaxie sein. Aus dem gleichen Grund wissen wir nicht, ob der 32-Tage-Gleitende Durchschnitt aus unserem Beispiel oben nur gut in unserem Test durch reine Chance, oder wenn es wirklich etwas Besonderes ist. Aber alles, was wir bisher getan haben, besteht darin, eine Hypothese zu finden, nämlich dass die 32-tägige gleitende Durchschnittsstrategie rentabel ist (oder dass Bill ein großer Münzflipper ist). Wir haben diese Hypothese noch nicht getestet. So, jetzt, dass wir verstehen, dass wir havent wirklich etwas Wesentliches aber über die 32-Tage gleitenden Durchschnitt oder über Rechnungen Fähigkeit, Münzen zu spiegeln entdeckt, ist die natürliche Frage zu fragen, was sollten wir als nächstes tun Wie ich bereits erwähnt, viele Händler nie erkennen, dass es Ist ein nächster Schritt überhaupt erforderlich. Nun, im Falle von Bill youd wahrscheinlich fragen, Aha, aber kann er Flip zehn Köpfe in einer Reihe wieder Im Falle der 32-Tage gleitenden Durchschnitt wollen wed es noch einmal testen, aber sicher nicht gegen die gleichen Daten-Probe, die Wir haben diese Hypothese gewählt. Wir würden eine weitere zehnjährige Periode wählen und sehen, ob die Strategie genauso gut funktionierte. Wir konnten dieses Experiment so oft fortsetzen, wie wir es wollten, bis unser Angebot an neuen Zehnjahreszeiten ausblieb. Wir verweisen auf diese als aus der Probe-Testing, und seine die Art und Weise, diese Fallstricke zu vermeiden. Es gibt verschiedene Methoden für solche Tests, von denen eine Cross-Validierung ist, aber wir kommen nicht in so viel Detail hier. Overfitting ist wirklich eine Art Umkehrung des oben genannten Problems. In der mehrfachen Hypothese Beispiel oben, schauten wir auf viele einfache Hypothesen und wählte die, die am besten in der Vergangenheit durchgeführt. Im Überbauen betrachten wir zuerst die Vergangenheit und konstruieren dann eine einzige komplexe Hypothese, die gut zu dem passt, was passiert ist. Zum Beispiel, wenn ich den USDJPY-Satz in den letzten 10 Tagen betrachte, könnte ich sehen, dass die tägliche Schließung dies tat: up, up, down, up, up, up, down, down, down, up. Erhielt es Sehen Sie das Muster Ja, ich auch nicht wirklich. Aber wenn ich diese Daten verwenden wollte, um eine Hypothese vorzuschlagen, könnte ich kommen. Meine erstaunliche Hypothese: Wenn der Schlusskurs zweimal in Folge dann nach unten für einen Tag steigt, oder wenn es für drei Tage in Folge geht, sollten wir kaufen, aber wenn der Schlusskurs drei Tage hintereinander steigt, sollten wir verkaufen , Aber wenn es nach oben geht drei Tage in Folge und dann nach drei Tagen in einer Reihe sollten wir kaufen. Huh Klingt wie eine whacky Hypothese rechts Aber wenn wir diese Strategie in den letzten 10 Tagen verwendet hätten, wären wir bei jedem einzelnen Trade, den wir gemacht haben Recht. Der Overfitter verwendet Backtesting und Data Mining anders als die mehrere Hypothesen Entscheidungsträger tun. Der Overfitter kommt nicht mit 400 verschiedenen Strategien zum Backtest. Keine Möglichkeit Der Overfitter nutzt Data-Mining-Tools, um herauszufinden, nur eine Strategie, egal wie komplex, das hätte die beste Leistung über die Backtesting-Periode haben. Wird es in der Zukunft funktionieren Nicht wahrscheinlich, aber wir konnten immer halten das Modell und testen die Strategie in verschiedenen Proben (aus der Probe-Test wieder), um zu sehen, ob unsere Leistung verbessert. Wenn wir aufhören, Leistungsverbesserungen und die einzige Sache, die steigt, ist die Komplexität unseres Modells, dann wissen wir, dass wir die Linie in Überformat überquerte. Zusammenfassend sehen wir, dass Data Mining eine Möglichkeit ist, unsere historischen Kursdaten zu verwenden, um eine handlungsfähige Handelsstrategie vorzuschlagen, aber wir müssen uns der Fallstricke des Mehrfachhypothesenproblems und der Überformung bewusst sein. Der Weg, um sicherzustellen, dass wir nicht zum Opfer fallen, um diese Fallstricke ist es, unsere Strategie mit einem anderen Datensatz als die, die wir während unserer Data-Mining-Exploration verwendet Backtest. Wir beziehen uns allgemein auf dieses als aus Probeprüfung heraus. Ein Problem bei Data Mining besteht darin, dass Trader dazu neigen, unterschiedliche Filter zu verwenden, um nach einem Muster zu suchen. Das Problem mit diesem ist, dass jedes Signal aus den verschiedenen sinusförmigen Signalen zusammengesetzt ist, also wenn Sie verschiedene Filter auf ein Signal anwenden, werden wir sicherlich am Ende mit einem Muster. Viele Studien wurden über das Preis-Muster gemacht, die meisten auf Data-Mining basieren, wird die Frage, die Annahme, dass die Zukunft spiegeln die Vergangenheit, die Antwort ist vielleicht. Wir haben eine 5050 Chance. Kann der Prozentsatz durch das Studium dieses Musters auf verschiedene Daten erhöht werden. Wenn wir sogar diesen Prozentsatz erhöhen wollen, müssen wir wissen, was die Ursache dieses Musters ist, indem wir die Ursache dieses Musters kennen, hätten wir einen Vorteil im Handel. Zum Beispiel werde ich diese Annahme machen, sagen wir, dass der erste Freitag eines jeden Monats aufgrund der Neuigkeiten viele Händler ihre Geschäfte am Morgen vor den Nachrichten verlassen und nach den Nachrichten wieder eintreten werden, so gibt es ein Muster des Verkaufs und Kauf zu bestimmten Zeit. Könnten wir diese Informationen zu unserem Vorteil durch die Anwendung einer Art von Hecke Handel, so dass wir mit beiden kaufen und verkaufen vor den Nachrichten. Dann nach den Nachrichten, die wir nur verkaufen, die wollen, zu kaufen und didn8217t wollen eine Position in den Nachrichten halten und wir lassen den Kauf, bis der Preis zurückkommt, könnte dies auf Sägezins Zinssatz angewendet werden, oder ein anderes Setup 8230 bla bla. Das ist nur eine Theorie. Ich benutze es, um zu sagen, dass Furcht und Gier eine Zeit auf dem Markt haben. Also, was schafft das Preis-Muster sind die Angst und Gier, jetzt, wenn wir das Muster zu isolieren und wissen, die Ursache hinter diesem Muster wie im vorherigen Beispiel Angst aus den Nachrichten oder die Abrechnung des Kontos am Ende des Monats. Sachen wie diese. Dann könnten wir in der Theorie die Zukunft der ersten beiden Post von dieser Website kopiert werden alle Artikel von Scott Percival sind lohnt sich zu lesen Ausgezeichneter Thread MiniMe Join us download MetaTrader 5 Copyright 2000-2016, MQL5 Ltd. Data Mining ein Forex Majors-Strategie Wegen der Die einzigartigen Merkmale der verschiedenen Währungspaare, sind viele quantitative Forex-Strategien mit einem bestimmten Währungspaar im Auge. Während dies viele rentable Handelsstrategien produzieren kann, gibt es auch Vorteile zu entwickelnden Strategien, die über mehrere Währungspaare gehandelt werden können. Dies führt zu einem Element der Diversifizierung, die ein zusätzliches Maß an Abwärtsschutz bieten kann. Daniel Fernandez veröffentlichte kürzlich ein System, das er entworfen hatte, um auf jedem der vier Forex Majors zu handeln. Sein Ziel war es, ein System zu finden, das eine 20-jährige Erfolgsbilanz mit profitablem Handel auf EURUSD, GBPUSD, USDJPY und USDCHF erzielt hätte. Daniel verwendet einen Data-Mining-Ansatz, um eine Strategie für den Handel der vier Forex-Majors zu entwickeln. Um sein System zu konstruieren, verwendete Daniel seine Data-Mining-Software, um Eingangs - und Ausgangssignale zu definieren, die eine rentable Handelsstrategie auf jedem der vier Währungspaare in den letzten 20 Jahren erzeugt hätten. Was er kommt, ist eine Kombination von drei Preis-Regeln, die die Grundlage für seine Forex Majors-Strategie bilden. Daniel8217s Forex Majors Strategie Daniel8217s Forex Majors Strategie ist sehr einfach, dass es immer eine Position, entweder lang oder kurz, in jedem der vier Währungspaare, die es handelt. Es basiert alle seine Trades auf Tages-Charts. Die Strategie ist lang, wenn die folgenden drei Bedingungen erfüllt sind: Die Strategie ist kurz, wenn die folgenden drei Bedingungen erfüllt sind: Wie Sie sehen können, ist die Strategie im Grunde ein optimierter Trend nach Strategie. Dies macht Sinn, weil Daniel am Anfang seines Artikels erklärt, dass langfristige Tendenzen nach Strategien in der Regel die besten Strategien für den Handel mehrere Märkte sind. Eine weitere Regel, die Daniel8217s Strategie nutzt, ist ein ATR-basierter Stop-Loss. Der feste Stop-Loss wird auf 180 der 20-Tage-ATR eingestellt. Wenn der Stop-Loss ausgelöst wird, bleibt die Strategie ausserhalb des Marktes, bis ein Signal in die entgegengesetzte Richtung erzeugt wird. Testen bedeutet, dass eine erneute Eingabe eines Signals in der gleichen Richtung die Leistung negativ beeinflusst. Backtesting Performance Die Backtesting-Ergebnisse, dass Daniel in seinem Beitrag enthalten, zeigen, dass die Strategie war ziemlich profitabel. Sie erzielte eine Gewinnquote von 45, einen Gewinnfaktor von 1,38 und ein Lohn-Risiko-Verhältnis von 1,68. Daniel8217s größte Sorge über die Strategie war, dass der maximale Drawdown-Zeitraum eine sehr lange Zeit darstellte. Nach Daniel8217s Zahlen, die durchschnittliche jährliche Rendite war 9,67. Diese bestand aus 16 rentablen Jahren, 4 Jahren zu verlieren, und ein Jahr, das im Grunde sogar brach. Das beste Jahr war eine Rendite von 37,76, und das schlechteste Jahr war ein Verlust von 20,2. Daniel weist darauf hin, dass dieses System keine gute eigenständige Strategie darstellen würde, da es im Vergleich zu maximalen Drawdowns eine Rendite gibt. Allerdings schlägt er vor, dass es ein interessantes Stück einer größeren, Multi-System-Strategie sein könnte.

No comments:

Post a Comment