Registriert: Do Sep 25, 2003 15:56 Beiträge: 7810 Wohnort: Sachsen - ERZ / C
Programmiersprache: Java (, Pascal)
Das kannst du dir selber beantworten. dj3hut1 hatte richtig geraten. Meine Frage bezog sich auf die beste Tank-Strategie. Ob die Preissprünge dort normalverteilt sind, weiß ich nicht.
_________________ Blog: kevin-fleischer.de und fbaingermany.com
Zustände sind : Tankfüllung und aktueller Preis
Aktionen : Verbrauchsgut mit einer bestimmten Menge auffüllen oder warten
Rewards ( negativ ) : bezahlter Preis pro verbrauchte Einheit
Viele Grüße
dj3hut1
_________________ Wenn Gauß heute lebte, wäre er ein Hacker. Peter Sarnak, Professor an der Princeton University
Registriert: Do Sep 25, 2003 15:56 Beiträge: 7810 Wohnort: Sachsen - ERZ / C
Programmiersprache: Java (, Pascal)
Hmmm, eigentlich keine schlechte Idee, aber leider hängen die Aktionen des Agenten und der Folgezustand nicht wirklich miteinander zusammen, denn der Preis verändert sich unabhängig von der Aktion des Agenten.
_________________ Blog: kevin-fleischer.de und fbaingermany.com
Registriert: Di Dez 27, 2005 12:44 Beiträge: 393 Wohnort: Berlin
Programmiersprache: Java, C++, Groovy
Hallo,
achso, es ist so gemeint, das Tankfüllung und Preis einen Zustand ergeben.
Man könnte dann z.B. im Zustand [10l, 1,53€] sein und landet, wenn man 30 l tankt im Zustand [40l, 1,53€].
Den erreichten Wert speichert man für das Zustands-Aktionspaar ab ( Q-Learning ).
Sollte sich dabei der Preis ändern hat man einen nichtdetermistischen Zustandsübergang, d.h. man müsste sich noch
die Übergangswahrscheinlichkeiten abspeichern. ( die man mit steigender Erfahrung hinzulernt )
_________________ Wenn Gauß heute lebte, wäre er ein Hacker. Peter Sarnak, Professor an der Princeton University
Registriert: Do Sep 25, 2003 15:56 Beiträge: 7810 Wohnort: Sachsen - ERZ / C
Programmiersprache: Java (, Pascal)
Naja, das was du schreibst ist schon richtig. Aber es gibt noch einen Zustandsübergang. Nämlich die Änderung des Preises über die Zeit und das konstante absinken der Tankfüllung über die Zeit.
_________________ Blog: kevin-fleischer.de und fbaingermany.com
Vielleicht ist es sogar am besten man schaut immer mal wieder auf die Kursentwicklung des Beninpreises in Rotterdam. Mit etwas Glück brauchen die Tankstellen ein wenig um zu reagieren.
Registriert: Do Sep 25, 2003 15:56 Beiträge: 7810 Wohnort: Sachsen - ERZ / C
Programmiersprache: Java (, Pascal)
Das ist tatsächlich so ... bei fallenden Kursen. Steigende werden schneller durchgegeben und erzeugen so den "Extrabonus" den man sich als Shareholder wünscht.
_________________ Blog: kevin-fleischer.de und fbaingermany.com
Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste
Du darfst keine neuen Themen in diesem Forum erstellen. Du darfst keine Antworten zu Themen in diesem Forum erstellen. Du darfst deine Beiträge in diesem Forum nicht ändern. Du darfst deine Beiträge in diesem Forum nicht löschen. Du darfst keine Dateianhänge in diesem Forum erstellen.