ich wollte mal fragen ob mir kurz wer nen kurzen überblick darüber geben kann wie man eine scriptsprache entwickelt.. Also nicht mit code beispielen etc, sondern eher wie das ganze abläuft..
Der anfang ist mir soweit alles klar, ich schreib ein skript und lasse das von nem parser parsen.. aber, wo parst' der das hin?
Es wird immer davon geredet das das mehr oder weniger compiliert wird, aber was genau macht denn der parser aus z.B. einem:
"if (bla > 5) .."
Also in was wird das umgewandelt um intern das script schneller abarbeiten zu können?
wenn ich bisher sowas brauhte hab ich einfach das script hergenommen und den parser entsprechend der befehle direkt das aufrufen lassen was gewollt war, aber das ist natürlich suboptimal wenn ein skript extrem oft benutzt wird = der parser ständig wieder ran muß..
Ich weiß das es zwar im Tutorial bereich zwei tutorials zu gibt, aber mir geht es hier grad echt nur um die theorie dahinter, nicht um das umsetzen..
Registriert: Do Sep 02, 2004 19:42 Beiträge: 4158
Programmiersprache: FreePascal, C++
Also... Der (ich nenns jetzt einfach mal so) Scanner geht den Code zeichen für Zeichen durch und trennt ihn in Tokens auf. Normalerweise reicht es aus, immer nur das aktuelle Token zu haben, ältere evtl. irgendwo zwischenspeichern. Der Scanner schaut sich das aktuelle Zeichen an und entscheiden anhand dessen, was er wohl vor sich hat. Ist es z.B. ein Buchstabe, ist es sicher, dass man einen Identifier oder ein Reserviertes Wort vor sich hat. Ist es ein Anführungszeichen, hat man einen String und so weiter.
Er macht dann so lange weiter bis er auf etwas stößt, was nicht mehr ins Schema passt. Er schreibt dann das, was er gefunden hat in eine Variable, dazu auch was für eine Art von "Ding" es ist (Reserviertes Wort, wenn ja, welches; Zahl; String; wasauchimmer).
Der Compiler nutzt diesen Scanner um den Code zu analysieren und zu compilieren. Dazu lässt er den Parser, wenn er ein Token verarbeitet hat, fortschreiten und sich so das nächste Token geben. Je nach dem, was er vorfindet generiert er dann Code, meistens einen Pseudo-ASM-Code, den dann der eigentliche Interpreter zu verstehen und auszuführen weiss.
Dadurch dass man jetzt nurnoch Binärcode hat wo jede Stelle eine Festgelegte Funktion hat (z.B. Byte 1-4 gibt an, welche Operation auszuführen ist, 5-12 Parameter 1, 13-20 Parameter 2, 21-28 Parameter 3), kann man das ganze viel schneller ausführen, weil man keine Stringvergleiche mehr hat, nurnoch Zahlen.
Das ist ganz grob die Theorie.
Gruß Lord Horazont
_________________ If you find any deadlinks, please send me a notification – Wenn du tote Links findest, sende mir eine Benachrichtigung. current projects: ManiacLab; aioxmpp zombofant network • my photostream „Writing code is like writing poetry“ - source unknown
„Give a man a fish, and you feed him for a day. Teach a man to fish and you feed him for a lifetime. “ ~ A Chinese Proverb
Ich würde aus dem code einen baum generieren. Ein Knoten in dem Baum kann das z.B. variablen, funktionen, Anweisungen, Ausdrücke etc darstellen. Aus diesem Baum kann man dann hinterher bytecode erstellen. Also so eine art eigenen Maschinencode, den man dann direkt ausführen, oder weiter in normales x86 asm übersetzen kann. Skriptsprachen bleiben üblicherweise bei dem bytecode.
Kleiner Tipp: Übersetzen braucht man den Code für Scriptsprachen eigentlich nicht. Wenn man Objektorientiert schreibt, erzeugt man einfach Klassen für die jeweiligen Statements, Ausdrücke etc. Die haben dann entsprechend Methoden ala Execute oder Evaluate. Jede Klasse sollte außerdem ihre Stelle im Code kennen - um bei Exceptions das Debugging leicht zu machen. Man bekommt dann einen als Baum für jedes Skript aufgezogenen Interpreter, welchen man dann mit der Methode Execute startet
Registriert: Do Sep 02, 2004 19:42 Beiträge: 4158
Programmiersprache: FreePascal, C++
Aber das OOP erzeugt doch einen drastischen Overhead, oder? Wenn man wirklich jede Anweisung in eine Klasse umwandelt, dürfe das das ganze doch sehr verlangsamen.
Gruß Lord Horazont
_________________ If you find any deadlinks, please send me a notification – Wenn du tote Links findest, sende mir eine Benachrichtigung. current projects: ManiacLab; aioxmpp zombofant network • my photostream „Writing code is like writing poetry“ - source unknown
„Give a man a fish, and you feed him for a day. Teach a man to fish and you feed him for a lifetime. “ ~ A Chinese Proverb
Du erzeugst halt ne Menge calls, aber für viele Scriptsprachen, bei denen Geschwindigkeit nicht unbedingt das A und O ist, ists mehr als geeignet - für code der sehr performant laufen muss, ists sicherlich nicht ganz optimal, aber man muss bedenken, daß bei einem iterativen bytecode auch vieles als funktionen geschachtelt wird, damits lesbar bleibt und da darf dann das inline auch nicht fehlen.
Mitglieder in diesem Forum: Bing [Bot] und 7 Gäste
Du darfst keine neuen Themen in diesem Forum erstellen. Du darfst keine Antworten zu Themen in diesem Forum erstellen. Du darfst deine Beiträge in diesem Forum nicht ändern. Du darfst deine Beiträge in diesem Forum nicht löschen. Du darfst keine Dateianhänge in diesem Forum erstellen.