Grundlagen der Programmkonstruktion 14s

<title>Grundlagen der Programmkonstruktion 14s</title>

<h1>Grundlagen der Programmkonstruktion 14s</h1>

<h1>6.3.2014</h1>

In dieser Vorlesung und den begleitenden Übungen lernen Sie wichtige
Konzepte der Programmierung.  Können Sie am Ende Programmieren?  Ja,
zu einem gewissen Grad.  Allerdings dauert es viel länger, bis man ein
wirklicher Experte ist; Peter Norvig
setzt <a href="http://norvig.com/21-days.html">10 Jahre</a> an.

<p>Weiters ist Programmieren eine Fertigkeit, die man sich weniger
durch Anhören von Vorlesungen und Lesen von Büchern erwirbt, sondern
vor allem, indem man selbst programmiert.  Allerdings können Bücher
und Vorlesungen helfen, den Horizont zu erweitern, sodass man nicht
immer auf den selben Trampelpfaden unterwegs ist.

<p>Zu beachten ist allerdings auch, dass die Informatik nicht nur aus
Programmieren besteht.

<h2>Was ist ein Programm?  Was ist Programmieren?</h2>

Ein Programm sagt dem Computer, wie er eine Aufgabe löst.
Programmieren ist das erstellen von Programmen.


<h2>Forth</h2>

Programme können in verschiedenen Programmiersprachen geschrieben
werden.  Im ersten Teil dieser LVA werden wir die Programmiersprache
Forth verwenden.  Die Vorteile von Forth für unsere Zwecke sind:

<ul>

<li> Forth ist maschinennah, sodass man einige Dinge ausprobieren und
zeigen kann, die in höherleveligen Programmiersprachen nicht oder nur
mit Schwierigkeiten möglich sind.

<li> Forth ist interaktiv, sodass man Dinge bequem ausprobieren kann.

<li> Forth ist relativ einfach.

<li> Die allermeisten von Ihnen kennen Forth nicht, sodass fast jeder
von Ihnen noch etwas dazulernen kann.

</ul>

Sie lernen hier aber nur einen Teil von Forth, nicht die ganze
Sprache, und nicht die typische Verwendung von Forth.  Wenn Sie sich
dafür interessieren, fangen Sie mit einer Einführung in Forth an,
z.B. das <a href="https://www.complang.tuwien.ac.at/forth/gforth/Docs-html/Tutorial.html">Forth-Tutorial
von Gforth</a>.

<p>Es gibt verschiedene Forth-Systeme; für diese LVA verwenden wir Gforth
(einige Gforth-spezifische Fähigkeiten werden verwendet).  Gforth ist
für Linux üblicherweise über die Linux-Distribution verfügbar, und für
Windows <a href="https://www.complang.tuwien.ac.at/forth/gforth/gforth-0.7.0.exe">hier</a>
als selbstinstallierendes Executable.  Für MacOS X gibt es eine
Erfolgsmeldung für das Gforth-Paket
auf <a href="http://brew.sh/">Homebrew</a>.  Fuer Android-Smartphones
gibt
es <a href="https://play.google.com/store/apps/details?id=gnu.gforth">Gforth
auf Google Play</a>.

<h2>Einfache Ausgabe</h2>

<a href="http://de.wikipedia.org/wiki/Bart_Simpson">Bart Simpson</a>
muss am Anfang vieler Folgen den selben Satz wiederholt an die Tafel
schreiben.  Eine ideale Aufgabe für den Computer.

<p>Fangen wir damit an, den Computer den Satz einmal schreiben zu lassen:

<pre>
." I will not do anything bad ever again."
</pre>

Zu beachten ist dabei das Leerzeichen
nach <code>."</code><!-- "--> . Probieren Sie aus, was passiert, wenn
Sie es weglassen.  Sie sehen: Computer, insbesondere
Programmiersprachen, sind pedantisch.  Dabei
ist <code>."</code> <!-- "--> ein Befehl, oder, in Forth-Terminologie,
ein <em>Wort</em>, der die Eingabe bis zum
nächsten <code>"</code><!-- "--> ausgibt.

<p>Sie können in Gforth mit der Pfeil-Hinauf-Taste die zuletzt
eingegebene Zeile (bei wiederholter Anwendung die davor) wieder in die
Kommandozeile holen und dann mit der Enter-Taste wieder ausführen, und
auf diese Weise die Ausgabe mit wenig Aufwand wiederholen.

<p>Aber auf die Dauer ist es praktischer, wenn wir dieser Aktion einen
kurzen Namen geben:

<pre>
: bart ." I will not do anything bad ever again." ;
</pre>

Jetzt können wir diese Aktion wie folgt ausführen:

<pre>
bart
</pre>

Mit <code>: bart</code> haben wir die Definition des
Wortes <code>bart</code> angefangen.  Danach kam das, was passieren
soll, wenn Sie das Wort ausführen.  Die Definition wird
mit <code>;</code> beendet.

<p>Sie können <code>bart</code> jetzt beliebig oft ausführen:

<pre>
bart bart bart bart bart
</pre>

Da haben wir auch schon den ersten Fehler: Jede Ausgabe schliesst
unmittelbar an die vorige an, anstatt auf einer neuen Zeile zu
beginnen.  Korrigieren wir das, indem wir <code>bart</code> anders
definieren:

<pre>
: bart cr ." I will not do anything bad ever again." ;
</pre>

Das Wort <code>cr</code>
(für <a href="http://de.wikipedia.org/wiki/Wagenrücklauf">Carriage
Return</a>) bewirkt, dass die Ausgabe am Anfang der nächsten Zeile
fortgesetzt wird.

<p>Jetzt können wir die Ausgabe leicht 20 mal machen lassen:

<pre>
bart bart bart bart bart bart bart bart bart bart bart bart bart bart bart bart bart bart bart bart
</pre>

Das ist zwar schon eine schöne Ersparnis im Vergleich zur
Originalaufgabe, aber noch immer recht repetetiv.  Auch das können wir
bald besser, aber davor müssen wir uns noch mit Daten befassen.  Dann
können wir irgendwann auch Programme schreiben, die nicht nur immer
das gleiche machen, sondern auch Eingaben verarbeiten und auf sie
reagieren.

<h2>Daten und ihre Bedeutung</h2>

Das selbe Datum kann auf verschiedene Arten dargestellt werden: 4 und
IV bezeichnen dieselbe Zahl.  11.9.2001, 2001-09-11, und "Nine-Eleven"
bezeichnen den selben Tag.  Hier sind die Unterschiede nur in der
Darstellung.

<p>Umgekehrt kann das selbe Datum auf verschiedene Arten interpretiert
werden und hat dann verschiedene Bedeutungen.  Zum Beispiel kann die
Zahl 65 ein Preis sein, eine Gewichtsangabe, eine Entfernung, usw.
Deswegen gibt man in solchen Fällen normalerweise auch die Einheit als
Kontext mit an: z.B. EUR65, 65N, 65km.

<p>Interessanterweise hat sich das Arbeiten mit Einheiten in der
Programmierung nicht durchgesetzt, obwohl da auch schon einige
kostspielige Fehler passiert sind.  Jedenfalls werden Zahlen in
praktisch allen Programmiersprachen ohne Dimension und ohne Einheit
verwendet, und Ihre Bedeutung erhalten Sie durch die Verwendung im
Programm.

<p>Auf einer maschinennahen Ebene werden alle Daten irgendwie mit Bits
dargestellt.  Ein Bit kann zwei Werte annehmen; ein Beispiel wäre, das
Geschlecht als Bit darzustellen, die beiden Werte sind dabei
"weiblich" und "männlich".  Wenn man ein Bit als Zahl interrpetiert,
ordnet man diesen beiden Werten üblicherweise die Zahlen 0 und 1
zuordnen.  Wie wir sehen werden, kann man es zum Beispiel auch als
Vorzeichen interpretieren, und die beiden Zustände sind ">=0" und
"<0".

<p>Meist braucht man mehr als zwei verschiedene Werte, um Daten
darzustellen, dann verwendet man mehrere Bits.  Bei der Darstellung
von Zahlen kann man mit n Bits z.B. Zahlen von 0 bis 2<sup>n</sup>-1
darstellen.

<h3>Natürliche Zahlen</h3>

<p>Dabei werden die n Bits als n-stellige Zahl mit der Basis 2
(Binärdarstellung, Binärzahl) interpretiert.  Die Zahl mit der
Dartellung <img src="http://upload.wikimedia.org/math/0/5/7/0572c60390734c51be8dc2c2af6a32c5.png">
kann also mit der
Formel <img src="http://upload.wikimedia.org/math/7/d/4/7d44d3a86fd8dbc8d3de9aa24a83c35c.png">
berechnet werden, wobei <em>b</em> die Basis ist.  Z.B. hat die
Binärzahl 101 den Wert
1*2<sup>2</sup>+0*2<sup>1</sup>+1*2<sup>0</sup>=1*4+1*1=5.

<p>In Forth können wir Zahlen in verschiedenen Basen ein- und ausgeben
lassen.  Einige Basen können wir direkt eingeben und direkt ausgeben:

<pre>
%101 dec.
#25 dec.
$25 dec.
%101 hex.
#25 hex.
$25 hex.
</pre>

Der Präfix <code>%</code> steht für eine Binärzahl, <code>#</code> für
eine Dezimalzahl, und <code>$</code> für eine Hexadezimalzahl (Basis
16).  Die Ausgabe erfolgt bei <code>dec.</code> dezimal,
bei <code>hex.</code> hexadezimal.  Für Binärausgabe gibt es kein
eigenes Wort.

<p>Bei Eingabe von Zahlen ohne Präfix, und bei der Ausgabe
mit <code>u.</code> wird die aktuelle Basis verwendet.  Am Anfang ist
die Basis dezimal, aber man kann sie mit <code><em>n</em> base
!</code> ändern:

<pre>
#2 base !
%101 u.
$95 u.
$9559 u.
#9559 u.
#10 base !
</pre>

Hier sieht man, dass die Binärdarstellung schon bei mittelgroßen
Zahlen schnell unübersichtlich wird.  Weiters sieht man, dass jede
Hex-Ziffer in 4 Binärziffern expandiert wird (denn 2<sup>4</sup>=16):
$9=%1001, $5=0101.  Im Gegensatz dazu ist die Umrechnung zwischen
Dezimal-Darstellung und Binärdarstellung komplizierter.  Daher wird in
der Informatik gerne die Hexadezimaldarstellung verwendet, wenn man
sich mit den Bits beschäftigen will; sie bietet einen guten Kompromiss
zwischen Übersichtlichkeit und direkter Beziehung zu den Bits.

<h2>Forth-Mechanismen und der Stack</h2>

Was passiert eigentlich bei

<pre>
%101 dec.
</pre>

Zunächst werden die Zeichen bis zum ersten Leerzeichen,
also <code>%101</code>, als Wort aufgefasst; da es kein Wort mit
diesem Namen im Forth-System gibt, werden die Zeichen dann als Zahl
interpretiert, und diese Zahl dann auf einen <em>Stapel</em>
(englisch: <em>Stack</em>) gelegt (englisch: <em>push</em>, denglisch:
gepusht).

<p>Dann wird das nächste Wort <code>dec.</code> angesehen; dieses wird
im Forth-System gefunden, und ausgeführt.  Es nimmt eine Zahl vom
Stack und gibt sie in Dezimaldarstellung aus.

<p>Man kann auch mehrere Werte auf den Stack legen, und dann ausgeben:

<pre>
#1 #2 dec. dec.
</pre>

Die Werte kommen in der umgekehrten Reihenfolge der Eingabe heraus,
weil 2 auf dem Stapel oberhalb von 1 zu liegen kommt, und vom
ersten <code>dec.</code> daher 2 vom Stapel genommen und ausgegeben
wird.  Der Stack wird daher auch als <em>last-in first-out</em> (LIFO)
Datenstruktur bezeichnet.  Das ist besonders nützlich, wenn man etwas
zwischendrin machen will, z.B.:

<pre>
#3 base !
121 #12 base ! u.
#10 base !
</pre>

Hier wollen wir eine Zahl mit der Basis 3 eingeben und mit der Basis
12 ausgeben.  Da es für Basis 3 keinen Präfix gibt, müssen wir
zunächst die Basis mit <code>#3 base !</code> auf 3 setzen.  Dann
folgt die Zahl <code>121</code>, die wir eingeben wollen.

<p>Um jetzt in der Basis 12 auszugeben, müssen wir die Basis
mit <code>#12 base !</code> ändern.  Dabei wird auch der Stack
benutzt, aber nach dem <code>!</code> sind alle Spuren davon
beseitigt, und es liegt nur noch die davor eingegebene Zahl auf dem
Stack, und <code>u.</code> gibt diese Zahl mit der nun aktuellen Basis
12 aus.

<p>Am Schluss schalten wir die Basis wieder auf Dezimal zurück, da es
leicht zu Fehlern führt, wenn man eine andere Basis beläßt (deswegen
empfehle ich allgemein, die Basis möglichst nicht zu ändern, sondern
mit Präfixen und <code>hex.</code> zu arbeiten.

<p>Allgemeiner: es ist meist problematisch, ein Programm so zu
gestalten, dass es mit einem globalen Zustand arbeitet (in diesem Fall
die Basis).  Bei kleinen Programmen kann man so etwas oft noch ohne
große Probleme verwenden, aber wenn das Programm wächst, werden
solche Techniken schnell unübersichtlich (noch schneller als der
Rest).

<p>Wenn Ihr System das Programm <code>xterm</code> installiert hat,
können Sie sich das
Forth-Programm <a href="http://git.savannah.gnu.org/cgit/gforth.git/plain/status.fs">status.fs</a> holen und Gforth mit

<pre>
gforth status.fs
</pre>

starten.  Dann wird ein Fenster geöffnet, das nach jeder Zeile die
aktuelle Basis, den Inhalt des Stacks, und andere Informationen
anzeigt.  Allerdings müssen Sie das Fenster selbst schliessen, wenn
Sie Gforth beenden.

<h2>Rechnen</h2>

Sie können in Forth wie folgt rechnen:

<pre>
5 4 + u.
</pre>

Das Wort <code>+</code> nimmt zwei Werte vom Stack, addiert sie, und
legt das Ergebnis auf den Stack.  Daraus ergibt sich bei Berechnungen
eine <a href="http://de.wikipedia.org/wiki/Umgekehrte_Polnische_Notation">Postfix-Notation</a>
(der Operator ist hinter den Operanden, auch als UPN bekannt).  Das
Wort <code>*</code> multipliziert, <code>-</code> subtrahiert,
und <code>/</code> dividiert (ganzzahlig):

<pre>
5 4 * u.
5 4 - u.
7 3 / u.
</pre>

Interessanter wird das ganze natürlich bei Rechnungen, die man nicht
so ohne weiters im Kopf ausrechnen kann:

<pre>
12345 67890 * u.
</pre>

Man kann auch komplexere Rechnungen durchführen:

<pre>
4 2 3 * + u.
4 2 + 3 * u.
</pre>

Wie man sieht, braucht man bei der Postfix-Notation im Gegensatz zur
Infix-Notation keine Klammern und auch keine Präzendenzregeln
("Punktrechnung vor Strichrechnung") um die Reihenfolge der Auswertung
festzulegen.  Programmiersprachen mit Infix-Notation (wie Java) sind
aber trotzdem populärer.

<h1>10.3.2014</h1>

<h2>Noch einmal Zahlendarstellung</h2>

<p>Warum sprechen wir davon, dass #33, $21, und %100001 nur
verschiedene Darstellungen derselben Zahl sind und nicht verschiedene
Zahlen?  Weil sich diese Zahl mathematisch gleich verhält, egal wie
sie eingegeben wurde.  Z.B.:

<pre>
#33 2 * u.
$21 2 * u.
%100001 2 * u.
</pre>

Dieses Prinzip, dass wir Daten verschieden darstellen können, dass sie
sich aber gleich verhalten, wird uns später bei den abstrakten
Datentypen noch einmal begegnen.

<p>In der Hardware werden die Zahlen binär dargestellt, aber davon
merken wir bei den bisher verwendeten Rechenoperationen normalerweise
nichts.  Allerdings haben die Zahlen in Forth (wie auch in den meisten
anderen maschinennahen Programmiersprachen) eine begrenzte Größe, und
wenn die Grenze erreicht wird, macht sich die binäre Natur schon
bemerkbar:

<pre>
4294967295 u.
4294967295 1 + u.
18446744073709551615 u.
18446744073709551615 1 + u.
</pre>

Wenn Ihr Gforth-System ein 32-bit-System ist, bewirkt schon die erste
Addition einen Überlauf, bei einem 64-bit-System erst die zweite.  Im
Dezimalsystem sieht man den Zahlen das nicht auf den ersten Blick an,
aber in der Binärdarstellung und Hexadezimaldarstellung sieht man die
Besonderheit:

<pre>
4294967295 #2 base ! u. #10 base !
18446744073709551615 #2 base ! u. #10 base !
4294967295 hex.
18446744073709551615 hex.
</pre>

Die Zahl besteht aus lauter Einsen, wenn man 1 dazuzählt, ergibt sich
mathematisch (ohne Überlauf) die Zahl
%100000000000000000000000000000000 (alias $100000000)
bzw. %10000000000000000000000000000000000000000000000000000000000000000
(alias $10000000000000000), die nicht mehr in 32 Bits bzw. 64 Bits
hineinpasst.

<p>Bei arithmetischem Überlauf werden in Forth (und in den meisten
maschinennahen Sprachen) die vorderen Stellen einfach abgeschnitten.
Das entspricht mathematisch der Operation modulo 2<sup>32</sup>
bzw. 2<sup>64</sup>.  Wenn man unbegrenzte Zahlen erwartet, ist dieses
Verhalten unerwünscht und führt zu Fehlern, aber es kann auch
nutzbringend eingesetzt werden.

<h2>Negative Zahlen</h2>

Betrachten wir die Subtraktion

<pre>
0 1 - u.
</pre>

dann erscheint als Ausgabe die uns von vorhin bekannte größte
darstellbare Zahl.  Auch beim Unterlauf erfolgt die Operation modulo
2<sup>n</sup>.  Wir können dieses Bitmuster aber auch als negative
Zahl interpretieren:

<pre>
0 1 - .
</pre>

Welche Interpretation wir verwenden, drücken wir in Forth dadurch aus,
welches Wort wir verwenden: Wenn wir ein Bitmuster als vorzeichenlose
ganze Zahl interpretieren und ausgeben wollen, verwenden
wir <code>u.</code>, wenn wir es als vorzeichenbehaftete Zahl
interpretieren wollen, verwenden wir <code>.</code>.

<p>In Forth ist es dem Programmierer überlassen, das Programm so zu
schreiben, dass die Bitmuster sinnvoll interpretiert werden.  Die
meisten anderen Programmiersprachen haben ein Typsystem, das auf
dieser Ebene eine konsistente Interpretation sicherstellt; allerdings
kann das Problem auf höherer Ebene durchaus auch bei
Programmiersprachen mit Typsystemen auftreten.

<p>Äquivalenz von -1 zur größten darstellbaren vorzeichenlosen Zahl
ergibt sich aus der Äquivalenz bei der Modulo-Arithmetik:

<p>-1 = 2<sup>n</sup>-1 (mod 2<sup>n</sup>)

<p>bzw. allgemeiner

<p>-m = 2<sup>n</sup>-m (mod 2<sup>n</sup>)

<p>Bei vorzeichenlosen n-Bit-Zahlen ist die kleinste klarerweise 0,
und die größte 2<sup>n</sup>-1.  Bei vorzeichenbehafteten Zahlen
interpretiert man alle Zahlen, bei denen das höchstwertigste Bit 1
ist, als negativ, und alle, bei denen dieses Bit 0 ist, als >=0; das
höchstwertige Bit wird daher auch Vorzeichen-Bit (Sign-Bit) genannt.
Die kleinste vorzeichenbehaftete n-Bit-Zahl ist -2<sup>n-1</sup>, die
größte 2<sup>n-1</sup>-1.

<p>Man kann die Arithmetik modulo 2<sup>n</sup> auch als Zahlenkreis
sehen.  Hier ein Beispiel für 4-bit Zahlen:

<p><img src="zahlenkreis.png">

<p>Bei vorzeichenlosen Zahlen findet ein Über- oder Unterlauf statt, wenn die
grüne Linie überschritten wird, bei vorzeichenbehafteten Zahlen, wenn
die rote Linie überschritten wird.

<p>Diese Darstellung der negativen Zahlen heißt
Zweierkomplement-Darstellung, und die hat sich gegenüber anderen
Darstellungen durchgesetzt, weil man dafür die gleichen
Modulo-Arithmetik-Operationen für Addition, Subtraktion, und
Multiplikation verwenden kann wie bei vorzeichenlosen Zahlen.
Dementsprechend gibt es in Forth nur ein +, -, * für beide Arten von
Zahlen.

<p>Wenn wir diese Idee auf unser Dezimalsystem übertragen, dann würden
wir nur Zahlen mit bis zu n Stellen darstellen und innerhalb dieser
Zahlen modulo 10<sup>n</sup> rechnen; nehmen wir als Beispiel n=3,
also vorzeichenlose Zahlen von 0 bis 999.  Dann legen wir fest, dass
wir bei der Verwendung als vorzeichenbehaftete Zahlen die Zahlen 500
bis 999 als negativ betrachten (um den eigentlichen Wert zu bekommen,
müssten wir einfach 1000 abziehen, 899 würde also in konventioneller
Schreibweise -101 entsprechen).  Wir schreiben sie aber weiterhin als
500...999 hin, dann brauchen wir keine Sonderregeln für das Addieren,
Subtrahieren, und Multiplizieren dieser Zahlen.

<p>Umgekehrt können wir uns überlegen, unsere übliche Darstellung
negativer Zahlen auf den Computer zu übertragen, nämlich die absolute
Größe der Zahl (dargestellt wie bei vorzeichenlosen Zahlen) mit einem
Vorzeichen zu kombinieren; diese Darstellung
heisst <em>sign-magnitude</em>.  Da wir auf dieser Darstellung nicht
mit Modulo-Arithmetik arbeiten können, stellen wir sie als Linie und
nicht als Kreis dar:

<p><img src="sign-magnitude.png">

<p>Der Nachteil dieser Darstellung ist, dass man für die Addition,
Subtraktion, und Multiplikation eigene Befehle braucht, die sich von
denen für vorzeichenlose Zahlen unterscheiden.  Wenn Sie zum Beispiel
1001 und 0010 als sign-magnitude-Zahlen addieren, soll 0001
herauskommen, bei der vorzeichenlosen (und 2er-Komplement) Addition
dagegen 1011.  Auch bei anderen Operationen ergeben sich durch die
Zweierkomplement-Darstellung Vorteile.

<p>Allerdings hat die Sign-Magnitude-Darstellung, wie sie (ausserhalb
von Computern) üblich ist, auch ihre Vorteile: So ist die übliche
Zahlendarstellung nicht auf eine bestimmte Anzahl von Stellen
festgelegt (wobei in Computern auch bei der
Darstellung <a href-"http://en.wikipedia.org/wiki/Arbitrary-precision_arithmetic">beliebig
großer ganzer Zahlen</a> die Zweierkomplementdarstellung dominiert).

<p>Welche allgemeine Lehre kann man daraus ziehen: Die naheliegende
Lösung ist nicht immer die beste.  Andererseits: Man kann beim Abwägen
verschiedener Lösungen viel Zeit verschwenden; oft ist es besser,
irgendeine Lösung morgen zu haben, als die optimale Lösung in einer
Woche.  Es hat mehrere Jahrzehnte gedauert, bis sich die
Zweierkomplementdarstellung durchgesetzt hat.

<h2>Lokale Variablen</h2>

Wir können leicht ein Forth-Wort schreiben, das drei Werte addiert:

<pre>
: sum-of-3 + + ;
1 2 3 sum-of-3 .
</pre>

Was wir noch nicht können, ist einen übergebenen Wert mehrfach zu
verwenden.  Wenn wir zum Beispiel eine Zahl quadrieren wollen indem
wir sie mit sich selbst multiplizieren, müssen wir sie bis jetzt zwei
mal hinschreiben; wenn man einen Wert viele male braucht, ist das
nicht praktikabel.  Stattdessen merken wir uns den Wert in
einer <em>lokalen Variable</em>, die wir dann beliebig oft verwenden
können:

<pre>
: squared { n } n n * ;
5 squared .
</pre>

Hier wird im Wort <code>squared</code> die lokale Variable n mit Hilfe
von <code>{ n }</code> definiert, und später wird sie verwendet.  Bei
der Ausführung von <code>squared</code> wird an der Stelle der
Definition ein Wert vom Stack genommen (und in der lokalen Variable
gespeichert).  Die Verwendung von n legt diesen Wert dann auf den
Stack.  Am Ende von <code>squared</code> verschwindet die lokale
Variable.

<p>Betrachten wir einen kompliziereren Fall:

<pre>
: squared { n } n n * ;
: foo { n } n squared squared n * ;
3 foo .
</pre>

Was berechnet foo?  Welchen Wert hat n an welcher Stelle?  Insbesondere:
Welchen Wert hat das letzte Vorkommen von n in foo?

<p>Squared und foo haben jeweils ihr eigenes n; tatsächlich hat sogar
jeder Aufruf von squared und foo eigene Exemplare (in
Informatiksprech: Instanzen) von n.  Das heißt, n hat in foo den Wert
3, bei jeder Verwendung.  Beim ersten Aufruf von squared hat n
ebenfalls den Wert 3; dieser Aufruf legt 9 auf den Stack, und dieser
Wert wird dann im zweiten Aufruf von squared in n gespeichert; n hat
also im zweiten Aufruf von squared den Wert 9.  Der zweite Aufruf legt
81 auf den Stack; danach wird wieder das n von foo, also 3, auf den
Stack gelegt, und mit 81 multipliziert; Ergebnis: 243.  Man kann sich
allgemein überlegen, dass foo den Wert
(n<sup>2</sup>)<sup>2</sup>*n=n<sup>5</sup> berechnet.

<p>Praktisch alle Programmiersprachen haben lokale Variablen, die sich
so verhalten.

<h1>13.3.2014</h1>


<h2>Kontrollstrukturen</h2>

<h3>Zählschleifen</h3>

Jetzt, da wir in Forth mit Zahlen umgehen können, können wir auch das
Bart-Simpson-Problem besser lösen:

<pre>
: bart cr ." I will not do anything bad ever again." ;
: tafel 20 0 ?do bart loop ;
</pre>

<code>?do <em>Schleifenrumpf</em> loop</code> nimmt zwei Werte (das
Limit, hier 20, und der Startwert, hier 0) vom Stack und
führt <code><em>Schleifenrumpf</em></code> d mal aus, wobei d die
Differenz der beiden Werte ist.

<p>Dabei kann man mit <code>i</code> den Schleifenzähler abfragen:

<pre>
: test ?do i . loop ;
10 0 test
5 3 test
</pre>

Beim ersten Durchlauf (<em>Iteration</em>) ist der Schleifenzähler gleich dem
Startwert, wenn das Limit erreicht ist, wird die Schleife nicht mehr
durchlaufen.  <code>I</code> verhält sich dabei ähnlich wie eine
lokale Variable (auch wenn es einige Unterschiede gibt).  Hier eine
Anwendung:

<pre>
: fac { n } n n 1 ?do i * loop ;
5 fac .
</pre>

Wobei dieses Programm verständlicher wird, wenn man es etwas
umformattiert und etwas dokumentiert:

<pre>
: fac { n -- n! }
  n
  n 1 ?do ( n1 )
    i *
  loop ;
5 fac .
</pre>

In diesem Programm ist im Gegensatz zu den bisherigen der Stack nicht
leer, wenn ein Schleifendurchlauf beginnt und endet, was das
Verständnis etwas erschwert.  Daher dokumentieren wir den Inhalt des
Stack am Anfang eines Durchlaufs mit dem Kommentar <code>( n1
)</code>.

<p>Und wenn wir schon dabei sind, dokumentieren wir auch noch den
<em>Stack-Effekt</em> der gesamten Definition.  Traditionell macht man
das in Forth mit Kommentaren wie <code>( n -- n! )</code> (mit runden
Klammern); vor <code>--</code> schreibt man die Stack-Elemente, die
das Wort vom Stack nimmt, hinter <code>--</code> die Stack-Elemente,
die das Wort auf den Stack legt.

<p>Da die Definition von lokalen Variablen oft am Anfang der
Wort-Definition erfolgt, kann man diese Definition auch als
Stack-Effekt hinschreiben: <code>{ n -- n!  }</code> (mit
geschwungenen Klammern im Gegensatz zu runden), wobei <code>--
n!</code> ignoriert wird.

<p>Die Zeilenumbrüche und Einrückungen sollen die Kontrollstruktur
deutlich machen.  Dabei hat man in der Formattierung in Forth wie in
den meisten Sprachen große Freiheiten, die praktisch immer so genutzt
werden, und das ist auch sehr empfehlenswert.  Einige
Programmiersprachen (z.B. Python) verlangen sogar so eine Einrückung,
um den Geltungsbereich der Kontrollstruktur festzulegen.

<h3>Bedingte Ausführung</h3>

Man kann in Forth auch Vergleiche durchführen:

<pre>
5 3 &lt; .
-5 -3 &lt; .
5 3 u&lt; .
-5 3 u&lt; .
3 3 = .
</pre>

Vergleiche liefern in Forth 0 für "falsch" und -1 für "wahr".  Man
kann auf der Grundlage von Vergleichen unterschiedliche Wörter
ausführen:

<pre>
: max { a b -- c }
  a b &lt; if
    b
  else
    a
  endif ;
3 5 max .
-3 -5 max .

: abs { n -- n1 }
  n
  n 0 &lt; if ( n )
    negate
  endif ;
3 abs .
-3 abs .
</pre>

<code>if <em>then-Zweig</em> else <em>else-Zweig</em> endif</code> nimmt einen
Wert vom Stack.  Ist er 0, wird <em>else-Zweig</em>
bzw. bei Nichtvorhandensein einer <code>else</code>-Klausel gar nichts
ausgeführt, ansonsten <em>then-Zweig</em> (so genannt, weil bei
manchen Sprachen dort ein <code>then</code> steht, wo in Forth
das <code>if</code> steht).  Anschliessend fährt die Ausführung hinter
dem <code>endif</code> fort.

<p><code>negate</code> hat den Stack-Effekt <code>( n -- -n )</code>.

<p>Wenn, wie hier, mehrere lokale Variablen in einer Definition
definiert werden, erhaelt die rechteste definierte lokale Variable den
obersten Wert auf dem Stack, die nächste von rechts den nächsten Wert
auf dem Stack, usw.

<h3>Allgemeine Schleifen</h3>

Man kann die wiederholte Ausführung auch von anderen Bedingungen
abhängig machen als bei Zählschleifen.  Nehmen wir als Beispiel die
Ausgabe der Ziffern einer im Dezimalsystem dargestellten Zahl:

<pre>
: digits ( n -- )
  begin { n }
    n while
      n 10 mod .
      n 10 /
  repeat ;
1234 digits
</pre>

[Hier werden die Ziffern in der umgekehrten Reihenfolge ausgegeben wie
gewöhnlich, und wir verwenden ein Wort zur Ausgabe der Ziffern, das
selbst die komplette Umwandlung machen kann; wir werden diese Makel
später beheben.]

<p>Eine <code>begin <em>Rumpf1</em> while <em>Rumpf2</em>
repeat</code> Schleife führt zunächst <em>Rumpf1</em> aus.
Das <code>while</code> nimmt einen Wert vom Stack; ist er 0
(<em>Abbruchbedingung</em>), wird die Ausführung der Schleife
hinter <code>repeat</code> fortgesetzt; ansonsten
wird <em>Rumpf2</em> ausgeführt, und dann beginnt die Ausführung der
Schleife von vorne.

<p><code>mod ( n1 n2 -- n3 )</code> berechnet den Rest der Division
von n1 durch n2 (Modul).

<h1>17.3.2014</h1>

<h4>Endlosschleifen und Vorbedingungen</h4>

... sind meist unerwünscht.  Normalerweise möchte man, dass die
Schleife irgendwann endet (<em>Termination</em>).  Um das
sicherzustellen, muss man sich in jeder Iteration der Abbruchbedingung
nähern.  In obigem Beispiel muss sich n in jeder Iteration an 0
annähern.  Das ist der Fall, wenn man einen positiven Wert
an <code>digits</code> übergibt.

<p>Bei einem negativem Parameter ist das allerdings nicht der Fall:
Gforth rundet bei der ganzzahligen Division in Richtung
-&infin;. <code>-1 10 /</code> ergibt -1, und alle negativen Zahlen
erreichen bei wiederholter Division durch 10 irgendwann -1, und
daraufhin wiederholt sich die Schleife endlos (Abbruch in Gforth mit
Ctrl-C).

<p>Um <code>digits</code> also so aufzurufen, dass es terminiert, muss
der Wert auf dem Stack also &ge;0 sein.  Das ist
die <em>Vorbedingung</em> für die Schleife und
für <code>digits</code>.  Wir werden uns später noch eingehender mit
Vorbedingungen beschäftigen.

<p>Termination ist in der theoretischen Informatik ein wichtiges
Thema: Man kann kein Programm schreiben, das von einem beliebigen
Programm feststellt, ob es terminiert oder nicht
(<em>Entscheidbarkeit</em>).

<p> In der Praxis ist Termination aber normalerweise kein großes
Problem; die Fälle, die in der Theorie Schwierigkeiten machen,
vermeidet man im Normalfall, und in den meisten Fällen ist es recht
einfach, festzustellen, dass man sich der Abbruchbedingung nähert (der
Fall oben ist schon relativ kompliziert).  Dass der Rest der Schleife
das tut, was man gerne hätte, ist in den meisten Fällen schwieriger
hinzubekommen.

<p>Aber auch wenn es nicht sehr schwer ist, muss man es trotzdem
machen, zum Beispiel beim Test; auch wenn Sie die Aufgabe nicht
komplett hinbekommen, werden Sie für eine Schleife, die endet, mehr
Punkte bekommen als für eine Endlosschleife, zumindest wenn die
Schleife mit der Problemstellung zu tun hat.

<h3>Beispiel Kontrollstrukturen</h3>

Betrachten wir die Folge:<br>
x<sub>n+1</sub> = 3 x<sub>n</sub>+1, wenn x<sub>n</sub> ungerade<br>
x<sub>n+1</sub> = x<sub>n</sub>/2, wenn x<sub>n</sub> gerade

<p>Es ist nicht offensichtlich, wohin sich die Folge entwickelt.  Wir
könnten das jetzt per Hand für ein paar Werte von x<sub>0</sub>
ausrechnen, aber das ist auf die Dauer etwas langwierig, also
schreiben wir ein Programm dafür.  Zunächst die Berechnung des
nächsten Elements der Folge:

<pre>
: step { xn -- xn1 }
  xn 2 mod 0 = if
    xn 2 /
  else
    xn 3 * 1 +
  endif ;
13 step .
</pre>

Jetzt können wir uns mit einer Zählschleife eine feste Anzahl von
Werten der Folge anzeigen lassen:

<pre>
: steps ( x0 k -- )
  0 ?do { xn }
    xn .
    xn step
  loop drop ;
13 20 steps
9 20 steps
7 20 steps
</pre>

Es schaut so aus, als ob die Folge bei x<sub>0</sub>&ge;1 irgendwann
den Zyklus 4 2 1 erreicht.  Ist dieser Zyklus erreicht, so bleibt die
Folge in dem Zyklus.  Wir können jetzt eine allgemeine Schleife
schreiben, die sich so lange wiederholt, bis 1 erreicht ist:

<pre>
: steps-to-1 ( x0 -- )
  begin { xn }
    xn 1 &lt;&gt; while
      xn .
      xn step
  repeat ;
7 steps-to-1
</pre>

Das ist möglicherweise eine Endlosschleife; wir wissen ja nicht, ob
jede Folge irgendwann 1 erreicht.  Aber da der Zweck dieses Programms
die Erkundung ist und nicht das Lösen eines gegebenen Problems, ist
das hier akzeptabel.

<h2>Traces</h2>

<p>Üblicherweise betrachtet man das Verhalten zur Laufzeit, indem man
einfach die Schritte des Programms durchgeht; "Debugger" verfügen
üblicherweise über eine Step-Funktion, die einem dabei unterstützt
(von deren Verwendung ich aber in den meisten Fällen abrate, weil es
wesentlich effektivere Methoden gibt, um Fehler zu lokalisieren).

<p>Aber man kann die ausgeführten Schritte auch hinschreiben, und
erhält so einen <em>Trace</em>.

<p>Als einfaches Beispiel betrachten wir einen Trace zu einem
einfachen Programm:

<pre>
: bla 1 - 3 * ;
: blub 2 * bla 3 bla + ;
</pre>

Der Trace für <code>5 blub .</code> ist:

<pre>
5 2 * 1 - 3 * 3 1 - 3 * + .
</pre>

In diesem Trace und in den folgenden ist der Kontrollfluss
(z.B. Aufrufe und die Rückkehr von Aufrufen) weggelassen, da der ja
schon in den im Trace vorkommenden Worten widergespiegelt ist.

<p>Betrachten wir als nächstes Beispiel:

<pre>
: squared { n } n n * ;
: foo { n } n squared squared n * ;
3 foo .
</pre>

Hier stellen wir den Anfang und das Ende des Sichtbarkeitsbereichs von
lokalen Variablen (der hier mit den Aufrufem und der Rückkehr von den
Aufrufen übereinstimmt) mit <code>( )</code> dar, weil das nötig ist,
um zu erkennen, welche Verwendung von n zu welcher Definition gehört.

<pre>
3 ( { n } n ( { n } n n * ) ( { n } n n * ) n * ) .
</pre>

Leider kann man diese Sequenz nicht direkt in Forth verarbeiten, weil
lokale Variablen nur in Definitionen funktionieren (und die Klammern
in Forth eine andere Bedeutung haben).  Wir können die lokalen
Variablen auch auflösen, dann erhalten wir eine ausführbare Sequenz:

<pre>
3 ( { n } n ( { n } n n * ) ( { n } n n * ) n * ) .
3   drop  3   drop  3 3 *     drop  9 9 *   3 *   .
</pre>

<code>Drop</code> entfernt das oberste Element des Stacks.

<p>Etwas interessanter wird das Ganze, wenn Kontrollstrukturen in's Spiel
kommen:

<pre>
13 steps-to-1
 4 steps-to-1
</pre>

Wir zeigen im folgenden die Kontrollflusswörtern <code>if
while</code>, weil sie neben ihrer Kontrollflussfunktion einen Wert
vom Stack nehmen (was im Trace äquivalent zu <code>drop</code> ist).

<pre>
13
( { n } n 1 <> while n . n ( { n } n 2 mod 0 = if n 3 * 1 + ) )
( { n } n 1 <> while n . n ( { n } n 2 mod 0 = if n 2 / ) )
( { n } n 1 <> while n . n ( { n } n 2 mod 0 = if n 2 / ) )
( { n } n 1 <> while n . n ( { n } n 2 mod 0 = if n 2 / ) )
( { n } n 1 <> while n . n ( { n } n 2 mod 0 = if n 3 * 1 + ) )
( { n } n 1 <> while n . n ( { n } n 2 mod 0 = if n 2 / ) )
( { n } n 1 <> while n . n ( { n } n 2 mod 0 = if n 2 / ) )
( { n } n 1 <> while n . n ( { n } n 2 mod 0 = if n 2 / ) )
( { n } n 1 <> while n . n ( { n } n 2 mod 0 = if n 2 / ) )
( { n } n 1 <> while )
.

4
( { n } n 1 <> while n . n ( { n } n 2 mod 0 = if n 2 / ) )
( { n } n 1 <> while n . n ( { n } n 2 mod 0 = if n 2 / ) )
( { n } n 1 <> while )
.
</pre>

Hier sehen, wir, dass ein Programm zur Laufzeit meist verschiedene
Abläufe abhängig von der Eingabe hat, und dass schon kurze Läufe viele
Schritte ausführen können.  Ein Fehler kann in einem Lauf (mit einer
Eingabe) auftreten und in einem anderen (mit anderer Eingabe) nicht.

<p>Es ist daher oft nicht zielführend, über ein Programm nur anhand eines
konkreten Laufs bzw. Traces nachzudenken.

<h2>Statisch und dynamisch</h2>

<p>Daher sollte man zusätzlich von diesen verschiedenen Abläufen
abstrahieren und gemeinsame Eigenschaften über alle Läufe erkennen.
Bzw. umgekehrt das Programm so schreiben, dass man mit einer
Beschreibung wichtige Eigenschaften aller Läufe erfasst.

<p>Die Repräsentation des Programms über alle Abläufe ist der Text des
Programms (auch <em>Quelltext</em>, <em>Quellcode</em> oder <em>Source
code</em> genannt), daher geht man bei solchen Beschreibungen mit dem
Programmtext.

Da der Programmtext feststeht, nennt man so eine
Beschreibung <em>statisch</em>, während eine Betrachtung, die sich auf
einen konkreten Lauf bzw. Eigenschaften zur Laufzeit
bezieht, <em>dynamisch</em> genannt wird.  Im folgenden sehen wir
einige Beispiele, und das Thema wird uns auch im Rest des Semesters
begleiten.


<h3>Stacktiefe</h3>

<p>In Forth ist es zum Beispiel im Prinzip möglich, dass ein Wort zur
Laufzeit einen beliebigen, stark von den Eingabedaten abhängigen
Stack-Effekt hat (also einen dynamischen Stack-Effekt).  Allerdings
kann man solche Wörter nicht vernünftig einsetzen und Programme mit
solchen Wörtern nur schwer, wenn überhaupt, verstehen.  Daher sind
solche Wörter und Programme in Forth unüblich.  Die Stack-Tiefe ist
normalerweise an einer bestimmten Stelle immer gleich, egal auf
welchem Weg diese Stelle erreicht wurde; und selbst bei den wenigen
Ausnahmen davon kommen nur Dinge vor, die man auf einer höheren Ebene
wieder statisch verstehen kann.

<p>Das spiegelt sich auch in der Dokumentation wieder:

<pre>
: fac { n -- n! }
  n
  n 1 ?do ( n1 )
    i *
  loop ;
5 fac .
</pre>

Hier sagt der Kommentar <code>( n1 )</code>, dass an dieser Stelle
genau ein Element über dem Grundniveau auf dem Stack liegt, egal mit
welchem Parameter <code>fac</code> aufgerufen wird und wie oft die
Schleife durchlaufen wird (das Grundniveau sind die Elemente auf dem
Stack, die von fac nicht berührt werden sollen, die also unter dem
Parameter n auf dem Stack liegen).

<p>Man kann das auch an den anderen Beispielen sehen, die wir bisher
gesehen haben:

<p>Bei Schleifen ist der Rumpf so gestaltet, dass die
Stacktiefe am Anfang und am Ende des Rumpfs gleich sind.  Wenn man
einen Wert auf dem Stack bearbeiten will, muss man ihn schon vor der
Schleife drauflegen, wie bei <code>fac</code> geschehen, und
ggf. nachher wieder entfernen.

<p>Bei bedingter Ausführung muss der then-Zweig den selben Effekt auf
die Stack-Tiefe haben wie der else-Zweig. Wenn es keinen else-Zweig
gibt, darf der then-Zweig die Tiefe nicht ändern.

<p>Betrachten wir als Beispiel

<pre>
: abs { n -- n1 }
  n
  n 0 &lt; if ( n )
    negate
  endif ;
</pre>

Hier haben wir einen then-Zweig, der die Stack-Tiefe nicht ändert,
dafür mussten wir das eventuell negierte n schon deutlich früher auf
den Stack legen.  Eine andere Lösung wäre:

<pre>
: abs { n -- n1 }
  n 0 &lt; if ( n )
    n negate
  else
    n
  endif ;
</pre>

Da hier im then-Zweig etwas auf den Stack gelegt wird, brauchen wir
auch einen else-Zweig, der etwas auf den Stack legt.  Falsch wäre:

<pre>
: abs { n -- n1 } \ falsch!
  n 0 &lt; if
    n negate
  endif ;
</pre>

Allerdings merken Sie diesen Fehler in Forth erst beim Testen:

<pre>
-5 abs .
5 abs .
</pre>

<p>Die Stack-Tiefe ist nur ein Beispiel.  Auch wenn die meisten
anderen Programmiersprachen keinen expliziten Stack haben und diese
spezielle Eigenschaft dort keine Rolle spielt, es gibt immer eine
Menge Eigenschaften, die man statisch verstehen möchte, und wir werden
noch weitere Beispiele sehen.

<h3>Invarianten</h3>

Eine Invariante ist eine Eigenschaft, die an einer bestimmten Stelle
immer gilt (dort also nicht variiert), wenn die Vorbedingung erfüllt
ist.  Invarianten sind nützlich, um korrekte Programme zu schreiben.
Die Stack-Tiefe ist ein einfaches Beispiel einer Invariante.
Besonders wichtig sind Invarianten in Schleifen, da man ja dort
sonst über eine im Wesentlichen unbegrenzte Anzahl möglicher
Durchläufe nachdenken muss.

<p>Schauen wir uns noch einmal unser fac-Beispiel an:

<pre>
: fac { n -- n! }
  n
  n 1 ?do ( n1 ) \ n1 = (i-1)!*n
    i *   ( n2 ) \ n2 = i!*n
  loop    ( n3 ) \ n3 = (n-1)!*n = n!
  ;
</pre>

Hier haben wir Kommentare wie <code>( n2 ) \ n2 = i!*n</code>
geschrieben.  

<p>Den ersten Teil <code>( n2 )</code> haben wir schon besprochen.
Dieses sogenannte Stack-Bild kann man auch als Invariante über die
Stack-Elemente sehen.

<p>Der Kommentar dahinter, der mit
<code>\</code> eingeleitet wird, ist eine Invariante bezüglich des
Wertes von n2.

<h1>20.3.2013</h1>

<h2>Erstellen einer Schleife</h2>

Zum Erstellen einer Schleife gibt es wie zum Programmieren allgemein
kein Patentrezept, aber doch einige wichtige Prinzipien, die sie hier
lernen; und zusätzlich brauchen Sie noch viel Übung.

<p>Betrachten wir noch einmal das Wort <code>fac</code>.  Wie bin ich
dazu gekommen, und gibt es noch andere Möglichkeiten?

<p>Fangen wir mit der mathematischen Formel an:<br>
n!=1*2*3*...*n

<p>In Postfix-Syntax ist das:<br>
1 2 * 3 * ... n *

<p>Das kann man jetzt als gewünschten Trace auffassen.  Die
aufsteigende Folge von Zahlen legt die Verwendung einer Zählschleife
nahe, wobei die Zahlen direkt über den Zähler i generiert werden
können.  Dann hätten wir also den Schleifenrumpf <code>i *</code>
bzw. die Schleife (ohne Parameter):

<pre>
?do
  i *
loop
</pre>

Im Schleifenrumpf legt <code>i</code> ein Element auf den
Stack, <code>*</code> nimmt 2 Elemente vom Stack und legt wieder eines
drauf.  Die Stacktiefe ändert sich also im Schleifenrumpf nicht, in
dieser Hinsicht ist die Schleife schon einmal in Ordnung.  Allerdings
muss schon vor dem Schleifenrumpf ein Element auf dem Stack liegen,
was wir mit einem Stack-Bild ausdrücken:

<pre>
?do ( n1 )
  i *
loop
</pre>

Wenn wir <code>i</code> von 2 bis n gehen lassen wollen, dann müssen
wir die Schleifenparameter so hinschreiben:

<pre>
: fac { n -- n! }
  ...
  n 1 + 2 ?do ( n1 )
    i *
  loop
  ... ;
</pre>

Aus der obigen Postfix-Formel haben wir "1" noch nicht in dem Programm
untergebracht, das ist ein naheliegender erster Wert für n1:

<pre>
: fac { n -- n! }
  1
  n 1 + 2 ?do ( n1 )
    i *
  loop
  ... ;
</pre>

Müssen wir noch etwas machen?  Überlegen wir uns
Schleifeninvarianten:

<pre>
: fac { n -- n! }
  1
  n 1 + 2 ?do ( n1 ) \ n1 = 1*2*..*(i-1)=(i-1)!
    i *       ( n2 ) \ n2 = 1*2*..*i    = i!
  loop ;
</pre>

Da der letzte Wert von i=n ist, haben wir am Ende n! auf dem Stack,
wir brauchen also nichts weiter machen.

<p>Allerdings ist die Vorbedingung dieser Schleife n&ge;1, da sonst
die Grenze der Zählschleife kleiner ist als der Startwert.  Wir können
den Startwert allerdings auch auf 1 setzen.  Das bewirkt in den
meisten Fällen einen zusätzlichen Schleifendurchlauf, der <code>1
*</code> bewirkt, was auf das Ergebnis keinen Einfluss hat.  Im Fall
n=0 sorgt er dafür, dass die Schleife nicht ausgeführt wird und das
Ergebnis gleich 1 ist (entsprechend 0!=1, wie in der Methematik
definiert):

<pre>
: fac { n -- n! }
  1
  n 1 + 1 ?do ( n1 ) \ n1 = 1*1*2*..*(i-1)=(i-1)!
    i *       ( n2 ) \ n2 = 1*1*2*..*i    = i!
  loop ;
</pre>

Früher haben wir die folgende Variante gesehen:

<pre>
: fac { n -- n! }
  n
  n 1 ?do ( n1 ) \ n1 = (i-1)!*n
    i *   ( n2 ) \ n2 = i!*n
  loop    ( n3 ) \ n3 = (n-1)!*n = n!
  ;
</pre>

Hier wird die Multiplikation mit n in der Schleife eliminiert, indem
wir am Anfang n statt 1 auf den Stack legen.  Man erspart sich dadurch
das <code>1 +</code> beim Berechnen der Schleifenparameter.
Allerdings hat diese Variante auch n&ge;1 als Vorbedingung.

<p>Auf diese Schleife bin ich gekommen, indem ich mir wie oben den
Schleifenrumpf überlegt habe.  Bei den Schleifenparametern bin ich
zunächst von n 0 ausgegangen, denn das ist für Zählschleifen der
Normalfall in Forth; allerdings würde das f0*0*1*..*(n-1) ergeben (f0
ist Anfangswert), wobei 0 schon einmal unerwünscht ist.  Das habe ich
korrigiert, indem ich n 1 als Schleifenparameter gewählt habe, macht
f0*1*..*(n-1)=f0*(n-1)!.  Dann kam die Idee, dass ich mit f0=n zu
meinem gewünschten Resultat käme.  Den Fall n=0 habe ich mir dabei
offensichtlich nicht überlegt; Fehler an den Grenzen des
Eingabebereichs sind übrigens häufig.

<h2>Korrektheit</h2>

<h3>Beweisen?</h3>

Wie ermitteln wir, ob das Programm tut, was wir von ihm erwarten?  Ein
Ideal ist es, die Korrektheit des Programmes formal (mathematisch) zu
beweisen.  Um das tun zu können, müssen wir aber auch formal
hinschreiben, was wir uns vom Programm erwarten (<em>formale
Spezifikation</em>).

<p>Das geht für Programme mit mathematischer Aufgabenstellung wie
unser fac-Beispiel recht gut; im Allgemeinen ist es aber sehr
aufwendig, ein größeres Programm formal zu spezifizieren, und dann die
Übereinstimmung des Programms mit der Spezifikation zu beweisen.

<p>Und dabei ist die Frage: Beschreibt die formale Spezifikation das,
was wir von dem Programm erwarten?  Auch in der Spezifikation können
Fehler vorkommen.

<p>Es gibt durchaus einige Bereiche, in denen formale Methoden
erfolgreich verwendet werden, aber meistens überprüft man damit nur
einen Teil der Eigenschaften, die wir vom Programm erwarten, und zwar
die, die mit formalen Methoden gut und verständlich spezifiziert und
überprüft werden können, und die mit anderen Methoden schlecht zu
überprüfen sind.  Ein berühmtes Beispiel ist die Überprüfung von
Windows-Treibern auf Fehler durch gleichzeitige Ausführung (z.B. auf
mehreren Kernen eines Multi-Core-Prozessors); Microsoft stellt ein
Werkzeug zur Verfügung, um die Abwesenheit solcher Fehler formal zu
beweisen.  Das beweist noch nicht, dass der Treiber funktioniert wie
erwartet, aber immerhin, dass er eine bestimmte Art von Fehler nicht
hat.

<h3>Testen?</h3>

Die bei weitem gebräuchlichste Methode, um zu ermitteln, ob ein
Programm den Erwartungen entspricht, ist das Testen: Man läßt das
Programm mit einer bestimmten Eingabe laufen, und überprüft, ob die
Ausgabe den Erwartungen entspricht.  Damit hat man ein Indiz, dass das
Programm zumindest für diesen Fall richtig ist (auch wenn das auch
nicht 100% zuverlässig ist), aber leider nur für diesen Fall.

<p>Wir können weitere Eingaben verwenden und die Ausgaben für diese
Eingaben prüfen (weitere <em>Testfälle</em>), und können so das
Vertrauen in die Korrektheit des Programmes steigern.

<p>Ein großer Vorteil solcher Testfälle ist, dass sie (im Vergleich zu
einer formalen spezifikation) relativ leicht verständlich sind, und es
daher seltener vorkommt, dass der Testfall von dem abweicht, was man
vom Programm erwartet.

<p>Damit das möglichst effektiv geschieht, sollte man aber nicht
einfach irgendwelche Testfälle verwenden, sondern mit System vorgehen.

<h4>Coverage</h4>

<p>Ein Grundsatz dabei ist, die Testfälle alle Teile des Codes einmal
ausführen sollten (<em>Coverage</em>).  Ein Testfall kann einen Fehler
in einem Stück Code ja nur dann finden, wenn er es ausführt.

<p>Unser fehlerhaftes <code>abs</code>-Beispiel zeigt, dass das nicht reicht:

<pre>
: abs { n -- n1 } \ falsch!
  n 0 &lt; if
    n negate
  endif ;
-5 abs . .s
</pre>

Hier führt der Testfall jedes Wort in abs aus (<em>statement
coverage</em>), trotzdem wird der Fehler nicht gefunden.  Man muss
also auch Testfälle haben, die Zweige ausführen, die keinen Code
enthalten (<em>branch coverage</em>), in diesem Fall mit "<code>5 abs
.</code>".  Es gibt auch noch
weitere <a href="https://en.wikipedia.org/wiki/Code_coverage">Coverage-Kriterien</a>,
auf die wir hier aber nicht weiter eingehen.

<p>Bei komplexeren Programmen ist es übrigens oft schwierig, 100%
Coverage zu erreichen, da ein Teil des Codes für die Behandlung von
Fehlern da ist, die normalerweise nicht auftreten (z.B. ein Fehler
durch eine kaputte Festplatte), oder nach der aktuellen Programmlogik
gar nicht auftreten können (aber möglicherweise nach Änderungen im
Programm schon).

<h1>24.3.2013</h1>

<h4>Off-by-one Fehler</h4>

<p>Eine häufige Fehlerquelle ist, bei Abfragen für Schleifenenden oder
bedingungte Ausführung auf z.B. n statt auf n+1 oder n-1 abzufragen,
oder <code>&gt;</code> statt <code>&gt;=</code> zu schreiben oder
umgekehrt.  Auf diese sogenannten <em>off-by-one</em>-Fehler können
Sie testen, indem Sie die Testfälle so gestalten, dass sie in dem
Bereich, in dem die Verzweigung in die andere Richtung ausfallen
würde, eben genau die beiden Grenzwerte abtestet.  Bei
unserem <code>abs</code>-Beispiel wären das die Testfälle:

<pre>
0 abs . .s
-1 abs . .s
</pre>

Da der 0-Fall in diesem Fall nicht besonders aussagekräftig ist, würde ich auch noch

<pre>
1 abs . .s
</pre>

hinzufügen.

<p>Wenn wir das <code>fac</code>-Beispiel betrachten, und ein Wort
haben wollen, das auch 0! korrekt berechnet, dann ist ein guter Testfall

<pre>
0 fac . .s
</pre>

Der würde unsere beiden Implementierungen mit der Vorbedingung n&ge;1
sofort als "nicht der Anforderung entsprechend" entlarven.  Weitere
Testfälle für <code>fac</code> wären:

<pre>
1 fac . .s \ weiterer off-by-one Test
3 fac . .s \ passt die Multiplikation?
</pre>

<h4>White Box und Black Box</h4>

Bei den vorherigen Tests haben wir uns zum Großteil am Code
orientiert, um unsere Testfälle zu erstellen (<em>white box</em>
testing).

<p>Man kann die Testfälle auch unabhängig von dem Code schreiben, den
man testen will (<em>black box</em> testing); solche Tests sollten
dann für alle möglichen Programme verwendbar sein, die die
Anforderungen erfüllen.  Teilweise werden sogar die Tests als
(partielle) Spezifikation der Anforderungen entwickelt und vor dem
Programm geschrieben
(<a href="https://en.wikipedia.org/wiki/Test-driven_development">Test-Driven
Development</a>).

<p>Da man Black-Box-Tests nicht auf die konkrete Programmstruktur
abstellen kann, hat man weniger Orientierung, was man Testen soll.
Aber man kann sich an Grenzwerten in der Spezifikation bzw. in den
Anforderungen orientieren; diese werden wohl auch zu Verzweigungen im
Code führen, und dort kann man dann Testfälle um diese Grenzwerte
herumgruppieren.  Bei <code>abs</code> kommen wir dabei auf die
gleichen Testfälle.

<h4>Ausgabe von Tests</h4>

<p>Bisher haben wir bei den Tests nur die Eingabe spezifiziert, und
die Ausgabe dann mit unseren Augen überprüft.  Das ist unpraktisch,
wenn man die Tests mehrfach durchführen will oder unabhängig von den
Programmen den kompletten Testfall hinschreiben will (was besonders
beim Black-box-Testen vorkommt).  Daher gibt es auch Möglichkeiten,
die Ausgabe eines Tests zu spezifizieren.  Wenn Sie Gforth mit

<pre>
gforth test/ttester.fs
</pre>

starten, dann steht ihnen so ein Werkzeug zur Verfügung, wobei
Ausgaben auf dem Stack überprüft werden:

<pre>
t{ -1 abs -> 1 }t
t{ 0 abs -> 1 }t
t{ 1 abs -> 1 }t
</pre>

<h3>Code Review?</h3>

<p>Da auch Testen die Korrektheit nicht beweist, kombiniert man es am
besten mit anderen Methoden, um Fehler zu finden.  Eine gute Ergänzung
zum Testen
ist <a href="https://en.wikipedia.org/wiki/Code_review">Code
Review</a>, wo man den Programmcode mit jemandem zusammen durchgeht,
der ihn nicht geschrieben hat.

<p>In der Lehrveranstaltung Übersetzerbau bewerte ich die abgegebenen
Programme in erster Linie mit (Black-Box-)Tests.  Zusätzlich kommt es
zu einem Gespräch, indem die Studentinnen und Studenten die von ihnen
abgegebenen Programme erklären müssen.  Oft entdecke ich dabei noch
Fehler, die durch die Testfälle nicht aufgedeckt wurden.

<h2>Speicher</h2>

<h3>Bytes und Adressen</h3>

Der bei der Programmierung wichtigste Speicher in einem Computer wird
Hauptspeicher oder RAM genannt.  Der Speicher wird in Gruppen von 8
Bits angesprochen werden, sogenannten <em>Bytes</em>.  Ein Byte kann
256 verschiedene Werte enthalten und man kann darin ein Zeichen aus
dem ASCII-Zeichensatz speichern (der aber keine Umlaute enthält).

<p>Jedes Byte kann einzeln angesprochen werden, es hat
eine <em>Adresse</em>, die natürlich auch wieder ein Bitmuster ist,
das man üblicherweise als vorzeichenlose Zahl interpretiert und oft in
Hexadezimaldarstellung hinschreibt.

<p>Ein Programm, das auf einem Betriebssystem mit Speicherschutz (wie
Linux, Windows, oder MacOS X) läuft, kann nicht auf jede beliebige
Adresse zugreifen, sondern nur auf Speicherbereiche, die das
Betriebssystem dem Programm zur Verfügung stellt.  In Forth können Sie
mit dem Wort <code>c@ ( addr -- c )</code> (ausgesprochen "C-Fetch")
das Byte c von der Adresse addr lesen.  Probieren wir das einmal an
irgendeiner Stelle:

<pre>
1234 c@ .
</pre>

Wenn Ihr Betriebssystem dem Forth-System nicht zufällig den Speicher
an der Adresse 1234 zur Verfügung stellt, sehen Sie eine Fehlermeldung wie

<pre>
:1: Invalid memory address
1234 &gt;&gt;&gt;c@&lt;&lt;&lt; .
Backtrace:
</pre>

Dann hat der Speicherschutz zugeschlagen; in diesem Fall wurde der
Fehler vom Forth-System abgefangen; wenn ein Programm so einen Fehler
nicht abfängt, produziert das Betriebssystem eine Fehlermeldung wie
"Segmentation fault" (Unix) oder "General protection fault"
bzw. "Allgemeine Schutzverletzung" (Windows).

<p>Auf welchen Speicher können wir jetzt zugreifen?  In Forth gibt es
einen großen Speicherbereich namens "Dictionary":

<p><img src="dict-memory.png">

<p>Die konkreten Zahlenwerte für die Adressen variieren von System zu
System und sind hier nur beispielhaft angegeben.  Wir können uns jetzt
die Bytes in diesem Speicherbereich anschauen, z.B.:

<pre>
forthstart c@ .
forthstart 1 + c@ .
</pre>

<p>Das wird auf die Dauer etwas mühsam, aber wir können ja ein Wort
schreiben, das uns das ganze etwas erleichtert.  Da so ein Wort öfters
benötigt wird, gibt es schon so eines in Forth: <code>dump ( addr u --
)</code> zeigt das Byte an Adresse addr und die folgenden, insgesamt u
Bytes (also bis inklusive addr+u-1).  Beispiel (mit Ausgabe):

<pre>
forthstart 80 dump 
7FF262A56030: 30 60 A5 62  F2 7F 00 00 - 65 87 CB BD  52 37 C8 2B  0`.b....e...R7.+
7FF262A56040: B0 72 05 00  00 00 00 00 - 00 00 80 00  00 00 00 00  .r..............
7FF262A56050: 00 40 00 00  00 00 00 00 - 00 40 00 00  00 00 00 00  .@.......@......
7FF262A56060: 00 3C 00 00  00 00 00 00 - 00 3A 00 00  00 00 00 00  .<.......:......
7FF262A56070: 80 06 A6 62  F2 7F 00 00 - D0 E7 A6 62  F2 7F 00 00  ...b.......b....
</pre>

<code>Dump</code> zeigt in jeder Zeile die Adresse des ersten Bytes
der Zeile an (als Hex-Zahl), und danach 16 Bytes auf zwei Arten an:
als Hex-Zahl, und, wenn es ein anzeigbares ASCII-Zeichen ist, als
Zeichen (sonst als .).  Wir sehen also im dump, dass an Adresse
$7FF262A56030 das Byte $30 steht, was der ASCII-Code für das Zeichen
"0" ist; an der nächsten Adresse $7FF262A56031 steht das Byte $60, als
Zeichen "`"; usw.

<p>Der Speicherbereich heißt deswegen Dictionary, weil dort die
Forth-Wörter gespeichert sind.  Wenn wir ein Wort dazufügen, wird es
am Anfang des bisher freien Speichers gespeichert,
und <code>here</code> verschiebt sich:

<pre>
here here
: bart cr ." I will not do anything bad ever again." ;
here cr .s - negate dump
<3> 140141316031200 140141316031200 140141316031368 
7F75315C42E0: D8 27 5C 31  75 7F 00 00 - 04 00 00 00  00 00 00 80  .'\1u...........
7F75315C42F0: 62 61 72 74  20 20 20 20 - AA 43 40 00  00 00 00 00  bart    .C@.....
7F75315C4300: 00 00 00 00  00 00 00 00 - F8 44 40 00  00 00 00 00  .........D@.....
7F75315C4310: D8 22 57 31  75 7F 00 00 - 1B 46 40 00  00 00 00 00  ."W1u....F@.....
7F75315C4320: 50 43 5C 31  75 7F 00 00 - 49 20 77 69  6C 6C 20 6E  PC\1u...I will n
7F75315C4330: 6F 74 20 64  6F 20 61 6E - 79 74 68 69  6E 67 20 62  ot do anything b
7F75315C4340: 61 64 20 65  76 65 72 20 - 61 67 61 69  6E 2E 20 20  ad ever again.  
7F75315C4350: 68 4D 40 00  00 00 00 00 - 28 43 5C 31  75 7F 00 00  hM@.....(C\1u...
7F75315C4360: 68 4D 40 00  00 00 00 00 - 26 00 00 00  00 00 00 00  hM@.....&.......
7F75315C4370: A0 45 40 00  00 00 00 00 - 88 1F 57 31  75 7F 00 00  .E@.......W1u...
7F75315C4380: 5B 45 40 00  00 00 00 00 -                           [E@.....
</pre>
<!-- " -->

Hier sehen wir den Speicher, der vom Wort <code>bart</code> belegt
wird.  Zu erkennen ist dabei der Name des Wortes, und der Text, den
das Wort ausgibt, der Rest besteht aus Verwaltungsinformation für das
Forth-System und aus einer anderen Repräsentation des Programmcodes.
Hier sehen wir schon, dass der Quellcode normalerweise nicht direkt
ausgeführt wird, sondern entweder in Maschinensprache übersetzt
(<em>compiliert</em>) wird, oder zumindest (wie hier) in eine Form,
die relativ schnell ausgeführt werden kann.

<p>Als nächstes wollen wir unseren eigenen Speicherbereich
reservieren, in dem wir tun und lassen können, was wir wollen:

<pre>
here 10 allot constant a
</pre>

Hier reservieren wir uns 10 Bytes mit mit <code>allot ( u -- )</code>,
und speichern die Anfangsadresse dieses Speicherbereichs in einer
Konstante <code>a</code>.  Dabei darf die Definition von a erst nach
dem <code>allot</code> erfolgen, da <code>constant</code> ja selbst
Speicher im Dictionary reserviert und <code>here</code> weiterbewegt:

<pre>
a here a - dump
</pre>

Wir können jetzt Bytes in diesen Bereich schreiben:

<pre>
$25 a c!
$35 a 1 + c!
$45 a 2 + c!
</pre>

... und von dort wieder auslesen:

<pre>
a 1 + c@ hex.
</pre>

bzw. den Speicherbereich anschauen:

<pre>
a 10 dump
</pre>

<code>c!</code> (ausgesprochen "C-Store") hat den Stack-Effekt <code>(
c addr -- )</code> und schreibt das Byte c an die Adresse addr.

<h1>27.3.2014</h1>

<h3>Zellen</h3>

Die heute gebräuchlichen PCs sind 64-bit-Maschinen, Smartphones sind
meist noch 32-bit-Maschinen.  Das heißt, dass eine Adresse 64 bits
bzw. 32 bits Platz braucht.  Bei einer 32-bit-Maschine ist der
Adressraum 4GB; um mehr Speicher direkt (z.B. mit <code>c@</code>)
addressieren zu können, ist man bei PCs seit 2003 und bei Smartphones
seit 2013 auf 64-bit-Maschinen umgestiegen, mit denen Adressräume bis
zu 16 EB (oder 4 Milliarden mal groesser als bei 32-bit-Maschinen)
möglich ist.

<p>Die Größe der Adressen bestimmt auch die Größe der effizient
verarbeitbaren ganzen Zahlen, da mit den Adressen auch gerechnet wird,
wie wir sehen werden.  Diese Größe nennt man in der
Computerarchitektur auch die <em>Wort</em>größe.  Allerdings hat
"Wort" in Forth eine andere Bedeutung, daher verwenden wir in Forth
stattdessen der Begriff <em>Zelle</em> (cell).

<p>[Leider wird "Wort" bzw. "word" auch in den Assemblerhandbüchern
diverser Prozessorhersteller anders verwendet: Es bezeichnet die
Adressgröße des Urahns einer Familie von Prozessoren; so verwendet
Intel (dominant bei PCs) auch auf 64-bit-Prozessoren "Word" für 16
bits, weil der
Urahn <a href="http://de.wikipedia.org/wiki/Intel_8008">8008</a>
Adressen in 16 bits speicherte, während ARM (dominant bei Smartphones)
"Word" für 32 bits verwendet.]

<p>Auf Gforth ist die Zellengröße 64 bits oder 32 bits (wobei der
Windows-Port derzeit ein 32-bit-Programm ist; das läuft auch auf
64-bit-Versionen von Windows, hat aber 32-bit-Zellen und daher nur 4GB
Adressraum).  Sie können sich die Zellengrösse in Bytes mit

<pre>
1 cells .
</pre>

anzeigen lassen.  <code>cells ( n1 -- n2 )</code> multipliziert den
Wert auf dem Stack mit der Anzahl der Bytes pro Zelle.  Wenn wir also
z.B. Speicher für 10 Zellen reservieren wollen, können wir das so
machen:

<pre>
here 10 cells allot constant b
</pre>

Jetzt können wir eine Zelle am Anfang dieses Bereichs speichern:

<pre>
$1234567890abcdef b !
b 1 cells dump
</pre>

<code>! ( x addr -- )</code> ("Store") speichert x an die Stelle addr.
Der Dump auf meinem Computer::

<pre>
7F702E2D72E0: EF CD AB 90  78 56 34 12 -                           ....xV4.
</pre>

Wenig überraschend benötigt die Speicherung mehrere Bytes, und zwar
auf diesem 64-bit-System 8 Bytes.  Das niederwertigste Byte wird an
der niedrigsten Adresse gespeichert, und das höchstwertige an der
höchsten.  Diese Speicherung
heißt <a href="http://de.wikipedia.org/wiki/Byte-Reihenfolge">little-endian</a>.
Wenn wir einen andere Wert in unserem Speicherbereich speichern
wollen, ohne den ersten zu zerstören, müessen wir frühestens 8 Bytes,
also eine Zelle, später beginnen:

<pre>
$fedcba0987654321 b 1 cells + !
b 2 cells dump
b @ hex.
</pre>

<code>@ ( addr -- x )</code> ("Fetch") liest die Zelle an der Adresse
addr und legt den Inhalt auf den Stack.  Wenn wir dagegen versuchen
würden, den zweiten Wert an der Adresse <code>b 1 +</code> zu
speichern, würde der erste Wert teilweise Überschrieben:

<pre>
$1111111111111111 b 1 + !
b 2 cells dump
b @ hex.
</pre>

[Manche Prozessoren können nur auf durch die Zellengröße
teilbare Adressen zellenweise zugreifen
(<a href="http://de.wikipedia.org/wiki/Speicherausrichtung">Ausrichtung</a>
oder Alignment) und liefern in diesem Fall einen Fehler.]

<h3>Arrays und Strings</h3>

Wir sehen also, dass man in einem Speicherbereich mehrere Werte
unterbringen kann, indem man mit Adressen rechnet.  Auf diese Weise
kann man verschiedene Datenstrukturen implementieren.  Beginnen wir
mit Arrays: Wir wollen mehrere gleiche Daten derselben Art speichern,
und über einen Index darauf zugreifen können.

<p>Wenn wir ein Array A von Zellen haben und auf einen Index k
zugreifen möchten, geht das einfach mit

<pre>
      A k cells + @ ( x ) \ Lesen
( x ) A k cells + !       \ Schreiben
</pre>

Bei einem Array B von Bytes geht es noch etwas einfacher:

<pre>
      B k + c@ ( c ) \ Lesen
( c ) B k + c!       \ Schreiben
</pre>

Wobei der Index dabei jeweils bei 0 anfängt; bei einem Array der Größe
n ist der maximale Index n-1.  Wenn wir ein Array mit kleinstem
Index l haben wollen, muss man den Zugriff etwas abwandeln:

<pre>
A k l - cells + \ und jetzt @ oder !
B k l - +       \ und jetzt c@ oder c!
</pre>

Dabei wird nicht überprüft, ob der Index im vorgesehenen Bereich ist;
das muss der Programmierer auf andere Weise sicherstellen.
Versäumnisse in dieser Hinsicht sind eine häufige Fehlerquelle und
auch eine häufige Sicherheitslücke
(insbesondere <a href="http://de.wikipedia.org/wiki/Pufferüberlauf">buffer
overflow attack</a>).  Höherlevelige Programmiersprachen wie Java
überprüfen allerdings den Index beim Arrayzugriff, ein Zugriff
ausserhalb des Arrays kann daher dort nicht vorkommen.

<h1>31.3.2014</h1>

Wenn wir zum Beispiel eine Statistik über die verwendeten druckbaren
ASCII-Zeichen (Wertebereich 32..126) in einem Byte-Array ( addr u )
machen wollen, geht das wie folgt:

<pre>
32 constant hl  \ lower index
127 constant hu \ upper index+1
here hu hl - cells allot constant hist

: inc { addr -- }
  addr @ 1 + addr ! ;

: count-char { c -- }
  c hl &gt= if
    c hu &lt; if
      hist c hl - cells + inc
    endif
  endif ;

: show-hist ( -- )
  hu hl ?do
    cr hist i hl - cells + @ .
    i emit
  loop ;

: count-chars { addr u -- }
  addr u + addr ?do
    i c@ count-char
  loop ;

: char-hist { addr u -- }
  hist hu hl - cells erase \ hist loeschen
  addr u count-chars
  show-hist ;
</pre>

Dabei gibt <code>emit ( c -- )</code> einen Wert als (ASCII-)Zeichen aus.

<p>Wir können dieses Programm mit einer Eingabe wie

<pre>
s" Testeingabe" char-hist
</pre>

testen, wobei <code>S"</code> den Text bis zum <code>"</code> als
Zeichen-Array (String) abspeichert und die Adresse und Länge des
Arrays <code>( addr u )</code> auf den Stack legt.  Dieses Array, und
das Array <code>hist</code> sind in folgender Grafik dargestellt:

<p><img src="char-hist.png">


<p>Als interessantere Eingabe kann man eine ganze Datei verwenden:

<pre>
s" slides.tex" slurp-file char-hist
</pre>

<code>slurp-file ( addr1 u1 -- addr2 u2 )</code> liest den Inhalt der
Datei mit dem durch addr1 u1 angegebenen Namen als großes
Zeichen-Array in den Speicher und legt die Anfangsadresse und Länge
des Arrays auf den Stack.

<p>In obiger Version von <code>count-chars</code> werden die
Start-Adresse und die End-Adresse als Schleifenparameter verwendet,
und <code>i</code> liefert in jeder Iteration die Adresse eines Bytes.
Man kann aber auch einfach von 0 bis zur Länge des Arrays hochzählen,
und die Adressberechnung erst unmittelbar vor dem <code>c@</code>
machen:

<pre>
: count-chars { addr u -- }
  u 0 ?do
    addr i + c@ count-char
  loop ;
</pre>


<p>Wir können jetzt auch das Problem der Ausgabe der Ziffern einer
Zahl in der richtigen Reihenfolge lösen:

<pre>
20 constant d-len
here d-len allot constant d
: digits ( n -- )
  d d-len + 1-
  begin { n d1 }
    n while
      n 10 mod '0 + d1 c!
      n 10 / d1 1 -
  repeat
  d1 d d-len + d1 - type ;
</pre>

<code>type ( addr u -- )</code> gibt einen String
aus.  <code>'0</code> produziert den ASCII-Code von <code>0</code>.
Die Ziffern 0..9 folgen im ASCII-Code unmittelbar aufeinander, sodass
man für einen Zahlenwert &lt;10 einfach den ASCII-Code von 0
dazuzählen kann und den ASCII-Code der entsprechenden Ziffer erhält.
Das kann man sich auch in Forth veranschaulichen:

<pre>
: print-ascii ( u l -- )
  ?do
     i emit
  loop ;
'9 1 + '0 print-ascii
</pre>

Bei <code>digits</code> wird das Array vom Ende her gefüllt, damit die
Zeichen danach in der richtigen Reihenfole für <code>type</code> im
Speicher stehen.

<h1>3.4.2014</h1>

<h2>Dateien und Editoren</h2>

Man kann in Gforth (und anderen interaktiven Systemen) zwar Programme
direkt eingeben und ausführen, aber wenn man ein Programm nicht nur in
einer Sitzung verfügbar haben will, wird man es sinnvollerweise in
einer Text-Datei speichern.

<p>Allgemein werden Dateien verwendet, um Daten über eine Sitzung
hinweg zu speichern, und um Daten von einem Programm zum anderen zu
übertragen; für Datentausch sind Dateien nicht die einzige
Möglichkeit, aber eine sehr gebräuchliche.

<p>Eine Text-Datei enthält nur die einzelnen Zeichen und einige
ASCII-Kontrollzeichen wie CR (ASCII 13), LF (10), oder beides für das
Zeilenende und TAB (9) für die Einrückung.  Text-Dateien können mit
vielen Werkzeugen relativ einfach verarbeitet werden, und sind deshalb
die gebräuchliche Form, Quellcode abzuspeichern, quer über alle
Programmiersprachen.

<p>Text-Dateien werden mit einem Text-Editor geschrieben und
bearbeitet.  Die meisten Programmierer finden irgendwann einmal ihren
Lieblings-Editor, und bleiben dem dann dauerhaft treu.

<p>Ein Unterschied zu einem Textverarbeitungsprogramm ist, dass man
bei der Textverarbeitung das Aussehen des Textes (z.B. Schrift-Art,
Schriftgröße, Dicke, Schrägstellung) bestimmen kann; das muss
mitabgespeichert werden, und daher sind die Dateien, die ein Dokument
einer Textverarbeitung speichern, im Normalfall keine Text-Dateien im
oben genannten Sinn; sie sind normalerweise auch spezifisch für das
Textverarbeitungsprogramm und können nur von wenigen anderen
Programmen bearbeitet werden, wenn überhaupt.  Man kann sich den
Unterschied auch leicht anschauen, wenn man einen kurzen Text mit
einem Text-Editor schreibt und mit einer Textverarbeitung, und sich
dann die Dateigrößen anschaut, und z.B. mit einem Dump-Programm wie
z.B. <code>hd</code> den Inhalt der Dateien.

<p>Viele Editoren bieten spezielle Unterstützung für die
Programmierung, zum Beispiel Einfärben gewisser Elemente (syntax
colouring) oder Unterstützung bei der Einrückung.  Manche Editoren
erlauben den Aufruf des Compilers oder Programmiersystems, oder
anderer Werkzeuge, z.B. Debugger.  Das führt dann zu Integrierten
Entwicklungsumgebungen (integrated developmentenvironments, IDEs) wie
z.B. Eclipse.

<p>Wenn Sie mit einem Editor eine Datei <code>datei.fs</code> erstellt
haben, können Sie sie mit

<pre>
gforth datei.fs
</pre>

ausführen.  Wenn Sie dabei gleich einen Aufruf machen wollen, den Sie
nicht in die Datei hineinschreiben wollen, können Sie den Aufruf auch
auf die Kommandozeile schreiben:

<pre>
gforth char-hist.fs -e 's" slides.tex" slurp-file char-hist bye'
</pre>

Hier sorgt das abschliessende <code>bye</code> dafür, dass Gforth am
Ende verlassen wird, Gforth wird also in diesem Beispiel als
Script-Sprache eingesetzt.

<h2>Debugging</h2>

Mit Testen können wir herausfinden, ob ein Programm als Ganzes für
einen bestimmten Fall das tut, was wir erwarten.  Wenn nicht, sieht
man bei kleinen Programmen dann auch relativ leicht, wo der Fehler
liegt, aber schon bei etwas größeren wie unserem Histogramm-Programm
ist das nicht so einfach, und Debugging-Werkzeuge und -Techniken können
helfen.

<p>Zunächst ist zu bemerken, dass das Histogramm-Programm nicht als
eine große Definition geschrieben wurde, sondern im mehreren
kleineren.  Diese kann man dann einzeln testen, und so schon den
Fehler eingrenzen, und eventuell doch durch Inspektion finden.

<h3>Single-Step</h3>

<p>Wenn das mit der Inspektion des Quellcodes nicht wirkt, ist es oft
erhellend, zu sehen, was zur Laufzeit passiert.  Viele
Entwicklungsumgebungen bieten dazu die Möglichkeit, das Programm
schrittweise durchzugehen (single-step debugging), und bei jedem
Schritt die Daten zu inspizieren.

<p>Auch Gforth bietet diese Möglichkeit, dazu muss man es allerdings
mit <code>gforth-itc</code> starten, statt mit <code>gforth</code>.
Um ein Wort im Single-Step-Modus auszuführen, rufen Sie es
mit <code>dbg <em>wort</em></code> auf.  Z.B.:

<pre>
s" I will never do anything bad ever again" dbg char-hist
</pre>

Dabei gibt es in jedem Schritt eine Zeile wie

<pre>
7FFFF6A4F998   60FFD0 &gt;l             -&gt; [ 1 ] 6640464 
</pre>

oder

<pre>
7FFFF6A4F9E0   60FB30 cells          -&gt; [ 2 ] 140737331393488 00760 
</pre>

Zunächst gibt der Debugger zum <code>-&gt;</code> aus, dann wartet er
auf eine Eingabe des Benutzers, dann führt er den Schritt aus, und
zeigt das Ergebnis des Schritts auf dem Stack an (die Tiefe des
Stacks, und die Werte auf dem Stack als Zahlen in der aktuellen
Basis).

<p>An der dritten Stelle steht das Wort, das in diesem Schritt ausgeführt
wurde, z.B. <code>cells</code> oder <code>&gt;l</code>.
Wobei <code>&gt;l</code> nicht im Quelcode vorkommt, sondern aus der
Definition der Locals stammt; an der ersten Stelle ist die Adresse des
Codes, der in diesem Schritt ausgeführt wurde, und an zweiter Stelle
der Inhalt der Zelle an dieser Stelle, beides als Hex-Zahl.  Das Wort
an dritter Stelle ist eine Interpretation dieser Daten als
Forth-Quellcode, was allerdings z.B. bei Locals nicht so recht gelingt.

<p>Ähnliche Einschränkungen gibt es auch in anderen Umgebungen.
Z.B. zeigt gdb bei optimierten C-Programmen zwar Quellcode an, der
wird aber dann nicht in der erwarteten Reihenfolge durchschritten, und
die Werte von Variablen stimmen dabei oft nicht mit dem überein, was
man sich von einer schrittweisen Ausführung des Originalcodes erwarten
würde, da die Optimierung z.B. die Reihenfolge von Operationen
geändert hat.

<p>Als Befehle ist für uns besonders die Enter-Taste interessant.  Sie
führt das Wort komplett aus.  Weiters ist auch noch die
Taste <code>n</code> interessant: wenn man sie bei einer Definition
anwendet, führt der Debugger die Definition schrittweise aus.  (Wenn
man n bei einem nicht in Forth definierten Wort verwendet,
z.B. <code>&gt;l</code>, zeigt der Debugger den Maschinencode für das
Wort an, oder versucht es zumindest.

<p>Leider ist auf manchen Systemen das installierte Gforth nicht mit
dem installierten gdb (der zum Disassemblieren des Maschinencodes
verwendet wird) kompatibel, sodass das System dann hängt und nur durch
Abschiessen das gdb-Prozesses (z.B. unter Linux mit "killall gdb") zum
Weiterarbeiten bewegt werden kann.  Sie können die Ausgabe des
Disassemblers aber mit

<pre>
' dump is discode
' 2drop is discode
</pre>

aber auf einen Speicherdump reduzieren oder ganz weglassen.

<p>Das schrittweise Ausführen eines Programmes kann zwar hilfreich
sein, um zu verstehen, wie Programme ausgeführt werden, ist bei
tausenden, Millionen, Milliarden oder Billionen Schritten, die
Programme typischerweise ausführen, als Debuggingtechnik nicht sehr
effektiv; insbesondere wenn man sich bei jedem Schritt noch überlegen
muss, ob das Ergebnis jetzt stimmt oder nicht.

<p>Debugger bieten daher Möglichkeiten an, Schritte zu überspringen,
auch
der <a href="http://www.complang.tuwien.ac.at/forth/gforth/Docs-html/Singlestep-Debugger.html">Gforth-Single-Step-Debugger</a>.

<p>Nach meiner Erfahrung ist aber auch das nicht besonders effektiv,
weil man zu leicht in Versuchung gerät, einfach weiter im
Einzelschrittmodus weiterzumachen, statt sich sinnvolle Abkürzungen zu
überlegen.  Das ist umso verführerischer, weil man traditionellerweise
nicht mehr so einfach zurückgehen kann, wenn man einmal zuviel
abgekürzt hat.

<h1>7.4.2014</h1>

<h3>Rückwärts debuggen</h3>

Inzwischen gibt es Debugger, mit denen man rückwärts gehen kann.
Das ist auch eigentlich die Richtung, die man beim Debuggen meistens
braucht: Ein Bug führt irgendwann zu falschen Werten im Speicher oder
auf dem Stack, und die führen etwas später zu Konsequenzen, die für
den Endanwender merkbar sind, z.B. einer Fehlermeldung. 

<p>Dann wäre es schön, das Programm bis zur Fehlermeldung auszführen,
und sich dann anzuschauen, welche Werte im Speicher oder am Stack
falsch sind, und dann per Rückwärts-Watchpoints die Plätze im Programm
zu finden zu finden, wo diese falschen Werte herkommen; wenn die aus
anderen, schon falschen Werten berechnet wurden, wiederholt man das
ganze für die anderen Wert, ansonsten hat man die Fehlerquelle
gefunden (wenn es sich, wie meistens, um einen einfachen Fehler
handelt).

<p>Leider ist Rückwärts-Debugging in der Form noch nicht in Gforth
implementiert.

<h3>Assertions</h3>

Eine weitere Debugging-Methode ist es, bei der Ausführung die Werte im
Speicher oder auf dem Stack automatisch zu prüfen.  Damit entdeckt man
Fehler oft näher an der Quelle, was es einem erleichtert, den Fehler
zu finden.

<p>Diese Prüfung kann über automatisch überprüfbare Zusicherungen
(Assertions) erfolgen.  Wenn wir zum Beispiel überprüfen wollen, dass
wir bei den Zugriffen auf hist nicht ausserhalb des reservierten
Speicherbereichs zugreifen, können wir das wie folgt machen:

<pre>
: check-in-hist { addr -- addr }
  assert( addr hist hist hu hl - cells + within )
  addr ;
</pre>


Dabei muss der Code zwischen <code>assert(</code> und <code>)</code>
eine Zelle auf den Stack legen, die "falsch" (also 0) sein soll, wenn
die Zusicherung nicht erfüllt ist.  <code>within ( x1 x2 x3 -- f
)</code> überprüft x2&le;x1&lt;x3.

<p>Und dieses Wort <code>check-in-hist</code> können wir dann vor
dem <code>inc</code> in <code>count-char</code> und vor
dem <code>@</code> in <code>show-hist</code> einfügen.

<p>Assertions fügt man meist schon beim Codieren ein, nicht erst beim
Debuggen.  Und zwar fügt man sie ein, wenn man so eine automatische
Prüfung hinschreiben kann, und wenn man der Quelle der Daten nicht
besonders traut, zum Beispiel weil sie aus kniffligem Code kommen, bei
dem die Fehlerhäufigkeit meist hoch ist, oder weil das Programmstück
von irgendwoher aufgerufen werden kann.  Besonders gerne verwendet man
daher Assertions, um die Vorbedingungen eines Wortes zu prüfen, soweit
möglich.

<p>Neben diesen automatisch prüfbaren Zusicherungen gibt es auch noch
Zusicherungen zu Dokumentationszwecken, die als Kommentare
hingeschrieben werden.  Zum Beispiel sind die Schleifeninvarianten bei
unseren fac-Beispielen solche Zusicherungen: Das Überprüfen dieser
Invarianten benötigt ein funktionierendes Fac-Wort, sodass es
normalerweise unpraktikabel ist, das automatisch zu überprüfen.

<p>Die Vorbedingung der Fac-Wörter könnte man dagegen mit automatisch
geprüften assertions prüfen.

<p>Wenn man einmal genug Vertrauen in die Korrektheit des Programmes
hat, kann man das Überprüfen der Assertions auch abdrehen, wenn diese
Überprüfung zuviel Zeit kostet.  In Gforth geht das mit

<pre>
0 assert-level !
</pre>

<em>vor</em> dem Code, in dem man die Assertions abdrehen will, und

<pre>
1 assert-level !
</pre>

danach.

<h3>Backtrace</h3>

Viele Entwicklungsumgebungen haben die Möglichkeit, anzuzeigen, wo der
Fehler passiert ist, und zwar nicht nur innerhalb einer Definition,
sondern auch in der Definition, die diese Definition aufgerufen hat,
in der Definition, die diese Definition aufgerufen hat, usw.  Es wird
also der Stapel der aufgerufenen Definitionen gezeigt, der
sogenannte <a href="https://de.wikipedia.org/wiki/Stacktrace">Stack
trace</a> oder backtrace.  In Gforth sieht das zum Beispiel so aus
(wenn man einen Fehler in <code>show-hist</code> einfügt):

<pre>
hist.fs:6: failed assertion
:1: assertion failed
s" bla " &gt;&gt;&gt;char-hist&lt;&lt;&lt;
Backtrace:
$7FFC4734C988 throw 
$7FFC47373CC8 c(abort") 
$7FFC4739F738 (end-assert) 
$7FFC4739F978 check-in-hist 
$5F 
$7F 
$7FFC4739FAD0 show-hist 
</pre> <!-- "-->

Hier sieht man, dass es auf der Kommandozeilenebene ein Fehler
in <code>char-hist</code> passiert ist (das ja direkt von der
Kommandozeile aufgerufen wurde), dieses rief
dann <code>show-hist</code> auf, und das
dann <code>check-in-hist</code> (dazwischen werden noch zwei Zahlen
angezeigt, die vom <code>?do</code>
stammen.  <code>Check-in-hist</code> ruft <code>(end-assert)</code>
auf (Laufzeit-Code, der von <code>assert(...)</code> erzeugt wurde),
und das wiederum <code>c(abort")</code> <!-- "-->
und <code>throw</code>.

<h1>10.4.2014</h1>

<h3>Einfügen von Ausgabebefehlen</h3>

Eine Debuggingmethode, die ohne besondere Unterstützung durch die
Entwicklungsumgebung auskommt, ist das Einfügen von Ausgabebefehlen.
Diese Methode wird auch <em>printf Debugging</em> genannt, da die in
der Programmiersprache C dafür benutzte Funktion <code>printf()</code>
heisst.

<p>Diese Debuggingmethode hat einige Vorteile:

<ul>

<li>Sie kann auf jedem System verwendet werden, auch wenn es keinen
Debugger hat.

<li>Die Ausgaben ergeben eine Art Trace.  Diesen kann man in beide
Richtungen lesen und hat damit eine Art Rückwärtsdebugging für Arme.
Man kann diese Traces auch automatisch verarbeiten, was mit den
Ausgaben der üblichen Debugger schwieriger ist.  Zum Beispiel half mir
einmal der automatische Vergleich zweier Traces, einen Fehler zu
finden.

<li>Man überlegt sich, wo es sinnvoll ist, einen Ausgabebefehl
einzufügen, während ein Single-step-Debugger einen leicht dazu
verleitet, einfach noch einen Schritt weiterzugehen.

</ul>

Der Hauptnachteil diese Methode ist der Aufwand:

<ul>

<li> Für das Einfügen der Ausgabebefehle und das anschließende
Entfernen oder Deaktivieren.

<li> Für das Neucompilieren des Programms.  Das spielt eine größere
Rolle, wenn die Compilation lange dauert (früher, und bei sehr großen
Programmen auch noch heute).

<li> Für das erneute Starten des Programms.  Das kann bei Programmen,
bei denen man viel händisch eingeben muss, oder die lange laufen,
bevor der Fehler auftritt, unpraktisch sein; zumindest für die Eingabe
gibt es da aber auch diverse Lösungsmöglichkeiten.

</ul>

Man kann natürlich die normalen Ausgabebefehle in Gforth verwenden, z.B.
<code>."</code><!--"--> und <code>.s</code>.  Aber es gibt in Gforth
noch das Wort <code>~~</code> (``Tracer'') für diesen Zweck.  Es zeigt
an, wo es im Code steht, und was auf dem Stack ist.  Wenn wir
z.B. unser fac-Beispiel damit verzieren

<pre>
: fac { n -- n! }
  n
  n 1 ?do ~~ ( n1 )
    i ~~ *
  loop ;
5 fac .
</pre>

erhalten wir folgende Ausgabe:

<pre>
fac.fs:3:<1> 5 

fac.fs:4:<2> 5 1 

fac.fs:3:<1> 5 

fac.fs:4:<2> 5 2 

fac.fs:3:<1> 10 

fac.fs:4:<2> 10 3 

fac.fs:3:<1> 30 

fac.fs:4:<2> 30 4 
120
</pre>

Hier wird die Position des ausgebenden Tracers immer über den
Dateinamen und die Zeile angezeigt (sodass wir verschiedene Tracer
unterscheiden können; besonders hilfreich im Zusammenspiel mit
Editoren wie Emacs), und den Stack-Inhalt.

<p>Solche Ausgabebefehle platziert man oft unmittelbar hinter einem
Kontrollfluss-Wort, um dem Kontrollfluss folgen zu können, oder dort,
wo interessante Daten berechnet wurden (und im Falle von Forth
besonders gerne dort, wo sie auf dem Stack sind).

<h3>Was tun, wenn ein Fehler gefunden ist</h3>

Wie man den Fehler richtig behebt, hängt vom Fehler und vom Programm
ab.

<p>Ein häufiges Problem dabei ist, dass man den Fehler falsch behebt,
dass die Änderung zwar für eine richtige Behandlung des bisher
fehlgeschlagenen Testfall sorgen, aber das Programm dafür in anderen
Fällen jetzt ein falsches Ergebnis liefert.  Daher sollte man für ein
Programm eine Menge von Tests haben (eine <em>Testsuite</em>), die man
nach jeder Änderung erneut testet.  Solche Tests nennt
man <em>Regressionstests</em>, da sie Testen, was in dem Programm
schon funktioniert hat; wenn sie nicht mehr funktionieren, ist das ein
Rückschritt, also eine Regression.  Mit einer guten Testsuite kann man
dadurch so einen Fehler finden.

<p>Weiters fügt man einen Testfall oder mehrere zu den
Regressionstests dazu, die den Fehler aufdecken würden.  Es passiert
nämlich doch recht oft, dass ein Fehler zurückkommt, und dann würde
man ihn durch diese Testfälle sofort bemerken.

<p>Schon einmal gemachte Fehler sind deswegen häufiger als
irgendwelche anderen Fehler, weil viele Fehler nicht zufällig
passieren, sondern weil der Teil des Programms, in dem sie vorkommen,
besonders schwierig ist, und die für dieses Problem naheliegende
(Schein-)Lösung falsch ist.

<p>Zum Beispiel kann es passieren, dass man die Fehlerbehebung trotz
der Regressionstests einen Fehler hinterlassen hat, der aber erst nach
längerer Zeit auffällt.  Und wenn man diesen Fehler dann beheben will,
kann es vorkommen, dass man die ursprungliche fehlerhafte Lösung
wieder einbaut (weil sich der ursprüngliche Programmierer nicht mehr
an den Fehler in dieser Lösung erinnert, oder ein anderer Programmiere
diesen Fehler bearbeitet).  Dann dienen die Regressionstests als
institutionelles Gedächtnis.


<h2>Records</h2>

In einem Array speichert man gleichartige Daten, die man dann auch
gleichartig behandeln kann (zum Beispiel in einer Schleife über jedes
Element).  Es gibt aber auch Gründe, verschiedenartige Daten zusammen zu
speichern, zum Beispiel die Adresse und Länge eines Array-Deskriptors.

<p><img src="record.png">

<p>So ein Verbund von Daten wird (nach den Namen in verschiedenen
Programmiersprachen) <em>Record</em> oder <em>Struktur</em> genannt,
eine Verallgemeinerung davon (auf die wir später eingehen werden) sind
Objekte bzw. Klassen.  Die Einzelteile eines Records
heißen <em>Feld</em>er (bzw. bei Objekten <em>Instanzvariablen</em>
oder <em>Objektvariablen</em>).

<p>Im Bild oben ist der Record im Speicher in rot dargestellt, in blau
die enthaltenen Daten (die Adresse und die Länge eines Strings), und
der String (Byte-Array) selbst.

<p>Wie im Bild zu sehen, implementieren wir Records, indem wir die
einzelnen Felder hintereinander im Speicher anordnen.  Der Unterschied
zum Array liegt in der Verwendung, nicht in der Implementierung.  Wir
könnten jetzt z.B. wir folgt auf die Struktur zugreifen:

<pre>
: array@ { addr1 -- addr2 u }
  addr1 @
  addr1 1 cells + @ ;

: array! { addr2 u addr1 -- }
  addr2 addr1 ! 
  u addr1 1 cells + ! ;
</pre>

Bei größeren Programmen, in denen verschiedene Records im Spiel sind,
wird es allerdings bald schwer durchschaubar, ob <code>1 cells
+</code> der Zugriff auf das Längenfeld des Array-Deskriptors ist,
oder etwas anderes.  Daher ist es sinnvoll, Worte für diese Felder
einzuführen:

<pre>
: array-addr ( addr1 -- addr2 )
  ;

: array-len ( addr1 -- addr2 )
  1 cells + ;

: array@ { addr1 -- addr2 u }
  addr1 array-addr @
  addr1 array-len  @ ;

: array! { addr2 u addr1 -- }
  addr2 addr1 array-addr ! 
  u addr1     array-len  ! ;
</pre>

Neben der Dokumentationswirkung hat die Verwendung
von <code>array-addr</code> und <code>array-len</code> noch weitere
Vorteile: Da die konkrete Anordnung der Felder jetzt nur mehr in
diesen Wörtern präsent ist statt im ganzen Programm, könnte man die
Anordnung der Felder bei Bedarf mit wenig Aufwand ändern.

<p>[Das ist nur ein Beispiel für ein allgemeines Prinzip: Da immer
wieder alle möglichen Änderungen in Programmen vorkommen, ist es
hilfreich, Implementierungsentscheidungen an einer Stelle zu
konzentrieren, damit man bei Bedarf nur diese Stelle ändern muss statt
das ganze Programm.]

<p>Da man öfters solche Wörter für Feldzugriffe braucht, gibt es schon
eigene Definitionswörter dafür in Gforth.  Z.B. können wir unseren
Array-Deskriptor wie folgt definieren:

<pre>
struct
  cell% field array-addr
  cell% field array-len
end-struct array-desc%
</pre>

Zusätzlich definiert dieser Code das Wort <code>array-desc%</code>,
das wir zum Beispiel verwenden können, um einen Array-Deskriptor als
Feld in einem anderen Record zu definieren, oder (wie wir später sehen
werden), um Speicher für den Record zu reservieren.

<h2>Verkettete Listen</h2>

Arrays haben den Nachteil, dass man im vorhinein (bei der
Speicherreservierung) wissen muss, wieviele Elemente es fassen soll.
Eine einfache und häufig verwendete Datenstruktur, die diesen Nachteil
nicht hat (dafür andere), ist die verkettete Liste.

<p><img src="list.png">

<p>Die oben gezeigte verkettete Liste besteht aus vier gleichen
Records mit je zwei Feldern: Das erste Feld ist die Adresse des
nächsten Records in der Liste (das nächste Listenelement), das zweite
Feld enthält die Nutzdaten, in unserem Fall (der Einfachkeit halber)
eine ganze Zahl.  Wenn es kein nächstes Listenelement gibt), speichern
wir 0 in das Feld <code>list-next</code>.

<p>Bei solchen Datenstrukturen, bei denen Records die Adressen anderer
Records enthalten, die Records also aufeinander zeigen, nennt man die
Records auch <em>Knoten</em> (<em>node</em>) und die Adressen/Zeiger
auch (gerichtete) <em>Kanten</em> (<em>edge</em>), abgeleitet von der
Graphentheorie in der Mathematik; diese Datenstrukturen kann man
nämlich auch als gerichtete Graphen sehen.

<p>Hier die Definition der Listenrecords:

<pre>
struct
  cell% field list-next
  cell% field list-val
end-struct list%
</pre>

Wir können ein Listen-Element wie folgt erzeugen:

<pre>
: new-list { list1 val -- list2 }
  list% %allot { list2 }
  list1 list2 list-next !
  val   list2 list-val  ! 
  list2 ;
</pre>

Wobei <code>%allot ( record-desc -- addr )</code> Platz für den Record
im Dictionary reserviert und die Anfangsadresse des reservierten
Platzes auf den Stack legt.

<p>Mit <code>new-list</code> können wir die oben gezeigte Liste wie
folgt aufbauen:

<pre>
0 
-5 new-list
 1 new-list
 4 new-list
 3 new-list
constant my-list
</pre>

Man kann sich die Liste jetzt im Speicher anschauen:

<pre>
<strong>my-list hex.</strong> $7F97FBA79470  ok
<strong>my-list 6 cells - 8 cells dump</strong>
7F97FBA79440: 00 00 00 00  00 00 00 00 - FB FF FF FF  FF FF FF FF  ................
7F97FBA79450: 40 94 A7 FB  97 7F 00 00 - 01 00 00 00  00 00 00 00  @...............
7F97FBA79460: 50 94 A7 FB  97 7F 00 00 - 04 00 00 00  00 00 00 00  P...............
7F97FBA79470: 60 94 A7 FB  97 7F 00 00 - 03 00 00 00  00 00 00 00  `...............
</pre>

[<code>my-list</code> zeigt auf den Anfang des letzten Records, davor sind drei
andere mit jeweils zwei Zellen, insgesamt sind 4 Records à 2 Zellen
vorhanden.]

<h1>28.4.2014</h1>

Hier nochmal derselbe Dump, mit der eingezeichneten graphischen
Darstellung der verketteten Liste.

<p><img src="list-dump.png" alt="graphische Aufbereitung des Dumps">

<p>Mit folgendem Wort können wir die Elemente der Liste ausgeben:

<pre>
: .list ( list -- )
  begin { l }
    l while
      l list-val @ .
      l list-next @
  repeat ;

my-list .list
</pre>

Im obigen Beispiel wurde eine Liste direkt gebaut, mit dem letzten
Element beginnend, und das Ergebnis haben wir uns dann in einer
Konstante gemerkt.  Wenn wir in eine Liste nachträglich ein Element
einfügen wollen, ist die Konstante zum merken nicht sehr praktisch.
Stattdessen können wir uns eine Zelle im Speicher reservieren und die
Liste dort abspeichern:

<pre>
here 1 cells allot constant lp
my-list lp !
</pre>

Jetzt zeigt <code>lp</code> auf die Zelle, in der die Adresse des
ersten Records der Liste steht.  Wir können jetzt ein weiteres Element
vorne in diese Liste einfügen:

<pre>
lp @ 7 new-list lp !
lp @ .list
</pre>

Da wir das vielleicht oefters machen möchten, machen wir eine
Definition dafür:

<pre>
: insert { val listp -- }
  listp @ val new-list listp ! ;

9 lp insert
lp @ .list
</pre>

Einfügen am Ende ist etwas komplizierter, weil wir zuerst das Ende
suchen müssen:

<pre>
: insert-end { val listp -- }
  listp begin { lp1 }
    lp1 @ while
      lp1 @ list-next
  repeat
  0 val new-list lp1 ! ;

11 lp insert-end
lp @ .list
</pre>  

Bemerkenswert ist hier: Wir brauchen die Adresse (nicht den Inhalt)
der Zelle, in der die abschließende 0 gespeichert ist, damit wir dort
das Element anhängen können.  Diese Möglichkeit, mit Referenzen auf
Speicherstellen umzugehen, gibt es in einer Reihe von
Programmiersprachen, aber nicht in Java.  Wir werden später sehen, wie
wir dieses Problem in Java umschiffen.

<p>Bemerkung: Wenn man öfters am Ende einfügen will, kann man sich
auch die Adresse der Zelle mit der abschließenden 0 merken, zusätzlich
zu der Adresse der Zelle, in der das erste Element steht.

<h2>Indirekte Ausführung</h2>

<p>Wie können wir alle Werte einer Liste aufaddieren?

<pre>
: sum-list { list -- n }
  0 list begin { l } ( n1 )
    l while
      l list-val @ +
      l list-next @
  repeat ;

lp @ sum-list .
</pre>

Wenn wir uns <code>sum-list</code> anschauen, sehen wir große
Ähnlichkeiten zu <code>.list</code>; im Schleifenkörper ist
jetzt <code>+</code> statt <code>.</code>, aber sonst ist alles gleich
(abgesehen vom Stack-Bild-Kommentar).  Tatsächlich werden alle Wörter,
die die Liste von vorne nach hinten durchgehen und mit jedem Element
etwas, machen, so ausschauen.  Wir können diese Gemeinsamkeit auch in
ein eigenes Wort <em>faktorisieren</em>:

<pre>
: do-list ( x1 list xt -- x2 ) { xt }
  begin { l } ( x )
    l while
      l list-val @ xt execute
      l list-next @
  repeat ;

: .list ( list -- )
  ['] . do-list ;

: sum-list { list -- n }
  0 list ['] + do-list ;

lp @ .list
lp @ sum-list .
</pre>

Wir übergeben an <code>do-list</code> nicht nur die Liste, sondern
auch ein Wort, repräsentiert durch die Anfangsadresse dieses Wortes;
diese Adresse heißt in Forth Execution token oder kurz xt.  Dieses xt
wird dann in der Schleife mit <code>execute ( ... xt -- ... )</code>
ausgeführt.  Das Execution Token eines Wortes erhält man innerhalb
einer Definition mit <code>['] <em>wort</em></code> und ausserhalb
mit <code>' <em>wort</em></code>.  D.h, ausserhalb einer Definition
ist <code>3 ' . execute</code> das gleiche wie <code>3 .</code>.

<p>Wir können mit <code>do-list</code> auch noch weitere Dinge tun, z.B. das
Maximum der Listen-Elemente berechnen:

<pre>
-$80000000 lp @ ' max do-list .
</pre>

<p>Damit die Stack-Tiefe im Schleifenrumpf gleich bleibt, muss das von
xt repräsentierte Wort eine Zelle mehr vom Stack nehmen als es auf den
Stack legt.  Der bei <code>do-list</code> angegebene Stack-Effekt und
die Stack-Bilder ist für den Fall geschrieben, dass man das xt eines
Wortes mit dem Stack-Effekt ( x1 x2 -- x3 ) übergibt
(z.B. <code>+</code> oder <code>max</code>), aber man sieht
am <code>.list</code>-Beispiel, dass auch der Stack-Effekt ( x2 -- )
möglich ist; der Stack-Effekt von <code>do-list</code> ist dann ( list
xt -- ).

<h1>5.5.2014</h1>

<h2>Suchschleifen und <code>exit</code></h2>

Wenn wir ein bestimmtes Element in der Liste suchen wollen, brauchen
wir eine Schleife mit zwei Abbruchbedingungen:

<ul>

<li>Das Ende der Liste ist erreicht.

<li>Das gesuchte Element wurde gefunden

</ul>

Es ist etwas mühsam, mehrere Abbruchbedingungen in
einem <code>while</code> zu berücksichtigen.  Eine andere Möglichkeit
ist es, die ganze Definition bei Erreichen einer der
Abbruchbedingungen zu verlassen (die andere Abbruchbedingung wird
weiterhin mit <code>while</code> abgefangen).  Zum Verlassen der
Definition gibt es das Wort <code>exit</code>.

<p>Als Beispiel suchen wir in unserer Liste von Zahlen nach einer
konkreten Zahl:

<pre>
: member? { key liste -- flag }
  liste begin { l }
    l while
      l list-val @ key = if
        true exit endif
      l list-next @
  repeat 
  false ;
</pre>

Hier verwenden wir dieselbe Struktur wie bei den bisherigen Schleifen
über Listen, das <code>while</code> bricht also ab, wenn das Ende der
Liste erreicht ist.  Für den Abbruch beim Finden des gesuchten Wertes
verwenden wir ein <code>exit</code> in
einem <code>if</code>...<code>endif</code>.  Dabei muss man beachten,
dass die Stack-Effekte bei beiden Möglichkeiten, die Definition zu
verlassen, zusammenpassen müssen.

<p>Auch wenn die Struktur dieses Wortes durchaus in
das <code>do-list</code>-Schema zu passen scheint, kann man hier
<code>do-list</code> nicht verwenden: Man müsste <code>key = if true
exit endif</code> in eine eigene Definition auslagern, aber da würde
das <code>exit</code> nur diese Definition verlassen, nicht
aber <code>do-list</code>.

<p>Wenn man <code>exit</code> in <code>?do</code>...<code>loop</code>
einsetzt, muss man vor dem <code>exit</code> noch <code>unloop</code>
schreiben.

<p>Übung: Schreiben Sie ein Wort, das in einem Array nach einem
bestimmten Element sucht.


<h2>Datentypen</h2>

Wir haben inzwischen schon mit einer Reihe von Typen gearbeitet; das
Wissen über den Datentyp ist vor allem deswegen wichtig, weil man
bestimmte Wörter nur auf bestimmte Typen anwenden kann, z.B.:

<dl>

<dt>vorzeichenbehaftete ganze Zahlen <dd><code>+ - * / &lt; .</code>

<dt>vorzeichenlose ganze Zahlen <dd><code>+ - * u&lt; u.</code>

<dt>Adressen von Zellen<dd><code>+ - @ !</code> (zweiter Parameter)

<dt>Zellen <dd><code>!</code> (erster Parameter)

<dt>Adressen von Zeichen<dd><code>+ - c@ c!</code> (zweiter Parameter)

<dt>Zeichen <dd><code>emit c!</code> (erster Parameter)

<dt>Execution Tokens <dd><code>execute</code>

<dt>Flags

</dl>

<p>Diese Sicht, Datentypen über die Wörter bzw. Operationen zu
definieren, die auf ihnen arbeiten, nennt man <em>strukturelle
Typisierung</em> oder auch <em>duck typing</em> (abgeleitet von dem
Satz: "When I see a bird that walks like a duck and swims like a duck
and quacks like a duck, I call that bird a duck").

<p>Wobei Zahlen, Adressen, Flags, und Execution Tokens auch Zellen sind
und damit ebenfalls als erster Parameter in <code>!</code> vorkommen
dürfen.  Man spricht davon, dass Zahlen, Adressen, Flags und Execution
Tokens <em>Untertypen</em> des Typs Zelle sind.  Wenn man ein Wort
geschrieben hat, das für Zellen im Allgemeinen arbeitet, funktioniert
es für alle Arten von Zellen, ob es jetzt eine Zahl ist oder eine
Adresse (<em>Ersetzbarkeitsprinzip</em>).  Wir werden Untertypen und
Ersetzbarkeit später genauer betrachten.

<p>Bei den Adressen von Zellen ist es oft sinnvoll, noch weiter zu
unterscheiden (also Untertypen des Typs "Adresse von Zelle" zu
verwenden).  Zum Beispiel übergibt man <code>list-next</code> die
Adresse eines Listenknoten und erhält die Adresse einer Zelle, in der
0 oder die Adresse eines Listenknoten steht; und während
man <code>.list</code> die Adresse eines Listenknoten (oder 0)
übergibt, ist das zweite Argument bei <code>insert</code>
und <code>insert-end</code> die Adresse einer Zelle, in der 0 oder die
Adresse eines Listenknoten steht.

<p>Wenn man ein Wort auf ein Datum vom falschen Typ anwendet, wird das
Programm nicht das gewünschte Ergebnis liefern; so etwas ist
ein <em>Typfehler</em>.  In vielen Programmiersprachen werden
Typfehler vom Compiler (<em>statische Typüberprüfung</em>) oder zur
Laufzeit (<em>dynamische Typüberprüfung</em>) erkannt und gemeldet, in
Forth nicht.

<p>In Forth liegt es am Programmierer, Typfehler zu vermeiden.  Dazu
werden in den Stack-Bildern und Stack-Effekt-Kommentaren die
Stack-Elemente auch entsprechend den Typen benannt.  Für einfache
Typen wie vorzeichenbehaftete bzw. vorzeichenlose ganze Zahlen gibt es
da Konventionen ("n" bzw. "u"), bei komplizierteren Typen muss man
sich selbst welche setzten; z.B. steht bei den Listenwörtern oben
"list" für die Adresse eines Listenknotens (oder 0) und "listp" (für
list pointer) für die Adresse einer Zelle, in der 0 oder die Adresse
eines Listenknoten steht.

<p>Die Typen der Zellen auf dem Stack sind also eine statische
Eigenschaft, genau wie die Stacktiefe.  Allerdings hat man es nicht
nur im Stack mit Typen zu tun, sondern auch im Speicher.

<p>Einige Wörter funktionieren auf mehreren Typen,
z.B. funktioniert <code>+</code> für vorzeichenlose und
vorzeichenbehaftete Zahlen, und um Adressen und Zahlen zu addieren.
Das liegt aber nur daran, dass Adressen auch Zahlen sind, und dass die
Repräsentation der vorzeichenbehafteten Zahlen genau so gewählt wurde,
dass die vorzeichenlose Addition auch für vorzeichenbehaftete Zahlen
funktioniert.

<p>Im allgemeinen funktioniert ein Wort aber nur für einen Typ.
Z.B. haben wir verschiedene Wörter für die Ausgabe:

<dl>

<dt>. <dd>vorzeichenbehaftete ganze Zahlen
<dt>u. <dd>vorzeichenlose ganze Zahlen
<dt>emit <dd>Zeichen
<dt>type <dd>String
<dt>.list <dd>unsere verkettete Liste von Zahlen
</dl>

Wir können in Arrays und verketteten Listen auch nur in jedem Element
den selben Typ speichern.

<h1>8.5.2014</h1>

<h2>Generizität</h2>

Wenn man unsere Wörter für verkettete Listen betrachtet, verwendet
nur <code>.list</code> ein Wort, das spezifisch für
vorzeichenbehaftete ganze Zahlen ist, nämlich <code>.</code> (weiters
verwendet <code>sum-list</code> das Wort <code>+</code>, das z.B. nicht
sinnvoll auf execution tokens angewendet werden kann).

<p>Für die meisten Wörter (<code>list-next list-val new-list insert
insert-end do-list</code>) spielt es aber keine Rolle, welcher
Untertyp von Zellen als Nutzlast gespeichert ist (eine Zelle muss es
aber sein).  Man kann diese Wörter daher allgemeiner benutzen als
ursprünglich vorgesehen, nämlich für alle Listen mit Zellen als
Nutzlast.  Diese Listen sind funktionieren also generisch für Zellen
und alle Untertypen von Zelle.  Diese Eigenschaft nennt man daher
Generizität.

<p>Wenn man allerdings z.B. <code>.list</code> auf einer Liste, die
mit diesen Wörtern erstellt wurde, anwenden will, muss man die Liste
schon mit vorzeichenbehafteten ganzen Zahlen als Nutzlast erstellen.

<p>Das Wort <code>do-list</code> selbst ist zwar generisch, aber der
xt-Parameter muss mit dem Typ der Elemente zusammenpassen: Wenn man
ein Wort übergibt, das auf dem Top-of-Stack einen Typ T erwartet, dann
dürfen nur Elemente vom Typ T als Nutzlast vorkommen.  Ein Beispiel
ist die Implementierung von <code>.list</code>
mit <code>do-list</code>: Hier wird als xt ein Wort übergeben, das
vorzeichenbehaftete ganze Zahlen erwartet, also kann man auch diese
Implementierung von <code>.list</code> nur für Listen von solchen
Zahlen verwenden.  Wenn man mit Hilfe von <code>do-list</code> für
vorzeichenlose ganze Zahlen ausgeben will, muss man
entsprechend <code>['] u.</code> übergeben.  Auch
mit <code>do-list</code> kann man aber nur Listen von Elementen
desselben Typs ausgeben.

<p>Es ist nicht einfach, Generizität in Programmiersprachen mit
statischer Typprüfung zu integrieren.  Zum Beispiel wurde sie erst 9
Jahre nach der Entwicklung von Java zu Java hinzugefügt.  Deswegen
wird diese Eigenschaft Programmiersprachen mit statischer Typprüfung
besonders erwähnt; sie braucht dort auch eigene Sprachkonstrukte.

<p>Wenn ein Programm mit verschiedenen Typen umgehen kann, nennt man
das <em>Polymorphismus</em>.  Generizität ist eine (von zwei)
Hauptformen davon, und man nennt sie auch <em>parametriscen
Polymorphismus.</em>

<h2><a name="Objekte">Objekte</a></h2>

Es gibt die Möglichkeit, das konkrete Ausgabewort mit den Daten
mitzuspeichern:

<pre>
struct
  cell% field obj-print \ xt ( obj -- )
end-struct obj%

obj%
  cell% field signed-val
end-struct signed%

obj%
  cell% field person-svnum \ 64 bits nötig bei einfacher Speicherung
  cell% field person-name-addr
  cell% field person-name-len
end-struct person%
</pre>

Die Strukturdefinitionen von <code>signed%</code>
und <code>person%</code> fangen nicht mir einer leeren Struktur an,
sondern setzen dort fort, wo die Definition von <code>object%</code>
aufhört.  Das Feld <code>obj-print</code> wird von der elterlichen
Struktur <code>obj%</code> geerbt, und hat bei beiden Typen den selben
Offset.  Man kann also bei beiden Typen auf dieses Feld zugreifen,
ohne zu wissen, welcher der beiden Typen es jetzt konkret ist.

<p><img src="object.png" alt="Darstellung von signed% und person%">

<p>Mit folgenden Wörtern können wir ein Record <code>signed%</code>
und ein Record <code>person%</code> ausgeben:

<pre>
: .signed ( signed -- )
  signed-val @ . ;

: .person { person -- }
  person person-name-addr @ person person-name-len @ type
  ."   SV-Nummer:" person person-svnum @ u. ;
</pre>

Wie gehabt kann man <code>.signed</code> sinnvollerweise nur
auf <code>signed%</code>-Records anwenden, und <code>.person</code>
nur auf <code>person%</code>-Records.  Definieren wir noch
Konstruktoren dazu:

<pre>
: new-signed { n -- signed }
  signed% %allot { signed }
  ['] .signed signed obj-print ! 
  n signed signed-val !
  signed ;

: new-person { svnum name-addr name-len -- person }
  person% %allot { person }
  ['] .person person obj-print !
  svnum     person person-svnum !
  name-addr person person-name-addr !
  name-len  person person-name-len !
  person ;

5 new-signed constant signed1
1234567890 s" Jane Doe" new-person constant person1
</pre>

In den Konstruktoren wird auch noch das Feld <code>obj-print</code>
gesetzt, und zwar bei signeds auf das xt von <code>.signed</code> und
bei persons auf das xt von <code>.person</code>.  Das kann man dzu
verwenden, um ein Ausgabe-Wort zu schreiben, das für beide Typen
funktioniert:

<pre>
: .obj { obj -- }
  obj  obj obj-print @ execute ;

signed1 .obj
person1 .obj
</pre>

<img src="object1.png">

<p>Hier weiss <code>.obj</code> zwar nichts über den konkreten Typ des
Parameters obj, aber es weiss, dass es ein Feld <code>obj-print</code>
hat, und dass dort das xt eines Wortes steht, das den konkreten Typ
richtig ausgeben kann.  Es führt dann dieses Wort aus, und dieses Wort
weiss dann auch, welchen konkreten Typ der Parameter
hat: <code>.obj</code> führt <code>.signed</code> nur aus, wenn das
Record tatsächlich ein <code>signed%</code>-Record ist, denn nur dann
steht in <code>obj-print</code> das xt von <code>.signed</code>.
Entsprechend für den Fall, wenn man <code>.obj</code>
ein <code>person%</code>-Record übergibt.

<p>Übung: Definieren Sie ein Record <code>unsigned%</code>, das
von <code>obj%</code> erbt, ein dazugehöriges Ausgabewort, und einen
dazugehörigen Konstruktor.

<p>Obwohl man im allgemeinen (z.B. bei <code>.objarray</code> unten)
den konkreten Typ des Parameters von <code>.obj</code> nicht kennt,
weiss man also, sobald die Ausführung ein konkretes Ausgabewort
(z.B. <code>.person</code>) erreicht hat, den konkreten Typ des
Parameters (z.B. person).  Man hat also in <code>.person</code> wieder
statisches Typ-Wissen.

<p>Da man <code>.obj</code> auch mit signeds und persons verwenden
kann, sind das Untertypen von obj.  Da <code>.obj</code> mit
verschiedenen konkreten Typen umgehen kann, ist es ein polymorphes
Wort.  Diese Art des Polymorphismus nennt
man <em>Untertyp-Polymorphismus</em> und er ist die Basis für
objektorientierte Programmiersprachen.

<p>Typen, die als einzige Operation die Ausgabe zulassen, sind zwar
nicht besonders aufregend, aber das ist ein einfaches Beispiel dafür,
wie die objektorientierten Konzepte wie Klassen, Objekte, und
dynamische Bindung implementiert sind, die wir später kennenlernen.

<p>Wir können jetzt Objekte mit verschiedenen konkreten Typen in einem
Array (oder auch einer Liste) speichern und abarbeiten.

<pre>
here 3 cells allot constant a
signed1 a 0 cells + !
person1 a 1 cells + !
9 new-signed a 2 cells + !

: .objarray { addr len -- }
  len 0 ?do
    cr addr i cells + @ .obj
  loop ;

a 3 .objarray
</pre>

<img src="objarray.png">

<p>Wir können auch einen weiteren Objekt-Typ erzeugen, indem wir von
einem existierenden erben:

<pre>
person%
  cell% field student-matnr
end-struct student%

: .student { s -- }
  s .person
  ."  Mat-Nr.: " s student-matnr @ . ;

: new-student { svnum name-addr name-len matnr -- student }
  student% %allot { s }
  ['] .student s obj-print !
  svnum        s person-svnum !
  name-addr    s person-name-addr !
  name-len     s person-name-len !
  matnr        s student-matnr !
  s ;

9876543210 s" John Smith" 1499999 new-student constant student1

student1 .student
student1 .person
student1 .obj

student1 a 2 cells + !
a 3 .objarray
</pre>


<h1>12.5.2014</h1>

<h2>Objektidentität und Seiteneffekte</h2>

Wir können ein Record/Objekt einmal im Speicher haben, aber die
Adresse dieses Objekts mehrfach kopieren:

<pre>
0 5 new-list constant list1
list1 constant list2
</pre>

Dabei legen <code>list1</code> und <code>list2</code> die gleiche
Adresse auf den Stack.  Wir können weitere Records mit dem
gleichen Inhalt erstellen:

<pre>
0 5 new-list constant list3
</pre>

Dieses Record hat zwar den selben Inhalt, aber eine andere Adresse:

<pre>
list1 .list  cr list1 . 
list2 .list  cr list2 . 
list3 .list  cr list3 . 
</pre>

<img src="identity1.png">

<p>Solange man die Records nicht verändert, spielt das keine Rolle, aber
wenn man sie verändert, schon:

<pre>
6 list1 list-val !
list2 .list
list3 .list
</pre>

Das an der von list1 angegebenen Adresse wird geändert; wenn man auf
eine andere Art auf dieselbe Adresse zugreift, sieht man die Änderung
auch.  Das Objekt, auf das list3 zeigt, wird dagegen nicht verändert.

<p>Als nächstes hängen wir ein Element vorne in der Liste ein:

<pre>
list1 8 new-list constant list4

list1 .list
list2 .list
list3 .list
list4 .list
</pre>

<img src="identity2.png">

<p>Wie man sieht, hat das an list1, list2, und list3 nichts geändert.
Der Konstruktor <code>new-list</code> hat also
keine <a href="http://en.wikipedia.org/wiki/Side_effect_(computer_science)">Seiteneffekte</a>
auf existierende Listen und ihre Referenzen.  Im Gegensatz dazu hat
ein Wort wie <code>insert-end</code> Seiteneffekte auf existierende
Listen:

<pre>
cell% %allot constant listp1
list4 listp1 !
9 listp1 insert-end
list1 .list
list2 .list
list3 .list
list4 .list
</pre>

<img src="identity3.png">

<p>In imperativen Sprachen wie Forth und Java verzichtet man
normalerweise nicht auf die Verwendung von Seiteneffekten, und muss
daher genau über die Objektidentität bescheid wissen.  Insbesondere
muss man zwischen dem Objekt und einer Referenz darauf unterscheiden.
Der Unterschied ist bei manchen Programmiersprachen nicht so
offensichtlich, z.B. in Java; aber wenn man weiss, dass man darauf
achten muss, sind die entsprechenden Hinweise in der Dokumentation
durchaus vorhanden.

<p>Wenn man Wörter mit Seiteneffekten auf eine Datenstruktur anwenden
will, aber nicht will, dass der Seiteneffekt für andere Benutzer der
Datenstruktur sichtbar wird, muss man Teile oder die ganze
Datenstruktur kopieren, und dann das Wort mit dem Seiteneffekt auf die
Kopie anwenden.  Z.B. muss man dann für <code>insert-end</code> die
gesamte Liste kopieren, da der Seiteneffekt auf den letzten Record
wirkt; wenn man nur den Wert im ersten Record ändern will, muss man
nur diesen Knoten kopieren:

<pre>
: copy-node { list1 -- list2 }
  list1 list-next @ list1 list-val @ new-list ;

list4 copy-node constant list5
2 list5 list-val !
list4 .list
listp @ .list
list5 .list
</pre>

<img src="identity4.png">

<p>Man kann auf alle diese Überlegungen verzichten, wenn man auf
Seiteneffekte verzichtet.  Dann muss man das, was man sonst mit
Seiteneffekten macht, aber auf andere Art machen.  Diese Techniken
lernen Sie im Rahmen der funktionalen Programmierung und der
Logik-Programmierung, denn die entsprechenden
Programmiersprachen erlauben keine Seiteneffekte (oder wenn, dann nur
sehr eingeschränkt).

<h2>Speicherverwaltung</h2>

Bisher haben wir Speicher nur mit <code>allot</code>
und <code>%allot</code> aus dem Dictionary reserviert.  Von dort holt
man sich normalweise Speicher, den man bis zum Ende des Programmlaufs
nicht mehr freigibt.  Klassischerweise hat man damit Speicher für ein
paar Arrays reserviert, und dann mit diesen Arrays gearbeitet; solche
Programme haben zur Laufzeit keinen weiteren Speicher benötigt.  Das
ganze nennt man auch <em>statische Speicherallokation</em>.

<p>Allerdings sind die Möglichkeiten, so zu programmieren, recht
eingeschränkt.  Man kann zum Beispiel zur Laufzeit keinen Speicher für
Listenknoten reservieren.  Wir können das in Forth zwar
mit <code>allot</code> machen, aber das ist dann zwar keine statische
Allokation mehr; was wichtiger ist, im Allgemeinen wird dadurch
irgendwann der Speicher ausgehen, auch wenn die meisten der
Listenelemente nicht mehr in Verwendung sind und keine Referenzen auf
diese Listenknoten mehr existieren.

<p>Daher wurde eine dynamische Speicherverwaltung entwickelt, bei der
man Speicher reservieren und reservierten Speicher wieder freigeben
konnte; in Forth mit den Wörtern <code>allocate</code>
und <code>free</code>, in C mit <code>malloc()</code>
und <code>free()</code>.  Dieses Konzept führt allerdings zu Fehlern:
Man kann Speicher freigeben, auf den noch Referenzen in Verwendung
sind (<em>dangling reference</em>, ein Spezialfall davon ist ein
"double free"-Fehler), oder Speicher nicht freigeben, obwohl er nicht
mehr verwendet wird (Speicherleck, <em>memory leak</em> bei
langlaufenden Programmen).

<p>In höherleveligen Sprachen wie Java übernimmt daher die
Laufzeitumgebung die Freigabe des Speichers, auf den es keine
Referenzen mehr gibt (<em>Garbage Collection</em>).  Es kann
allerdings in manchen Fällen hilfreich sein, unbenutzte Referenzen zu
löschen; dann kann das Laufzeitsystem den Speicher der Datenstruktur
früher freigeben.

<h1>15.5.2014</h1>

<h2>Java und Objektidentität</h2>

Im folgenden vergleichen wir das obige Beispiel für Objektidentität in
Java und Forth und arbeiten dabei einige Sprachfeatures von Java
heraus.  Der Quellcode für die beiden Versionen ist
in <a href="java/identity/">diesem
Verzeichnis</a>: <a href="java/identity/ListNode.java">Java</a>
und <a href="java/identity/ListNode.fs">Forth</a>.  Man kann diese
Programme mit

<pre>
javac ListNode.java
java ListNode
gforth ListNode.fs
</pre>

ausführen.

<pre>
public class ListNode {
                                           // struct
  public int val;                          //   cell% field list-next
  public ListNode next;                    //   cell% field list-val
                                           // end-struct list%
</pre>

In Java verwendet man dieselbe Syntax zum Definieren von Feldern (auch
<em>Objektvariablen</em> oder <em>Instanzvariablen</em> genannt) wie
für lokale Variablen; der Unterschied ist, dass lokale Variablen in
einer Methode stehen, und Felder direkt in einer Klasse.

<p>Da die Klasse definiert, welche Felder zu einem Record
zusammengefasst werden, braucht man für jeden Recordtyp, den man
definieren will, eine eigene Klasse.

<pre>
  ListNode(int v, ListNode l) {            // : new-list { list1 val -- list2 }
      val = v;                             //   list% %allot { list2 }
      next = l;                            //   list1 list2 list-next !
  }                                        //   val   list2 list-val  !
                                           //   list2 ;
</pre>

Das ist ein Konstruktor, erkennbar daran, dass er den selben Namen hat
wie die Klasse (und die Definitionssyntax unterscheidet sich ein
bisschen von normalen Methoden).  Der Aufruf dieses Konstruktors
erflogt z.B. mit <code>new ListNode(5, null)</code>.  Dabei erhält
dann die lokale Variable v den Wert 5 und die lokale Variable l den
Wert null.


<p>Die Speicherreservierung erfolgt in Forth explizit, in Java
implizit; der Konstruktor dient nur dazu, nach der
Speicherreservierung die Felder zu initialisieren.  Auf die Felder
kann man direkt mit dem Namen zugreifen, oder, wenn der Name
z.B. durch eine gleichnamige lokale Variable verdeckt ist,
mit <code>this.<em>name</em></code>.

<pre>
  static void print(ListNode l) {          // : .list ( list -- )
    while (l != null) {                    //   begin { l }
      System.out.print(l.val);             //     l while
      System.out.print(" ");               //       l list-val @ .
      l = l.next;                          //       l list-next @
    }                                      //   repeat ;
    System.out.println();
  }
</pre>

Statische Methoden werden mit <code>static</code> definiert; die
(dynamischen) Methoden (ohne <code>static</code> lernen wir später
kennen.  Wir sehen hier allerdings den Aufruf von zwei
nicht-statischen Methoden: <code>System.out.print(int i)</code>
und <code>System.out.print(String s)</code>; und zwar ruft man diese
Methoden für das Objekt <code>System.out</code> auf; sie unterscheiden
sich durch den Typ des Parameters.

<p><code>void</code> ist der Rückgabetyp der Methode, und bedeutet,
dass sie nichts zurückgibt.

<p>Die von uns definierte Methode heißt <code>print</code>, genau wie
zwei der Methoden, die in dieser Methode aufgerufen werden.  Allgemein
erlaubt Java die vielfältige Verwendung des gleichen Namens, wobei
dann bei Verwendung verschiedene Möglichkeiten genutzt werden, um
diese Mehrfachdefinition aufzulösen.  Der Typ der Argumente ist einer
davon; in Forth hat man diese Möglichkeit nicht, und verwendet lieber
verschiedene Namen.

<p>Die Methode hat einen Parameter l vom Typ <code>ListNode</code>.
Parameter sind Variablen, die in den Klammern einer Methodendefinition
stehen, und sie werden mit dem Wert initialisiert, der an dieser
Stelle als Argument übergeben wird.

<p>Die Methode enthält eine Schleife, um alle Listenelemente
auszugeben. Ein Unterschied zwischen den Schleifen der beiden Sprachen
ist, wie der Wert von l geändert wird: In Forth wird er am Anfang der
Schleife aus dem definiert, was am Stack ist, und am Ende der Schleife
wird der nächste Wert auf den Stack gelegt.  In Java wird am Ende der
Schleife der neue Wert berechnet und in die Variable l gespeichert.

<pre>
  static void almostInsertEnd(int v,       // : insert-end { val listp -- }
                              ListNode l) {//   listp begin { lp1 }
    while (l.next != null)                 //     lp1 @ while
      l=l.next;                            //       lp1 @ list-next
    l.next = new ListNode(v, null);        //   repeat
  }                                        //   0 val new-list lp1 ! ;
</pre>

Da man in Java keine Referenzen auf Speicherstellen zur Verfügung hat,
können wir die auch nicht an InsertEnd übergeben.  Daher machen wir
vorerst eine Variante, die versagt, wenn man eine leere Liste als
Parameter übergibt.  Statt (in Forth) eine Referenz auf die
Speicherstelle, die den nächsten Listenknoten enthält, merken wir uns
in Java den vorigen Listenknoten.  Wir werden später noch andere
Lösungen dieses Problems betrachten.

<p>Sobald ein Knoten mit einem leeren next-Feld gefunden ist, wird ein
neuer Listenknoten erzeugt, und die Referenz in diesem Feld
gespeichert.

<pre>
  static ListNode copy(ListNode l) {       // : copy-node { list1 -- list2 }
    return new ListNode(l.val, l.next);    //    list1 list-next @
  }                                        //    list1 list-val @ new-list ;
</pre>

Hier ist der Rückgabewert eine Referenz auf ein ListNode-Objekt.  Die
Java-Methode entspricht direkt der Forth-Definition.

<p>Wer schon mehr Java-Erfahrung hat, wird sich vielleicht fragen,
warum ich hier
nicht <a href="http://docs.oracle.com/javase/7/docs/api/java/lang/Object.html#clone()">clone()</a>
definiere und weiter unten verwende.  Der Grund liegt daran, dass ein
ordentliches clone eine komplette Kopie der gesamten Liste machen
sollte, und nicht nur des ersten Knotens.

<pre>
  public static void main(String [] args) {
    ListNode list1=new ListNode(5, null);  // 0 5 new-list constant list1
    ListNode list2=list1;                  // list1 constant list2
    ListNode list3=new ListNode(5,null);   // 0 5 new-list constant list3
    print(list1);                          // cr list1 .list
    print(list2);                          // cr list2 .list
    print(list3);                          // cr list3 .list
</pre>

In Java wird beim Aufruf <code>java ListNode</code> die
Methode <code>main</code> der Klasse <code>ListNode</code> aufgerufen;
wenn man also will, dass etwas passiert, muss man es dorthin
schreiben, oder dort zumindest die Aufrufe der Methoden, in denen es
passiert.

<p>Hier enthält <code>main</code> die Java-Version unseres Testcodes
für die Objektidentität.  Nach diesen Aufrufen ist der Zustand wie
folgt:

<p><img src="identity1.png">

<p>In Java wird also mit <code>new</code> ein Objekt angelegt, und
Variablen, die einen Objekttyp haben, enthalten immer nur Referenzen
auf die entsprechenden Objekte.  Wir haben hier also zwei Objekte und
drei Variablen mit Referenzen darauf.

<pre>
    list1.val=6;                           // 6 list1 list-val !
    System.out.println();                  // cr
    print(list1);                          // cr list1 .list
    print(list2);                          // cr list2 .list
    print(list3);                          // cr list3 .list
</pre>

Hier zeigt sich in der Ausgabe, dass list1 und list2 Referenzen auf
das selbe Objekt sind.  Bei beiden wird die Liste "6" augegeben, bei list3 "5".

<pre>
    ListNode list4=new ListNode(8, list1); // list1 8 new-list constant list4
    System.out.println();                  // cr
    print(list1);                          // cr list1 .list
    print(list2);                          // cr list2 .list
    print(list3);                          // cr list3 .list
    print(list4);                          // cr list4 .list
</pre>

<p><img src="identity2.png">

<pre>
                                           // cell% %allot constant listp1
                                           // list4 listp1 !
    almostInsertEnd(9, list4);             // 9 listp1 insert-end
    System.out.println();                  // cr
    print(list1);                          // cr list1 .list
    print(list2);                          // cr list2 .list
    print(list3);                          // cr list3 .list
    print(list4);                          // cr list4 .list
</pre>

Da man in Java keine Referenzen auf Speicherstellen schreiben kann,
wird hier auch keine Speicherstelle dafuer angelegt und initialisiert.
Da list4 aber nicht leer ist, macht der Aufruf
von <code>almostInsertEnd</code> hier das gleiche wie der
von <code>insert-end</code> (bei der Java-Variante die listp1-Zelle
wegdenken):

<p><img src="identity3.png">

<pre>
    ListNode list5=copy(list4);            // list4 copy-node constant list5
    System.out.println();                  // cr
    print(list1);                          // cr list1 .list
    print(list2);                          // cr list2 .list
    print(list3);                          // cr list3 .list
    print(list4);                          // cr list4 .list
    print(list5);                          // cr list5 .list
    list5.val=2;                           // 2 list5 list-val !
    System.out.println();                  // cr
    print(list1);                          // cr list1 .list
    print(list2);                          // cr list2 .list
    print(list3);                          // cr list3 .list
    print(list4);                          // cr list4 .list
    print(list5);                          // cr list5 .list
  }                                        // cr bye
}
</pre>

Hier wird der Knoten, auf den list4 zeigt, kopiert, und das Ergebnis
merken wir uns in list5.  Durch Ändern von <code>list5.val</code> und
die Ausgabe der Listen, auf die unsere Referenzen zeigen, sehen wir,
dass list5 nicht auf das selbe Objekt zeigt wie list4.

<h1>19.5.2014</h1>

<h2>Einfügen in einer Liste</h2>

Betrachten wir noch einmal das Einfügen in eine Liste, zunächst in
Forth.  Zur besseren Veranschaulichung des Unterschiedes zwischen der
Adresse des Listenknotens und der Adresse des
Feldes <code>list-next</code> machen wir hier dieses Feld an zweiter
Stelle.  Wir beginnen mit einer Liste mit zwei Knoten:

<pre>
cell% %allot constant listp
0 3 new-list
  1 new-list
listp !
listp @ .list
</pre>

<p><img src="list-insert.png">

<p>Betrachten wir als einfachen Fall einmal das Einfügen eines Knotens
mit dem Wert 5 zwischen erstem und zweitem Knoten.  Wir müssen
zunächst den neuen Knoten anlegen.  Das Feld <code>list-val</code>
dieses Knotens setzen wir auf 5; <code>list-next</code> des neuen
Knoten soll auf den letzten Knoten der Liste zeigen:

<p><img src="list-insert2.png">

<p>Im letzten Schritt überschreiben wir die Zelle die bisher auf das letzte
Listenelement zeigt mit der Adresse des neuen Listenelements:

<p><img src="list-insert3.png">

<p>Damit das funktioniert, muss unserem Einfügewort die Adresse der
Zelle <code>list-next</code> übergeben werden, bzw. allgemein die
Adresse einer Zelle, in der der Zeiger auf den Listenknoten steht, vor
dem das neue Element eingefügt werden soll.

<pre>
5 listp @ list-next insert
listp @ .list
</pre>

Wenn wir nach dem ersten Element einer Liste irgendwo ein Element
einfügen wollen, ist der zweite Parameter von <code>insert</code> die
Adresse des Feldes <code>list-next</code> des Knoten, hinter dem wir
einfügen wollen.  Wenn wir vor dem ersten Knoten einfügen wollen,
übergeben wir die Zelle, in der die Adresse auf den ersten Knoten
steht, in unserem Beispiel also <code>listp</code>.

<pre>
7 listp insert
listp @ .list
</pre>

<img src="list-insert4.png">

Diese Zelle haben wir genau dafür angelegt.

<h3>Einfügen und Suchschleifen</h3>

Da man beim Einfügen immer die Adresse der Zelle braucht, die auf den
Listenknoten zeigt, vor dem wir einfügen wollen, und nicht den
Listenknoten selbst, unterscheidet sich eine Suchschleife, in der man
einen Platz sucht, wo man einfügen will, von einer Suchschleife wie
der von <code>member?</code>.

<pre>
: search { key listp -- listp2 } \ : member? { key liste -- flag }
  listp begin { lp }             \   liste begin { l }            
    lp @ while                   \     l while                    
      lp @ list-val @ key = if   \       l list-val @ key = if    
        lp exit endif            \         true exit endif        
      lp @ list-next             \       l list-next @            
  repeat                         \   repeat                       
  lp ;                           \   false ;                      
</pre>

<code>Search</code> muss ja immer die Adresse der Zelle, die auf das
gerade betrachtete Element zeigt, bereithalten (als <code>lp</code>),
damit es diese Adresse an den Aufrufer zurückgeben kann, wenn es
fertig ist.

<p>Der interessanteste Unterschied daraus ergibt sich bei der
Berechnung des Wertes für die nächste Iteration: <code>lp @
list-next</code> bei search, <code>l list-next @</code> bei member?.
Wenn wir diese Berechnungen verschiedener Iterationen aneinandergereit
sehen (als Trace ohne die Abbruchbedingungen) und das Definieren und
Benutzen der lokalen Variablen weglassen, sehen wir in beiden Fällen
eine Sequenz <code>... @ list-next @ list-next ...</code>.  Der
Unterschied zwischen den beiden Schleifen ist, wo der Rest der
Schleife eingefügt wird: bei search zwischen <code>list-next</code>
und <code>@</code>, bei member? zwischen <code>@</code>
und <code>list-next</code>.

<p>Die Unterschiede bei den Abbruchbedingungen kommen daher, dass man
in beiden Fällen die Adresse des Knotens braucht, dafür bei search
aber <code>lp @</code> statt <code>l</code> schreiben muss.  Und die
Rückgabewerte sind verschieden und dementsprechend auch der Code
dafür.

<p>Hier eine Verwendung von search.  Wir wollen einen Knoten mit dem
Wert 8 von dem Knoten mit dem Wert 5 einfügen.

<pre>
8 5 listp search insert
cr listp @ .list
</pre>

Der Forth-Code für dieses Beispiel ist
in <a href="java/identity/insert.fs">dieser Datei</a>.

<h3>Einfügen in Java</h3>

Java unterstützt keine Adressen von Feldern oder Variablen, was also
tun?  Man kann sich stattdessen (soweit vorhanden) eine Referenz auf
den Vorgängerknoten in der Liste merken, und dann einfach auf dessen
next-Feld zugreifen.  Diesen Weg haben wir schon
in <code>almostInsertEnd</code> beschritten.

<p>Allerings gibt es am Anfang der Liste keinen Vorgängerknoten.
Unsere erste Lösung behandelt diesen Fall als Sonderfall:

<pre>
public class List1 {
    ListNode head;
</pre>

Zunächst brauchen wir eine eigene Klasse für unsere Liste: Wir
brauchen ein Feld <code>head</code> mit einer Referenz auf den ersten
Listenknoten, und wir müssen dieses Feld in ein Objekt packen (und
dafür eine Klasse definieren), damit wir eine Referenz darauf machen
können, die wir dann unserer Einfügemethode übergeben können; denn
diese Methode soll ja <code>head</code> verändern können.

<p>Wir definieren keinen Konstruktor für List1, und das System
initialisiert dieses Feld daher mit null, also einer leeren Liste
(Vorsicht, in manchen Programmiersprachen gibt es so eine automatische
Initialisierung nicht, da würde eine fehlende Initialisierung
wahrscheinlich zu einem Fehler führen).

<pre>
    static void searchInsert(List1 l, int key, int v) {
        // neuen Knoten mit Wert v vor dem Knoten mit wert key in l einfuegen
        // bzw. am Ende
        ListNode previous = null;
        ListNode n = l.head;
        while (n != null &amp;&amp; n.val != key) {
            previous = n;
            n = n.next;
        }
        ListNode newnode = new ListNode(v, n);
        if (previous == null) {
            l.head = newnode;
        } else {
            previous.next = newnode;
        }
    }
</pre>

Da wir keine Referenzen auf Speicherstellen übergeben können wie in
Forth, haben wir hier die beiden Wöerter search und insert zu einer
Methode <code>searchInsert</code> zusammengefasst.  Der Nachteil dabei
ist, dass man den search-Teil nicht wiederverwenden kann, wenn man zum
Beispiel ein <code>searchDelete</code> schreiben will.

<p>Wir verwenden zwei Variablen: n zeigt auf den Knoten, den wir
gerade untersuchen, und previous auf den vorherigen Knoten; wenn es
keinen vorherigen Knoten gibt, also in der ersten Iteration, ist
previous gleich null.  Eine Schleifeninvariante ist also

<pre>
((previous==null &amp;&amp; n==l.head) || previous.next==n)
</pre>

Wenn die Schleife verlassen wurde, möchten wir das neue Element
zwischen previous und n einfügen.  Dazu bauen wir uns einmal den neuen
Knoten mit n als Nachfolgeknoten.  Die Referenz auf diesen neuen
Knoten wollen wir also dem next-Feld des previous-Knotens zuweisen,
und wenn previous!=null, dann machen wir das auch.

<p>Das geht aber nicht, wenn die Schleife schon bei der ersten
Iteration abgebrochen hat.  Das erkennen wir daran, dass previous noch
gleich null ist.  In dem Fall hängen wir das neue Element direkt im
head ein.  head entspricht also in der Forth-Version der Zelle, auf
die listp zeigt.

<p>Bemerkung zu Syntax und Semantik von Java: "==" ist der Vergleich auf
Gleichheit, "!=" auf Ungleichheit, "&amp;&amp;" ist ein logisches und, und
"||" ist ein logisches oder.  "=" ist die Zuweisung des Wertes auf der
rechten Seite an die Variable oder das Feld auf der linken Seite.

<p>Bei <code>n != null &amp;&amp; n.val != key</code> sehen wir auch
die <a href="http://en.wikipedia.org/wiki/Short-circuit_evaluation">Kurzschlussauswertung</a>
(short-circuit evaluation) beim Operator &amp;&amp;: Zuerst
wird <code>n!=null</code> ausgewertet; wenn das Ergebnis falsch ist,
wird der zweite Teilausdruck gar nicht mehr ausgewertet und das
Ergebnis des gesamten Ausdrucks ist falsch.  Ansonsten ist das
Ergebnis des zweiten Teilausdrucks das Ergebnis des Gesamtausdrucks.
Dass der zweite Teilausdruck nicht mehr ausgewertet wird, wenn n==null
ist, ist deswegen wichtig, weil n.val dann einen Fehler liefern würde.

<p>Bei || ist es ähnlich, nur ist der Ausdruck wahr, wenn schon der
erste Teilausdruck wahr ist, und dementsprechend wird dann der zweite
Teilausdruck nicht mehr ausgewertet.

<pre>
    public static void main(String [] args) {
        List1 l1=new List1();
        l1.head = new ListNode(1, new ListNode(3,null));
        ListNode.print(l1.head);
        searchInsert(l1, 3, 5);
        ListNode.print(l1.head);
        searchInsert(l1, 1, 7);
        ListNode.print(l1.head);
        searchInsert(l1, 5, 8);
        ListNode.print(l1.head);
        // Einfuegen am Ende testen
        searchInsert(l1, 99, 9);
        ListNode.print(l1.head);
    }
}
</pre>

In unserer Hauptmethode bauen wir einfach (wie in der Forth-Version)
eine Liste mit zwei Knoten mit den Werten 1 und 3, und fügen dann vor
dem Knoten 3 einen weiteren Knoten 5 ein, vor dem Knoten 1 einen
Knoten 7 (dabei wird getestet, ob das Einfügen am Anfang
funktioniert), usw.  Das Einfügen vor dem Knoten 99 testet, ob auf der
Fall funktioniert, wo der Wert nicht gefunden wird und am Ende
eingefügt werden soll.

<p>Das Java-Programm finden Sie in <a href="java/identity/">diesem
Verzeichnis</a>, Sie benötigen die Dateien List1.java und
ListNode.java.

<h3>Einfügen in Java, die zweite</h3>


<p>Es gibt auch noch eine andere Möglichkeit, das Problem am Anfang
der Liste anzugehen: Wir sorgen dafür, dass es auch für den ersten
richtigen Knoten einen Vorgängerknoten gibt, der allerdings nur für
diesen Zweck da ist.  Die Nutzlast dieses Knotens spielt in diesem
Vorgängerknoten keine Rolle:

<pre>
public class List2 {
    ListNode prehead;
    List2() {
        prehead = new ListNode(0,null);
    }
</pre>

Dieser Vorgängerknoten des ersten Knotens wird im Feld prehead unseres
List2-Objektes gespeichert, und wir erzeugen im Konstruktor von List2
diesen Knoten und weisen die Referenz auf diesen Knoten prehead zu.

<pre>
    static void searchInsert(List2 l, int key, int v) {
        // neuen Knoten mit Wert v vor dem Knoten mit wert key in l einfuegen
        // bzw. am Ende
        ListNode previous = l.prehead;
        ListNode n = previous.next;
        while (n != null && n.val != key) {
            previous = n;
            n = n.next;
        }
        ListNode newnode = new ListNode(v, n);
        previous.next = newnode;
    }
</pre>

Hier können wir jetzt previous mit der Referenz auf den prehead-Knoten
initialisieren, und brauchen am Ende der Schleife keinen Sonderfall
mehr behandeln: previous zeigt immer auf den Knoten, in dessen
next-Feld wir einfügen wollen.  Die obige Schleifeninvariante ist auch
einfacher, der Sonderfall ist weg:

<pre>
previous.next==n
</pre>

Die Main-Methode ist zwar im Grunde gleich wie bei List1, aber die
Verwendungen von <code>head</code> mussten
durch <code>prehead.next</code> ersetzt werden:

<pre>
    public static void main(String [] args) {
        List2 l1=new List2();
        l1.prehead.next = new ListNode(1, new ListNode(3,null));
        ListNode.print(l1.prehead.next);
        searchInsert(l1, 3, 5);
        ListNode.print(l1.prehead.next);
        searchInsert(l1, 1, 7);
        ListNode.print(l1.prehead.next);
        searchInsert(l1, 5, 8);
        ListNode.print(l1.prehead.next);
        // Einfuegen am Ende testen
        searchInsert(l1, 99, 9);
        ListNode.print(l1.prehead.next);
    }
</pre>

<h2>Abstraktion von der Implementierung, Schnittstellen</h2>

Dass eine Änderung der Implementierung einer Klasse zu solchen Änderungen bei
der Verwendung führt, würde man lieber vermeiden.  Daher entwirft man
die Programme so, dass das in vielen Fällen nicht nötig ist, und Sie
werden hier und in späteren Lehrveranstaltungen noch öfters auf
entsprechende Programmiertechniken und Programmiersprachenfeatures
treffen.

<p>Grundsätzlich löst man das Problem, indem man von der konkreten
Implementierung abstrahiert und abstrakte Schnittstellen in Form von
Methoden zur Verfügung stellt.

<p>In unserem Fall könnte man z.B. eine Methode print(List1)
bzw. print(List2) zur Verfügung stellen, und einen Konstruktor, der
einen ListNode als Parameter nimmt.  Dann wären die Zugriffe auf head
bzw. prehead auf diese Methoden beschränkt und main() und andere
Aufrufer würden diesen Unterschied nicht sehen.
Siehe <a href="java/identity/List1a.java">List1a.java</a>
und <a href="java/identity/List2a.java">List2a.java</a>; beachten Sie die
kaum vorhandenen Unterschiede bei main().

<p>Eine andere Alternative wäre es, zwei Methoden 

<pre>
void setHead(List1 l, ListNode n);
ListNode getHead(List1 l);
</pre>

zur Verfügung zu stellen, sogenannte getter und setter-Methoden.  Mit
diesen könnte man zwar in unserem Fall das Problem lösen, allerdings
ist der Abstraktionsgrad relativ gering und oft zu gering; zum
Beispiel kann man einen getter und setter fuer prehead von List2 nicht
so einfach in List1 implementieren.

<p>Man sollte sich also sinnvolle Abstraktionen überlegen, und da die
richtigen zu finden, ist eine Kunst, und man wird die optimalen
Schnittstellen meist nicht im ersten Versuch finden.

<p>Damit ein Programmierer, die eine Klasse verwendet, nicht doch auf
die Interna der Implementierung zugreift und dann sein Programm bei
Änderung der Implementierung nicht mehr funktioniert, schränkt man den
Zugriff auf die Interna ein (data hiding, infomation hiding).  In Java
kann man zum Beispiel die Sichtbarkeit von Feldern und Methoden
mit <code>private</code> einschränken.

<p>Allerdings kann man nicht alle gewünschten Einschränkungen mit
Sprachfeatures ausdrücken.  In unserem Beispiel ist main() ja eine
Methode von List1 bzw. List2 und kann auch auf head bzw. prehead
zugreifen, wenn diese private sind.  Viele Einschränkungen kann man
nur über die Dokumentation mitteilen.  Umgekehrt sollten Sie bei
Verwendung einer Klasse solche Einschränkungen in der Dokumentation
beachten, das erhöht die Chance, dass Ihr Programm noch mit der
nächsten Version der Klasse läuft.

<p>Wichtige Begriffe in diesem Zusammenhang
sind <em>Schnittstelle</em> (Interface; es gibt auch ein
Java-Sprachfeature, das so heisst, hier ist aber ein allgemeineres
Konzept gemeint), die beschreibt, wie auf eine Komponente (z.B. eine
Klasse) von anderen Komponenten zugegriffen werden kann.  Dadurch
müssen sich die Verwender der Komponente nicht mi der Implementierung
beschäftigen, sondern nur mit der Schnittstelle (die meistens deutlich
einfacher ist); umgekehrt hat man beim Implementieren der Komponente
gewisse Freiheiten, weil man sich nur an die Schnittstelle halten
muss.

<p>Das ganze geht von einer Rollenverteilung von Verwender und
Implementierer einer Komponente aus, und ist besonders wichtig, wenn
das verschiedene Personen sind.  Aber es hilft auch, wenn es dieselbe
Person ist.  Hätte ich beim Schreiben von List1 schon von den
Zugriffen auf head abstrahiert, hätte ich beim Schreiben von List2
wenig an main ändern müssen.

<h1>26.5.2014</h1>

<h2>Objekte</h2>

In diesem Abschnitt sehen wir uns die Sprachfeatures von Java für
Objektorientierung an, indem wir das, was
wir <a href="#Objekte">früher</a> in Forth gemacht haben, in Java
machen.  Die Dateien finden Sie in <a href="java/obj/">diesem
Verzeichnis</a>.

<pre>
public abstract class Obj {       // struct                                 
    public abstract void print(); //   cell% field obj-print \ xt ( obj -- )
}                                 // end-struct obj%                        
                                  //                                        
                                  // : .obj { obj -- }                      
                                  //   obj  obj obj-print @ execute ;       
</pre>

Eine Klasse (class) beschreibt eine bestimmte Art von Objekten.  Diese
Objekte werden dann Instanzen (instances; die korrekte deutsche
Übersetzung wäre "Exemplar", aber "Instanz" hat sich durchgesetzt)
genannt.  Eine Klasse wäre zum Beispiel "Person", Instanzen davon
"Jane Doe" und "John Smith".

<p>In Java legen Sie meist für jede Klasse eine neue Datei an, und
umgekehrt müssen Sie in einer Datei eine Klasse definieren.

<p>Hier definieren wir eine Klasse Obj (die Forth-Entsprechung
ist <code>obj%</code>), mit einer Methode print()
(entsprechend <code>.obj</code>).  Die Klasse ist abstract, das heißt,
man darf von dieser Klasse keine Instanzen erzeugen; sie dient nur als
Fundament für Unterklassen.

<p>Und die Methode print() ist ebenfalls abstract, das heisst, es gibt
keine konkrete Implementierung für diese Klasse, und auch print() wird
nur in Unterklassen implementiert; die Deklaration von print() hier
dient dazu, um die Schnittstelle der Klasse Obj und (vor allem) ihrer
Unterklassen festzulegen.  Wenn ich zum Beispiel eine
Methode <code>foo(Obj x)</code> schreibe, weiss ich, dass ich x mit
der Methode <code>print()</code> ausgeben kann.

<p>Im Gegensatz zu allen bisherigen Methoden ist print() nicht
statisch (kein <code>static</code>-Keyword bei der Deklaration).  Was
das genau bedeutet, sehen wir weiter unten.

<p>In Java muss man kein Feld obj-print definieren.  Intern macht Java
so etwas ähnliches, weil print() keine statische Methode ist, aber das
sieht man als Programmierer nicht.  Umgekehrt kann man so etwas in
Java gar nicht explizit schreiben, weil es so etwas wie Execution
Tokens und <code>execute</code> in Java nicht direkt gibt.

<!-- public -->

<pre>
public class Signed extends Obj {       // obj%                            
    int val;                            //   cell% field signed-val        
    Signed(int n) {                     // end-struct signed%              
        val=n;                          //                                 
    }                                   // : .signed ( signed -- )         
    static public void print(Signed s) {//     signed-val @ . ;            
        System.out.print(s.val);        //                                 
    }                                   // : new-signed { n -- signed }    
    public final void printSigned() {   //   signed% %allot { signed }     
        System.out.print(val);          //   ['] .signed signed obj-print !
    }                                   //   n signed signed-val !         
    public void print() {               //   signed ;                      
        // System.out.print(val);
        // printSigned();
        print(this);
    }
}
</pre>

Signed ist eine Unterklasse von Obj (angezeigt durch <code>extends
Obj</code>).  Wir fügen ein Feld val hinzu.  Jede Instanz der Klasse
hat also so ein Feld.

<p>Der Konstruktor Signed(int n) initialisiert das Feld.  Man erzeugt
sich ein Objekt und ruft diesen Konstruktor auf, indem man
z.B. <code>new Signed(5)</code> schreibt.  Das Anlegen des Objektes
und die Verwaltung der internen Informationen geschieht automatisch,
der Konstruktor initialisiert nur noch die Felder; in unserem Fall
entspricht also das, was der Konstruktor zu tun hat, dem <code>n
signed signed-val !</code> in Forth, der Rest wird automatisch vom
System gemacht.

<p>Danach sehen wir noch drei Varianten von Ausgabemethoden:

<p>Zunächst eine statische Methode print(Signed s)
(entsprechend <code>.signed</code>).  Dieser Methode übergibt man das
auszugebende Objekt beim Aufruf in den Klammern
(z.B. <code>print(s1)</code>), und wir erhalten dieses Argument dann
als Parameter s, und greifen über s auf dieses Objekt zu.

<p>Danach kommen zwei nicht-statische Methoden printSigned() und
print().  Die nicht-statischen Methoden (meist auch einfach "Methoden"
genannt) werden z.B. mit <code>s1.print()</code> aufgerufen; in der
Methode kann man auf das Objekt vor dem Punkt mit <code>this</code>
zugreifen, und auf das Feld val mit this.val oder einfach mit val.

<p>print() ist die Implementierung der abstrakten Methode print() aus
der Klasse Obj für die (konkrete) Klasse Signed.  Wir sehen hier drei
mögliche Implementierungen, zwei davon in Kommentaren: Die nicht
auskommentierte Version ruft einfach das statische print(Signed s)
auf, und zwar mit dem Objekt this als Parameter.  Ein Aufruf
s1.print() bewirkt also dann einen Aufruf print(s1).  

<p>Eine Alternative wäre es, den Wert direkt auszugeben
mit <code>System.out.print(val)</code>.  Dabei sieht man einen Zugriff
auf das Feld val von this.

<p>Als weitere Alternative sehen wir einen Aufruf der nicht-statischen
Methode printSigned().  Wir könnten das mit this.printSigned() machen,
aber in dem meisten Fällen kann man "this." weglassen.  Nur wenn es
mögliche Namenskonflikte gibt, braucht man "this." eventuell, um sie
zu vermeiden.  Das <code>final</code> gibt an, dass man printSigned()
in Unterklassen nicht überschreiben (override) kann.  Näheres dazu
später.

<p>Die Forth-Variante entspricht am ehesten der
nicht-auskommentierten: .signed entspricht einer statischen Methode,
und .obj ruft diese auf, wenn das Objekt ein signed% ist, und die
Verbindung wird über das Feld obj-print hergestellt, indem es mit dem
xt von .signed initialiert wird.  In Java müssen wir das nicht
hinschreiben, dafür müssen wir eben diese Definition von print()
hinschreiben, und das System macht die Details automatisch.

<pre>
public class Person extends Obj {       //obj%                                    
    long svnum;                         //  cell% field person-svnum              
    String name;                        //  cell% field person-name-addr          
    Person(long svnum, String name) {   //  cell% field person-name-len           
        this.svnum=svnum;               //end-struct person%                      
        this.name=name;                 //                                        
    }                                   //: .person { person -- }                 
    public static void print(Person p)  //  person person-name-addr @             
    {                                   //  person person-name-len @ type         
        System.out.print(p.name);       //  ."   SV-Nummer:"                      
        System.out.print(" SV-Nummer:");//  person person-svnum @ u. ;            
        System.out.print(p.svnum);      //                                        
    }                                   //: new-person                            
    public final void printPerson()     //  { svnum name-addr name-len -- person }
    {                                   //  person% %allot { person }             
        System.out.print(name);         //  ['] .person person obj-print !        
        System.out.print(" SV-Nummer:");//  svnum     person person-svnum !       
        System.out.print(svnum);        //  name-addr person person-name-addr !   
    }                                   //  name-len  person person-name-len !    
    public void print()                 //  person ;                              
    {
        print(this);
    }
}
</pre>

Vom Aufbau und von den verwendeten Mechanismen her ist die Klasse
Person der Klasse Signed sehr ähnlich.  Beides sind Unterklassen von
Obj.  Der größte Unterschied liegt darin, dass es hier zwei Felder
gibt, und eines davon ein String ist.

<p>Beim Konstruktor sehen wir hier (im Gegensatz zu Signed) den Fall,
dass die lokalen Variablen svnum und name die selben Namen haben wie
die Felder svnum und name.  Wenn man nur den Namen angibt, bezieht
sich das dann immer auf die lokale Variable (bzw. allgemein auf den
Namen, der weiter innen in der Verschachtelung definiert ist).  Um auf
die Felder zugreifen zu können, schreiben wir this.svnum und
this.name; dann ist klar, dass sich das auf die entsprechenden Felder
von this bezieht.

<p>Die folgende Klasse kam in der Vorlesung vom 26.5. noch nicht vor,
die Klasse Main weiter unten aber teilweise schon.

<pre>
public class Student extends Person {  //person%                                   
    int matnr;                         //  cell% field student-matnr               
    Student(long svnum, String name,   //end-struct student%                       
            int matnr) {               //                                          
        super(svnum,name);             //: .student { s -- }                       
        this.matnr=matnr;              //  s .person                               
    }                                  //  ."  Mat-Nr.: " s student-matnr @ . ;    
    public static void print(Student s)//                                          
    {                                  //: new-student { sv n-addr n-len mat -- s }
        Person.print(s);               //  student% %allot { s }                   
        System.out.print(" Mat-Nr.:"); //  ['] .student s obj-print !              
        System.out.print(s.matnr);     //  sv           s person-svnum !           
    }                                  //  n-addr       s person-name-addr !       
    public final void printStudent()   //  n-len        s person-name-len !        
    {                                  //  mat          s student-matnr !          
        printPerson();                 //  s ;                                     
        System.out.print(" Mat-Nr.:");
        System.out.print(matnr);
    }
    public void print()
    {
        this.printStudent();
    }
}
</pre>

Die Klasse Student ist eine Unterklasse der Klasse Person (und damit
indirekt auch von Obj, aber diesmal nicht direkt); man sagt dazu auch
Kindklasse.  Daher hat ein Objekt der Klasse Student alle Felder und
Methoden von Person.  Dazu kommt dann noch das Feld matnr.

<p>Beim Konstruktor Student könnte man hier alle drei Felder explizit
initialisieren, aber wir machen es anders: Wir rufen mit
super(svnum,name) den Konstruktor für die Oberklasse auf.  Wenn die
Felder der Oberklasse private sind, dann kann man in der Unterklasse
nicht darauf zugreifen, und dann ist das der naheliegendste Weg, sie
zu initialisieren.  Zusätzlich initialisiert der Konstruktor auch das
zusätzliche Feld matnr.  (In der Forth-Variante werden alle Felder
direkt initialisiert).

<p>Das statische print(Student s) ruft das statische print(Person s)
der Klasse Person auf, um die Felder auszugeben, die jede Person (und
daher auch ein Student) hat, und gibt das zusätzliche Feld selbst aus.
Da ein Student ein Untertyp von Person ist, kann man s als Parameter
an die Methode Person.print(Person) übergeben, obwohl diese Methode
eine Person als Parameter erwartet.

<p>printStudent() ist eine Methode ähnlich printPerson(), also
nicht-statisch, aber final.  printStudent() gibt die Felder aus, die
alle Personen haben, indem es printPerson() aufruft.  Der Student, den
printStudent() ausgeben soll (in der Variable this) wird automatisch
an printPerson() weitergereicht, und wird dort dessen this.  Man
könnte das auch explizit machen, indem man this.printPerson()
hinschreibt.  Zusätzlich gibt printStudent() die Matrikelnummer aus,
wie gehabt.

<p>Die Methode print() ist die Implementierung der abstrakten Methode
print() der Klasse Obj für die Klasse Student.  Im Gegensatz dazu sind
die statischen Methoden Signed.print(Signed), Person.print(Person),
und Student.print(Student) alles unterschiedliche Methoden, und
printSigned(), printPerson(), printStudent() natürlich auch.
Statische Methoden in unterschiedlichen Klassen sind grundsätzlich
verschieden (auch wenn sie den selben Namen haben), und nichtstatische
Methoden mit unterschiedlichen Namen auch.  Die Methode print() ist
aber nichtstatisch und hat den selben Namen (und die selben Parameter)
in allen von Obj abgeleiteten Klassen, und es handelt sich dabei also
um verschiedene Implementierungen der selben abstrakten Methode.

<p>Hier ist print() einfach als Aufruf von printStudent()
implementiert, diesmal mit explizitem this.


<pre>
public class Main {
  static void printArray(Obj a[]) {  //: .objarray { addr len -- } 
    for (int i=0; i&lt;a.length; i++) { //  len 0 ?do                 
      a[i].print();                  //    cr addr i cells + @ .obj
      System.out.println();          //  loop ;                    
    }
  }
</pre>

<p>In der Klasse Main definieren wir eine statische Methode
printArray(Obj a[]), die als Parameter ein Array a von Obj-Referenzen
hat; dass es sich um ein Array handelt, sieht man an "[]".
printArray() ruft für jedes Element dieses Arrays die Methode print()
auf, und gibt dann ein newline aus (damit jedes Objekt eine eigene
Zeile bekommt).  Arrays in Java beginnen mit dem Index 0, und die
Anzahl der Elemente kann man mit .length ermitteln.  Der höchste Index
von a ist also a.length-1.

<p>Beim Aufruf a[i].print() wird vom Array a das i. Element gelesen,
eine Referenz auf ein Objekt einer Unterklasse von Obj.  Dann wird das
print() für die entsprechende Unterklasse aufgerufen, wobei die
Referenz in der aufgerufenen Methodenimplementierung zu this wird.


<pre>
  public static void main(String [] args) {
    Obj signed1 = new Signed(5);   //5 new-signed constant signed1
    Person person1 = new Person(1234567890L,"Jane Doe");
             //1234567890 s" Jane Doe" new-person constant person1
    signed1.print();               //signed1 .obj
    Signed.print((Signed)signed1); //signed1 .signed
    System.out.println();          //cr
</pre>

Hier legen wir uns zunächst zwei Objekte an: Eines (signed1) vom Typ
Signed wird aber in einer variable vom Typ Obj gespeichert.  Da Signed
ein Untertyp von Obj ist und damit überall dort vorkommen darf, wo Obj
vorkommen darf, geht das.  Das andere Objekt (person1) hat den Typ
Person.

<p>Dann geben wir signed1 auf zwei Arten aus: Als erstes durch den
Aufruf der nichtstatischen abstrakten Methode print() der Klasse Obj
für das Objekt signed1.  Von dieser abstrakten Methode gibt es drei
Implementierungen (für Signed, Person, und Student).  Je nachdem, für
welchen Typ von Objekt print aufgerufen wird, wird die entsprechende
Implementierung ausgewählt und ausgeführt.  Und zwar erfolgt diese
Auswahl (dispatch) zur Laufzeit anhand des konkreten Typs zur Laufzeit
(dynamic dispatch).  Das sieht man hier daran, dass hier die
print()-Implementierung von signed ausgeführt wird, obwohl der
statische Typ der Variable signed1 Obj ist.

<p>Die zweite Ausgabe erfolgt über die statische Methode print(Signed
s) der Klasse Signed.  Wenn wir uns in anderen Klassen auf statische
Methoden beziehen, müssen wir die Klasse angeben, in der die statische
Methode liegt; deswegen erfolgt der Aufruf hier mit Signed.print(...).
Als Parameter übergeben wir signed1.  Aber signed1 ist eine Variable
vom Typ Obj.  Daher können wir den Aufruf nicht einfach mit
Signed.print(signed1) machen, denn wir haben keine statische Methode
print(Obj) in Signed definiert.  Damit wir Signed.print(Signed s)
aufrufen können, müssen wir den Typ zuerst mit einem <em>Cast</em> in
Signed umwandeln (konvertieren).  Das geschieht mit "(Signed)signed1".
Da das Ergebnis davon garantiert den Typ Signed (oder einen Untertyp
davon) hat, und der Java-Compiler das jetzt auch weiß, kann man jetzt
die statische Methode aufrufen.

<p>Was bei dem Cast tatsächlich passiert, ist, dass der konkrete Typ
des Objekts, auf das signed1 zeigt, überprüft wird, und wenn es nicht
Signed (oder ein Untertyp von Signed) ist, wird das Programm
abgebrochen.  Wenn die Cast-Operation erfolgreich beendet wird,
haben wir also garantiert ein Signed.

<pre>
    person1.print();      //person1 .obj
    System.out.println(); //cr
    System.out.println(); //cr
</pre>

Die Ausgabe von person1 erfolgt über die abstrakte Methode print() von
Obj, genau wie oben die erste Ausgabe von signed1.  Da das Objekt hier
eine Person ist, wird von den verschiedenen Implementierungen der
Methode die in der Klasse Person definierte ausgewählt und ausgeführt.

<pre>
    Obj a[]=new Obj[3];  //here 3 cells allot constant a
    a[0] = signed1;      //signed1 a 0 cells + !        
    a[1] = person1;      //person1 a 1 cells + !        
    a[2] = new Signed(9);//9 new-signed a 2 cells + !   
    printArray(a);       //a 3 .objarray
    System.out.println();//cr
</pre>

Hier legen wir ein Array a mit drei Elementen an, und initialisieren
die Elemente mit signed1, person1, und einem weiteren Signed-Objekt.
Dann geben wir diese Elemente mit printArray(Obj a[]) aus.  Je
nachdem, ob das Objekt ein Signed oder eine Person ist, wird dabei die
entsprechende Implementierung von print() aufgerufen.  Das
funktioniert so nur mit der abstrakten Methode print() von Obj, nicht
mit den diversen statischen Methoden oder den final-Methoden, eben
weil die abstrakte Methode print() von Obj dynamischen dispatch
benutzt, und die statischen Methoden nicht; und die final-Methoden
wurden so geschrieben, dass dort kein dynamischer dispatch passiert.

<pre>
    Student student1=new Student(9876543210L,"John Smith",1499999);
        //9876543210 s" John Smith" 1499999 new-student constant student1
    Student.print(student1); //student1 .student
    System.out.println();    //cr
    Person.print(student1);  //student1 .person
    System.out.println();    //cr
    student1.print();        //student1 .obj
    System.out.println();    //cr
    System.out.println();    //cr
    a[2] = student1;         //student1 a 2 cells + !
    printArray(a);           //a 3 .objarray
  }
}
</pre>

Hier legen wir ein Objekt vom Typ Student an, und drucken es auf
verschiedene Weise: zunächst mit der statischen Methode
Student.print(Stident s), dann mit der statischen Methode
Person.print(Person s).  Der erste Aufruf gibt die Matrikelnummer mit
aus, der zweite nicht, denn die statisch Methode Person.print() macht
das nicht.

<p>Als drittes wird die abstrakte Methode print() def Klasse Obj
aufgerufen, die wiederum zur Laufzeit die Implementierung dieser
Methode in der Klasse Student wählt, weil das Objekt diesen Typ hat.
Diese Ausgabe zeigt uns also wieder die Metrikelnummer an.

<p>Schliesslich ersetzen wir die Zahl in a[2] durch student1, und
rufen wieder printArray(a) auf.  Diesmal gibt uns printArray als
dritten Wert unseren Studenten John Smith aus statt der Zahl 9.

<h1>2.6.2014</h2>

(einige Teile von oben werden auch erst am 2.6. vorgetragen).

<p>Zusammenfassend, was sind die wichtigen Aspekte des obigen Beispiels?

<p>Methoden haben einerseits eine Schnittstelle (auch Signatur
genannt), über die sie aufgerufen werden, also der Teil vor den
geschwungenen Klammern, andererseits eine Implementierung (der Teil in
den geschwungenen Klammern).

<p>Während bei statischen Methoden die Schnittstelle mit der
Implementierung fest verbunden ist, ist das bei nicht-statischen
Methoden anders: Da kann es mehrere Implementierungen für eine
Schnittstelle geben.  Welche davon verwendet wird, entscheidet sich
beim Aufruf zur Laufzeit anhand der konkreten Klasse des Objekts links
vom Punkt (dynamisches Binden, dynamic dispatch).

<p>Diese Trennung von Schnittstelle und Implementierung kann man auch
ganz explizit machen, indem man die Schnittstelle als abstrakte
Methode definiert, und die Implementierungen extra.  Das ist in
unserem Beispiel bei der nicht-statischen Methode print() gemacht
worden, während bei den nicht-statischen Methoden printSigned(),
printPerson() und printStudent() keine separate abstrakte Methode
definiert wurde.

<p>Ein weiterer Aspekt, den man an diesem Beispiel sehen konnte, ist
die Vererbung: Unterklassen erben Felder von Oberklassen, in unserem
Beispiel erbt die Klasse Student die Felder svnum und name von der
Oberklasse Person.

<p>Auch Methodenschnittstellen werden von Unterklassen geerbt: In
unserem Beispiel vererbt Obj die Methodenschnittstelle print() an
Signed, Person, und Student; und Person vererbt die
Methodenschnittstelle printPerson() an Student (man kann also
z.B. student1.printPerson() aufrufen).

<p>Schliesslich werden Methodenimplementierungen von Unterklassen
geerbt, wenn die Unterklasse keine eigene Implementierung der Methode
hat; wenn die Klasse eine eigene Implementierung hat, sagt man auch,
dass die Unterklasse die Methode überschreibt (override). In unserem
Beispiel haben Signed, Person und Student jeweils eigene
Implementierungen von print(), sodass hier keine Vererbung sichtbar
wird.  Dagegen erbt die Klasse Student die Implementierung von
printPerson() von der Klasse Person; das <code>final</code> bei der
Definition von printPerson() in Person sorgt auch dafür, dass die
Methode in Unterklassen nicht anders implementiert werden kann.

<p>Der Name "Unterklasse" legt nahe, dass Unterklassen weniger können
als Oberklassen.  Das Gegenteil ist der Fall: Ein Objekt einer
Unterklasse kann man überall einsetzen, wo ein Objekt der Oberklasse
erwartet wird, Unterklassen müssen daher mindestens genauso viel
können wie die Oberklassen.  Oft können sie mehr.

<p><strong>Übung</strong>: Definieren Sie folgende statische Methode
in der Klasse Person:

<pre>
public static void print1(Person p) {
  p.print();
}
</pre>

Überlegen Sie sich, was passiert, wenn Sie in
main <code>Person.print1(student1);</code> schreiben, und warum.
Überprüfen Sie Ihre Theorie durch Compilieren und Laufenlassen des
Programms.  Erklären Sie das Ergebnis.

<h1>5.6.2014</h1>

<h3>Nutzen von Objekten</h3>

Wozu sind diese doch recht komplizierten Mechanismen gut?  Allgemein
dazu, damit man Programme flexibel aus Komponenten zusammenbauen kann.
Eine Komponente braucht nur die Schnittstellen zu den anderen zu
kennen, und die anderen Komponenten können bei Bedarf ersetzt werden,
z.B. wenn eine bessere Implementierung vorliegt, oder wenn die
Komponente mehr können muss.  Bzw. man kann auch Komponenten
verwenden, die gar nicht für das konkrete Programm geschrieben worden
sind.

<p>Und wozu ist dynamic dispatch gut?  Dynamic dispatch erlaubt es, an
einer Stelle Objekte zu verwenden, die sich zwar von der Schnittstelle
her gleich, aber ansonsten verschieden verhalten.  Ein klassisches
Beispiel ist ein Vektor-Grafik-Programm, wo Kreise, Rechtecke,
Linienzüge, Bezierkurven, etc. alles einfach Grafik-Objekte sind, und
wenn man so ein Objekt anzeigen will, ruft main einfach eine
draw()-Methode dafür auf, und die Implementierungen dieser Methode
sind für die verschiedenen Grafik-Objekte unterschiedlich, aber alle
zeichnen das jeweilige Objekt.

<h2>Interfaces</h2>

Neben Klassen gibt es in Java noch Interfaces.  Interfaces können nur
abstrakte Methoden enthalten (in abstrakten Klasse dürfen auch
Implementierungen vorkommen), deshalb kann man
das <code>abstract</code> bei der Definition einer abstrakten Methode
in einem Interface weglassen.  Ein syntaktischer Unterschied ist, dass
eine Klasse die Methoden eines Interfaces nicht
mit <code>extends</code>, sondern mit <code>implements</code>
übernimmt.

<p>Eine Klasse kann in Java nur von maximal einer anderen Klasse
direkt erben (extends), aber sie kann (stattdessen oder zusätzlich)
noch beliebig viele Interfaces implementieren (implements).
Interfaces können wiederum von einem oder mehreren anderen Interfaces
erben (extends).

<p>In unserem obigen Beispiel erfüllt die Klasse Obj sowohl die
Einschränkungen einer Klasse (erbt von maximal einer Klasse) als auch
die eines Interfaces (keine Felder, nur abstrakte Methoden, erbt
höchstens von Interfaces), und man kann diese Klasse daher ohne
Probleme in ein Interface umwandeln.  Dazu muss nur das <code>abstract
class Obj</code> durch <code>interface Obj</code> ersetzt werden
und <code>extends Obj</code> durch <code>implements Obj</code>.  Das
Ergebnis finden Sie in <a href="java/interface">diesem
Verzeichnis</a>.

<p>Ein besserer (und den Java-Konventionen entsprechender) Name für
dieses Interface wäre übrigens "Printable", da Objekte mit diesem
Interface ausgegeben werden können.

<h2>Untertypen</h2>

Der allgemeine Begriff, den wir für die Beziehung zwischen einer
Klasse oder einem Interface A und einer davon abgeleiteten Klasse oder
Interface B verwenden, ist Untertypbeziehung: B ist ein Untertyp von
A.  Wie schon erwähnt, muss der Untertyp alles können, was der Obertyp
kann, und man kann ihn daher überall einsetzen, wo der Obertyp
erwartet wird (Ersetzbarkeitsprinzip).

<p>Beim Programmieren stellt sich die Frage: Welche Klassen soll man
jetzt als Untertypen welcher anderer Klassen im Programm vorsehen?
Dabei werden häufig Fehler gemacht, die entweder gleich zu unnötig
komplizierten Programmen führen oder später bei der Wartung Probleme
machen.

<p>Die Untertypbeziehung drückt eine Spezialisierung aus: Daher ist
eine Faustregel, dass es oft sinnvoll ist, eine Untertypbeziehung
zwischen zwei Typen zu haben, wenn die Konzepte, die sie modellieren,
über eine "ist-ein"-Beziehung (engl: is-a) miteinander verbunden sind.
Zum Beispiel: Ein Student "ist eine" Person.

<p>Wenn man davon abweicht, führt das oft über kurz oder lang zu
Problemen führen: Häufige Fehler sind zum Beispiel, eine
"enthält"-Beziehung in der realen Welt zu einer Untertypbeziehung zu
machen (z.B. Auto als Untertyp von Motor).  Oder eine Entwicklung zur
Grundlage von Untertypen zu machen: z.B. Vogel als Untertyp von
Einzeller.

<p>Selbst bei Ist-ein-Beziehungen muss man sich genau anschauen, ob
Ersetzbarkeit gegeben ist.  Z.B. ist ein Quadrat ein Rechteck.  Aber
wenn man für Rechteck eine Methode setGroesse(double x, double y) hat,
wird man diese Methode wahrscheinlich nicht sinnvoll für Quadrate
implementieren können.  Wenn man also so eine Methode haben will, wird
man Quadrat nicht als Untertyp von Rechteck definieren.  Wenn man aber
so eine Methode nicht hat, und für alle vorkommenden Methoden die
Ersetzbarkeit gegeben ist, ist es durchaus sinnvoll, Quadrat als
Untertyp von Rechteck zu definieren.

<p>Mehr zu diesen Themen erfahren Sie in den LVAs objektorientierte
Modellierung und objektorientierte Programmierung.


<h2>Java API und Object</h2>

Java hat eine reichhaltige Bibliothek von vordefinierten Klassen, die
auch gut dokumentiert
sind: <a href="http://docs.oracle.com/javase/7/docs/api/">Java™
Platform, Standard Edition 7 API Specification</a>.  Bei jeder Klasse
und bei jedem Interface findet man Beschreibungen der Methoden und
anderer Elemente der Klasse.  Besonders interessant sind die Klassen
in java.lang und java.util.

<p>Wichtig ist insbesondere die
Klasse <a href="http://docs.oracle.com/javase/7/docs/api/java/lang/Object.html">Object</a>,
denn jede Klasse ohne Oberklasse hat diese Klasse implizit als
Oberklasse, und jede andere Klasse hat Object dadurch indirekt als
Oberklasse.

<p>Die Klasse Object definiert eine Reihe von Methoden-Schnittstellen,
die daher für Objekte aller Klassen aufgerufen werden können, u.a.:

<ul>

<li> String toString(): Umwandlung in Zeichenkette
<li> boolean equals(Object): Vergleich auf Gleichheit
<li> int hashCode(): gleiche Objekte =&gt; gleiche Hashwerte
<li> Class getClass(): Klasse das Objekts (= dynamischer Typ)
<li> Object clone(): Erzeugen einer Kopie

</ul>

Diese Methoden (ausser getClass()) wird man beim Implementieren einer
Klasse überschreiben.

<h3>equals(Object)</h3>

Dabei ist besonders die Methode equals() lehrreich.  Sie soll
Gleichheit ausdrücken (und nicht Objektidentität).  D.h, wenn wir
folgendes machen:

<pre>
Person p1 = new Person(1234567890L,"Jane Doe");
Person p2 = new Person(1234567890L,"Jane Doe");
</pre>

dann ergibt der Vergleich p1==p2 als Ergebnis false, weil "==" die
Objektreferenzen vergleicht, also prüft, ob p1 auf das selbe Objekt
zeigt wie p2 (und da p1 auf das Ergebnis eines new-Aufrufs zeigt und
p2 auf das Ergebnis eines anderen, handelt es sich um verschiedene
Objekte, die nur den gleichen Inhalt haben).  Dagegen sollte
p1.equals(p2) als Ergebnis true liefern; dazu müssen wir aber
equals(Object) erst entsprechend definieren (Vorsicht, die in Object
definierte Version vergleicht auf Identität):

<pre>
public boolean equals(Object that) {
    if (that != null && this.getClass() == that.getClass()) {
        Person p = (Person) that;
        return svnum == p.svnum && name.equals(p.name);
    } else
        return false;
}
</pre>

Zunächst ist zu bemerken, dass diese Implementierung von
equals(Object) auch ein Object als Parameter nimmt.  Das geht in Java
nicht anders (sonst waere es eine andere Methode), und es ist auch
sinnvoll, da wir dadurch beliebige Objekte auf Gleichheit vergleichen
können.  Dann überprüfen wir, ob that nicht eine null-Referenz ist,
bevor wir prüfen, ob die Klasse von this identisch mit der Klasse von
that ist.

<p>Da das eine Methode von Person ist, ist this ein Objekt (einer
Unterklasse) von der Klasse Person.  Und wenn der Vergleich der
Klassen erfolgreich war (also im then-Zweig der if-Anweisung), wissen
wir damit auch, dass die Klasse von that (eine Unterklasse von) Person
ist, und können im nächsten Schritt that (von der statischen Klasse
Object) zur Klasse Person umwandeln (casten) und einer Variable p vom
Typ Person zuweisen.  Da der dynamische Typ von that auf jeden Fall
(eine Unterklasse von) Person ist, wissen wir auch, dass der cast
keinen Fehler zur Laufzeit auslösen wird; wenn wir zuerst den Cast
machen würden, und dann den Vergleich der Klassen, und wir übergeben
z.B. ein Signed als Parameter that, würde der Cast einen Fehler zur
Laufzeit produzieren, und zum Vergleich der Klassen würde es gar nicht
kommen.

<p>Die Reihenfolge des Vergleichs mit null und des Klassenvergleichs
ist übrigens auch wichtig: Wir holen uns die Klasse von that nur, wenn
wir wissen, dass that ungleich null ist.

<p>Die Variable p vom Typ Person brauchen wir, damit wir auf die
Personen-Felder von p/that zugreifen können und die dann mit den
entsprechenden Feldern von this vergleichen können.  Wir verleichen
svnum mit p.svnum mit dem Operator ==, weil svnum ein Feld vom Typ
long ist.  Das ist einer der elementaren Typen von Java, diese
vergleicht man mit == auf Gleichheit.  Das Feld name ist dagegen vom
Typ String, das ist ein Objekt-Typ und daher ist der richtige
Vergleich auf Gleichheit für diesen Typ equals(Object).  Allgemein
gibt es in Java die Konvention, dass Objekt-Typen gross geschrieben
werden (z.B. String), und elementare Typen klein (z.B. long); ein
Array von einem Elementaren Typ ist allerdings auch ein Objekt-Typ.

<p>Die beiden letzten Vergleiche liefern das Resultat, wenn der
null-Vergleich und der Klassenvergleich erfolgreich waren.  Sollte
einer der beiden false ergeben haben (also wenn that gleich null ist
oder eine andere Klasse als this hat), liefert unser equals(Object)
false zurück.

<p>Typische equals(Object)-Methoden für andere Klassen werden so
ähnlich ausschauen.

<p>Sie finden den Quellcode für dieses
Beispiel <a href="java/equals/">hier</a> und als
Zip-Datei <a href="java/equals.zip">hier</a>.

<p>Übung: Von den vier Bedingungen im obigen equals(Object) dürfen nur
die letzten beiden vertauscht werden, ohne einen Fehler einzuführen.
Ändern Sie equals(Object) so, dass die erste Bedingung nach der
zweiten geprüft wird, und in einem weiteren Versuch so, dass die
zweite Bedingung nach der dritten geprüft wird, und fügen Sie in
Main.java Testfälle ein, anhand derer man den Unterschied im Verhalten
zwischen der neuen Variante und der ursprünglichen sehen kann.

<h1>12.6.2014</h1>

<h3>hashCode() und Casts</h3>

<p>Damit die Invariante "a.equals(b) =&gt; a.hashCode() ==
b.hashCode()" erhalten bleibt, muss man meist auch hashCode geeignet
überschreiben.  Idealerweise sollte auch, wenn die beiden Objekte
ungleich sind, der Hash-Wert mit hoher Wahrscheinlichkeit verschieden
sein.  Wozu Hash-Werte gebraucht werden, erfahren Sie spätestens in
Algorithmen und Datenstrukturen, wenn es um Hash-Tabellen geht; aber
bei den Anwendungen von Hash-Werten geht es immer darum, dass man die
obige Invariante umdreht: a.hashCode() != b.hashCode =&gt;
!(a.equals(b)).  Man hat damit also eine Abkürzung, um die
Ungleichheit zu ermitteln, und kann sich damit einen aufwendigen
equals-Vergleich mit vielen Objekten sparen.

<p>Eine einfache und halbwegs brauchbare (wenn auch verbesserbare)
Hash-Funktion für unsere Klasse Person ist:

<pre>
    public int hashCode() {
        return ((int)svnum)+name.hashCode();
    }
</pre>

Alle Felder gehen in den Hash-Wert ein (bei svnum allerdings nur die
untersten 32 bits).

<p>Das Feld svnum ist ein long, und muss in ein int konvertiert werden,
damit wir es zu einem int addieren können und ein int herauskommt;
dabei gehen die oberen 32bits verloren (bei svnum sind diese Bits aber
fast alle 0, da eine österreichische Sozialversicherungsnummer nur 10
Stellen hat).  Die Konversion erfolgt mit der selben Syntax wie beim
Casten eines Objekt-Typs in einen spezialisierteren Objekt-Typ, und
die Operation wird auch Cast genannt, aber was dabei passiert, ist
doch recht verschieden:

<p>Beim Cast eines Objekt-Typs wird an dem Objekt und der Referenz
darauf nichts geaendert, sondern nur überprüft, ob das referenzierte
Objekt tatsächlich den Typ hat, in den gecastet wird (oder einen
Untertyp dieses Typs), und ggf. einen Fehler meldet.

<p>Im Gegensatz dazu erfolgt beim Casten eines elementaren Typ meist
eine Änderung: Bits werden hinzugefügt oder weggeworfen (bei
Konversion zwischen verschiedenen ganzzahligen Typen), oder die
Repräsentation ist überhaupt deutlich anders (z.B. bei Konversionen
zwischen ganzzahligen und Gleitkomma-Typen).

<p>In Java gibt es zu den elementaren Typen auch entsprechende
Objekt-Typen, z.B. Objekt-Typ Long zum elementaren Typ Long und
Objekt-Typ Integer zum elementaren Typ int.  Wenn wir svnum als Long
und nicht als long definiert hätten, hätten wir die Konversion nicht
mit einem Cast auf Integer oder int machen können, sondern
mit <code>svnum.intValue()</code> (für int)
bzw. <code>Integer.valueOf(svnum.intValue())</code> (für Integer).

<!-- !!  Bei einem Cast eines elementaren Typs findet keine Typprüfung zur
    Laufzeit statt.
-->

<p>Übung: Welche Hash-Werte erhalten Sie für p1 und p2?  Welche erhalten
Sie, wenn Sie hashCode() nicht für Person implementieren?  Unter
welchen Umständen ist die Invariante zwischen equals(Object) und
hashCode() erfüllt?

<h2>Generizität</h2>

<p>Quellcode für folgendes in <a href="java/generics/">diesem
Verzeichnis</a>.

<p>Es wäre recht praktisch, eine allgemeine Liste für Java implementieren
zu können, mit beliebigen Objekt-Typen als Nutzlast.  Fangen wir mit
einer einfachen Listenknoten-Klasse an:

<pre>
public class OListNode {
    public OListNode next;
    public Object val;
    ...
}
</pre>

Damit kann man zwar mit den val-Feldern alles machen, was man mit
Object-Objekten so machen kann, z.B. die Methode equals(Object)
aufrufen, aber nicht so ohne weiteres mehr.  Wenn wir z.B. wissen,
dass alle Nutzlasten in der Liste Objekte eines Untertyps von Obj
(unserem Typ mit der print()-Methode) sind, möchten wir vielleicht
alle Elemente der Liste mit print() ausgeben.  Das geht aber nicht so
ohne weiteres, denn val ist vom Typ Object, und dieser Typ hat keine
Methode print().

<p>Man kann das Problem aber lösen, indem man val auf den Typ Obj
castet:

<pre>
public static void printList(OListNode l) {
    for (; l!=null; l=l.next) {
        ((Obj)(l.val)).print();
        System.out.println();
    }
}
</pre>

Das wird vom Java-Compiler verarbeitet, und man kann Listen mi
Untertypen von Obj als Nutzlasten bauen, und dieses
printList(OListNode) wird so eine Liste klaglos ausgeben.

<p>Allerdings kann man auch z.B. ein String als Nutzlast verwenden,
und kann dann printList(OListNode) mit dieser Liste als Parameter
aufrufen; der Compiler beschwert sich darüber nicht, allerdings gibt
das einen Fehler zur Laufzeit: der Cast auf Obj entdeckt, dass val auf
ein String zeigt, und weil das kein Untertyp von Obj ist, meldet der
Cast einen Fehler.  Das ist dynamische Typüberprüfung.

<p>Eventuell möchten wir aber lieber die Möglichkeit haben, von
vornherein nur Untertypen von Obj als Nutzlast zu verwenden, sodass
solche Typfehler zur Laufzeit nicht auftreten.  Das geht mit
Typ-Parametern in Java:

<pre>
public class ListNode&lt;A&gt; {
    public ListNode&lt;A&gt; next;
    public A val;
    ...
}
</pre>

Die Klasse ListNode hat den Typparameter A, für den ein beliebiger
konkreter Typ eingesetzt werden kann, z.B. Obj.  In der
Klassendefinition kommt A dort vor, wo bei OListNode Object vorkam,
und fast überall ListNode&lt;A&gt;, wo in OListNode OListNode vorkam
(nur beim Konstruktornamen muss man den Typparameter weglassen).

<p>Bei der Verwendung von ListNode&lt;A&gt; setzt man einfach den
gewünschten Typ statt A ein:

<pre>
public static void printList(ListNode&lt;Obj&gt; l) {
    for (; l!=null; l=l.next) {
        l.val.print();
        System.out.println();
    }
}
</pre>

Hier braucht man keinen Cast auf Obj, weil val ja vom Typ Obj ist.
Und wenn man versuchen würde, ein Objekt mit einem unpassenden Typ als
Nutzlast zu verwenden, meldet schon der Compiler einen Fehler,
z.B. wenn man in Main folgendes versucht:

<pre>
k=new ListNode&lt;Obj&gt;(k,"acde");
</pre>

Der Stoff für den dritten Test geht bis hierher.

<h1>16.6.2014</h1>


<h2>Bäume und Rekursion</h2>

Bäume sind eine Form von Graphen (aus der mathematischen
Graphentheorie).  In der Informatik wie in der realen Welt sind
gerichtete Bäume recht häufig (und wenn man von "Baum" spricht, meint
man in der Informatik normalerweise einen gerichteten Baum).  Bei
gerichteten Bäumen hat man einen Wurzelknoten (root), und von ihm
ausgehend Kanten zu weiteren Knoten, von denen Kanten auf weitere
Knoten, und schließlich Knoten ohne Nachfolgerknoten (sogenannte
Blätter (leaves, Einzahl leaf)).  Bäume werden oft mit dem
Wurzelknoten oben gezeichnet:

<p><img src="tree.png">

<p>Da gerichtete Bäume praktisch immer so gezeichnet werden, dass die
Kanten alle in eine Richtung zeigen (im obigen Beispiel von oben nach
unten), zeichnet man die Kanten meistens nicht als Pfeile, sondern als
einfache Linien; es handelt sich trotzdem um einen gerichteten Graphen.

<p>Beispiele für Bäume ausserhalb der Informatk sind natürlich
botanische Bäume (wobei sowohl der Teil vom Stamm aufwärts als auch
der Teil vom Stamm abwärts (das Wurzelsystem) Bäume im Sinne der
Graphentheorie sind), Stammbäume (wobei die Nachkommen einer Person
ebenso einen Baum bilden wie die Vorfahren einer Person),
Organigramme, Flusssysteme, und das K.O.-System für Turniere.

<p>Beispiele in der Informatik ist der die Klassenhierarchie (nicht
die Interface-Hierarchie) in Java und der (dynamische) Aufrufbaum:
Ausgehend von der main-Methode werden andere Methoden aufgerufen, die
wiederum andere Methoden aufrufen; wenn man jeweils den Aufrufer und
die Aufgerufene Methode über eine Kante verbindet, und dabei für
verschiedene Aufrufe derselben Methode eigene Knoten anglegt, erhält
man den Aufrufbaum.  Für <a href="hist.fs">hist.fs</a> wäre das (wenn
man nur die dort definierten Wörter darstellt):

<p><img src="hist-calltree.png">

<p>Als Datenstrukturen kommen recht häufig binäre Bäume auf, also
Bäume, bei denen jeder Knoten höchstens zwei Nachfolgeknoten hat.

<p>Im folgenden werden wir uns mit dem <em>binären Suchbaum</em>
befassen.  Dabei ist die Nutzlast jedes Baumknotens mit der jedes
anderen vergleichbar, und diese bilden eine totale Ordnung
(z.B. Zahlen, oder lexikographische Ordnung von Strings).  Betrachten
wir einen beliebigen Knoten n: Dabei ist die Nutzlast von n größer als
die Nutzlasten der Knoten, die über den linken Nachfolger erreichbar
sind, und kleiner als die Nutzlasten der Knoten, die über den rechten
Nachfolger erreichbar sind.  Wenn das für alle Knoten im Baum gilt,
haben wir einen binären Suchbaum.

<p><img src="search-tree.png">

<p>Im folgenden definieren wir eine Klasse Tree für den binären Suchbaum.
Im Interesse der Einfachkeit vewrwenden wir einfach int als Nutzlast
und vergleichen das mit &lt;.  Eine allgemeinere Version würde auf
das <a href="http://docs.oracle.com/javase/7/docs/api/java/lang/Comparable.html">Interface
Comparable</a> aufbauen.  Das Kernstück der Implementierung ist die
Klasse Node:

<pre>
class Node {
    int val;
    Node left, right;
    Node(int v) {
        val=v;
        left=null;
        right=null;
    }
</pre>

Jeder Baumknoten hat eine Nutzlast val und einen linken (left) und
rechten (right) Nachfolgeknoten (gelegentlich spricht man auch vom
Vaterknoten und dem linken und dem rechten Kind).  Die Referenzen auf
die Nachfolgeknoten werden mit null initialisiert, ein Knoten wird
also zunächst als Blatt erstellt.

<pre>
static boolean contains(Node n, int v) {
    while (n!=null) {
        if (v==n.val)
            return true;
        if (v&lt;n.val)
            n = n.left;
        else
            n = n.right;
    }
    return false;
}
</pre>

<p>Die Methode contains überprüft, ob v im Baum enthalten ist.  Dazu
vergleicht sie nicht mit jedem Knoten, sondern nutzt die Eigenschaften
des Suchbaums aus, um nur wenige Knoten anschauen zu müssen.

<p>Zunächst wird überprüft, ob n tatsächlich ein Knoten ist; wenn es
null ist, haben wir v nicht gefunden und liefern false zurück.

<p>Als nächstes prüfen wir, ob n der Knoten mit dem Wert gleich v ist.
Wenn ja, dann ist v im Baum enthalten und wir liefern true zurueck.

<p>Wenn beides nicht zutrifft, müssen wir im Baum weitersuchen.
Aufgrund der Suchbaum-Eigenschaft müssen wir aber nicht beide
Unterbäume durchsuchen, sondern nur einen: Wenn v&lt;n.val, den
linken, sonst den rechten.

<pre>
static Node insert(Node n, int v) {
    if (n==null)
        return new Node(v);
    if (v==n.val)
        return n;
    if (v&lt;n.val)
        n.left=insert(n.left, v);
    else
        n.right=insert(n.right, v);
    return n;
}
</pre>

Das Einfügen eines neuen Wertes in den Baum veräuft im Prinzip
ähnlich.  Allerdings muss man hier eventuell einen neuen Knoten an den
Baum anfügen.  Wenn Java Referenzen auf Speicherstellen hätte, würde
der Code tatsächlich dem Code von contains recht ähnlich sehen (siehe
member? und search für verkettete Listen in Forth).  Der Trick mit dem
prehead, den wir in Java bei verketteten Listen verwendet haben,
funktioniert auch nicht so einfach, da man ja entweder left oder right
verändern muss.

<p>Was wir hier machen, ist, dass insert einfach den (Unter-)Baum mit
dem neuen Knoten zurückgibt, und der dann in das entsprechende Feld
gespeichert wird.  Wenn n==null, ist das besonders einfach: insert
gibt einfach einen neuen Blattknoten zurück.

<p>Als weiteren Sonderfall betrachten wir den Fall, wenn der Wert
schon im Baum vorhanden ist; dann fügen wir nichts ein, sondern geben
einfach n unverändert zurück.  Diese Implementierung des Baumes merkt
sich also nicht, wenn der gleiche Wert mehrfach eingefügt wurde.

<p>Wenn beides nicht zutrifft, müssen wir v in einen Unterbaum
einfügen.  Wenn v&lt;n.val, in den linken, sonst in den rechten.  Das
Einfügen machen wir, indem wir insert mit den entsprechenden
Parametern aufrufen.  Das Ergebnis des Aufrufs speichern wir in das
entsprechende Feld.  In den meisten Fällen bleibt der Inhalt des
Feldes dabei gleich (immer noch eine Referenz auf den entsprechenden
Nachfolgeknoten), aber wenn das Feld ursprünglich null enthielt, dann
wird es durch die Referenz auf einen Blattknoten überschrieben.

<p>Den Aufruf einer Methode durch sich selbst nennt man Rekursion.  Er
funktioniert eigentlich wie jeder andere Aufruf auch, und man
betrachtet ihn beim Programmieren am besten auch einfach abstrakt als
einen Aufruf, der etwas bestimmtes erledigen soll.  Ein Unterschied:
Damit es nicht zur Endlosrekursion kommt, muss man genau wie bei
Schleifen darauf schauen, dass man sich bei jedem rekursiven Aufruf
der Abbruchbedingung (hier: n==null) nähert.  Ein weiterer wichtiger
Aspekt bei rekursiven Aufrufen ist, dass jeder Aufruf neue Exemplare
(Instanzen) der lokalen Variablen und Parameter (hier n und v) erhält,
sodass nach der Rückkehr vom rekursiven Aufruf die gleichen Werte in
diesen Variablen sind wie davor.

<p>"insert" ist übrigens der übliche Name für solche
Einfügeoperationen bei Leuten, die sich mit Algorithmen und
Datenstrukturen befassen.  In Java-Datenstrukturen heisst diese
Operation
aber <a href="http://docs.oracle.com/javase/7/docs/api/java/util/Collection.html#add(E)">üblicherweise</a>
"add".

<pre>
static String toString(Node n) {
    if (n==null)
        return "";
    return toString(n.left)+" "+n.val+" "+toString(n.right);
}
</pre>

Die Methode toString soll einen String zurückliefern, der die Elemente
des Baumes sortiert enthaelt.  Wenn n==null, dann liefert es einen
Leerstring zurück.  Der andere Fall ist interessanter: Da wird der
String erzeugt, indem der sortierte String des linken Unterbaums der
String für n.val und der sortierte String für den rechten Unterbaum in
dieser Reihenfolge zusammengefügt werden.  Da n.val größer als alle
Elemente des linken TUnterbaums und kleiner als alle Elemente des
rechten Unterbaums ist, ist n.val im String an genau der richtigen
Stelle, und da die Strings der beiden Unterbäume beide sortiert sind,
ist auch das Resultat der Stringverkettung ein sortierter String und
kann einfach so zurückgegeben werden.

<p>Diese drei Methoden sind alle static, und die Referenz auf den
Knoten, der bearbeitet wird, wird als Parameter übergeben.  Das
erlaubt es, auch null zu übergeben, sodass die Abfrage auf null in der
Methode an einer Stelle erfolgen kann.

<p>Wenn man stattdessen nicht-statische Methoden schreiben würde, die
den Referenz auf den Knoten als this übergeben bekommen, dann dürfte
man diese Methoden nicht mit null aufrufen und mÜsste bei jedem Aufruf
eine Sonderbehandlung für null einbauen.  Zusammen mit den Aufrufen in
tree sind das für insert und toString jeweils drei Aufrufe.

<p>Wenn man toString(x) aufruft, wobei x auf den
Wurzelknoten des oben gezeigten Suchbaumes zeigt, dann ergibt sich
folgender Aufrufbaum (rechts):

<p><img src="toString.png">

<p>In dieser Grafik werden die Kanten doppelt gezeigt: Die Aufrufe in
schwarz, die Rückkehr von den Aufrufen in rot; bei der Rückkehr wird
auch der zurückgegebene String angezeigt (in rot).  Das übergebene
argument ist ja immer ein Knoten des Baumes, oder null; bei einem
Knoten zeigt die Grafik durch einen türkisen Pfeil an, um welchen
Knoten es sich handelt.

<p>Die Methode toString(Node) besucht jeden einzelnen Knoten über
einen Aufruf, daher spiegelt der Aufbau des Aufrufgraphen den Aufbau
des Baums wider.  Zusätzlich hat der Aufrufgraph noch Kanten und
Knoten für die Felder im Baum, die null enthalten.

<p>Die nächste Graphik zeigt den Aufruf"baum" von insert(x,9), wobei x
auf den Wurzelknoten des oben gezeigten Suchbaumes zeigt.

<p><img src="search-call.png">

<p>Wieder werden sowohl der Aufruf (schwarz) als auch die Rückkehr
(rot) gezeigt.  Links sieht man den ursprünglichen Baum, rechts das
Ergebnis der Einfügeoperation.  Wieder werden die Node-Argumente durch
türkise Pfeile symbolisiert.  Diesmal werden auch Knoten
zurückgegeben, diese werden ebenfalls durch türkise pPfeile
symbolisiert.

<p>Insbesondere liefert insert(null,9) einen neugeschaffenen Knoten
mit val=9 zurück, der dann in den existierenden Baum eingehängt wird.

<p>Diesmal wandert die Rekursion nur jeweils in eine Richtung den Baum
hinunter, dementsprechend hat jeder Knoten im Aufrufbaum maximal einen
Nachfolger.  Wieder gibt es für den null-Fall zusätzliche Aufrufe,
diesmal nur einen.

<p>Unsere Node-Klasse kann schon recht viel, aber normalerweise
versteckt man die hinter einer weiteren Klasse, die dann eine für Java
idiomatischere Schnittstelle zur Verfügung stellt: nicht-statische
Methoden, besonders für toString(), wo ja so eine
Methodenschnittstelle von Object herkommt:

<pre>
public class Tree {
    Node root=null;

    boolean contains(int v) {
        return Node.contains(root,v);
    }
    void insert(int v) {
        root=Node.insert(root,v);
    }
    public String toString() {
        return Node.toString(root);
    }
}
</pre>

Mit dieser Klasse können wir auch für einen leeren Baum ein
Tree-Objekt haben, und dafür dann nicht-statische Methoden wie zum
Beispiel t.toString() aufrufen; wenn wir uns nur auf Node beschränken
würden, müssten wir leere Bäume durch null repräsentieren und können
dafür nicht t.toString() aufrufen.  Die Methode insert(int) braucht
nichts zurückliefern; verändert wird ggf. das Feld root.

<p>Und hier einige Aufrufe der Methoden von Tree:

<pre>
public class Main {
    public static void main(String [] args) {
        Tree t=new Tree();
        System.out.println(t.contains(6));
        System.out.println(t.toString());
        t.insert(1);
        t.insert(5);
        t.insert(3);
        t.insert(8);
        System.out.println(t.contains(6));
        t.insert(2);
        t.insert(4);
        t.insert(6);
        t.insert(7);
        System.out.println(t.contains(6));
        System.out.println(t.toString());
    }
}
</pre>

Die insert-Aufrufe bauen den oben gezeigten Suchbaum auf.  Man beachte
insbesondere, dass beim ersten Aufruf von insert in einen leeren Baum
eingefügt wird, und davor contains(int) und toString() mit dem leeren
Baum aufgerufen werden.

<p><a href="java/tree/">Programm</a> (<a href="java/tree.zip">zip-Datei</a>).

<h1>23.6.2014</h1>

<h2>Performance</h2>

Bei Programmen ist nicht nur die Korrektheit wichtig, sondern auch die
Verarbeitungsgeschwindigkeit und der Speicherverbrauch.  Weitere
wichtige Kriterien sind der Entwicklungsaufwand und die dafür
benötigte Zeit (time-to-market).

<p>Allerdings wird gerade im Bereich der Verarbeitungsgeschwindigkeit
(Performance) viel Unsinn verbreitet und programmiert.  Wobei mancher
Unsinn durchaus eine sinnige Grundlage hat, und nur in der Anwendung
unsinnig ist; wenn man zum Beispiel in einem Programmteil, der nicht
nennenswert zur Laufzeit beiträgt, eine komplizierte Optimierung
einbaut, hat man bezüglich der Verarbeitungsgeschwindigkeit nichts
gewonnen, aber den Entwicklungsaufwand, Wartungsaufwand und eventuell
die Entwicklungszeit erhöht und mit höherer Wahrscheinlichkeit Fehler
eingebaut.

<p>Einige Sprüche zu dem Thema spiegeln das wieder:

<p>"Premature optimization is the root of all evil." Donald Knuth

<p> "The First Rule of Program Optimization: Don't do it. The Second
Rule of Program Optimization (for experts only!): Don't do it yet."
Michael A. Jackson

<p>Das andere Extrem wiederum ist, wenig oder gar keinen Gedanken an
Effizienz zu verschwenden, denn "die Maschinen sind heutzutage ohnehin
schnell genug".  Als Ergebnis höre ich immer wieder von Projekten, die
scheitern, weil die Performance nicht stimmt.  Den richtigen Mittelweg
zwischen diesen beiden Extremen zu finden, ist eine Kunst, für die
allerdings eine gute Grundlage an Wissen über Programmierung und
Algorithmen und Datenstrukturen nötig ist.

<p>Aber einige Grundregeln werde ich im folgenden vermitteln, und
weiteres Wissen dazu erhalten Sie in "Algorithmen und
Datenstrukturen", und in den Wahllehrveranstaltungen "Effiziente
Programme" und "Effiziente Algorithmen".

<h3>Algorithmische Komplexität</h3>

Oft möchte man wissen, wie die Laufzeit mit der Problemgröße
zusammenhängt.  Man kann das in gewissen Bereichen messen, allerdings
gilt das Resultat zunächst einmal nur für die gemessenen Eingabedaten
auf der gemessenen Maschine (und selbst dort kann es zu
unterschiedlichen Laufzeiten kommen).  Oft interessieren uns
allerdings eher qualitative Betrachtungen als genaue (quantitative)
Werte, und dafür haben wir die algorithmische Komplexität, besser
bekannt als O(...)-Notation.

<p>Die O(...)-Notation kommt aus der Mathematik und betrachtet
abstrakt Verhalten von Funktionen bei grossen Operanden und
vernachlässigt dabei konstante Faktoren und untergeordneter Terme.  So
ist zum Beispiel die Funktion 3n<sup>2</sup>+1000000n+10<sup>20</sup>
bei genügend großen n immer noch kleiner als 4n<sup>2</sup>, und für
ein noch größeres n kleiner als 3.5n<sup>2</sup>; der konstante Faktor
4 bzw. 3.5 fällt bei der O(...)-Notation auch unter den Tisch , also
fasst man diese drei Funktionen unter O(n<sup>2</sup>) zusammen.

<p>Wichtig ist das vor allem, um abschätzen zu können, ob ein
Algroithmus auch für große Problemgrößen schnell genug ist.  In der
Informatik haben wir es öfters mit Algorithmen der Komplexität O(1)
(konstant), O(ln n) (logarithmisch), O(n) (linear), O(n ln n),
O(n<sup>2</sup>) (quadratisch), O(2<sup>n</sup> (exponentiell) zu tun.
Betrachten wir einmal konkrete Funktionen dieser abstrakten Klassen;
wir verwenden kleine konstanten Faktoren, da eine einzelne Operationen
im Computer sehr schnell ist.  Gerade diese kleinen konstanten
Faktoren machen aber Messungen bei kleinen Problemgrößen oft
trügerisch:

<pre>
Klasse   O(1)   O(ln n)  O(n)   O(n<sup>2</sup>)    O(2<sup>n</sup>)
Funktion 1 ns   ld n ns  n ns   n<sup>2</sup>      2<sup>n</sup> ns
n=10     1ns     3ns     10ns   100ns   1024ns
n=20     1ns     4ns     20ns   400ns   1ms
n=50     1ns     6ns     50ns   2500ns  13d
n=100    1ns     7ns     100ns  0.01ms  4*10<sup>13</sup>a
n=1000   1ns    10ns     1000ns 1ms
n=10<sup>6</sup>    1ns    20ns     1ms    17m
n=10<sup>9</sup>    1ns    30ns     1s     32a
n=10<sup>12</sup>   1ns    40ns     17m
</pre>

Bei Algorithmen höherer Komplexität sind die maximalen praktisch
lösbaren Problemgrößen recht klein.  Wenn man die Wahl hat, wird man
einen Algorithmus bzw. eine Datenstruktur niedriger Komplexitätsstufe
wählen, oder besser, sein Programm so gestalten, dass man bei Bedarf
so einen Algorithmus bzw. so eine Datenstruktur einsetzen kann.

<p>In dem Zusammenhang ist auch noch zu erwähnen, dass manche Probleme
grundsätzlich so schwer sind, dass sie sich wahrscheinlich nur mit
exponentiellen Algorithmen lösen lassen (NP-vollständige Probleme); es
gibt sogar Probleme, die nicht einmal sicher in endlicher Zeit gelöst
werden können (unentscheidbare Probleme, z.B. das Halteproblem).

<p>Diese Resultate aus der theoretischen Informatik sind zwar wichtig,
aber kein Grund, gleich aufzugeben.  Viele NP-vollständige Probleme
sind Optimierungsprobleme, bei denen man mit Heuristiken in
vertretbarer Zeit eine sehr gute, wenn auch nicht garantiert optimale
Lösung finden kann.  Bei anderen Problemen ist es oft immer noch
interessant, für die Probleme, die in akzeptabler Zeit gelöst werden
können, eine Lösung zu bekommen; für die anderen wird dann ein anderer
Weg gewählt, zum Beispiel indem man das Problem weiter vereinfacht,
auch wenn man eigentlich lieber das ursprüngliche Problem gelöst
hätte.

<p>Wie ermitteln wir jetzt die algorithmische Komplexität?  Dazu
berechnet man, wie oft ein bestimmter Programmschritt vorkommt.  Von
den in Frage kommenden Programmschritten nimmt man den, der am
öftesten ausgeführt wird; normalerweise gibt es da mehrere Kandidaten,
die alle dieselbe Komplexität ergeben.  Betrachten wir das für die
einzelnen Algorithmen auf unserem Baum:

<pre>
static boolean contains(Node n, int v) {
    while (n!=null) {
        if (v==n.val)
            return true;
        if (v&lt;n.val)
            n = n.left;
        else
            n = n.right;
    }
    return false;
}
</pre>

Bei contains wählen wir einfach die Anzahl der Iterationen der
Schleife als Masszahl.  Für jede Kante, die auf der Scuhe nach dem
Element durchlaufen wird, wird eine weitere Iteration der Schleife
durchlaufen, wir durchlaufen aber von jedem Knoten ausgehend nur eine
Kante.  Ein Unsicherheitsfaktor ist dabei die Struktur des Baumes, ein
anderer, ob das gesuchte Element vorhanden ist.</p>

<p><img src="balanced.png">

<p>Bei einem perfekt balancierten Baum, in dem jeder innere Knoten
zwei Kinder hat, ist in der ersten Ebene 1 Knoten, in der zweiten 2,
in der dritten 4, in der n-ten 2<sup>n-1</sup> Knoten, insgesamt bei n
Ebenen 2<sup>n</sup>-1 Knoten.  Wenn das gesuchte Element im Baum
ist, hat man eine Wahrscheinlichkein von 1/(2<sup>n</sup>-1), das
Element in der ersten Ebene zu finden, von 2/(2<sup>n</sup>-1), es
in der zweiten Ebene zu finden, usw.  In Durchschnitt wird man es in
der vorletzten Ebene finden, also O(n-1) (=O(n)), wobei n hier die Anzahl
der Ebenen ist; wenn man von der Anzahl der Elemente e ausgeht, kommt
man auf O(ld(e+1))=O(ln e).  Wenn das Element nicht gefunden wird,
muss man eben bis zur letzten Ebene durchsuchen, dann kommt man
allerdings in der O(...)-Notation ebenfalls auf O(ln e).

<p>Wenn die Elemente einfach in völlig zufälliger Reihenfolge in den
Baum eingefügt werden, ist der Baum am Ende nicht perfekt balanciert,
aber die Tiefe ist (im Durchschnitt) nur um einen konstanten Faktor
schlechter.  Daher gilt auch in diesem Fall, dass contains O(ln e)
Schritte braucht (allerdings mit einem schlechteren konstanten
Faktor).

<p>Wenn der Baum allerdings deutlich schlechter balanciert ist (im
Extremfall so degeneriert, dass ein Baum mit n Elementen n Ebenen
hat), ist die Komplexität von contains allerdings höher, bis zo O(n).

<p>insert funktioniert sehr ähnlich wie contains (nur wird nach der
Suche noch eingefügt), und die algorithmische Komplexität ist
dieselbe.

<h1>26.6.2014</h1>

Bei toString() sieht die algorithmische Komplexität anders aus:
toString() besucht jeden Knoten genau einmal (O(e)); weiters erfolgen
noch rekursive Aufrufe für alle left- und right-Felder, die null
enthaten; die Anzahl dieser Felder ist aber auch O(e) (jeder Baum
enthält e left-Felder und e right-Felder.  Von denen zeigen e-1 Felder
auf innere Knoten oder Blätter, also enthalten e+1 Felder null).

<p>Die Anzahl der Aufrufe in toString ist also linear in der Anzahl
der Elemente des Baums (O(e)) (unabhängig von der Struktur des Baums).
Allerdings sind die Operationen in einem Aufruf von toString() nicht
unbedingt konstante Kosten: die Kosten der Stringverkettung + wird
wohl linear mit der Länge des Ergebnisstrings steigen.  Dadurch kommt
man für toString() auf höhere Kosten als O(e).

<p>Um die theoretische algorithmische Komplexität in Beziehung zur
Realität zu setzen, vergleichen wir im Folgenden die Laufzeiten von
insert, contains, und toString vom Suchbaum mit denen einer
Implementierung einer sortierten verketteten Liste (wo insert und
contains O(e) sind).  Dazu verwenden wir Benchmark-Programme, die
Bäume aus (pseudo-)zufälligen Werten aufbaut und solche Werte im Baum
sucht.  Der insert-Benchmark führt ca. 8 Millionen inserts aus (und
baut dabei viele Bäume der entsprechenden Größe auf), der
contains-Benchmark baut einen Baum mit n Knoten (mit n inserts) auf
und macht dann ca. 8 Millionen contains, der toString-Benchmark baut
so einen Baum auf und macht dann 20 toString()s.

<pre>
            Suchbaum              sortierte Liste
n     insert contains toString insert contains toString
2     0.82s   0.65s   0.16s     0.75s   0.54s   0.17s
4     0.90s   0.81s   0.16s     0.75s   0.62s   0.15s
8     1.06s   0.82s   0.17s     0.81s   0.70s   0.18s
16    1.16s   0.88s   0.18s     0.86s   0.72s   0.18s
32    1.30s   0.96s   0.16s     0.98s   0.92s   0.17s
64    1.49s   1.11s   0.19s     1.17s   1.19s   0.20s
128   1.68s   1.35s   0.20s     1.54s   1.70s   0.24s
256   1.82s   1.44s   0.25s     2.26s   2.82s   0.30s
512   1.98s   1.59s   0.29s     4.06s   4.88s   0.47s
1024  2.16s   1.81s   0.39s     7.42s   8.73s   0.65s
2048  2.39s   2.05s   0.50s    15.98s  39.56s   1.10s
4096  2.68s   2.36s   0.60s    77.39s 169.05s   2.62s
</pre>

Die Werte wachsen hier nicht überall so wie erwartet; zum Beispiel
würde man bei O(n)-Algorithmen (insert und contains von der sortierten
Liste) erwarten, dass bei größeren n die Zeit um den Faktor zwei
ansteigt, wenn n um den Faktor 2 ansteigt; die Abweichungen kommen
vielleicht von von Caches, JIT-Compilern, oder Garbage Collection.
Aber jedenfalls sind insert und contains vom Suchbaum bei größeren n
deutlich schneller als die entsprechenden Operationen bei einer
sortierten Liste.  Interessanterweise ist sogar toString beim Suchbaum
schneller, vermutlich weil im Suchbaum die Stringverkettungen im
Durchschnitt mit kürzeren Strings gemacht werden.

<p><a href="java/performance/">Code</a> (die Benchmark-Programme
müssen für die andere Datenstruktur geändert werden).

<h3>Multithreading</h3>

Ausführung mehrerer Kontrollflüsse gleichzeitig.
Klasse <a href="http://docs.oracle.com/javase/6/docs/api/java/lang/Thread.html">Thread</a>.

<p>Zweck:

<ul>

<li>Ausnutzung mehrerer Cores zur Geschwindigkeitssteigerung
(Parallelisierung).  Vor allem sinnvoll bei gleichmäßig aufteilbaren
Aufgaben auf getrennten Daten (Supercomputing); und bei einem noch
unoptimierten Programm bringt die Optimierung des sequentiellen Programms
meist mehr und verursacht weniger Probleme.

<li>Andere Organisation des Programms (Concurrency/Nebenläufigkeit).
Praktisch unumgänglich bei verteilten Systemen und im Kern von
Betriebssystemen; gelegentlich sinnvoll, um Programme besser
organisieren zu können.  Aber: Nichts für Anfänger, viele
Fehlermöglichkeiten.  Hardware verhält sich oft sehr unintuitiv.

</ul>

Probleme:

<ul>
<li>Race condition: Zugriff auf das selbe Datum: Was passiert, hängt
davon ab, welcher Thread zuerst dran ist (wer das Rennen gewinnt).
Wird verhindert durch Synchronisation.  Aber: Synchronisation kostet
Zeit.  Und kann andere Fehler zur Folge haben:

<li>Deadlock: Mehrere Threads warten darauf, dass ein anderer mit
einer Resource (z.B. einem Objekt) fertig wird, aber da sie alle
warten, wird keiner damit fertig.  Jeder beteiligte Thread befindet
sich in einem Wartezustand.

<li>Livelock: Wie ein Deadlock, nur warten die Threads aktiv, indem
sie immer wieder testen, ob sich eine Variable geändert hat (busy
waiting).

<li>Starvation: Ein Thread kommt nicht dran, weil andere Threads Resourcen
blockieren, die dieser Thread benötigt.

</ul>

Ein großes Problem dabei ist, dass solche Fehler oft schwer zu
reproduzieren sind, da es davon abhängt, in welcher Reihenfolge die
diversen Operationen der Threads ausgeführt werden.

<p>Beispiel: <a href="java/threads/counter.java">counter</a>
(Variationen siehe Kommentar).


<!--
<h1>... später</h1>
 
<h3>Gebundene Generizität</h3>

Was mit den bisher bekannten Typparametern noch nicht geht, ist, in
der generischen Klasse selbst mit den Parametern mehr zu machen, als
für alle Objekte geht.  Wenn wir zum Beispiel in der Klasse selbst das
print() von Obj für den Typparameter aufrufen wollen, geht das nicht.

<p>Für solche Zwecke gibt es gebundene Generizität, mit der man
festlegen kann, dass ein Typparameter ein Untertyp eines bestimmten
Typs sein muss.  Für unser Beispiel:

<pre>
public class ObjListNode&lt;A extends Obj&gt; {
    public ObjListNode&lt;A&gt; next;
    public A val;
    ObjListNode(ObjListNode&lt;A&gt; n, A v) {
        next=n;
        val=v;
    }
    public void print() {
        ObjListNode&lt;A&gt;l = this;
        for (; l!=null; l=l.next) {
            l.val.print();
            System.out.println();
        }
    }
}
</pre>

In der entsprechende nicht-generischen Version würde statt A die
Klasse Obj vorkommen.  Der Vorteil der generischen Version ist wieder,
dass man bei der Verwendung einen Untertyp von Obj angeben kann
(z.B. Person), dass dann vom Compiler zur Compile-Zeit überprüft wird,
dass nur dieser Typ vorkommt, und dass man sich die Casts auf diesen
Typ erspart.  Z.B.:

<pre>
ObjListNode<Person> l3=null;
l3=new ObjListNode<Person>(l3,p2);
3=new ObjListNode<Person>(l3,p1);
l3.print();
System.out.println(l3.val.svnum);
</pre>

Hier legt man fest, dass nur Personen (und keine anderen Objs, also
keine Signeds) in der Liste l3 vorkommen.  Man kann die Methode
print() von ObjListNode verwenden (die übrigens keine Implementierung
der Methode print() von Obj ist, da ObjListNode nicht von Obj
abgeleitet ist).  Und da wir wissen, dass das val-Feld von l3 nur
Personen enthält können wir auch Dinge damit tun, die man nur mit
Personen machen kann, zum Beispiel auf das Feld svnum zugreifen.
-->


<!--

Baeume, Rekursion
Lebensdauer, Scoping
Algorithmen
Multi-threading
Generics
Exceptions
-->


<!-- 

erklaere stack effekt
erklaere 0 bzw. -$8000000
dasselbe fuer arrays?
Objekte

addr als Typ

Testen
invariants
memory
characters


-->


<!-- Procedural Abstraction


Speicher

Verschiedene Programmierstile/Sprachfeatures anhand von tree insertion:

Referenzen
Java-like mit null und vielen null-checks
Objektorientiert mit eigenem null-tree-Objekt
ohne Referenzen mit Ueberschreiben aller Links
funktional durch komplettes Neubauen

Eigenschaften von Schleifen
  naehern sich dem Ziel


Datenfluss

Parallelismus

Abhaengigkeiten: Flow, Anti, Output
Eliminieren von Anti-Dependences durch Duplikation


State Machines und sowas

Darstellung als Daten oder als Kontrollfluss


Interpreter
-->

<!--

Programmkonstruktion (8.8 Ects) Das Modul Programmkonstruktion führt Anfän-
ger in die Programmierung ein, wobei der Schwerpunkt auf einer systematischen Vor-
gehensweise bei der Erstellung und Evaluierung von Programmen in einer objektorien-
tierten Programmiersprache liegt. Neben Fachkenntnissen werden vor allem praktische
Fertigkeiten in der Programmierung im Team (einschlieÿlich des Einsatzes formaler und
informeller Methoden) sowie abstrakte und systemorientierte Denkweisen vermittelt und
die Neugierde an der Programmierung gefördert.


Programmkonstruktion
Regelarbeitsaufwand: 8.8 Ects
Bildungsziele:
Fachliche und methodische Kenntnisse: Das Modul vermittelt
   · alle zur Erstellung von Programmen in einer stark typisierten objektorientierten
      Programmiersprache notwendigen Kenntnisse
   · sowie Kenntnisse über eine systematische, konstruktive Vorgehensweise bei der
      Erstellung und Evaluation von Programmen.
Kognitive und praktische Fertigkeiten: Die Auseinandersetzung mit Methoden und
Werkzeugen der Programmierung vermittelt
   · die praktische Fähigkeit zur Konstruktion von Programmen,
   · eine abstrakte und systemorientierte Denkweise in der Programmierung,
   · sowie die Fähigkeit zum Einsatz einfacher formaler und informeller Methoden bei
      der Erstellung und Evaluation von Programmen.
Soziale Kompetenzen, Innovationskompetenz und Kreativität: Folgende Kompetenzen
werden besonders gefördert:
   · Selbstorganisation und Eigenverantwortlichkeit,
   · Fähigkeit zur Zusammenarbeit in kleinen Teams,
   · Neugierde an der Programmierung.
Inhalt:
   · Ziele und Qualitätsbegri in der Programmierung
   · Abstraktes Modell (= Objekt oder abstrakte Maschine), dessen Verhalten durch
      ein Programm beschrieben wird
   · Grundlegende Sprachkonstrukte und ihre Anwendungen
   · Zusicherungen (formal und informell) und Testfälle zur Spezikation des Pro-
      grammverhaltens und zur Evaluation
   · Umgang mit und Strategien zur Vermeidung von Laufzeitfehlern (Debugging, Ex-
      ception Handling, Programmanalyse)
   · Verwendung einer Programmierumgebung und von Programmierwerkzeugen
   · Problemlösungsstrategien, Datenstrukturen und Algorithmen
   · Implementierung von Listen, Stapelspeichern und Bäumen
   · Rekursion in Datenstrukturen und Algorithmen
   · Prinzipien der objektorientierten Programmierung (Datenabstraktion, Unterty-
      pen, Polymorphie, Vererbung)
   · Verwendung von Standardbibliotheken
   · Ein- und Ausgabe sowie die interne Repräsentation von Daten
   · Basiswissen über Generizität und nebenläuge Programmierung
   · Sicherheit in der Programmierung (Gefahrenquellen und Vermeidungsstrategien)
   · Verweise auf und Beispiele in andere(n) Programmiersprachen zur Förderung des
     Interesses an der Programmierung
Erwartete   Vorkenntisse:    Fundierte   Mathematik-Kenntnisse     auf  AHS/BHS-
Maturaniveau.
Verpichtende Voraussetzungen: Keine.
Angewandte Lehr- und Lernformen und geeignete Leistungsbeurteilung:
   · 1.9 Ects Vortrag und selbständiges Erlernen der eher theoretischen Grundlagen
     (Vorlesung). Beurteilungsformen: Prüfung, Tests.
   · 1.0 Ects Übung mit Aufgaben zu ausgewählten Fragestellungen zur Festigung und
     Reexion wichtiger Aspekte der eher theoretischen Grundlagen. Beurteilungsfor-
     men: Abgaben, Tests.
   · 5.9 Ects Übung zur Entwicklung praktischer Programmierfähigkeiten mit Betreu-
     ung in geführten Kleingruppen, wobei der Zeitrahmen exibel gehalten wird, um
     Unterschiede in den Vorkenntnissen der StudentInnen auszugleichen (auf bis zu
     2 Semester dehnbar). Beurteilungsformen: Lösungen von Programmieraufgaben,
     Tests.
Lehrveranstaltungen des Moduls:
 2.9/2.0 VU Grundlagen der Programmkonstruktion
 5.9/4.0 UE Programmierpraxis


Technische Grundlagen der Informatik (6.0 Ects) Das Modul vermittelt Kenntnisse
im Bereich von Zahlendarstellungen, Boole'scher Algebra, Schaltnetzen und Schaltwer-
ken, Grundlagen digitaler Systeme, Aufbau und Funktionsweise von Prozessoren und
Computersystemen, Speicherverwaltung und Systemsoftware sowie peripheren Geräten.

Technische Grundlagen der Informatik
Regelarbeitsaufwand: 6.0 Ects
Bildungsziele:
Fachliche und methodische Kenntnisse: Grundkenntnisse über Aufbau und Funktions-
weise von Computersystemen
Kognitive und praktische Fertigkeiten: Modellbildung und Abstraktion, methodisch fun-
dierte Herangehensweise an Probleme bei der Erstellung und Evaluation von Program-
men.
Soziale Kompetenzen, Innovationskompetenz und Kreativität: Selbstorganisation und
Eigenverantwortlichkeit
Inhalt:
    · Kenntnisse zur Darstellung von Zahlen in Computern
    · Grundlagen der Boole'schen Algebra und Minimierungsverfahren
    · Grundlagen digitaler Schaltungstechnik
    · Gatterschaltungen (Addierer, Codierer, Multiplexer, ...)
    · Schaltnetze mit programmierbaren Bausteinen (ROM, PROM/EPROM, PLA,
      PAL)
   · Speicherglieder (RS, JK, D) und Speicher (statisch, dynamisch)
   · Synthese und Analyse von Schaltwerken
   · Prozessor
   · Adressierungsarten, Befehlssatz, RISC/CISC und Pipelining
   · Speicherverwaltung
   · Ein/Ausgabe und Peripheriegeräte
   · Systemsoftware (Kurzüberblick)
Erwartete    Vorkenntisse:   Fundierte   Mathematik-Kenntnisse      auf AHS/BHS-
Maturaniveau.
Verpichtende Voraussetzungen: Keine.
Angewandte Lehr- und Lernformen und geeignete Leistungsbeurteilung: Frontalvortrag
mit Prüfung. In Abhängigkeit der Bedeckbarkeit Übung in Groÿgruppen (Papier und
Tafel) zur Festigung des Lehrstoes. Beurteilung durch Tests.
Lehrveranstaltungen des Moduls:
 6.0/4.0 VU Technische Grundlagen der Informatik
-->