Wer nichts anderes vorhat, kann die unten vorgegebene Aufgabe für dieses Semester wählen.
Natürlich können Sie, wenn Sie wollen, auch die Implementierung eines anderen Problems optimieren; allerdings hat das einige Nachteile: Sie müssen einen Teil der Zeit Ihrer Präsentation für die Erklärung des Problems und des Algorithmus aufwenden, und die Ergebnisse sind nicht direkt vergleichbar. Der Vorteil (vor allem, wenn Sie einen späteren Termin wählen) ist, dass Sie nicht das wiederholen, was andere gemacht haben, oder ein langsameres Programm präsentieren.
Bereiten Sie eine 18-minütige Präsentation vor (am besten machen Sie einen Probelauf, damit sich die Präsentation auch sicher in der Zeit ausgeht). Da Sie dabei nicht soviel Zeit haben wie ich in der Vorlesung, präsentieren Sie die meisten Schritte nur im Überblick (also eventuell nur, wieviel er gebracht hat), und nur ein paar besonders interessante Schritte mit mehr Details. Besonders interessant sind u.a. die Schritte, die unerwartet viel oder unerwartet wenig bringen.
An sich muss das optimierte Programm für die gleiche Eingabe die gleiche Ausgabe produzieren wie das Originalprogramm, insbesondere für die gemessenen Testfälle. Sie können Sich auch überlegen, bestimmte Eingaben nicht korrekt zu verarbeiten, müssen das dann aber dokumentieren und begründen, warum Sie meinen, dass das sinnvoll ist.
Sie dürfen auch die Programmiersprache ändern.
Ausgeschlossen sind allerdings Optimierungen zu Trivialprogrammen
(z.B. if Eingabe=Benchmarkeingabe then print
Benchmarkausgabe
), da dabei zuwenig zu lernen ist.
>make perf stat -e cycles:u -e cycles:k -e instructions:u -e branch-misses -e L1-dcache-load-misses:u -e L1-dcache-store-misses:u -e LLC-loads:u -e LLC-stores:u -e LLC-load-misses:u -e LLC-store-misses:u pi2 1000000000 3424506 Primzahl-Zwillinge <= 1000000000 Performance counter stats for 'pi2 1000000000': 36853691835 cycles # 0.000 M/sec 460823637 cycles # 0.000 M/sec 16409716977 instructions # 0.880 IPC 105631399 branch-misses # 0.000 M/sec 336240788 L1-dcache-load-misses # 0.000 M/sec 6433672819 L1-dcache-store-misses # 0.000 M/sec 234126762 LLC-loads # 0.000 M/sec 780718162 LLC-stores # 0.000 M/sec 123683248 LLC-load-misses # 0.000 M/sec 752737955 LLC-store-misses # 0.000 M/sec 11.097182413 seconds time elapsedDas sind die Basiswerte, mit denen Sie Ihre Lösung vergleichen sollten (am Besten, indem Sie einen Speedup-Faktor angeben). Relevant sind vor allem die Zyklen (und zwar die Summe der User-Zyklen (cycles:u) und Kernel-Zyklen (cycles:k), die anderen Werte können aber zur Erklärung der gemessenen Zyklen dienen. Interessant ist auch der Speicherverbrauch.
Sie können Ihr Programm (und Doku dazu, z.B. Ihre Präsentation) im Web veröffentlichen (wird nicht beurteilt), und zwar indem Sie auf /nfs/unsafe/httpd/ftp/pub/anton/lvas/effizienz-abgaben/2016w ein Verzeichnis anlegen und Ihre Dateien in diesem Verzeichnis ablegen.
Aufgaben vom [WS02/03 | WS03/04 | WS04/05 | WS05/06 | WS06/07 | WS07/08 | WS08/09 | WS09/10 | WS10/11 | WS11/12 | WS12/13 | WS13/14 | WS14/15 | WS15/16 ]
13.1., 20.1., 27.1.Die Terminvergabe erfolgt, über unser Web-Anmeldesystem. Und zwar müssen Sie dabei folgendermaßen vorgehen:
![]() | Name | Last modified | Size | Description |
---|---|---|---|---|
![]() | Parent Directory | - | ||
![]() | pi2 | 2016-11-24 18:15 | 8.1K | |
![]() | pi2.c | 2016-11-24 14:46 | 1.5K | |
![]() | Makefile | 2016-11-24 18:52 | 277 | |