.. _Hilfreiche Werkzeuge:

Hilfreiche Werkzeuge
====================

Im folgenden werden kurz einige Programme beschrieben, die bei der Entwicklung
von C-Programmen hilfreich sein können. Bei den meisten :ref:`Linux-Systemen
<gwl:Grundkurs Linux>` (Debian, Ubuntu, Linux Mint) lassen sich diese
unmittelbar mittels :ref:`apt <gwl:apt>` installieren:

.. code-block:: bash

    aptitude install astyle cdecl cflow doxygen gdb graphviz splint valgrind

Anschließend können die jeweiligen Programme mittels einer :ref:`Shell
<gwl:Shell>` im Projekt-Verzeichnis aufgerufen beziehungsweise auf
Quellcode-Dateien angewendet werden.

.. index:: astyle, Code Beautifier
.. _astyle:

``astyle`` -- Code-Beautifier
-----------------------------

Das Programm ``astyle`` kann verwendet werden, um C-Code in eine einheitliche
Form zu bringen. Die Syntax dafür lautet:

.. code-block:: bash

    astyle option < sourcefile > output_file

Als Option kann mittels ``-A1`` bis ``-A12`` ein gewünschter Code-Style
angegeben werden. Eine Übersicht über die möglichen Style-Varianten ist in der
`Dokumentation
<http://astyle.sourceforge.net/astyle.html#_Bracket_Style_Options>`_ des
Programms zu finden. In den Beispielen dieses Tutorials wird der Codestyle
"Allman" (Option ``-A1``) verwendet.

Um beispielsweise alle ``c``-Dateien eines Verzeichnisses mittels ``astyle`` in
den gewünschten Code-Style zu bringen, kann folgendes Mini-Skript verwendet
werden (die existierenden Dateien werden dabei ueberschrieben, bei Bedarf vorher
Sicherheitskopie anlegen!):

.. code-block:: bash

    for i in *.c ; \
    do astyle -A1 < $i > $(basename $i).tmp && mv $(basename $i).tmp $i; \
    done


.. ebenso: indent?

.. index:: cdecl
.. _cdecl:

``cdecl`` -- Deklarations-Übersetzer
------------------------------------

Das Programm ``cdecl`` kann verwendet werden, um komplexe Deklarationen, auf die
man beispielsweise beim Lesen von Quellcode stoßen kann, in einfachem Englisch
zu beschreiben. Umgekehrt kann man durch die Angabe eines Strukturtyps in
entsprechender Englisch-Syntax die entsprechende C-Deklaration zu erhalten.

Üblicherweise wird ``cdecl`` mittels der Option ``-i`` im interaktiven Modus
gestartet:

.. code-block:: bash

    cdecl -i

Anschließend kann durch Eingabe von ``explain`` und einer beliebigen
C-Deklaration diese in einfachem Englisch angezeigt werden, beispielsweise
liefert ``explain int myfunc(int, char *);`` als Ergebnis: ``declare myfunc as
function (int, pointer to char) returning int``. Umgekehrt kann ``declare`` in
Verbindung mit einer solchen Englisch-Syntax aufgerufen werden, um C-Code zu
erhalten, beispielsweise liefert ``declare mylist as array 20 of pointer to
char`` das Ergebnis ``char *mylist[20]``.

..  Beispiel Ösch S.16:

..  Wie deklariere ich ein Array a von N Zeigern auf Funktionen ohne Argumente, welche
..  Zeiger auf argumentlose Funktionen welche ihrerseits Zeiger auf char zurückliefern,
..  zurückliefern?

.. declare a as array 10 of pointer to function (void) returning pointer to function (void) returning pointer to char
.. char *(*(*a[10])(void ))(void )

Mit ``help`` kann Hilfe angezeigt werden, mit ``quit`` wird ``cdecl`` wieder
beendet.

.. index:: cflow
.. _cflow:

``cflow`` -- Funktionsstruktur-Viewer
-------------------------------------

Mittels ``cflow`` kann angezeigt werden, welche Funktionen schrittweise von
einer Quelldatei aufgerufen werden, und falls es sich um externe Funktionen
handelt, in welcher Datei und an welcher Stelle sich diese befinden.

Die Syntax von ``cflow`` lautet:

.. code-block:: bash

    cflow quelldatei.c

..  ``cscope`` -- Examine C Code
..  ----------------------------

..  ``cxref`` -- Referenzliste anzeigen
..  -----------------------------------

``doxygen`` -- Dokumentations-Generator
---------------------------------------

Mittels ``doxygen`` kann eine Dokumentation eines C-Projekts erzeugt werden,
ohne dass innerhalb der Code-Dateien irgendeine Markup-Sprache verwendet werden
muss. Dafür werden beispielsweise Übersichts- und Strukturdiagramme automatisch
erzeugt, sofern auch das Programm ``graphviz`` installiert ist.

Um eine Dokumentation mit Doxygen zu erstellen, wechselt man in das
Projektverzeichnis und gibt ``doxygen -g Doxyfile`` ein, um eine
Konfigurationsdatei (üblicherweise: ``Doxyfile``) zu generieren. Die erzeugte
Beispieldatei ist anhand vieler Kommentare weitgehend selbst erklärend und kann
einfach mit einem Texteditor bearbeitet werden; unnötige Kommentare oder
Optionen können dabei zur besseren Übersicht gelöscht werden. Alternativ kann
man eine leere ``Doxyfile`` erzeugen und darin wichtige Optionen aktivieren.

Möchte man die von ``doxygen`` erstellte Dokumentation in einem eigenen Ordner
abgelegt haben, so sollte man zudem beispielsweise mittels ``mkdir doxygen`` im
Projektverzeichnis einen neuen Unterordner erstellen.

Als Optionen zur Erzeugung von C-Code-Übersichten halte ich für sinnvoll:

.. list-table::
    :name: tab-optionen-oxygen
    :widths: 30 50

    * - Option in der Doxyfile
      - Beschreibung
    * - ``PROJECT_NAME = Toolname``
      - Namen des Projekts angeben
    * - ``OUTPUT_DIRECTORY = ./doxygen``
      - Verzeichnis für HTML- und LaTeX-Dokumentation festlegen
    * - ``OUTPUT_LANGUAGE = German``
      - Sprache auswählen
    * - ``EXTRACT_ALL = YES``
      - Alle Informationen des Quellcodes verwenden
    * - ``SOURCE_BROWSER = YES``
      - Immer Links zu den entsprechenden Funktionen und Dateien erzeugen
    * - ``HAVE_DOT = YES``
      - Nützliche Aufrufdiagramme mittels ``graphviz`` erzeugen
    * - ``CALL_GRAPH = YES``
      - Funktionsaufrufe als Graphen erzeugen
    * - ``CALLER_GRAPH = YES``
      - Als Graphen darstellen, von wo aus die einzelnen Funktionen aufgerufen werden
    * - ``FILE_PATTERNS = *.c *.h``
      - Alle ``.c`` und ``.h``-Dateien berücksichtigen

Nach dem Anpassen der ``Doxyfile`` muss im Projektpfad nur ``doxygen`` ohne
weiteren Argumente aufgerufen werden, um die Dokumentation zu erstellen und im
``doxygen``-Unterverzeichnis abzulegen. Anschließend kann man die Indexdatei
``./doxygen/html/index.html`` mit Firefox oder einem anderen Webbrowser öffnen.

..  * - CLASS_DIAGRAMS
..  Create class diagrams and inheritance graphs
..  CALL_GRAPH 	Make a call graph following all function calls
..  CALLER_GRAPH 	Output a graph of the caller dependencies

..  The option HAVE_DOT is the most important one because it’s what allows
..  Doxygen to generate the most useful output for the code spelunker, including
..  class, collaboration, call, and caller graphs.

.. index:: gdb, Debugger
.. _gdb:

``gdb`` -- Debugger
-------------------

Fehler übersieht man gerne. Bei der Fehlersuche in C-Code kann der Debugger
``gdb`` eingesetzt werden, um das Verhalten eines Programms schrittweise zu
überprüfen sowie Teile des Quellcodes, die als Fehlerquelle in Frage kommen,
näher eingrenzen zu können.

Um den ``gdb``-Debugger nutzen zu können, muss das zu untersuchende Programm mit
der Option ``-g`` oder ``-ggdb`` compiliert werden, um für den Debugger
relevante Informationen zu generieren.

.. code-block:: bash

    # Compilieren zu Debug-Zwecken:
    gcc -ggdb -o myprogram myprogram.c

Die Option ``-ggdb`` erzeugt ausführlichere, auf ``gdb`` zugeschnittene
Informationen und dürfte in den meisten Fällen zu bevorzugen sein.

Anschließend kann das compilierte Programm mit ``gdb`` geladen werden: [#]_

.. code-block:: bash

    gdb myprogram

Der Debugger wird dabei im interaktiven Modus gestartet. Um das angegebene
Programm ``myprogram`` zu starten, kann ``run`` (oder kurz: ``r``) eingegeben
werden; dabei können dem Programm mittels ``run arg_1 arg_2 ...`` beliebig viele
Argumente übergeben werden, als ob der Aufruf aus der Shell heraus erfolgen
würde. Das Programm kann dabei abstürzen, wobei eine entsprechende
Fehlermeldung und die für den Absturz relevante Code-Zeile angezeigt wird, oder
(anscheinend) fehlerfrei durchlaufen.

Wird ein Fehler angezeigt, beispielsweise eine "Arithmetic exception", wenn
versucht wird durch Null zu dividieren, so kann mittels ``print varname`` der
Wert der angegebenen Variable zu diesem Zeitpunkt ausgegeben werden.

.. rubric:: Verwendung von Breakpoints

Um sich den Programmablauf im Detail anzuschauen, können mit ``break`` (oder
kurz: ``b``) so genannte "Breakpoints" gesetzt werden. An diesen Stellen stoppt
das Programm, wenn es mit ``run`` gestartet wird, automatisch. Die Breakpoints
werden von ``gdb`` automatisch ausgewählt, beispielsweise werden sie vor
Funktionsaufrufen gesetzt, um mittels ``print`` die Werte der übergebenen
Variablen prüfen zu können.

Mittels eines Aufrufs von ``break num`` kann auch eine weiterer Breakpoint
unmittelbar vor der Code-Zeile ``num`` manuell gesetzt werden. Ist in dem
Programm eine Funktion ``myfunc()`` definiert, so werden mittels ``break
myfunc`` Breakpoints vor jeder Stelle gesetzt, an denen die angegebene Funktion
aufgerufen wird.

Ist man nach dem Setzen der Breakpoints und dem Aufruf von ``run`` am ersten
Breakpoint angekommen, so kann man mittels ``continue`` (oder kurz: ``c``) bis
zum nächsten Breakpoint mit der Ausführung des Programms fortfahren.
Alternativ kann ``next`` (oder kurz: ``n``) beziehungsweise ``step`` (oder kurz:
``s``) eingegeben werden, um nur die unmittelbar nächste Quellcode-Zeile
auszuführen. Der Unterschied zwischen ``next`` und ``step`` liegt darin, dass
``next`` die nächste Code-Zeile als eine einzige Anweisung ausführt, während
``step`` im Falle eines Funktionsaufrufs den Code der Funktion zeilenweise
durchläuft.

Drückt man in ``gdb`` die Enter-Taste, so wird die unmittelbar vorher
gegebene Anweisung erneut ausgeführt. Dies kann insbesondere in Verbindung mit
``next`` oder ``step`` viel Schreibarbeit ersparen.. ;-)


.. rubric:: Werte von Variablen beobachten

Ebenso wie Breakpoints die Ausführung des Programms an bestimmten Code-Zeilen
gezielt unterbrechen, kann man mit so genannten "Watchpoints" das Programm
jedes mal automatisch stoppen, wenn sich der Wert einer angegebenen Variablen
ändert. Befindet sich beispielsweise im Programm eine Variable ``myvar``, so
kann mittels ``watch myvar`` ein zu dieser Variablen passender Watchpoint
definiert werden.

.. rubric:: Backtraces

Wird eine Funktion aufgerufen, so erzeugt ``gdb`` einen so genannten "frame", in
dem der Funktionsname und die übergebenen Argumente festgehalten werden,
beispielsweise existiert immer ein Frame für die Funktion ``main``, der
gegebenenfalls die beim Aufruf übergebenen Argumente ``argv`` sowie ihre Anzahl
``argc`` beinhaltet. Mit jedem Aufruf einer weiteren Funktion wird, solange
deren Ausführung dauert, ein weiterer Frame angelegt.

Tritt ein Fehler auf, so genügt es unter Umständen, wenn die Zeile des Codes
angezeigt wird, die den Fehler verursacht hat. Mitunter ist es jedoch auch gut
zu wissen, wie das Programm zur fehlerhaften Zeile gelangt ist. Dies kann in
``gdb`` mittels einer Eingabe von ``backtrace`` (oder kurz: ``bt``) geprüft
werden. Ein solcher Backtrace gibt in umgekehrter Reihenfolge an, durch welche
Funktionsaufruf das Programm an die Fehlerstelle gelangt ist. Somit können
beim nächsten Durchlauf von ``gdb`` gezielt Breakpoints gesetzt bzw.
Variablenwerte überprüft werden.

In sehr verschachtelten Programmen können mittels ``backtrace n`` nur die
"inneren" :math:`n` Frames um die Fehlerstelle herum angezeigt werden, mittels
``backtrace -n`` die :math:`n` äußeren Frames.


.. rubric:: ``ddd`` als graphisches Frontend für ``gdb``

Möchte man ``gdb`` mit einer graphischen Oberfläche nutzen, so können
optional die Pakete ``ddd`` und ``xterm`` via :ref:`apt <apt>` installiert
werden:

.. code-block:: bash

    sudo aptitude install ddd xterm

Anschließend kann man  ``ddd`` als Debugger-Frontend aufrufen.

..  Real programmers can read core dumps.

.. index:: gprof
.. _gprof:

``gprof`` -- Profiler
---------------------

Der Profiler ``gprof`` kann verwendet werden, um zu untersuchen, wie häufig die
einzelnen Funktionen eines Programms aufgerufen werden und wie viel Zeit sie
dabei für ihre Ausführung benötigen. Dies soll kurz anhand des folgenden
Beispielprogramms gezeigt werden:

.. code-block:: c

    // Datei: gprof_test.c

    #include<stdio.h>

    void new_func1(void);

    void func_1(void)
    {
        int i;
        printf("\n Now: Inside func_1 \n");

         for(i=0; i<1000000000; i++)
             ;

         return;
    }

    static void func_2(void)
    {
        int i;
        printf("\n Now: Inside func_2 \n");

        for(i=0 ;i<2000000000; i++)
            ;

        return;
    }

    int main(void)
    {
        int i;
        printf("\n Now: Inside main()\n");

        for(i=0; i<10000000; i++)
            ;

        func_1();
        func_2();

        return 0;
    }


Um ``gprof`` nutzen zu können, muss als erstes das zu untersuchende Programm
zunächst mit der Option ``-pg`` compiliert werden, um für den Profiler relevante
Informationen zu generieren; als zweites muss das Programm einmal aufgerufen
werden, um die für ``gprof`` relevante Datei ``gmon.out`` zu erzeugen:

.. code-block:: bash

    gcc -o gprof_test -pg gprof_test.c

    ./gprof_test

Anschließend kann der Profiler mittels ``gprof ./gprof_test`` aufgerufen werden.
Ruft man ``gprof`` allerdings ohne zusätzliche Optionen auf, so wird eine
ziemlich lange Ausgabe auf dem Bildschirm erzeugt, wobei die meisten
beschreibenden Kommentare in den Regel nicht benötigt werden; ``gprof`` sollte
daher mit der Option ``-b`` aufgerufen werden, um die ausführlichen Kommentare
auszublenden. Verwendet man zusätzlich die Option ``-p``, so wird die Ausgabe
auf ein Minimum reduziert:

.. code-block:: bash

    gprof -b -p ./gprof_test

    # Ergebnis:
    # Flat profile:
    #
    # Each sample counts as 0.01 seconds.
    #   %   cumulative   self              self     total
    #  time   seconds   seconds    calls   s/call   s/call  name
    #  67.28      4.89     4.89        1     4.89     4.89  func_2
    #  33.71      7.34     2.45        1     2.45     2.45  func_1
    #   0.28      7.36     0.02                             main

Bei dieser Ausgabe sieht man auf den ersten Blick, welche Funktion im Laufe des
Programms am meisten Zeit benötigt beziehungsweise wie viel Zeit sie je Aufruf
braucht. Wird anstelle der Option ``-p`` die Option ``-P`` verwendet, so wird
neben dieser Aufgliederung angezeigt, an welcher Stelle eine Funktion aufgerufen
wird:

.. code-block:: bash

    gprof -b -P ./gprof_test

    # Ergebnis:
    # 			Call graph
    #
    #
    # granularity: each sample hit covers 2 byte(s) for 0.14% of 7.36 seconds
    #
    # index % time    self  children    called     name
    #                                                  <spontaneous>
    # [1]    100.0    0.02    7.34                 main [1]
    #                 4.89    0.00       1/1           func_2 [2]
    #                 2.45    0.00       1/1           func_1 [3]
    # -----------------------------------------------
    #                 4.89    0.00       1/1           main [1]
    # [2]     66.4    4.89    0.00       1         func_2 [2]
    # -----------------------------------------------
    #                 2.45    0.00       1/1           main [1]
    # [3]     33.3    2.45    0.00       1         func_1 [3]
    # -----------------------------------------------
    #
    #
    # Index by function name
    #
    #    [3] func_1                  [2] func_2                  [1] main

Unmittelbar im Anschluss an die Optionen ``-p`` oder ``-P`` kann auch ein
Funktionsname ausgegeben werden, um die Ausgabe von ``gprof`` auf die angegebene
Funktion zu beschränken; zudem kann mittels der Option ``-a`` die Aufgabe auf
alle nicht als statisch (privat) deklarierten Funktionen beschränkt werden.


..  http://www.stack.nl/~dimitri/doxygen/examples/diagrams/html/diagrams__d_8h.html

.. index:: make, Makefile
.. _make:

``make`` -- Compilier-Hilfe
---------------------------

Das Shell-Programm ``make`` ist ein äußert praktisches Hilfsmittel beim
Compilieren von C-Quellcode zu fertigen Programmen. Die grundlegende
Funktionsweise von ``make`` ist unter :ref:`Linux und Open Source: Makefiles
<gwl:Makefiles>` beschrieben.


.. index:: splint
.. _splint:

``splint`` -- Syntax Checker
----------------------------

Wendet man den Syntax-Prüfer ``lint`` oder die verbesserte Variante ``splint``
auf eine C-Datei an, so reklamiert dieser nicht nur Fehler, sondern auch
Stilmängel.

.. code-block:: bash

    splint quelldatei.c

Bisweilen kann ``splint`` auch Code-Zeilen beanstanden, in denen man bewusst
gegen einzelne "Regeln" verstoßen hat. In diesem Fall muss man das Ergebnis der
Syntax-Prüfung selbst interpretieren und/oder gegebenenfalls Warnungen mittels
der jeweiligen Option abschalten (diese wird bei der Ausgabe von ``splint``
gleich als Möglichkeit mit angegeben).

.. index:: time
.. _time:

``time`` -- Timer
-----------------

Der Timer ``time`` kann verwendet werden, um die Laufzeit eines Programms zu
messen. Dies ist nützlich, um verschiedene Algorithmen hinsichtlich ihrer
Effizienz zu vergleichen. Als Beispiel soll die Laufzeit zweier Algorithmen
verglichen werden, welche alle Primzahlen zwischen :math:`1` und :math:`10000`
bestimmen sollen:

.. code-block:: c

    // Datei: prim1.c
    // (Ein nicht sehr effizienter Algorithmus)

    #include <stdio.h>

    #define N 10000

    int main()
    {
        int num, factor;
        int is_prim;

        for(num = 2; num <= N; num++)               // Alle Zahlen testen
        {
            is_prim = 0;                            // Vermutung: keine Primzahl

            for(factor = 2; factor < N; factor++)   // Alle möglichen Faktoren ausprobieren
            {
                if (num % factor == 0)              // Test, ob num den Faktor factor enthält
                {
                    if(num == factor)               // num ist genau dann Primzahl, wenn sie
                        is_prim = 1;                // nur sich selbst als Faktor enthält
                    else
                        break;                      // sonst nicht
                }
            }

            if (is_prim == 1)                       // Wenn num Primzahl ist,
               printf("%d ", num);                  // dann Ausgabe auf Bildschirm
        }

        printf("\n");
        return 0;
    }

Übersetzt man dieses Programm mittels ``gcc -o prim1 prim1.c`` und ruft
anschließend ``time ./prim1`` auf, so erhält man (neben der Auflistung der
Primzahlen) folgende Ausgabe:

.. code-block:: bash

    gcc -o prim1.c && time ./prim1

    # Ergebnis:
    # ...
    # real	0m0.179s
    # user	0m0.175s
    # sys	0m0.003s

Die Ausgabe besagt, dass das Programm zur Ausführung insgesamt
:math:`\unit[0,179]{s}` benötigt hat, wobei die zur Ausführung von Benutzer-
und Systemanweisungen benötigten Zeiten getrennt aufgelistet werden. Beide
zusammen ergeben (von Rundungsfehlern abgesehen) die Gesamtzeit.

Im Vergleich dazu soll ein zweiter, wesentlich effizienterer Algorithmus
getestet werden: [#]_

.. code-block:: c

    // Datei: prim2.c
    // (Ein wesentlich effizienterer Algorithmus)
    // ("Das Sieb des Eratosthenes")

    #include <stdio.h>

    #define N 10000

    int main()
    {
        int num = 1;
        int factor_1, factor_2;
        int numbers[N];

        for (numbers[1] = 1; num < N; num++)        // Alle Zahlen zunächst
            numbers[num] = 1;                       // als Primzahlen vermuten

        for (factor_1 = 2; factor_1 < N/2; factor_1++)
        {
            for (factor_2 = 2; factor_2 <= N / factor_1; factor_2++)
            {
                numbers[factor_1 * factor_2] = 0;   // Alle möglichen Produkte
            }                                       // aus factor_1 und factor_2
                                                    // sind keine Primzahlen
        }

        for (num = 1; num <= N; num++)
        {
            if (numbers[num] == 1)                  // Jede verbleibende Zahl 1
            {                                       // entspricht einer Primzahl
                printf("%d ", num);                 // Alle Primzahlen ausgeben
            }
        }
        printf("\n");
        return 0;
    }

In diesem Fall liefert ``time`` nach dem Compilieren folgendes Ergebnis:

.. code-block:: bash

    gcc -o prim1.c && time ./prim1

    # Ergebnis:
    # ...
    # real	0m0.003s
    # user	0m0.002s
    # sys	0m0.001s

Der zweite Algorithmus gibt das gleiche Ergebnis aus, benötigt dafür aber nur
rund :math:`1/60` der Zeit. Dieser Unterschied im Rechenaufwand wird noch
wesentlich deutlicher, wenn man in den Quelldateien den Wert ``N`` statt auf
:math:`10\,000` auf :math:`100\,000` setzt: In diesem Fall ist der erste
Algorithmus auf meinem Rechner erst nach :math:`\unit[14.397]{s}` (!!) fertig,
während der zweite nur :math:`\unit[0,032]{s}` benötigt.


.. index:: valgrind
.. _valgrind:

``valgrind`` - Speicher-Testprogramm
------------------------------------

Das Programm ``valgrind`` prüft bei einem ausführbaren Programm, wieviel
Speicher dynamisch reserviert bzw. wieder freigegeben wurde.

.. code-block:: bash

    valgrind programmname

Man kann ``valgrind`` auch auf Standard-Programme anwenden, beispielsweise wird
mittels ``valgrind ps -ax`` der Speicherbedarf des Programms ``ps`` analysiert,
wenn dieses mit der Option ``-ax`` aufgerufen wird.

.. raw:: html

    <hr />

.. only:: html

    .. rubric:: Anmerkungen:

.. [#] Alternativ kann man ``gdb`` auch ohne Angabe eines Programmnamens starten
    und dieses im interaktiven Modus mittels ``file myprogram`` öffnen.

.. [#] Eratosthenes entwickelte ein einfaches Schema zur Bestimmung aller
    Primzahlen kleiner als :math:`100`: Zunächst schrieb er die Zahlen in zehn
    Zeilen mit je zehn Zahlen auf ein Blatt. Anschließend strich er zunächst
    alle geraden Zahlen (jede jede zweite) durch, dann alle durch :math:`3`
    teilbaren Zahlen (also jede dritte), dann alle durch :math:`5` teilbaren
    Zahlen (die :math:`4` war ja bereits durchgestrichen), usw. Alle
    verbleibenden Zahlen mussten Primzahlen sein, denn sie waren nicht als
    Vielfache einer anderen Zahl darstellbar.