Programmeren met stijl in C++

Jan Cnops & Kris Coolsaet

Hogeschool Gent - Departement INWE
Vakgroep Informatica 2000-2007

Inleiding

In de eerste jaren van de opleiding leer je programmeren aan de hand van de programmeertaal C++. Daarbij wordt van jou geen enkele voorkennis verwacht. Nochtans heeft een groot gedeelte van de studenten reeds ervaring met programmeren - hetzij in C++, hetzij in een andere programmeertaal - en dit is niet altijd een voordeel.

Een programmeertaal kennen is één ding - kunnen programmeren is iets anders. Een taal zoals C++ bevat verschillende manieren waarmee je hetzelfde idee kan uitdrukken, en hoewel ze allemaal wellicht tot een `werkend' programma zullen leiden, zijn ze toch niet allemaal even `goed'. Je hebt misschien een methode gebruikt die veel minder efficiënt is, die wel veertig lijnen vraagt in plaats van tien of die obscure C++-opdrachten gebruikt waarvan niemand nog de betekenis kent. Het belangrijkste kenmerk van een programma is leesbaarheid. Code die een paar regels langer is dan andere kan betere code zijn omdat ze duidelijker is. Soms gebruikt men methodes die iets meer computertijd vragen omdat ze duidelijker zijn en gemakkelijker te testen.

Vaak is je programma enkel begrijpelijk voor jezelf. Nochtans wordt er tegenwoordig geen enkel programma van professionele kwaliteit nog door één enkele programmeur geschreven (en in grotere projecten wordt het altijd door iemand anders gecontroleerd en getest). Softwareontwikkeling is een groepsgebeuren geworden. Je programma's moeten dus niet alleen duidelijk zijn voor je computer, maar ook voor je medewerkers en opvolgers. Vergeet trouwens de belangrijkste `verborgen' medewerker niet: je toekomstige zelf!

Deze nota's introduceren een aantal programmeertechnieken waar wij voorstander van zijn en die wij natuurlijk ook zelf in alle lessen en oefeningensessies toepassen. Ze zijn gegroeid uit een jarenlange programmeerervaring van verschillende mensen. Een aantal van deze stijlelementen zijn trouwens opgenomen als onderdeel van programmeertalen zoals Java en C# (C-sharp) - de jongere neven van C en C++. Dit geeft aan hoe ook internationale experts het op dit gebied met ons eens zijn.

Deze regels zijn wat ons betreft helemaal niet vrijblijvend! Wij beschouwen ze als even belangrijk als de kennis van de programmeertaal zelf en we verplichten je om ze in al je programma's toe te passen. Dit lijkt misschien streng, maar het zal gemakkelijker zijn om later in het professionele leven eventjes de teugels te vieren dan omgekeerd. Wellicht zal je daar niet eens meer de neiging toe voelen want een consistente programmeerstijl heeft vele voordelen: je programmeert vlugger, je maakt minder fouten en je spoort eventuele fouten ook veel sneller op. En zoals men in het onderwijs nogal veel hoort verklaren: je zal er ons later dankbaar voor zijn!

Gevorderde topics (al wat buiten leerstof van het eerste jaar valt) worden behandeld in kleiner lettertype, zoals deze opmerking.
Deze tekst behandelt alleen het schrijven van duidelijke stukjes code. Hoe je alles samenvoegt tot een duidelijk geheel, ingedeeld in klassen en lidfuncties, komt hier niet ter sprake.

KC, september 1999

JC, februari 2007

Hoofdstuk 1
Vorm

1.1 Bladspiegel

Een goed programma heeft een bladspiegel waaruit je onmiddellijk de interne structuur van het programma kan afleiden. Bovendien helpen sommige programmeeromgevingen en editors je. Je kan netjes indenteren met de tabtoets, en in sommige gevallen kan je een overzicht maken van je programma, met een lijst van procedures en klassen. Maar dan moet je je wel aan de regels houden.

Het sleutelwoord is indentatie: pas de linkermarge steeds zodanig aan dat de binnenkant van een samengestelde opdracht (zoals een if, while of for) zich meer naar rechts bevindt dan de hoofding van de opdracht zelf. De standaardbreedte hiervoor is bij de meeste editors 3 of 4 spaties: minder is niet duidelijk, en meer zorgt dat je in de problemen komt bij verneste opdrachten.

    cin >> getal;
    while (getal != 0){
        aantal++;
        if (getal % 2 == 0)
            someven=someven + getal;
        else
            somoneven=somoneven + getal;
        cin >> getal;
    }

De eindaccolade van (de binnenkant van) een opdracht plaats je onder de eerste letter van de hoofding van de opdracht. Zo zie je onmiddellijk waar ze bij hoort. De beginaccolade plaats je op de hoofdinglijn zoals hierboven.

Hier is één uitzondering op. Bij het definiëren van functies en klassen plaatsen sommigen de beginaccolade aan het begin van een nieuwe lijn. Er zijn programma's die code samenvatten door alleen functiehoofdingen te geven en die deze conventie gebruiken. Als je dit doet plaats je de beginaccolade onder de eerste letter van de functieopdracht (of de classdeclaratie). De eerste regel code volgt dan ofwel op dezelfde lijn, ofwel op de volgende. Er zijn dus drie mogelijkheden:

int main(){
    cout<<"dag wereld";
}

int main()
{   cout<<"dag wereld";
}

int main()
{
    cout<<"dag wereld";
}

Volgens bovenstaande regels moet je een ifopdracht die binnen een if of een else ligt verder indenteren. Er is een uitzondering op de regel: als we drie of meer gelijkwaardige mogelijkheden hebben schrijven we ze met dezelfde indentatie. Een voorbeeld:

    if (getal==0)
        cout<<"het is nul";
    else if (getal<0)
        cout<<"het is kleiner dan nul";
    else
        cout<<"het is groter dan nul";

Wanneer er zich slechts één opdracht binnen de if-, while- of forstructuur bevindt, dan mag je de accolades weglaten. De indentatie moet je echter behouden. Wanneer het om een hele korte opdracht gaat dan kan je het geheel eventueel op één lijn plaatsen. Overdrijf hier echter niet. Dus niet

    while (i--) if (tab[i]>0) aant++;      //VERKEERD

maar wel

    while (i--)
        if (tab[i]>0)
            aant++;

Je kan de opdracht `aant++' eventueel op dezelfde lijn plaatsen als de if.

Let wel: wil je altijd en overal een snelle visuele controle hebben over de structuur van je programma, dan is het aangeraden om wél overal accolades te zetten (behalve als de unieke opdracht die tussen de accolades hoort, op één lijn gezet wordt met de inleidende voorwaarde). Dan geldt immers volgende regel: de code kan pas terugspringen naar de kantlijn die meer naar links staat, als dit wordt voorafgegaan door een sluitende accolade. Staat die accolade er niet (eentje per negatieve indentatie), dan verschilt de code die er staat waarschijnlijk van de code die je bedoelde te schrijven.

Vermijd om meer dan één opdracht op dezelfde lijn te plaatsen. Is een opdracht te lang om op één lijn te passen, indenteer dan het tweede stuk en splits de lijn op een logische plaats. Schrijf dus niet

    if ((get >= 0 && get < 10) || (get     //VERKEERD
    >= 20 && get < 30)) {                  //VERKEERD
        cout << get << endl;               //VERKEERD
    }                                      //VERKEERD

maar wel

    if ( (get >= 0 && get < 10) ||
         (get >= 20 && get < 30) ) {
        cout << get << endl;
    }

Merk hier ook op dat de voortzetting van een opdrachtlijn op een eigen manier inspringt: verder naar rechts dan gewone indentatie. Er zijn geen vaste regels voor, maar men probeert het netjes te houden: bij meervoudige condities zet men de condities onder elkaar, bij een lange parameterlijst de parameters van de tweede lijn onder die van de eerste, bij een toekenning begint men rechts van het gelijkheidsteken (of iets verder, zoals bij het drukken van formules gebruikelijk is):

    if ( (get >= 0 && get < 10) ||
         (get >= 20 && get < 30) )
        stel_nieuwelijst_op(oude_lijst, aantal_elementen,
                            dag, verder, lijsttype);
    else
        dagorder=voorstel*kernfunctie - 23
                   + dagtekening/hoofdpremie;

Afzonderlijke procedure- en functiedefinities moeten in één oogopslag kunnen bekeken worden. Als vuistregel mag één definitie niet meer dan één scherm beslaan - dus ongeveer 20 lijnen (dit is een oude regel). Heb je meer lijnen nodig, dan betekent dit wellicht dat je je programma nog verder in afzonderlijke deelprogramma's moet opsplitsen. Voor de hoofding van een functiedefinitie zet je een blanco lijn.

Binnen een programma kan je hier en daar een blanco lijn toevoegen: dit heeft ongeveer hetzelfde effect als een nieuwe paragraaf beginnen in een tekst. Doe het dan ook als je een reeks bij elkaar horende opdrachten hebt, zoals een rij declaraties.

Binnen opdrachten kan je ook blanco's gebruiken om alles meer leesbaar te maken. We geven hier geen vaste regels (experten zijn het er niet over eens), maar waarschijnlijk is het best om blanco's te gebruiken om elementen van de opdracht in groepjes in te delen. Sleutelwoorden van C++, zoals if, while en for zet je best voor de duidelijkheid tussen blanco's. Teveel wit kan storend zijn. Vergelijk maar eens de drie mogelijkheden voor een programmafragment dat te maken heeft met de vergelijking ax²+bx+c.

    if ((b*b-4*a*c>0)&&(a!=0))
        brandpt=-b/a+2*a;
    else
        brandpt=0;

    if ((b*b-4*a*c > 0) && (a!=0))
        brandpt= -b/a + 2*a;
    else
        brandpt=0;

    if ( ( b * b - 4 * a * c > 0 ) && ( a != 0) )
        brandpt = - b / a + 2 * a;
    else
        brandpt = 0;

1.2 Naamkeuze

De regels voor naamgeving in Java zijn zeer streng, en leiden vaak tot lange namen (dat is ook wel nodig als je veel namen hebt). In C++ gaat het er iets losser aan toe, maar toch zijn een aantal dingen belangrijk. Een programma wordt heel wat leesbaarder als je de juiste namen kiest voor je variabelen en functies. Zorg ervoor dat de namen zinvol en leesbaar zijn. Wil je voorbeelden van onduidelijke naamgeving, kijk dan eens in string.h, waar functies zoals strncmp en strcspn gedefinieerd zijn.

Wat hoofdletters betreft zijn er in C++ twee regels: de namen van constanten worden in hoofdletters geschreven, en klassennamen beginnen soms met een hoofdletter. Voornamelijk onder invloed van Java schrijven sommige mensen op sommige plaatsen nog hoofdletters; anderen doen dat nooit.

Je mag rustig afkortingen gebruiken, maar maak ze niet te kort. Een variabele die het product van een aantal ingelezen waarden moet bevatten noem je product of prod, maar niet p (en zeker niet w). Let echter op met nietszeggende lange namen zoals geheelgetal. Wellicht zal je programma heel wat andere gehele getallen te verwerken krijgen. Ook een naam als tabel_van_ingevoerde_waarden slaat nergens op. Dat een variabele een tabel is zie je wel aan de indexen die er achter staan, en een variabele kan moeilijk iets anders dan waarden bevatten. invoer lijkt een iets logischer keuze voor deze variabele.

Voorbeelden van domme namen zijn: dummy, tabel, tab, getal, teller, pointer, ptr, temp (behalve als het over temperatuur gaat), hulp, enzovoorts.

In enkele situaties zijn zeer korte variabelennamen toegelaten. Eenlettervariabelen mogen in drie gevallen:

De lopende index van een forlus heet meestal i (en vernestelde lussen krijgen dan j, k, en zo verder). Natuurlijk, als de index een `echte' betekenis heeft krijgt hij een echte naam, maar het heeft geen zin om namen als teller of index te gebruiken.

Dikwijls heeft de parameter van een functie geen andere betekenis dan dat het een parameter is. In de functiedefinitie krijgt deze dan een enkele letter. Je schrijft dan bijvoorbeeld

double kwadraat(double x){
    return x*x;
}

Overdrijf hier niet in: als er verscheidene parameters zijn, dan hebben ze meestal wel een betekenis. Schrijf dus

double macht(double x,unsigned int exponent){
    double numacht=x, uit=1;
    while (exponent>0){
        if (exponent % 2==0)
            uit*=numacht;
        numacht*=numacht;
        exponent/=2;
    }
    return uit;
}

en niet

double macht(double x,unsigned int n){     //VERKEERD
    double y=x, u=1;                       //VERKEERD
    while (n>0){                           //VERKEERD
        if (n % 2==0)                      //VERKEERD
            u*=y;                          //VERKEERD
        y*=y;                              //VERKEERD
        n/=2;                              //VERKEERD
    }                                      //VERKEERD
}                                          //VERKEERD

Vaak duidt de gebruikte letter, of de korte naam, het type van de parameter aan: x voor een double, n voor een geheel getal, c of ch voor een karakter, str voor een string en l voor een gelinkte lijst.

Als het programma gebaseerd is op een tekst of op wiskundige formules waar korte namen gebruikt worden. Het heeft geen zin om, als in de tekst een gewichtenmatrix w voorkomt, deze in het programma gewichtenmatrix te noemen. Ook x, y en z voor reële coördinaten van een punt zijn voorbeelden van klassieke notaties.

Ook de plaats waarop je een variabele declareert is belangrijk. Declareer een variabele altijd op de plaats waar je ze gaat gebruiken . Dit zeggen we niet zomaar: wie een (stukje) programma leest moet onthouden welke variabelen er bestaan en wat voor type ze zijn: dus wil je dat er op elk ogenblik zo weinig mogelijk variabelen relevant zijn, en dat de declaratie gemakkelijk terug te vinden is. Variabelen die in een heel codestuk (bijvoorbeeld een functiedefinitie) belangrijk blijven declareer je in het begin van dat stuk. Maar variabelen die je binnen een lusblok (of een if- of een elseblok) nodig hebt, declareer je binnen dat blok. Variabelen die je maar voor een paar opdrachten nodig hebt declareer je vlak voor die opdrachten. En ja, in dit laatste geval mag je een domme naam gebruiken. Voor domme variabelen geldt dat je niet zuinig hoeft te zijn: het is een slecht idee om een domme variabele die toevallig al gedefinieerd is te hergebruiken. Volgende code roteert een tabel een plaats naar links en verwisselt dan de elementen paarsgewijs

    int hulp,i;                            //VERKEERD
    hulp=tab[0];                           //VERKEERD
    for (i=0;i<TABGROOTTE-1;i++){          //VERKEERD
        tab[i]=tab[i+1];                   //VERKEERD
    }                                      //VERKEERD
    tab[TABGROOTTE-1]=hulp;                //VERKEERD
    for (i=0;i<TABGROOTTE-1;i+=2){         //VERKEERD
        hulp=tab[i];                       //VERKEERD
        tab[i]=tab[i+1];                   //VERKEERD
        tab[i+1]=hulp;                     //VERKEERD
    }                                      //VERKEERD

Goede code ziet er zo uit:

    int hulp=tab[0];
    for (i=0;i<TABGROOTTE-1;i++){
        tab[i]=tab[i+1];
    }
    tab[TABGROOTTE-1]=hulp;
    for (int i=0;i<TABGROOTTE-1;i+=2){
        int hulp=tab[i];
        tab[i]=tab[i+1];
        tab[i+1]=hulp;
    }

Zorg ervoor dat de namen die je gebruikt allemaal op dezelfde wijze gevormd worden. Als je in een programma het aantal studenten en het aantal vakken moet bijhouden, gebruik dan niet de combinatie vak_aant en aantalstudenten. Als je afkortingen gebruikt, wees dan altijd even bondig: korte en heel lange namen door elkaar werkt verwarrend.

Procedures en functies Ook dien je duidelijk te maken of iets een procedure of een functie is. Daarom is het slechte stijl om de twee te vermengen: normaal heeft een functie nooit uitvoerparameters. Ook verandert ze niets aan de omgeving: je maakt dus nooit een functie die zaken uitschrijft naar het scherm. Er is één uitzondering: als er een zeer zware fout is die niet door het oproepende programma kan worden opgevangen, kan je een foutmelding naar het scherm schrijven. Een zware fout betekent niet zoiets als een ontbrekend bestand of een ongeldige waarde van een parameter, wel dat het geheugen op is, of dat de halve computer is opgebrand.
In C oude stijl gaf een procedure wel eens een getal terug om te melden of alles goed was gegaan (0 betekende alles OK), en werd zo een functie die een int teruggaf. Dit is geen nette techniek, maar je kan ze nog wel terugvinden in de gebruiksbibliotheken.

1.3 Een compleet programma

Binnen de C++-wereld bestaan een aantal verschillende opvattingen over #includeopdrachten, wat je voor en na het woord main moet schrijven, en zo verder. Het volgende voorbeeld geeft al deze elementen in de stijl die wij gebruiken.

#include <iostream>
using std::cout;

int main(){
    cout<<"dag wereld"<<endl;
    return 0;
}

Enige opmerkingen daarbij: we schrijven #include <iostream> en niet #include <iostream.h>: zo krijgen we een recentere versie van dit bestand. Voor het woord main staat int, en niet iets anders, en we gebruiken niet void voor een lege argumentenlijst. Waar het programma eindigt, als alles goed gaat, wordt aangegeven met return 0.

Hoofdstuk 2
Inhoud

2.1 Constanten

Je kan numerieke constanten die je in je programma gebruikt ook een naam geven met behulp van een constdeclaratie. Namen van constanten noteer je, zoals gezegd, steeds in hoofdletters. Wees niet zuinig met constanten: als je een numerieke waarde twee of meer keer moet schrijven in een programma is het bijna altijd een goed idee er een constante van te maken. Hetzelfde geldt voor de grootte van een tabel, en constante strings die twee keer voorkomen. Er is een school die eist dat alle strings samengezet worden en als constanten gedefinieerd. Ook kan het goed zijn een constante die één keer voorkomt met const te definiëren: ze valt dan tenminste op.

Er zijn twee redenen hiervoor. Ten eerste maakt het een programma leesbaarder. Als je in een programma BTW moet berekenen is een uitdrukking als taks=BTWVOET*prijs; duidelijker dan taks=20.5*prijs;. Een programma met constanten is ook beter aanpasbaar. Soms verandert de BTW-voet, en als je overal manueel de 20.5 in je programma verandert kan je in de problemen komen als er ergens een 20.5 staat die geen BTW-voet is, of als je de BTW-voet al ergens verrekend hebt. Vergelijk de veranderingen in

    cout<<"Prijs zonder BTW van 20.5% is"  //VERKEERD
        <<prijs*0.829876                   //VERKEERD
        <<endl;                            //VERKEERD

met deze in

    const double BTWVOET=20.5;

    double prijszonder=prijs*100.0/(100.0+BTWVOET);
    cout<<"Prijs zonder BTW van "<<BTWVOET<<"% is"
        <<prijszonder
        <<endl;

Het tweede argument is minder belangrijk bij een constante zoals p.

2.2 Types

Hoewel er hiervoor in C++ ook nog andere mogelijkheden bestaan, gebruiken wij enkel int voor gehele getallen, en double voor reële getallen. Op sommige oudere implementaties betekent dit dat gehele getallen beperkt zijn tot het interval [-32768, 32767], maar daar hoef je je meestal niets van aan te trekken. Types zoals unsigned long zijn uit den boze, behalve als je er een heel goede reden voor hebt, zoals bitbewerkingen.

Het type char gebruiken we enkel voor lettertekens, niet voor kleine gehele getallen. We maken trouwens helemaal geen gebruik van het feit dat lettertekens eigenlijk voorgesteld worden door kleine gehele getallen die hun ASCII-code bevatten. Dus niet:
if (ch >= 'A' && ch <= 'Z') //VERKEERD ch += 32; //VERKEERD
maar wel
if (ch >= 'A' && ch <= 'Z') ch += 'a' - 'A';

2.3 Logische uitdrukkingen

Het type bool wordt gebruikt voor logische variabelen. Verder heb je logische uitdrukkingen zoals i==0 of b*b>5. Je kan de waarde van zo'n uitdrukking direct in een logische variabele steken. Bijvoorbeeld:

    bool positief=(a>=0);

Logische variabelen vormen een logische uitdrukking op zich. Het heeft geen zin om te schrijven if ((a>=0)==true)), en dus heeft het ook geen zin om te schrijven if (positief==true). Een echt gruwelijke stijlfout is het toekennen van logische waarden met een if-else. Schrijf dus nooit

    if (a>0 || a<-10)                      //VERKEERD
        gedaan=false;                      //VERKEERD
    else                                   //VERKEERD
        gedaan=true;                       //VERKEERD

maar gewoon

    gedaan=!(a>0 || a<-10);

Meestal is het netter om de negatie weg te werken en gewoon te schrijven gedaan=(a>=-10 && a<=0). De ronde haakjes rond de logische uitdrukkingen zijn niet altijd echt nodig. Zet ze echter altijd: ze maken duidelijk dat het om een logische uitdrukkingen gaat.

Let op bij voorwaarden met doublevariabelen. Afrondingen kunnen ervoor zorgen dat gelijkheden niet opgaan. Het programmafragment

    double x=1.0;                          //VERKEERD
    while (x!=0){                          //VERKEERD
        x-=0.1;                            //VERKEERD
        cout<<x<<endl;                     //VERKEERD
    }                                      //VERKEERD

levert op mijn computer een oneindige lus op.

Tenslotte: je compiler laat toe om gehele getallen en dergelijke te beschouwen als logische uitdrukkingen (ze zijn onwaar als ze nul zijn). Een goede programmeur doet dit niet. schrijf dus niet while (i)..., maar while (i!=0)....

2.4 Declaraties

C++ staat toe om meerdere variabelen in één keer te declareren. Gebruik dit niet om tegelijkertijd tabellen en gewone variabelen te introduceren. Je kan ook variabelen ineens initialiseren. Schrijf die drie soorten niet in dezelfde opdracht. Dus niet

    int punt[AANTPUNT], code[AANTCODE],    //VERKEERD
        aantfact=5, discr, mediaan=0, alfa;//VERKEERD

maar

    int punt[AANTPUNT], code[AANTCODE];
    int aantfact=5, mediaan=0;
    int discr, alfa;

Als je meerdere tabellen in de declaratie initialiseert, gebruik je voor elke tabel een aparte declaratieopdracht. Het is niet wenselijk om `voor de zekerheid' alle variabelen op voorhand de waarde 0 te geven.

2.5 Toewijzingen

We beschouwen een toewijzing als een opdracht en niet als een uitdrukking. Dus staat een toewijzing altijd alleen en maakt geen deel uit van een andere uitdrukking. In klassieke C-programma's wordt wel eens een toewijzing als een conditionele uitdrukking gebruikt: als er nul wordt toegewezen is de uitdrukking onwaar. Een voorbeeld: schrijf een positief geheel getal a in bits uit (minst significante bit links!). In C wordt dit

    cout<<a%2;                             //VERKEERD
    while (a/=2)                           //VERKEERD
        cout<<a%2;                         //VERKEERD

Nette C++-programmeurs schrijven dan

    cout<<a%2;
    a/=2;
    while (a!=0){
        cout<<a%2;
        a/=2;
    }

Dit is langer, maar gemakkelijker om te lezen.

Overdrijf niet met het gebruik van `++' en `--' binnenin andere uitdrukkingen. Beperk je tot verhogen en verlagen van indices van tabellen. Je mag deze uitdrukkingen natuurlijk wel los gebruiken, maar probeer maar eens te begrijpen wat

    while (n > 0)                          //VERKEERD
        som += n * n--;                    //VERKEERD

betekent.

Tenslotte: als je een waarde twee keer nodig hebt, steek je ze altijd in een variabele. Dit is duidelijker (je ziet meteen dat het dezelfde waarde is die je gebruikt), en ook efficiënter. Vooral als je een functie oproept, die misschien veel rekenwerk vergt, is dat nuttig (en bij recursie kan je verschrikkelijke resultaten krijgen als je het niet doet: een programma 1000000000000 keer trager laten lopen is geen goed idee). Schrijf dus niet

    x=25.0;                                //VERKEERD
    som=0;                                 //VERKEERD
    while (cos(x)>-0.9){                   //VERKEERD
        som+=cos(x);                       //VERKEERD
        x-=0.01;                           //VERKEERD
    };                                     //VERKEERD

maar wel

    x=25.0;
    som=0;
    double cosx=cos(x);
    while (cosx>-0.9){
        som+=cosx;
        x-=0.01;
        cosx=cos(x);
    };

Eén uitzondering op deze regel: de voorwaarde in een for wordt meestal verschillende keren getest, en toch mag je er eenvoudige uitdrukkingen inzetten.

    for (int i=0; i<aantkol*aantrij;i++)
        ...

mag dus nog net. De reden hiervoor: de meeste compilers zijn slim genoeg om hier zelf een variabele aan te maken. Doe dit echter nooit met functieoproepen!

Hoofdstuk 3
Samengestelde opdrachten

Van alle samengestelde opdrachten die C++ rijk is, gebruiken wij enkel de if-, while- en foropdracht. Andere constructies moet je steeds door combinaties van deze drie opdrachten vervangen. Verbannen zijn do, continue, break en -horresco referens- goto.

throw, try and catch dienen voor foutafhandeling en worden hier niet behandeld. Met if zijn er meestal weinig problemen. Twee opmerkingen toch: schrijf alleen opdrachten binnen de if-elsestructuur die er binnen thuis horen. Je schrijft dus niet

    if (disc>0){                           //VERKEERD
        afstand=sqrt(x*x+y*y);             //VERKEERD
        aantal=2;                          //VERKEERD
    }                                      //VERKEERD
    else{                                  //VERKEERD
        afstand=sqrt(x*x+y*y);             //VERKEERD
        aantal=0;                          //VERKEERD
    };                                     //VERKEERD

maar wel

    afstand=sqrt(x*x+y*y);
    if (disc>0)
        aantal=2;
    else
        aantal=0;

Ten tweede: wees erg zuinig op de (... ? ... : ... )-vorm. Deze is over het algemeen erg slecht leesbaar. Vergelijk het bovenstaande fragment maar eens met

    afstand=sqrt(x*x+y*y);
    aantal=(disc>0 ? 2:0);

Voor een simpele uitdrukking als deze is dit nog net aanvaardbaar, maar als het een beetje ingewikkelder wordt moet je de if-else voluit schrijven.

Lussen verdienen wel wat meer uitleg.

3.1 `for` of `while`?

Een forlus is een lus met een teller die voorafbepaalde waarden aanneemt. Meestal is dit heel duidelijk: de teller neemt alle even waarden aan tussen 1 en 365, of gaat van nul tot aan het aantal studenten (sprong 1), enzovoorts. Soms is het minder duidelijk en neemt de teller bijvoorbeeld alle strikt positieve waarden aan met kwadraat kleiner dan 729. Dan kan je kiezen tussen een while en een for. Bij een dubbele voorwaarde gebruik je bijna altijd een while. Dit is bijvoorbeeld het geval als je achteraf nog moet nakijken waarom de lus gestopt is. Zo schrijf je, om te weten of er een nul in een tabel staat

    int i=0;
    while (i<TABGROOTTE && tabel[i]!=0)
        i++;
    bool erisnul=(i<TABGROOTTE);

De teller mag binnen een forlus niet van waarde veranderen. Deze techniek wordt door slechte programmeurs gebruikt om een for vroegtijdig te beëindigen:

    for (int i=0;i<TABGROOTTE;i++){        //VERKEERD
        ...                                //VERKEERD
        if (tabel[i]==0)                   //VERKEERD
            i=TABGROOTTE;                  //VERKEERD
    }                                      //VERKEERD

is even erg als een break gebruiken! Hier hoort duidelijk een while te staan, die er hetzelfde uitziet als het vorige voorbeeld.

De teller wordt binnen de foropdracht gedeclareerd Soms heb je de waarde van de teller na de for nog nodig. Dat is geen reden om de teller niet binnen de lus te declareren. Ofwel kan je de eindwaarde op voorhand berekenen (en dan is het veel beter dit met een aparte opdracht te doen), ofwel moet je een while gebruiken.

En dan is er nog één speciaal geval: de oneindige lus. Deze wordt gebruikt bij allerhande serverprogramma's die moeten blijven draaien. Deze wordt traditioneel in C als een forlus geschreven:

    for(;;)

en niet als een while, zoals je misschien zou denken.

3.2 Binnen of buiten de lus?

Wanneer je in een lus een ifopdracht nodig hebt om een bijzonder geval op te vangen, dan ben je wellicht op de verkeerde weg. Het volgende fragment drukt een tabel van getallen af, gescheiden door komma's. Na het laatste element mag er geen komma staan.

    for (int i=0; i < AANT; i++) {         //VERKEERD
        cout << tab[i];                    //VERKEERD
        if (i != AANT-1)                   //VERKEERD
            cout << ", ";                  //VERKEERD
    }                                      //VERKEERD

Dit werkt wel maar is onduidelijk. Schrijf wel

    for (int i=0; i < AANT-1; i++)
        cout << tab[i] << ", ";
    cout << tab[AANT-1];

Wanneer je in een herhaling het laatste geval op een speciale manier moet behandelen, haal dit geval dan uit de lus en verwerk het achteraf. Op dezelfde manier kan je een speciaal begingeval best vóór de lus plaatsen.

Soms gebruik je één lus waar er eigenlijk twee opeenvolgende lussen nodig zijn. Hieronder lezen we een reeks gehele getallen afgesloten met een 0 en drukken daarna het eerste getal uit deze rij af dat kleiner was dan 10 (de invoer moet zeker een getal kleiner dan tien bevatten). Foutief is

    const int GRENS=10;                    //VERKEERD
    res=GRENS;                             //VERKEERD
    cin >> getal;                          //VERKEERD
    while (getal != 0){                    //VERKEERD
        if ( res == GRENS &&               //VERKEERD
             getal < GRENS)                //VERKEERD
            res=getal;                     //VERKEERD
        cin >> getal;                      //VERKEERD
    }                                      //VERKEERD
    if (res == GRENS) res=0;               //VERKEERD
    cout << res << endl;                   //VERKEERD

wat wel OK is is

    const int GRENS=10;
    int uit;
    cin >> getal;
    while (getal >= GRENS)
        cin >> getal;
    uit=getal;
    while (getal != 0)
        cin >> getal;
    cout<<uit<<endl;

3.3 De structuur van een `while`

De structuur van een whilelus ziet er altijd als volgt uit:

    klaarzetten voorwaarde;                // deel 1
    while (voorwaarde voldaan){            // deel 2
        uitvoeren lus;                     // deel 3
        opnieuw klaarzetten voorwaarde;    // deel 4
    }

Beginnende programmeurs willen nogal eens van deze structuur afwijken, wat altijd problemen geeft: ze vergeten dikwijls het eerste geval te behandelen, ze voeren de lus een keer te veel uit, en zo verder. Enkele voorbeelden. Stel dat je getallen moet inlezen tot je een nul tegenkomt. Zolang je geen nul hebt geef je het kwadraat terug. Schrijf dan niet

    int getal;                             //VERKEERD
    while (getal!=0){                      //VERKEERD
        cin>>getal;                        //VERKEERD
        cout<<getal*getal;                 //VERKEERD
    };                                     //VERKEERD

(denk maar eens even na waarom dit de mist in gaat. Het kan op twee plaatsen verkeerd lopen). Correct is wel

    int getal;
    cin>>getal;
    while (getal!=0){
        cout<<getal*getal;
        cin>>getal;
    };

Een ander voorbeeld: bereken de som van alle gehele kwadraten kleiner dan 729. Schrijf dan niet

    int i=0;                               //VERKEERD
    int kwadr=0;                           //VERKEERD
    som=0;                                 //VERKEERD
    while (kwadr<729){                     //VERKEERD
        i++;                               //VERKEERD
        kwadr=i*i;                         //VERKEERD
        if (kwadr<729)                     //VERKEERD
            som+=kwadr;                    //VERKEERD
    };                                     //VERKEERD

hoewel dit tenminste al werkt¹. Juist is

    int i=1;
    int kwadr=i*i;// kwadr=1 mag ook
    som=0;
    while (kwadr<729){
        som+=kwadr;
        i++;
        kwadr=i*i;
    };

Tip: schrijf eerst deel 2 van de whilelus. Daarna deel 1 en deel 4 (die dikwijls heel erg lijken op elkaar). Pas als laatste komt deel 3: al wat óók binnen de lus hoort maar niet tot deel 4 behoort, komt in deel 3.

3.4 Lussen binnen lussen

Als je binnen een lus nog eens een lus gebruikt, dan kan het zijn dat je programma traag gaat lopen (10000 keer een stukje code uitvoeren is niet veel, 100000000 keer wel). Soms is daar niets aan te doen, maar soms is het mogelijk je programma te herschrijven zodanig dat je geen binnenlus nodig hebt. Een klassiek voorbeeld is dat van de machtreeks. Als je bijvoorbeeld 1+x+x²/2+�xⁿ/(n!) moet berekenen, moet je niet voor de i-de stap zowel xⁱ als i! berekenen beginnend vanaf niets: je maakt gebruik van de waarden die je de vorige keer berekend hebt. Je schrijft dus niet

    reeks=1;
    for (int i=1;i<=n;i++){                //VERKEERD
        double xmacht=1;                   //VERKEERD
        double faculteit=1;                //VERKEERD
        for (int j=1;j<=i;j++){            //VERKEERD
            xmacht*=x;                     //VERKEERD
            faculteit*=j;                  //VERKEERD
        }                                  //VERKEERD
        reeks+=xmacht/faculteit;           //VERKEERD
    }

maar wel

    reeks=1;
    double xmacht=1;
    double faculteit=1;
    for (int i=1;i<=n;i++){
        xmacht*=x;
        faculteit*=j;
        reeks+=xmacht/faculteit;
    }

En als je je afvraagt waarom faculteit als double gedefinieerd is terwijl het alleen gehele getallen bevat: dit is nodig omdat i! heel erg groot kan worden: voor i groter dan 12 gaat i! niet meer in een geheel getal van 32 bits. Bij deze machtreeks moesten we bij de kleinste macht van x beginnen omdat we de coëfficiënten nog moesten berekenen. Als we bij de grootste macht van x kunnen beginnen, is het beter om het geheel als een veelterm beschouwen, en dit doe je met de regel van Horner

a_nxⁿ+a_n-1x^n-1+�+a₁x+a₀ = (�(a_nx+a_n-1)x+�+a₁)x+a₀.

In code (merk op dat a n+1 elementen heeft, en niet n)

//berekent a[n]*x^n+a[n-1]*x^(n-1)+a[0];
    double result=a[n];
    for (int i=n-1;i>=0;i--)
        result=result*x+a[i];

Je gebruikt geen tweede lus (en je gebruikt ook niet pow, dat al minstens even traag is en bovendien bij gehele x afrondingsfouten geeft).

3.5 Lussen met meerdere stopcondities

Niet alleen een forlus kan vroegtijdig beëindigd worden, ook een while kan op die manier verknoeid worden:

    int i=0;                               //VERKEERD
    while (i<TABGROOTTE){                  //VERKEERD
        ...                                //VERKEERD
        if (tabel[i]==0)                   //VERKEERD
            i=TABGROOTTE;                  //VERKEERD
        else                               //VERKEERD
            i++;                           //VERKEERD
    }                                      //VERKEERD

Je moet er steeds voor zorgen dat elke reden waarom een bepaalde lus eventueel kan stoppen, duidelijk zichtbaar is in de conditie bovenaan de lus.

We zien dan ook niet graag dat je een returnopdracht gebruikt om uit een lus te springen (en trouwens ook niet om vroegtijdig een functie of procedure te verlaten). Een returnopdracht hoort thuis waar je haar het meest verwacht: onderaan de definitie van een functie of procedure.

We geven nog een ander voorbeeld van een lus die om meerdere redenen kan stoppen. In onderstaand fragment bepalen we of een gegeven getal een priemgetal is.

    deler=2;
    while (deler * deler <= getal && getal % deler != 0)
        deler++;
    if (deler*deler <= getal)
        cout << getal << "is niet priem" << endl;
    else
        cout << getal << "is priem" << endl;

Dergelijke lussen `met dubbele conditie' zijn een zeer belangrijk (maar niet eenvoudig) hulpmiddel voor de programmeur. Merk op dat er in de meeste gevallen na een dergelijke lus nog een ifopdracht volgt waarin één van de twee condities opnieuw wordt getest. Denk steeds goed na welke van de twee je nodig hebt. Het is immers altijd mogelijk dat, bij een EN-conditie, de twee voorwaarden tegelijk onwaar worden.

In bovenstaand voorbeeld zou `if (getal % deler == 0) niet correct geweest zijn. Kun je een getal geven waarvoor het programma dan niet zou werken?

Om je op dit soort lussen te oefenen kan je je eens aan de volgende opgave wagen: Schrijf een programma dat een rij getallen inleest, afgeloten met een nul. Druk daarna op het scherm af hoeveel getallen deze lijst bevat (de nul op het einde niet meegerekend). Stop echter met de invoer zodra er tien getallen zijn ingelezen en zorg dat er nooit een elfde getal aan de gebruiker wordt gevraagd, zelfs al zou je dit in je programma niet gebruiken. Los dit op `met stijl'.

3.6 Verschillende lussen na elkaar

Als je na elkaar twee lussen hebt die evenveel keer worden uitgevoerd kan je ze dikwijls combineren. Het maakt je programma eenvoudiger, en dus leesbaarder. In het volgende fragment lezen we tien getallen x₀,�,x₉ in en bepalen de variantie van die getallen. Deze wordt gedefinieerd als [ 1/10]�_i(x_i-[`x])², waarbij [`x] het gemiddelde van die 10 getallen is². Verkeerd is

    const int AANT = 10;                   //VERKEERD
                                           //VERKEERD
    for (int i=0; i < AANT; i++)           //VERKEERD
        cin >> tab[i];                     //VERKEERD
                                           //VERKEERD
    double gem = 0;                        //VERKEERD
    for (int i=0; i < AANT; i++)           //VERKEERD
        gem+=tab[i];                       //VERKEERD
    gem/=AANT;                             //VERKEERD
                                           //VERKEERD
    double var=0;                          //VERKEERD
    for (int i=0; i<AANT; i++)             //VERKEERD
        var+=(gem-tab[i])                  //VERKEERD
               *(gem-tab[i]);              //VERKEERD
    var /= AANT;                           //VERKEERD

In de plaats schrijf je

    const int AANT=10;

    double gem=0;
    for (int i=0; i<AANT; i++) {
        cin>>tab[i];
        gem+=tab[i];
    }
    gem/=AANT;

    var = 0;
    for (int i=0; i < AANT; i++)
        var+=(gem-tab[i])
               *(gem-tab[i]);
    var/=AANT;

Merk op dat we de overblijvende lussen niet nogmaals kunnen combineren omdat we eerst de volledige reeks moeten inlezen om het gemiddelde te bepalen vooraleer we de variantie kunnen berekenen (tenzij we onze statistiek goed kennen ...).

Hoofdstuk 4
Tabellen

4.1 Tabelelementen

Tabelelementen zijn volwaardige `C++-burgers'. Je kan er mee rekenen, je kan ze afdrukken, je kan ze van waarde veranderen en je kan ze rechtstreeks inlezen met >> . Vele programmeurs gebruiken in dit laatste geval echter steeds een overbodige extra variabele. Het is geen goed idee om te schrijven

    double tab[AANT];                      //VERKEERD
    double getal;                          //VERKEERD
                                           //VERKEERD
    for (int i=0; i<AANT; i++){            //VERKEERD
        cin>>getal;                        //VERKEERD
        tab[i]=getal;                      //VERKEERD
    }                                      //VERKEERD

Beter is

    double tab[AANT];

    for (int i=0; i < AANT; i++)
        cin >> tab[i];

Laat je door dit voorbeeld niet misleiden. In dit geval zijn we op voorhand zeker dat we precies AANT elementen willen inlezen. Wanneer we daarentegen bijvoorbeeld een reeks elementen in een tabel inlezen die afgesloten wordt met een nul, dan gebruik je beter een whilelus (immers: je kan niet uitrekenen hoe vaak de lus doorlopen wordt, en bovendien zal je waarschijnlijk moeten onthouden hoeveel elementen in de tabel zijn gestoken) en een hulpvariabele. De afsluitende nul sla je dus niet op in de tabel, tenzij het expliciet gevraagd is. Merk op dat je daar één plaats mee uitspaart: dat kan belangrijk zijn als een tabel maar net groot genoeg is. Dus niet

    aant=0;                                //VERKEERD
    cin>>tab[aant];                        //VERKEERD
    while (tab[aant]!=0)                   //VERKEERD
        cin>>tab[++aant];                  //VERKEERD

maar wel

    aant=0;
    cin>>getal;
    while (getal != 0) {
        tab[aant++]=getal;
        cin>>getal;
    }

Het is misschien nuttig er nog eens op te wijzen dat tabelelementen in C++ genummerd worden vanaf 0 (en niet vanaf 1).

4.2 Indexvariabelen

Je hoeft je ook niet in allerlei bochten te wringen om steeds dezelfde indexvariabele te gebruiken bij dezelfde tabel. Er is geen enkel verband tussen een tabelvariabele en de tellervariabele die je gebruikt om door die tabel te lopen. Je kan het ook niet altijd. Probeer maar eens het volgende programmafragment (dat een tabel omdraait) te herschrijven op zo'n manier dat je altijd dezelfde index gebruikt voor tab:

    double tab[TABGROOTTE];
    ...
    for (int i=0;i<TABGROOTTE/2;i++){
        double temp=tab[i];
        int j=TABGROOTTE-1-i;
        tab[i]=tab[j];
        tab[j]=temp;
    }

4.3 Welke tabellen heb je nodig?

Vele programmeurs zijn de eerste keer blijkbaar zodanig onder de indruk van het begrip `tabel' dat ze naderhand niets anders meer wensen te gebruiken. Ze vergeten daarbij dat vele problemen kunnen worden opgelost zonder ook maar één tabel te gebruiken. Het volgende fragment leest een aantal reële getallen in en drukt hun gemiddelde af³:

    for (int i=0; i<AANT; i++)             //VERKEERD
        cin>>tab[i];                       //VERKEERD
    som=0;                                 //VERKEERD
    for (int i=0; i<AANT; i++)             //VERKEERD
        som+=tab[i];                       //VERKEERD
    cout << som/AANT << endl;              //VERKEERD

De tabel is overbodig: schrijf gewoon

    som=0;
    for (int i=0; i<AANT; i++){
        cin>>getal;
        som+=getal;
    }
    cout << som/AANT << endl;

Als vuistregel kan je stellen dat je een tabel slechts nodig hebt wanneer je de eerste elementen van de tabel nog dient te gebruiken nadat je de laatste hebt ingevuld. Het is niet omdat er in het probleem een `rij' of `reeks' ter sprake komt dat je noodzakelijk een tabel nodig hebt.

Soms zijn tabellen een stuk kleiner dan je op het eerste zicht zou denken of duiken er tabellen op uit onverwachte hoek. Om de vijf kleinste waarden te bepalen van tienduizend ingetikte getallen, heb je slechts een tabel van vijf elementen nodig - je hoeft de tienduizend getallen niet eerst op te slaan en te sorteren. Om van zes miljoen kiezers de stemmen te tellen, heb je slechts tabellen nodig waarvan de grootteorde overeenkomt met het aantal kandidaten - niet met het aantal kiezers. Om van zes miljard aardbewoners te bepalen welke verjaardagsdatum er het meest voorkomt, heb je slechts een tabel nodig van 366 gehele getallen.

Soms is het beter om meer dan één tabel te gebruiken, bijvoorbeeld bij het inlezen van coördinaten van punten. Schrijf niet

    double coord[2*AANT];                  //VERKEERD
    for (i=0; i < AANT; i++) {             //VERKEERD
        cout<<"Punt "<< i                  //VERKEERD
            <<" ?"<<endl;                  //VERKEERD
        cin>>coord[2*i];                   //VERKEERD
        cin>>coord[2*i+1];                 //VERKEERD
  }                                        //VERKEERD

maar wel

    double x[AANT], y[AANT];
    for (i=0; i<AANT; i++){
        cout<<"Punt "<<i
            <<" ?" <<endl;
        cin>>x[i];
        cin>>y[i];
    }

De programmeur die twee tabellen ziet die evenveel elementen hebben, gaat zich afvragen of die tabellen bij elkaar horen. Hierboven is dat het geval: x[5] en y[5] horen bij hetzelfde punt. Als de programmeur constructies zoals struct of class kent kan hij die gebruiken om ze samen te zetten. Een andere, meestal minder goede oplossing is om een tweedimensionale tabel te gebruiken, maar dat kan alleen als de twee tabellen van hetzelfde type zijn.

4.4 Commentaar

Soms is het nuttig om commentaarregels aan je programma toe te voegen. Een programma dat volgens de stijlregels van dit document is opgebouwd, behoeft echter meestal niet veel uitleg. Beperk je tot opmerkingen die misschien niet door iedereen onmiddellijk uit de programmacode kunnen worden afgeleid. Over het algemeen zijn er twee soorten commentaar: detailcommentaar en algemeen commentaar.

Detailcommentaar wordt gegeven om kleine dingen toe te lichten die niet duidelijk worden uit de code: als je een truukje moet gebruiken, of als je een reden hebt om iets eigenaardigs te doen. Ook als de lezer zou denken dat je iets verkeerds gedaan hebt moet je zeker commentaar toevoegen. Bijvoorbeeld:

    double faculteit;   //double om overflow te voorkomen!
    ...
    bool schrikkeljaar=(jaar%4==0);
    if ( (jaar%100==0) && (jaar%400!=0) &&
         (jaar>1582)) //Gregoriaanse kalender ingevoerd in 1582
        schrikkeljaar=false;

Het is volkomen overbodig om dingen die duidelijk zijn te commentariëren:

                                           //VERKEERD
    int aantdagen;     //geeft aantal dagen aan
    ...                                    //VERKEERD
    cout<<aantaldagen; //uitschrijven aantal dagen.
                                           //VERKEERD

Verder is er nog algemene commentaar. Deze geeft van een stuk code aan wat ze uitvoert. Ook hier geldt dat dingen die al duidelijk zijn niet vermeld worden:

                                           //VERKEERD
double faculteit(int n){   //berekent de faculteit van n
...                                        //VERKEERD

Waar de je de code echt van dichtbij moet bekijken om te weten wat er gebeurt zet je wel commentaar, zoals in een vorig voorbeeld:

//berekent a[n]*x^n+a[n-1]*x^(n-1)+a[0];
    double result=a[n];
    for (int i=n-1;i>=0;i--)
        result=result*x+a[i];

In het begin van een programma kan je ook best zetten wat het programma allemaal doet. Vooral uitzonderingsgevallen, en uitleg over hoe het programma moet gebruikt worden moet je becommentariëren. Vaak gebeurt dat niet zozeer in commentaar tussen de code, maar bijvoorbeeld in een tekst die in een hulpfunctie thuishoort. Je kan dan bovenaan naar die hulpfunctie verwijzen.

Bij grotere projecten heeft elk programma ook nog documentatie buiten de code om. Daar staat voor elk onderdeel (zoals functies en procedures) beschreven waar de code voor dient. In dit geval zal veel van de algemene commentaar wegvallen.

Footnotes:

¹We herhalen nog maar eens: het is niet omdat een programma werkt dat het goed is.

²Je kan bewijzen dat de variantie in dit geval ook gelijk is aan [ 1/10](�x_i²) - ([`x])². Welk merkwaardig gevolg heeft het gebruik van deze formule voor het programma?

³Een programmeur met stijl merkt trouwens reeds de verdachte tweevoudige forlus op. Wanneer je deze twee lussen samenneemt, valt het nog meer op dat de tabel tab hier overbodig is.

File translated from T_EX by T_TH, version 3.22.
On 3 Oct 2007, 12:03.

Programmeren met stijl in C++

Jan Cnops & Kris Coolsaet

Hogeschool Gent - Departement INWE Vakgroep Informatica 2000-2007

Inleiding

Hoofdstuk 1 Vorm

1.1 Bladspiegel

1.2 Naamkeuze

1.3 Een compleet programma

Hoofdstuk 2 Inhoud

2.1 Constanten

2.2 Types

2.3 Logische uitdrukkingen

2.4 Declaraties

2.5 Toewijzingen

Hoofdstuk 3 Samengestelde opdrachten

3.1 for of while?

3.2 Binnen of buiten de lus?

3.3 De structuur van een while

3.4 Lussen binnen lussen

3.5 Lussen met meerdere stopcondities

3.6 Verschillende lussen na elkaar

Hoofdstuk 4 Tabellen

4.1 Tabelelementen

4.2 Indexvariabelen

4.3 Welke tabellen heb je nodig?

4.4 Commentaar

Footnotes:

Hogeschool Gent - Departement INWE
Vakgroep Informatica 2000-2007

Hoofdstuk 1
Vorm

Hoofdstuk 2
Inhoud

Hoofdstuk 3
Samengestelde opdrachten

3.1 `for` of `while`?

3.3 De structuur van een `while`

Hoofdstuk 4
Tabellen