Practicum week 3 - Algemene introductie in het gebruik van SPSS SPSS (Statistical Package for the - Studeersnel (2024)

practicum week 3 vak inleiding onderzoek

Vak

Inleiding Onderzoek (PABAP035)

234Documenten

Studenten deelden 234 documenten in dit vak

Universiteit

Rijksuniversiteit Groningen

Studiejaar: 2023/2024

Aanbevolen voor jou

Reacties

inloggen of registreren om een reactie te plaatsen.

Preview tekst

Practicum week 3

Data grafisch weergeven

De leesstof van deze weekis: H3 van Agresti & Finlay, en Hoofdstuk 1 van de Syllabus

3 Hoe werkt SPSS?

De doelen / onderwerpen van dit practicum:▪ De basisbeginselen van SPSS leren▪ Het maken van goede grafische weergaven in SPSS▪ Het trekken van juiste conclusies op grond van een grafiek▪ Keuze van goede samenvattingsmaten om het centrum en de spreiding van gegevens te karakteriseren▪ Het trekken van conclusies op grond van samenvattingsmatenOpdracht 3-1. Algemene introductie in het gebruik van SPSSSPSS (Statistical Package for the Social Sciences) is één van de vele statistische softwarepakketten. SPSS is bedoeld om op eenvoudige wijze statistische berekeningen te kunnenmaken. In de practica zul je af en toe SPSS gebruiken. Het is de bedoeling om nu alvasteen aantal basisvaardigheden onder de knie te krijgen (zoals het openen van eendatafile), zodat je je later kunt concentreren op het toepassen van de technieken zelf. Een opmerking over het verschil tussen Excel en SPSS: Excel is expliciet gemaaktvoor het manipuleren van gegevens. In Excel is het gemakkelijk om zelf een bewerkingop gegevens toe te passen (bijvoorbeeld in rij 3 het gemiddelde van rijen 1 en 2weergeven). In SPSS is dat iets lastiger. SPSS heeft echter als voordeel dat een groot

aantal statistische technieken standaard direct voorhanden zijn. Soms kan het handig zijnom Excel en SPSS naast elkaar te gebruiken, bijvoorbeeld door de voorbewerkingen op jegegevens in Excel te doen, en de statistische analyses in SPSS.

▪ het (nu lege) spreadsheet;

Twee vensters in SPSS

Onderin het scherm zie je dat de Data Editor twee Tabbladen heeft, namelijk het DataView en het Variable View tabblad. In Data view kun je gegevens invoeren, bekijken enbewerkingen uitvoeren. Variable view is bedoeld om variabelen die je wilt invoeren inSPSS te definiëren, of de al ingevoerde definities te bekijken.Om bewerkingen op gegevens te kunnen uitvoeren, moeten de gegevens in SPSS zijningevoerd. Hierbij zijn drie situaties te onderscheiden (geordend van weinig werk naarveel werk):

  1. De gegevens staan in een SPSS datafile.
  2. De gegevens staan niet in een SPSS file, maar bijvoorbeeld in een Word of Excel file.
  3. De gegevens staan niet in een file, maar staan op papier.In dit practicum zullen de gegevens altijd in een SPSS data file staan. Hoe files uit eenander programma (Situatie 2) in te lezen zijn, of hoe gegevens handmatig in te voerenzijn (Situatie 3) komt later aan de orde.

Hoe een SPSS data file te openen?

 In de file ‘iq’, te vinden onder de knop cursusdocumenten in deBrightspaceomgeving van het vak Inleiding onderzoek de (fictieve) scores van 12kinderen op de variabelen sexe, leeftijd en iq.Je ziet het volgende scherm:

In de kolom met de variabele ‘sexe’ zie je de scores ‘1’ en ‘2’ staan. Dit is een codering,waarbij de waarde ‘1’ staat voor ‘meisje’ en ‘2’ voor ‘jongen’. Het is handig om dezecodering in SPSS (tabblad Variable view) in te voeren, omdat het voor een andereonderzoeker (of student) anders niet duidelijk is wat er bedoeld wordt.2.  Voer de codering van het geslacht in. Klik hiertoe op de cel ‘values’ in de rij van de variabele ‘sexe’. Klik op het vierkantje met ‘...’; Voer in bij ‘Value’ de waarde ‘1’, en bij ‘Value label’ de tekst ‘meisje’. Klik op ‘Add’. Voer nu in bij ‘Value’ de waarde ‘2’, en bij ‘Value label’ de tekst ‘jongen’. Klik op ‘Add’. Klik op ‘OK’.

Een berekening in SPSS

Tot nu toe hebben we alleen naar de data gekeken en het SPSS-bestand aangepast. Nugaan we een enkele bewerking op de gegevens toepassen, namelijk een aantalsamenvattingsmaten van de iq scores berekenen. Samenvattingsmaten zijn bijvoorbeeldde minimum score, de maximum score en het gemiddelde.  Ga naar het tabblad Data view. Klik op Analyze ► Descriptive statistics ►Descriptives.Je ziet het volgende scherm:

 Door éénmaal te klikken op ‘iq’ markeer je de variabele iq. Door vervolgens op de ‘►’knop te klikken, verplaatst de gemarkeerde variabele zich naar het vak onder ‘Variables’.Je kunt de variabele ook van het linkervak naar het rechtervak slepen.Net als bijna elk venster dat vanuit het menu geopend wordt, heeft dit venster devolgende knoppen:▪ OK, welke pas aangeklikt kan worden als in de nodige handelingen zijn uitgevoerd. Een opdracht wordt alleen met OK uitgevoerd;▪ Paste, de opdracht wordt niet uitgevoerd, maar het bijbehorende SPSS-commando wordt in het zogenaamde Syntax-venster geplaatst;▪ Reset, alle selecties worden opgeheven, het venster is weer helemaal leeg;▪ Cancel, afbreken en het venster wordt afgesloten;▪ Help, geeft informatie over de opdracht.Wanneer je SPSS de opdracht geeft bepaalde berekeningen uit te voeren, verschijnt ereen nieuw venster (zoals hierboven afgebeeld). Afhankelijk van de opdracht zijn ervervolgens verschillende specificatieopties (in dit geval onder de knoppen Options, Style,Bootstrap. Wanneer je op één van die knoppen klikt, opent een Dialoogvenster. 🖰 Klik op ‘Options’.

Je hebt nu de opdracht aan SPSS gegeven om een aantal beschrijvende statistieken(Descriptive statistics) van de variabele ‘iq’ uit te rekenen.Na de verwerking van een opdracht in welke vorm dan ook wordt automatisch hetuitvoervenster (“IBM SPSS Statistics Viewer”, of “Output”) geopend. Dit vensterbestaat uit twee delen. De icoontjes links fungeren als een inhoudsopgave voor debijbehorende uitvoer in het rechterdeel, wat erg handig is om bepaalde uitvoer snel op tezoeken. Elk icoontje bevat de naam van het analysemoduul en daarnaast een Title, eenNote, een Statistics en een tabel.  Bekijk de uitvoer.3. Wat zijn de minimale iq score, de gemiddelde iq-score en de som van de iq scores? Minimale iq score is 75 Gemiddelde iq-score 100, Som van de iq-scores 1206  Ga terug naar je data.Het is nu de bedoeling om een frequentietabel te maken van de variabele ‘geslacht’. Ditgaat als volgt:  Analyze ► Descriptive statistics ► Frequencies’. Verplaats de variabele ‘sexe’ naar het vak onder ‘Variables’. Is het hokje vóór ‘Display frequency tables’ leeg, klik dan eenmaal op dit vierkantje. Er komt een vinkje te staan. Klik op ‘OK’.4. Bekijk de verkregen uitvoer. Hoeveel jongens zijn er? Hoeveel procent van het totaal is dat? Er zijn 6 jongens en dit is 50% van het totaalJe hebt nu een aantal eenvoudige bewerkingen uitgevoerd op deze gegevens. Voor dezekleine hoeveelheid zou dat natuurlijk nog eenvoudig met de hand kunnen, maar bijgrotere hoeveelheden data is een computer een uitkomst. SPSS is dan een handigsoftware pakket.

Opslaan van gegevens

Zoals je hebt gezien, gebruikt SPSS twee vensters, namelijk het datavenster met despreadsheet (SPSS Data Editor), en het uitvoervenster (IBM SPSS StatisticsViewer). Jekunt de gegevens in deze vensters opslaan. De gegevens in het datavenster zijnnoodzakelijk als je later nog verdere berekeningen wilt uitvoeren. De gegevens in hetuitvoerscherm zijn nuttig bij het rapporteren over je gegevens. De gegevens in deze

vensters worden afzonderlijk bewaard. Het opslaan van de bestanden gaat net als inbijvoorbeeld Word Office: File ► Save As ► etc.Let op:▪ Een file met de gegevens uit SPSS Data Editor krijgt altijd de extensie .sav mee.▪ Een file met de gegevens uit SPSS Viewer krijgt altijd de extensie .spv mee. Een *.spv-bestand noemen we een SPSS output-bestand. 🖰 Sla de gegevens in de spreadsheet op. Let op: Kies voor het bewaren altijd voor Save As en nooit Save, want SPSS overschrijft zonder waarschuwingen een bestaande file en het is bij het doen van onderzoek cruciaal dat het oorspronkelijke databestand beschikbaar blijft. ▪ Als je met je s-nummer hebt ingelogd op een computer, kun je de files opslaan op de X-schijf (X:) ▪ Wanneer je op een eigen pc werkt kun je uiteraard zelf beslissen waar je de gegevens opslaat. Sluit SPSS af door te klikken op: ‘File’, ‘Exit’Van alle vensters die je nog niet opgeslagen hebt, vraagt SPSS of die vensters alsnogbewaard moeten worden. Waarschuwing bij het verlaten van SPSSLET OP: SPSS wil files altijd bewaren in de map, waarin SPSS geïnstalleerd is. Op hetuniversiteitsnetwerk kan dat nooit, omdat de netwerk-drive beveiligd is voor derden. Opeen stand-alone pc is het ook niet handig, want in de SPSS map staat het SPSSprogramma. Je raakt dan makkelijk het overzicht kwijt. Maak daarom eerst een apartemap aan om je SPSS files op te slaan. Er komen steeds weer nieuwe versies van SPSS. Houd er dus rekening mee dat innieuwe releases weer kleine veranderingen kunnen plaatsvinden. In elke nieuwe versieworden fouten opgelost, nieuwe facetten toegevoegd en natuurlijk ook weer nieuwe"oneffenheden" ingevoerd. Kijk dus altijd goed naar de uitvoer. Ook vragen nieuwereleases weer "meer" van de computers, zoals meer geheugen en grotererekensnelheden.

  1. Hoeveel mensen hebben een hogere temperatuur dan de in het algemeen als normaal beschouwde temperatuur van 37 °C? Er zijn verschillende manieren om tot het antwoord op deze vraag te komen. Probeer zelf een handige manier te bedenken.39 mensen hebben een hogere temperatuur dan de normal beschouwde temperatuur van37 graden
  2. Wat kan je concluderen over de normale lichaamstemperatuur van 37 °C op grond van de grafiek?Het gemiddelde is 36,81 graden dus dit ligt lager dan de normale lichaamstemperatuurvan 37 graden.
  3.  Maak m.b. SPSS een histogram en een boxplot voor het vergelijken van de verdeling van de lichaamstemperatuur van mannen en vrouwen. Plak de plots hieronder. Tip voor het histogram: Graphs ► Legacy dialogs ► Histogram. Plaats de variabele ‘temp’ in het vak onder ‘variable’ en de variabele ‘gender’ onder ‘row’. Tip voor de boxplot: Graphs ► Legacy dialogs ► Boxplot (Simple & Summaries for groups of cases).Plaats de variabele ‘temp’ in het vak onder ‘variable’ en de variabele ‘gender’ onder ‘category axis’. Ga ook na waarom je dit zo doet.

Je zet de variabele ‘gender’ onder ‘category axis’ omdat je 2 soorten gender hebt endeze wil je scheiden van elkaar.7.  Is de ‘normale’ temperatuur voor mannen en vrouwen verschillend? Zo ja, waarinverschillen ze? Gebruik de gemaakte grafische weergaven, maar bereken ook eenaantal samenvattingsmaten. Beschrijf ook de verdelingTip: Gebruik de functie SPLIT-file: Data ► Split file. Vink aan: compare groups. Gebruikde variabele ‘gender’. Hiermee geef je SPSS de opdracht om voor alle volgendeberekeningen de dataset te splitsen in een groep mannen en een groep vrouwen. Omhet gemiddelde uit te laten rekenen: analyze ► descriptive statistics ► descriptive,variabele ‘temp’.Vrouwen hebben het gemiddeld iets warmer dan mannen. Ook ligt het maximum vanvrouwen 0 graden hoger dan bij mannen.Vergeet na deze analyse SPLIT-file niet weer uit te zetten! Data ► Split file,klik op reset en op ok.)Opdracht 3-3. De levensverwachting in de wereldDe data komen van twee bronnen: ‘UNESCO 1990 Demographic Year Book’ en Day's ‘TheAnnual Register 1992’. De gegevens zijn van 97 landen in 1990 en worden besprokendoor Rouncefield (1995). Ze geven verschillende eigenschappen van landen, die als indexkunnen worden gebruikt voor armoede en ongelijkheid. Open de data file Poverty

In de regio’s 5 en 6 is de spreiding van de levensverwachting veel groter dan in de andereregio’s. Dit komt door de grote verschillen tussen voorzieningen en inkomen ook zijn indeze regio’s sociale instanties en aanvullingen van de overheid minder tot niet aanwezigwaardoor er een grote spreiding in de regio zit.3. In welke regio (of regio’s) is de spreiding in levensverwachting het grootst? Kun jehiervoor een (inhoudelijke) reden geven?In regio 5: Azië is de spreiding in levensverwachting het grootst, dit heeft te maken metde verschillen in deze regio. Er zit veel verschil in inkomen en voorzieningen in dezeregio, mensen met minder goede voorzieningen (ziekenhuis, hygiëne, etc.) zullen eerderoverlijden dan mensen waarbij er betere voorzieningen zijn.4. Welke landen laten een relatief lage dan wel hoge levensverwachting zien, tenopzichte van de rest van hun regio? (Tip: bekijk de boxplot. Bij iedere uitbijter staateen nummer dat overeenkomt met het ‘case number’ in het databestand. 1 =Albanië, 2 = Bulgarije, etc.)Land 13: Bolivia heeft een relatief lage levensverwachting ten opzicht van de rest van deregio.Land 34: Portugal heeft een relatief lage levensverwachting ten opzichte van de rest vande regio.Land 29: Griekenland heeft een relatief lage levensverwachting ten opzichte van de restvan de regio.Land 33: Noorwegen heeft een relatief lage levensverwachting ten opzichte van de restvan de regio.Wat de experts zeggen ...

“With the data presented like this one can acquire at a glance⎯or at most, a couple ofglances⎯the same information that it would have taken practically forever to get of[a] table ... It really is true that a picture is worth 1000 words.”(Geoffrey Loftus, 1996)“ ... presenting data in the form of one or more well-designed graphs⎯particularlygraphs that represent the relevant [summary statistics]⎯potentially conveys theinteresting and important information from the experiment in a manner that ... isimmediate and direct ...”(Geoffrey Loftus, 1993)5. Ben je het eens met Loftus? Vind je grafieken van data makkelijker en informatieverdan een tabel met de samenvattingsmaten? Leg uit waaromIk ben het een met Loftus want als data in een grafiek staat kun je heel gemakkelijk zienals er uitschieters naar boven of beneden zijn. In een tabel gaat dit veel lastiger want danmoet je eerst alle getallen bestuderen.Opdracht 3-4. Tufte's principes

  1. Een journalist dient bij zijn redacteur een artikel in waarin hij op basis vanonderstaande grafieken beweert dat mazelen wordt veroorzaakt door het stemmen opde SGP (Staatkundig Gereformeerde Partij).Welke fout maakt deze journalist bij het gebruik van de grafieken? Probeer zelf eenbetere conclusie te geven.De journalist ziet een causaal verband terwijl er bij deze twee grafieken geen sprakeis van een causaal verband. A gaat in tijd vooraf aan B, klopt omdat mensen in 2012op SGP hebben gestemd en in 2013/2014 last hadden van de mazelen.Waarneembare samenhang, klopt ook want er is te zien dat in de gemeentes waar het

▪ Samenvattingsmaten (min, max en gemiddelde) van variabelen berekenen▪ Probeer te onthouden hoe deze bewerkingen uitgevoerd moeten worden met SPSS!

Opdracht 3-5.Geef bij het maken van de opgaven niet alleen het antwoord, maar ook de uitwerking. Jekunt sommige van deze opgaven zelf invoeren in SPSS, maar dit is niet per senoodzakelijk.1Het aantal sterfgevallen aan kanker is in Nederland in de loop der tijd gestaag gegroeid.In 2002 stierven er bijvoorbeeld 37 975 mensen aan kanker, terwijl dat aantal in 1970nog 25 217 bedroeg. Een lid van de Tweede Kamer beweert dat deze cijfers aantonen dater geen voortgang is geboekt in de behandeling van kanker. Verklaar hoe het mogelijkzou kunnen zijn dat het aantal sterfgevallen aan kanker toeneemt, hoewel debehandeling van de ziekte is verbeterd. Beschrijf vervolgens een variabele die een beteremaat is voor de effectiviteit van een medische behandeling voor een mogelijk dodelijkeziekte.Het is mogelijk dat het aantal sterfgevallen stijgt terwijl de behandeling van de ziekte isverbeterd omdat er ook meer mensen in Nederland wonen. De bevolking is gegroeid ener heeft ook nog migratie plaatsgevonden. Een betere maat om te kijken of de medischebehandeling effectief is door te kijken hoeveel mensen er dood zijn gegaan die debepaalde medische behandeling kregen en hoeveel mensen er niet dood zijn gegaan.Door in verhoudingen te kijken krijg je een beter beeld.2Er zijn aanwijzingen dat verhoging van de hoeveelheid calcium in het voedselpakket debloeddruk kan verlagen. In een medisch experiment werd aan een groep mannen eendagelijkse toevoeging van calcium gegeven, terwijl een controle groep een placebokreeg. De bovendruk in zittende toestand werd voor iedere man gemeten voordat debehandeling begon, en vervolgens 12 weken daarna nogmaals. De verdelingen van debloeddruk in de twee groepen moesten in het begin van het experiment overeenkomen.Hier zijn voor de twee groepen de metingen van de bloeddruk bij de aanvang van hetexperiment: Calcium groep107

11

0

12

3

12

9

11

2

11

1

10

7

11

2

13

6

10

2

Placebo groep123

10

9

11

2

10

2

98 11

4

11

9

11

2

11

0

11

7

13

0

a) Waarom is het belangrijk dat de scores in de twee groepen ongeveer gelijk zijn? Het is belangrijk dat de scores van de twee groepen ongeveer gelijk zijn zodat er na het experiment duidelijke resultaten uit kunnen komen. Zijn de groepen niet gelijk dan kun je achteraf niet achterhalen of dit kwam door de calcium of dat dit kwam omdat de groep gewoon een hoger of lagere bloeddruk had.b) Maak een rug-aan-rug stamdiagram (back-to-back stemplot (boek Agresti p. 45) van deze gegevens). Calcium Stem-and-Leaf Plot Frequency Stem & Leaf 3,00 10. 277 4,00 11. 0122 2,00 12. 39 1,00 13. 6

Practicum week 3 - Algemene introductie in het gebruik van SPSS SPSS (Statistical Package for the - Studeersnel (2024)
Top Articles
Latest Posts
Article information

Author: Wyatt Volkman LLD

Last Updated:

Views: 6012

Rating: 4.6 / 5 (46 voted)

Reviews: 93% of readers found this page helpful

Author information

Name: Wyatt Volkman LLD

Birthday: 1992-02-16

Address: Suite 851 78549 Lubowitz Well, Wardside, TX 98080-8615

Phone: +67618977178100

Job: Manufacturing Director

Hobby: Running, Mountaineering, Inline skating, Writing, Baton twirling, Computer programming, Stone skipping

Introduction: My name is Wyatt Volkman LLD, I am a handsome, rich, comfortable, lively, zealous, graceful, gifted person who loves writing and wants to share my knowledge and understanding with you.