brlogo
untitled
   
   
   
   
 

Mathe-Treff: Magazin - Mathe & Leute
Dankwart Vogel über die explorative Datenanalyse

Dankwart Vogel arbeitete nach Studium und Promotion längere Jahre an der Universität Bielefeld. Er nahm Lehraufträge wahr, hatte mit Hochschulverwaltung zu tun und baute das Institut für Didaktik der Mathematik mit auf. Dann zog es ihn in die Schule: Er unterrichtete an mehreren Schulen und arbeitet nun am Ceciliengymnasium in Bielefeld. Zudem ist er Fachleiter für Mathematik.

D. Vogel: " Die Verbesserung des Mathematikunterrichts - und da gibt es viel zu verbessern, meinen eigenen Unterricht schließe ich hier ausdrücklich ein - ist nur mit den Lehrern, nicht ohne oder gar gegen sie möglich. Je länger ich unterrichte und Lehrer in den Beruf einführe, umso deutlicher sehe ich das. Hier gibt es viel Arbeit, und wir stehen erst am Anfang.

Ich träume von einer Schule, in der es einzig und allein um die Schüler und ihre Weiterentwicklung geht, von Büchern, die die Schüler gewinnen, sie neugierig machen und nicht belehren oder gar entmündigen, von einer Schule ohne Druck und Zwang, geprägt allein vom Wunsch dazu zu lernen. Und Lernen ist immer auch anstrengend, mühsam und schmerzlich.
"
Und die Hobbys neben der Mathematik? Er liest gern, und zwar nicht nur Fachliches sondern auch Literatur, etwa Autoren des 19. Jahrhunderts. Wandern in den Bergen, Fahrrad fahren und kochen liebt er, und er hasst Gartenarbeit. Da ist er nicht der einzige.

Nun folgt ein etwas längeres Interview über Explorative Datenanalyse, einem recht modernen Zweig der Statistik. Lehrerinnen und Lehrer sollten sich darin etwas auskennen. Drucken Sie sich den Text aus, setzen Sie sich in den Sessel und lesen Sie.

MT: Herr Vogel, Sie sind Experte für Explorative Datenanalyse (EDA). Was ist das? Wie unterscheidet sich die EDA von der üblichen Statistik?

D. Vogel: Der bekannte amerikanische Statistiker John W. Tukey, der als Vater der EDA gilt, hat den Beruf des Statistikers mit dem des Detektivs verglichen. Der Detektiv ist offen für das Unerwartete. Er will Neues entdecken und Verborgenes ans Licht bringen. Seine Fragen sind: Habe ich etwas übersehen? Wie lassen sich die Fakten erklären? Was fällt auf? Sind die Aussagen plausibel?
Genau mit dieser Haltung sollte sich auch der Statistiker den Daten nähern. Und der erfolgreiche Statistiker hat das auch immer getan. Allerdings kommt es darauf an, dies bewusst und systematisch zu tun, als einen eigenständigen Schritt zu Beginn der Arbeit, und dabei vorhandene explorative Instrumente zu nutzen, sie zu modifizieren und weitere zu ersinnen. Genau dies will die EDA.
Die EDA will die herkömmliche Statistik ergänzen, nicht verdrängen. Sie verändert den Blick und ergänzt das Methodenrepertoire. Seit ihrem Aufkommen in den siebziger Jahren des letzten Jahrhunderts wächst ihr Einfluss, gewinnen explorative Methoden an Bedeutung gegenüber den formellen Verfahren der beurteilenden Statistik.
Letztlich dient die Statistik nur einem Zweck: der Erweiterung unseres Wissens.

MT: Wer nach dem neuen Lehrplan für Mathematik in der JS 11 unterrichtet, sieht, dass die geforderten Inhalte mindestens aus zeitlichen Gründen, wenn nicht aus anderen, kaum machbar sind. Ist die EDA ein Ausweg?

D. Vogel: Die EDA bietet in der Tat dem Mathematiklehrer die Chance, das Interesse der Schüler über reale Daten und echte Fragen zu gewinnen. Insofern könnte sie zur Entspannung der Situation beitragen. Das hebt das Problem der Stofffülle nicht auf, doch ist ein intellektuell redlicher Umgang mit dem Thema auch in begrenzter Zeit möglich. Im übrigen sind Abstriche an der Statistik nicht im wohlverstandenen Interesse der Schüler, denn sie werden mit statistischen Fragen zumindest als Bürger einer demokratisch verfassten Gesellschaft fortgesetzt konfrontiert werden. Von anderen Inhalten des Mathematikunterrichts kann man dies nicht mit derselben Bestimmtheit sagen.

MT: Frau G. Wintermantel und Sie haben gerade ein Buch mit Schülerarbeitsheft veröffentlicht:
Mathe, explorative Datenanalyse – statistik aktiv lernen,
Stuttgart 2003
Das Buch enthält vier Lerneinheiten und eine CD-Rom. Referieren Sie bitte ganz kurz die Inhalte dieser Lerneinheiten.

D. Vogel: Den Kern einer Lerneinheit bildet jeweils eine "geleitete Erkundung" anhand einer Arbeitsmappe. Es genügt, diese Mappe durchzuarbeiten. Wer sich weitergehend interessiert, dem wird Zusätzliches geboten, u. a. vertiefende Aufgaben, aber auch Projekte etc.
Im übrigen setzen wir auf das exemplarische Prinzip. Die Schüler sollen einen Einblick in den explorativen Umgang mit Daten erhalten, nicht unbedingt ein fest umrissenes Methodenrepertoire erlernen. Wir halten es für besser, im Unterricht einen deutlichen Schwerpunkt zu setzen, etwa die Schüler nur eine der vier Arbeitsmappen vollständig bearbeiten zu lassen, also nur eine Erkundung durchzuführen, und eine weitere nur zu streifen usw. Daher waren wir bemüht, die geleiteten Erkundungen so zu konzipieren, dass sie weitgehend unabhängig voneinander sind. Dennoch gibt es eine gewisse Progression von der ersten bis zur vierten und letzten Erkundung. Interessierte Schüler finden in den Arbeitsmappen der nicht oder teilweise durchgeführten Erkundungen viel Material zum selbstständigen Weiterforschen und -arbeiten.
Doch nun zu den Inhalten.
In Lerneinheit 1 ("Lesen und Visualisieren von Daten") begegnen die Schüler Problemen der Erhebung, der Aufbereitung und der Interpretation von Daten. Sie lernen univariate Daten in verschiedener Weise graphisch darstellen (Stängel-Blatt-Diagramm, Histogramm, Box-plot, Quantil-plot, Quantil-Quantil-plot), sie lernen Verteilungen lesen und vergleichen sowie numerisch zusammenfassen.
In Lerneinheit 2 ("Mittelwert und Standardabweichung") stehen parametrische Verfahren im Mittelpunkt. Die Schüler lernen Mittelwert und Standardabweichung in Bezug auf die Normalverteilung als Lage- und Streuparameter interpretieren und verwenden.
In Lerneinheit 3 ("Korrelation") rücken bivariate genauer in den Blick. Die Schüler erleben das Streudiagramm als mächtiges Explorationsinstrument. Sie lernen Punktwolken beschreiben, interpretieren und numerisch zusammenfassen. Insbesondere lernen sie den Korrelationskoeffizienten berechnen, deuten und - besonders wichtig - kritisch verwenden.
In Lerneinheit 4 ("Lineare Regression") wird der Gesichtspunkt der Modellierung bivariater Daten aufgegriffen. Die Schüler lernen, wie man funktionalen Beziehungen zwischen zwei metrischen Größen gezielt nachspürt, wie man von der Methode der kleinsten Quadrate Gebrauch macht und die Güte der Anpassung mittels graphischer Verfahren beurteilt. Zudem begegnen sie dem Regressionseffekt, von dem die Methode ihren Namen hat, und lernen ihn als zufallsbedingt verstehen.

MT: Wenn man das Buch durchblättert, fällt sofort die Normalverteilung auf. Es handelt sich also kaum um einen Lehrgang, der im wesentlichen für die JS 11 gedacht ist.

D. Vogel: Da irren Sie. Das Material ist vor allem mit Blick auf Klasse 11 konzipiert, Analysis wird nicht vorausgesetzt. Im Gegenteil, man gewinnt Motive für spätere analytische Begriffsbildungen.
Auch der Begriff "Lehrgang" trifft nicht ganz unsere Intention. Wir hatten exemplarisches und aktives Lernen im Auge, als wir die vier geleiteten Erkundungen konzipierten, nicht einen abgeschlossenen Lehrgang.
Viele Menschen gehen täglich verständig mit der Normalverteilung um, ohne an ihren Term zu denken, ja ihn überhaupt zu kennen oder gar etwas vom zentralen Grenzwertsatz gehört zu haben. Und sie verwenden die Normalverteilung dennoch zu unserer aller Nutzen. Offenbar geht das. Nein, man kann und sollte die Normalverteilung durchaus schon in Klasse 11 einführen. Und wir halten das auch für notwendig, um Mittelwert und Standardabweichung gegen andere Lage- und Streuparametern abzugrenzen und so einen kritischer Umgang mit statistischen Kenngrößen zu pflegen und einzuüben. Letzteres ist für uns ein unverzichtbares Element statistischer Allgemeinbildung.
Die Brauchbarkeit der Parameter Mittelwert und Standardabweichung zur Charakterisierung einer gegebenen empirischen Verteilung prüft man zunächst am besten graphisch, indem man etwa ein Histogramm der empirischen Verteilung die passende Normalverteilung gegenüber stellt oder - besser noch - ein Quantil-Quantil-Plot anfertigt. Dies kann in der Schule mit einem grafikfähiger Taschenrechner geschehen. Natürlich wäre es besser, wenn jedem Schüler ein Statistikprogramm (etwa Fathom) zur Verfügung stünde.
Die für den Anwender wichtigen Eigenschaften der Normalverteilung - Symmetrie zum Mittelwert, Glockenform, 68% bzw. 95% der Daten in der einfachen bzw. zweifachen Standardumgebung des Mittelwerts - lassen sich ohne Formalismus von den Schülern selbst erkunden, aussprechen und benutzen.
Abschließend noch eine Bemerkung zur Bedeutung der Normalverteilung: Sie geht im wesentlichen auf drei Gründe zurück, in der Reihenfolge ihrer Wichtigkeit:
1. Die weite Gültigkeit des zentralen Grenzwertsatzes: Dieser Satz ist das theoretische Gegenstück zu der Erfahrungstatsache, dass Größen - wie zum Beispiel Messfehler - , die von einer Vielzahl zufallsbedingter Einzeleffekte abhängen, näherungsweise normalverteilt sind.
Diese Erfahrung ist, nebenbei bemerkt, Schülern der 11. Klasse durchaus zugänglich.
2. Viele sogenannte Statistiken (Kennwerte, Schätzfunktionen, Testgrößen) sind exakt oder in guter Näherung normalverteilt. Dazu zählen Mittelwert, (empirische) Varianz, Median und Totalwert (das ist die Summe aller Datenwerte).
3. Die Normalverteilung ist Grenzverteilung vieler anderer ihrerseits wichtiger theoretischer Verteilungen, zum Beispiel ist sie Grenzverteilung der Binomialverteilung, der Poisson-Verteilung, der hypergeometrischen Verteilung, der Chiquadratverteilung.

MT: Besonders sympathisch finde ich die Plausibilitätserklärung des Korrelationskoeffizienten in der dritten Lerneinheit. Sie haben damit sicher Unterrichtserfahrung?

D. Vogel: Es ist mehr als eine Plausibilitätserklärung. Der Korrelationskoeffizient hat viele Deutungen. Eine davon, die besonders leicht zugänglich ist, ist die eines Mittelwertes orientierter Flächeninhalte. Erinnert das nicht an den Integralbegriff? Wir halten diese Deutung für ein tieferes Verständnis dieses Begriffes für zentral; zudem kann es nicht schaden, wenn der vorzeichenbehaftete Flächeninhalt sich bereits hier als nützliche Begriffsbildung erweist.
Doch zu ihrer Frage eigener, d. h. persönlicher Unterrichterfahrung mit dem Korrelationskoeffizienten: Die Idee den Korrelationskoeffizienten in der beschriebenen Weise geometrisch zu deuten, ist zwar vor dem Hintergrund eigener Unterrichterfahrung gewachsen, das ist richtig. Leider sind Frau Dr. Wintermantel und ich in den letzten zwei Jahren nicht mehr in der Jahrgangsstufe 11 tätig gewesen. So hatten wir leider noch keine Gelegenheit, die dritte Erkundung in ihrer jetzigen Fassung zu erproben. Wir werden das sicher tun, sobald es geht, und würden uns im übrigen freuen, von Erfahrungen anderer Schulen zu hören.

MT: Die Steuerung im Unterricht erfolgt im wesentlichen über Arbeitsblätter. Mir scheint, dass der Arbeitsaufwand für Unterrichtende nach einer kleinen Einarbeitungsphase sehr gering ist, zudem findet sich alles auf der CD-Rom. Ich denke, das haben sie so geplant. Haben Sie schon Rückmeldungen?

D. Vogel: Ja, erste Versionen der Arbeitsmappen wurden an vielen Schulen im Rahmen des Modellversuchs SelMa (Selbstlernen in der gymnasialen Oberstufe Mathematik) erprobt. Viele Lehrer gaben uns ermutigende Rückmeldungen.
In der Tat ist unsere Absicht, den Lehrer zu entlasten und zugleich aktives Lernen der Schüler zu stimulieren und zu stützen. Dies scheint das Material bei vielen Lerngruppen gut zu leisten.
Alle wichtige Information ist übrigens im Lehrerbuch abgedruckt. Das Schülerarbeitsbuch, das aus vier Arbeitsmappen besteht, bildet nämlich den Kern der Materialien. Diese Arbeitsmappen sind im Lehrerbuch nochmals abgedruckt, zusammen mit den Lösungen, vielen unterrichtspraktischen Hinweisen und Hintergrundsinformationen zu den Inhalten und Zielen. Das kann die Arbeit sehr erleichtern. Jedenfalls war das unsere Intention.
Die beiliegende CD ist in erster Linie deswegen nützlich, weil sich dort sämtliche verwendeten Datensätze in allen gängigen Formaten finden.

MT: Letzte Frage: EDA erfordert schon der Idee nach Technik, also einen Taschenrechner oder mehr. Wie sind da Ihre Vorstellungen? Was tut sich dazu im Ihrem Buch?

D. Vogel: Wir selbst unterrichten an einer Schule, die unter bedrängender Enge und bedrückender Raumnot leidet. Dies macht einen kontinuierlichen Einsatz von Computern unmöglich. Dies täglich vor Augen, haben wir das Material so konzipiert, dass es weitgehend unabhängig vom jeweiligem Medium zu verwenden ist. Dies hat im übrigen den Vorzug, dass es nicht so rasch veraltet.
Wir geben Anregungen für alle gängigen Programme: Excel, Fathom, TI-83/89/92 bzw. Voyage 200 und S-Plus. Als Mindestvoraussetzung empfehlen wir einen Graphik-Taschenrechner, der statistische Diagramme darstellen kann. Wichtiger als das Medium erscheint uns der Umgang mit den Daten selbst. Hier liegt der Akzent unserer Materialien.

MT: Vielen Dank.

Das Interview führte Rolf Neveling.