KIF465:Vorhersage Studienerfolgswahrscheinlichkeit per Machine Learning

Aus KIF

Anmerkung: die meisten Aussagen wurden nicht abgestimmt, sondern nur einzeln geäußert.

Links: https://www.jmwiarda.de/2018/06/21/algorithmus-enthusiasmus/ https://www.jmwiarda.de/2018/06/26/algorithmus-enthusiasmus/ https://arxiv.org/abs/1606.06364 https://www.researchgate.net/publication/322919234_Predicting_Student_Dropout_a_Machine_Learning_Approach

Protokoll[Bearbeiten]

AK-Leitung übernommen Ziel: Resolution ## Kurze Vorstellungsrunde Hochschule Karlsruhe, TU Kaiserslautern, Göttingen, Uni Bonn, HTWK Leipzig, Uni Tübingen, Hochschule Emden-Leer, TU Chemnitz, TH Mittelhessen, Wiesbaden HSRheinMain, Aachen, Uni Mainz, Hamburg, Bamberg, TU Dresden

Motivation für AK-Teilnahme: * Machine Learning in Uni / Arbeit * Technische Motivation * Predictive Measuring / Datensammlung * Ethik * Folgen für Studierende * Realitätsabgleich / Einfluss von ML auf Alltag (u.a. Konkrete Nutzung bestehender Daten) * Erwartete Folgen (Diskriminierung? Chance?) * Rechtliche Auswirkungen, u.a. bzgl. d. Berufsfreiheit i.S.v. Art. 12 GG

Fragen * Sinnvoller Einsatz der ML Technik * Erwartbare Folgen * Methodische Ansätze * Auswirkungen * Unterstützung forcieren * Wirkung-Datenschutz-Nutzen * Machine-Learning erforderlich? -> Was wollen wir überhaupt?

Kurze Zussammenfassung von dem vorrangegangen Beitrag siehe Links[Bearbeiten]

  • Aufgrund von Noten in ersten beiden / bis zu drittem Semester Abbruchquote errechnen
  • verpflichtende Beratungsgespräche

Technische Umsetzung[Bearbeiten]

  • Definition Machine Learning (Deep Learning)
  • Modell auf bestehenden Daten trainieren
  • Testdaten einordnen
  • Problematik: erforderliche Datenmenge nicht einfach zu erhalten
  • Statistische Signifikanz der “Ergebnisse”
  • Genauigkeit der Vorhersage nimmt durch zu exakte Zuordnung ab (Pattern Matching nicht zu spezifisch)

Welche Datenmengen wären erforderlich?[Bearbeiten]

  • 100000-500000 Datenpunkte erforderlich
  • es gibt auch andere Ansichten (deutlich weniger Datenpunkte)

Erfoderlichkeit von ML für ein solches Verfahren[Bearbeiten]

  • Statistik: Regression anstelle von ML, sofern nur Noten betrachtet werden?
  • bei Betrachtung von Noten vermutlich möglich, falls andere Datenmengen betrachtet werden vermutlich erforderlich (z.B. Mensa und Bib.-Besuche)
  • Fallunterscheidung: ML vs. “reine Statistik” von Zielfall abhängig (Notwendigkeit der Unterscheidung wird angezweifelt, da ML im Grunde nur Statistik sei)

Ethische Positionierung[Bearbeiten]

  • Wirtschaftliche Motivation für die Verwendung von ML (Studienabbrecher)
  • Kontrahierende Positionen
  • Weniger Geld in Studierende stecken, die das Studium abbrechen
  • lehnt AK ab(?)
  • Studieren über Regelstudienzeit hinaus kostet Uni Geld (in Niedersachsen) -> Lehre wird schlechter für alle
  • Studierenden helfen, das Studium noch zu retten
  • kann unintendierte Auswirkungen haben (Demotivation, Self-Fullfilling-Prophecy)
  • jede Person soll selbst entscheiden, ob sie eine Prognose möchte (Opt-Out)
  • Welche Daten sollen erhoben werden dürfen?
  • in USA-Beispiel scheint ML sinnvoll (Daten auch bei Bewerbung schon vorhanden)
  • Unterrepräsentierte Gruppen (Migrationshintergrund etc.) werden weiter diskriminiert
  • Fraglich bei der Datenerhebung, welche Daten bezogen werden und wie diese interpretiert werden
  • Datensammlung
  • Problematik Helikoptereltern
  • Fachschaftsengagement -> länger studieren
  • Hessen: zwingendes Mentoring im Studienverlauf (bevor Drittsemestermodule geschrieben werden können)
  • Vorschlag: Orientierungsprüfungen anstelle von anderen “Aussortierungsmechanismen”
  • Mentoring verpflichtend
  • Darf Wahrscheinlichkeit Grundlage für Entscheidung sein?
  • Risikotstudierende erkennen und Mentoring anbieten, aber nicht
  • Nutzung für automatische Aussortierung ausschließen
  • Anfang des Verlaufs
  • Wirtschaftliche Aspekte dürfen nicht in Vordergrund stehen, sondern Studierende

Motivationen zur Nutzung * bei Hochschule: Ablehnung der Erhebung von Daten * Ursachenforschung in Schule, in HS nicht sinnvoll * Gegenmeinung: in Verlauf des Studiums wird erst klar, ob Studiengang passt * Lehre * Wirtschatliche Motivation * lieber: positiven Einfluss vor Studium * Buddy-Programme für Ersties

Vertretbarkeit der Datenquellen * Datenerhebung * Sollen Daten für den Zweck erfasst werden, die bisher nicht erfasst wurden? (zusätzlich zu Noten, letztem Zeugnis, persönlichen Daten) * Nein (rechtlich auch kompliziert, zweckgebunden) + Ja * Sollen vorhandene Daten verwendet werden für Prediction? * Nein + Ja * Sollen Notendaten verwendet werden dürfen? * Ja mit Opt-Out (Opt-In schöner)

  • Konsequenzen abgesehen von Gespräch werden abgelehnt
  • Prüfungsordnung kann Pflichtgespräche beinhalten
  • Studierende (bzw. Erwachsene?) nicht zwingen, etwas zu tun
  • Frage stellen: “Willst Du eigentlich studieren, was Du studierst?”
  • Beratung grundsätzlich gut, Zwang diskutabel -> zu Glück zwingen?
  • Mentoring durch ältere Studis
  • ganz allgemein: Datenerhebung als Opt-In
  • Personenbezogene Daten anonym verwenden
  • Sozialer Druck == Regelstudienzeit
  • Leute in zweitem Semester kennen Angebote nicht

Gespräch mit wem? Wozu? * Ablehnung von Zwangsgesprächen