KIF465:Vorhersage Studienerfolgswahrscheinlichkeit per Machine Learning
Anmerkung: die meisten Aussagen wurden nicht abgestimmt, sondern nur einzeln geäußert.
Links: https://www.jmwiarda.de/2018/06/21/algorithmus-enthusiasmus/ https://www.jmwiarda.de/2018/06/26/algorithmus-enthusiasmus/ https://arxiv.org/abs/1606.06364 https://www.researchgate.net/publication/322919234_Predicting_Student_Dropout_a_Machine_Learning_Approach
Protokoll
AK-Leitung übernommen Ziel: Resolution ## Kurze Vorstellungsrunde Hochschule Karlsruhe, TU Kaiserslautern, Göttingen, Uni Bonn, HTWK Leipzig, Uni Tübingen, Hochschule Emden-Leer, TU Chemnitz, TH Mittelhessen, Wiesbaden HSRheinMain, Aachen, Uni Mainz, Hamburg, Bamberg, TU Dresden
Motivation für AK-Teilnahme: * Machine Learning in Uni / Arbeit * Technische Motivation * Predictive Measuring / Datensammlung * Ethik * Folgen für Studierende * Realitätsabgleich / Einfluss von ML auf Alltag (u.a. Konkrete Nutzung bestehender Daten) * Erwartete Folgen (Diskriminierung? Chance?) * Rechtliche Auswirkungen, u.a. bzgl. d. Berufsfreiheit i.S.v. Art. 12 GG
Fragen * Sinnvoller Einsatz der ML Technik * Erwartbare Folgen * Methodische Ansätze * Auswirkungen * Unterstützung forcieren * Wirkung-Datenschutz-Nutzen * Machine-Learning erforderlich? -> Was wollen wir überhaupt?
Kurze Zussammenfassung von dem vorrangegangen Beitrag siehe Links
- Aufgrund von Noten in ersten beiden / bis zu drittem Semester Abbruchquote errechnen
- verpflichtende Beratungsgespräche
Technische Umsetzung
- Definition Machine Learning (Deep Learning)
- Modell auf bestehenden Daten trainieren
- Testdaten einordnen
- Problematik: erforderliche Datenmenge nicht einfach zu erhalten
- Statistische Signifikanz der “Ergebnisse”
- Genauigkeit der Vorhersage nimmt durch zu exakte Zuordnung ab (Pattern Matching nicht zu spezifisch)
Welche Datenmengen wären erforderlich?
- 100000-500000 Datenpunkte erforderlich
- es gibt auch andere Ansichten (deutlich weniger Datenpunkte)
Erfoderlichkeit von ML für ein solches Verfahren
- Statistik: Regression anstelle von ML, sofern nur Noten betrachtet werden?
- bei Betrachtung von Noten vermutlich möglich, falls andere Datenmengen betrachtet werden vermutlich erforderlich (z.B. Mensa und Bib.-Besuche)
- Fallunterscheidung: ML vs. “reine Statistik” von Zielfall abhängig (Notwendigkeit der Unterscheidung wird angezweifelt, da ML im Grunde nur Statistik sei)
Ethische Positionierung
- Wirtschaftliche Motivation für die Verwendung von ML (Studienabbrecher)
- Kontrahierende Positionen
- Weniger Geld in Studierende stecken, die das Studium abbrechen
- lehnt AK ab(?)
- Studieren über Regelstudienzeit hinaus kostet Uni Geld (in Niedersachsen) -> Lehre wird schlechter für alle
- Studierenden helfen, das Studium noch zu retten
- kann unintendierte Auswirkungen haben (Demotivation, Self-Fullfilling-Prophecy)
- jede Person soll selbst entscheiden, ob sie eine Prognose möchte (Opt-Out)
- Welche Daten sollen erhoben werden dürfen?
- in USA-Beispiel scheint ML sinnvoll (Daten auch bei Bewerbung schon vorhanden)
- Unterrepräsentierte Gruppen (Migrationshintergrund etc.) werden weiter diskriminiert
- Fraglich bei der Datenerhebung, welche Daten bezogen werden und wie diese interpretiert werden
- Datensammlung
- Problematik Helikoptereltern
- Fachschaftsengagement -> länger studieren
- Hessen: zwingendes Mentoring im Studienverlauf (bevor Drittsemestermodule geschrieben werden können)
- Vorschlag: Orientierungsprüfungen anstelle von anderen “Aussortierungsmechanismen”
- Mentoring verpflichtend
- Darf Wahrscheinlichkeit Grundlage für Entscheidung sein?
- Risikotstudierende erkennen und Mentoring anbieten, aber nicht
- Nutzung für automatische Aussortierung ausschließen
- Anfang des Verlaufs
- Wirtschaftliche Aspekte dürfen nicht in Vordergrund stehen, sondern Studierende
Motivationen zur Nutzung * bei Hochschule: Ablehnung der Erhebung von Daten * Ursachenforschung in Schule, in HS nicht sinnvoll * Gegenmeinung: in Verlauf des Studiums wird erst klar, ob Studiengang passt * Lehre * Wirtschatliche Motivation * lieber: positiven Einfluss vor Studium * Buddy-Programme für Ersties
Vertretbarkeit der Datenquellen * Datenerhebung * Sollen Daten für den Zweck erfasst werden, die bisher nicht erfasst wurden? (zusätzlich zu Noten, letztem Zeugnis, persönlichen Daten) * Nein (rechtlich auch kompliziert, zweckgebunden) + Ja * Sollen vorhandene Daten verwendet werden für Prediction? * Nein + Ja * Sollen Notendaten verwendet werden dürfen? * Ja mit Opt-Out (Opt-In schöner)
- Konsequenzen abgesehen von Gespräch werden abgelehnt
- Prüfungsordnung kann Pflichtgespräche beinhalten
- Studierende (bzw. Erwachsene?) nicht zwingen, etwas zu tun
- Frage stellen: “Willst Du eigentlich studieren, was Du studierst?”
- Beratung grundsätzlich gut, Zwang diskutabel -> zu Glück zwingen?
- Mentoring durch ältere Studis
- ganz allgemein: Datenerhebung als Opt-In
- Personenbezogene Daten anonym verwenden
- Sozialer Druck == Regelstudienzeit
- Leute in zweitem Semester kennen Angebote nicht
Gespräch mit wem? Wozu? * Ablehnung von Zwangsgesprächen