Bearbeiten von „KIF465:Vorhersage Studienerfolgswahrscheinlichkeit per Machine Learning“

Szenario: Die Hochschule sagt zu einer Person die studieren möchte: Du wirst mit einer Wahrscheinlichkeit von 95% dein Studium nicht bestehen. Das hat der Computer ausgerechnet.

Da die KIF sich der Informatik zuständig fühlt hat sie vielleicht eine Meinung dazu ob so etwas hilfreich ist oder nicht.

== Links ==
* https://www.jmwiarda.de/2018/06/21/algorithmus-enthusiasmus/
* https://www.jmwiarda.de/2018/06/26/algorithmus-enthusiasmus/
* Predicting Student Dropout in Higher Education https://arxiv.org/abs/1606.06364  (US university)
* Predicting Student Dropout: a Machine Learning Approach https://www.researchgate.net/publication/322919234_Predicting_Student_Dropout_a_Machine_Learning_Approach (German university)
https://md.kif.rocks/Studierenerfolgswahrscheinlichkeit#

== Mögliche Fragen zur Diskussion ==
* Ist das methodisch ok?
* Welche Auswirkungen hat das?
* Kann es hilfreich sein so etwas zu wissen um Unterstützungsangebote zu forcieren?
* Wollen wir Studierende die Probleme mit ihrem Studium haben oder haben werden identifizieren um ihnen zu helfen? Wie würden wir dies einbetten in ein komplexes Feld von falscher Nutzung/Wirkung, Datenschutz und Nutzen?
* Braucht man dafür ML, oder ist das nur ein Hype?
@@ Zeile 1: / Zeile 1: @@
-''Anmerkung: die meisten Aussagen wurden nicht abgestimmt, sondern nur einzeln geäußert.''
+Szenario: Die Hochschule sagt zu einer Person die studieren möchte: Du wirst mit einer Wahrscheinlichkeit von 95% dein Studium nicht bestehen. Das hat der Computer ausgerechnet.
-Links: https://www.jmwiarda.de/2018/06/21/algorithmus-enthusiasmus/ https://www.jmwiarda.de/2018/06/26/algorithmus-enthusiasmus/ https://arxiv.org/abs/1606.06364 https://www.researchgate.net/publication/322919234_Predicting_Student_Dropout_a_Machine_Learning_Approach
+Da die KIF sich der Informatik zuständig fühlt hat sie vielleicht eine Meinung dazu ob so etwas hilfreich ist oder nicht.
-= Protokoll =
+== Links ==
+* https://www.jmwiarda.de/2018/06/21/algorithmus-enthusiasmus/
+* https://www.jmwiarda.de/2018/06/26/algorithmus-enthusiasmus/
+* Predicting Student Dropout in Higher Education https://arxiv.org/abs/1606.06364  (US university)
+* Predicting Student Dropout: a Machine Learning Approach https://www.researchgate.net/publication/322919234_Predicting_Student_Dropout_a_Machine_Learning_Approach (German university)
+https://md.kif.rocks/Studierenerfolgswahrscheinlichkeit#
-AK-Leitung übernommen Ziel: Resolution ## Kurze Vorstellungsrunde Hochschule Karlsruhe, TU Kaiserslautern, Göttingen, Uni Bonn, HTWK Leipzig, Uni Tübingen, Hochschule Emden-Leer, TU Chemnitz, TH Mittelhessen, Wiesbaden HSRheinMain, Aachen, Uni Mainz, Hamburg, Bamberg, TU Dresden
+== Mögliche Fragen zur Diskussion ==
+* Ist das methodisch ok?
-'''Motivation für AK-Teilnahme:''' * Machine Learning in Uni / Arbeit * Technische Motivation * Predictive Measuring / Datensammlung * Ethik * Folgen für Studierende * Realitätsabgleich / Einfluss von ML auf Alltag (u.a. Konkrete Nutzung bestehender Daten) * Erwartete Folgen (Diskriminierung? Chance?) * Rechtliche Auswirkungen, u.a. bzgl. d. Berufsfreiheit i.S.v. Art. 12 GG
+* Welche Auswirkungen hat das?
+* Kann es hilfreich sein so etwas zu wissen um Unterstützungsangebote zu forcieren?
-'''Fragen''' * Sinnvoller Einsatz der ML Technik * Erwartbare Folgen * Methodische Ansätze * Auswirkungen * Unterstützung forcieren * Wirkung-Datenschutz-Nutzen * Machine-Learning erforderlich? -&gt; Was wollen wir überhaupt?
+* Wollen wir Studierende die Probleme mit ihrem Studium haben oder haben werden identifizieren um ihnen zu helfen? Wie würden wir dies einbetten in ein komplexes Feld von falscher Nutzung/Wirkung, Datenschutz und Nutzen?
+* Braucht man dafür ML, oder ist das nur ein Hype?
-=== Kurze Zussammenfassung von dem vorrangegangen Beitrag siehe Links ===
-* Aufgrund von Noten in ersten beiden / bis zu drittem Semester Abbruchquote errechnen
-* verpflichtende Beratungsgespräche
-== Technische Umsetzung ==
-* Definition Machine Learning (Deep Learning)
-* Modell auf bestehenden Daten trainieren
-* Testdaten einordnen
-* Problematik: erforderliche Datenmenge nicht einfach zu erhalten
-* Statistische Signifikanz der “Ergebnisse”
-* Genauigkeit der Vorhersage nimmt durch zu exakte Zuordnung ab (Pattern Matching nicht zu spezifisch)
-=== Welche Datenmengen wären erforderlich? ===
-* 100000-500000 Datenpunkte erforderlich
-* es gibt auch andere Ansichten (deutlich weniger Datenpunkte)
-=== Erfoderlichkeit von ML für ein solches Verfahren ===
-* Statistik: Regression anstelle von ML, sofern nur Noten betrachtet werden?
-* bei Betrachtung von Noten vermutlich möglich, falls andere Datenmengen betrachtet werden vermutlich erforderlich (z.B. Mensa und Bib.-Besuche)
-* Fallunterscheidung: ML vs. “reine Statistik” von Zielfall abhängig (Notwendigkeit der Unterscheidung wird angezweifelt, da ML im Grunde nur Statistik sei)
-== Ethische Positionierung ==
-* Wirtschaftliche Motivation für die Verwendung von ML (Studienabbrecher)
-* Kontrahierende Positionen
-* Weniger Geld in Studierende stecken, die das Studium abbrechen
-* lehnt AK ab(?)
-* Studieren über Regelstudienzeit hinaus kostet Uni Geld (in Niedersachsen) -&gt; Lehre wird schlechter für alle
-* Studierenden helfen, das Studium noch zu retten
-* kann unintendierte Auswirkungen haben (Demotivation, Self-Fullfilling-Prophecy)
-* jede Person soll selbst entscheiden, ob sie eine Prognose möchte (Opt-Out)
-* Welche Daten sollen erhoben werden dürfen?
-* in USA-Beispiel scheint ML sinnvoll (Daten auch bei Bewerbung schon vorhanden)
-* Unterrepräsentierte Gruppen (Migrationshintergrund etc.) werden weiter diskriminiert
-* Fraglich bei der Datenerhebung, welche Daten bezogen werden und wie diese interpretiert werden
-* Datensammlung
-* Problematik Helikoptereltern
-* Fachschaftsengagement -&gt; länger studieren
-* Hessen: zwingendes Mentoring im Studienverlauf (bevor Drittsemestermodule geschrieben werden können)
-* Vorschlag: Orientierungsprüfungen anstelle von anderen “Aussortierungsmechanismen”
-* Mentoring verpflichtend
-* Darf Wahrscheinlichkeit Grundlage für Entscheidung sein?
-* Risikotstudierende erkennen und Mentoring anbieten, aber nicht
-* Nutzung für automatische Aussortierung ausschließen
-* Anfang des Verlaufs
-* Wirtschaftliche Aspekte dürfen nicht in Vordergrund stehen, sondern Studierende
-'''Motivationen zur Nutzung''' * bei Hochschule: Ablehnung der Erhebung von Daten * Ursachenforschung in Schule, in HS nicht sinnvoll * Gegenmeinung: in Verlauf des Studiums wird erst klar, ob Studiengang passt * Lehre * Wirtschatliche Motivation * lieber: positiven Einfluss vor Studium * Buddy-Programme für Ersties
-'''Vertretbarkeit der Datenquellen''' * Datenerhebung * Sollen Daten für den Zweck erfasst werden, die bisher nicht erfasst wurden? (zusätzlich zu Noten, letztem Zeugnis, persönlichen Daten) * Nein (rechtlich auch kompliziert, zweckgebunden) + Ja * Sollen vorhandene Daten verwendet werden für Prediction? * Nein + Ja * Sollen Notendaten verwendet werden dürfen? * Ja mit Opt-Out (Opt-In schöner)
-* Konsequenzen abgesehen von Gespräch werden abgelehnt
-* Prüfungsordnung kann Pflichtgespräche beinhalten
-* Studierende (bzw. Erwachsene?) nicht zwingen, etwas zu tun
-* Frage stellen: “Willst Du eigentlich studieren, was Du studierst?”
-* Beratung grundsätzlich gut, Zwang diskutabel -&gt; zu Glück zwingen?
-* Mentoring durch ältere Studis
-* ganz allgemein: Datenerhebung als Opt-In
-* Personenbezogene Daten anonym verwenden
-* Sozialer Druck == Regelstudienzeit
-* Leute in zweitem Semester kennen Angebote nicht
-'''Gespräch mit wem? Wozu?''' * Ablehnung von Zwangsgesprächen