Bearbeiten von „KIF465:Vorhersage Studienerfolgswahrscheinlichkeit per Machine Learning

Aus KIF
Warnung: Du bist nicht angemeldet. Deine IP-Adresse wird bei Bearbeitungen öffentlich sichtbar. Melde dich an oder erstelle ein Benutzerkonto, damit Bearbeitungen deinem Benutzernamen zugeordnet werden. Ein eigenes Benutzerkonto hat eine ganze Reihe von Vorteilen.

Die Bearbeitung kann rückgängig gemacht werden. Bitte prüfe den Vergleich unten, um sicherzustellen, dass du dies tun möchtest, und veröffentliche dann unten deine Änderungen, um die Bearbeitung rückgängig zu machen.

Aktuelle Version Dein Text
Zeile 1: Zeile 1:
''Anmerkung: die meisten Aussagen wurden nicht abgestimmt, sondern nur einzeln geäußert.''
Szenario: Die Hochschule sagt zu einer Person die studieren möchte: Du wirst mit einer Wahrscheinlichkeit von 95% dein Studium nicht bestehen. Das hat der Computer ausgerechnet.


Links: https://www.jmwiarda.de/2018/06/21/algorithmus-enthusiasmus/ https://www.jmwiarda.de/2018/06/26/algorithmus-enthusiasmus/ https://arxiv.org/abs/1606.06364 https://www.researchgate.net/publication/322919234_Predicting_Student_Dropout_a_Machine_Learning_Approach
Da die KIF sich der Informatik zuständig fühlt hat sie vielleicht eine Meinung dazu ob so etwas hilfreich ist oder nicht.


= Protokoll =
== Links ==
* https://www.jmwiarda.de/2018/06/21/algorithmus-enthusiasmus/
* https://www.jmwiarda.de/2018/06/26/algorithmus-enthusiasmus/
* Predicting Student Dropout in Higher Education https://arxiv.org/abs/1606.06364  (US university)
* Predicting Student Dropout: a Machine Learning Approach https://www.researchgate.net/publication/322919234_Predicting_Student_Dropout_a_Machine_Learning_Approach (German university)
https://md.kif.rocks/Studierenerfolgswahrscheinlichkeit#


AK-Leitung übernommen Ziel: Resolution ## Kurze Vorstellungsrunde Hochschule Karlsruhe, TU Kaiserslautern, Göttingen, Uni Bonn, HTWK Leipzig, Uni Tübingen, Hochschule Emden-Leer, TU Chemnitz, TH Mittelhessen, Wiesbaden HSRheinMain, Aachen, Uni Mainz, Hamburg, Bamberg, TU Dresden
== Mögliche Fragen zur Diskussion ==
 
* Ist das methodisch ok?
'''Motivation für AK-Teilnahme:''' * Machine Learning in Uni / Arbeit * Technische Motivation * Predictive Measuring / Datensammlung * Ethik * Folgen für Studierende * Realitätsabgleich / Einfluss von ML auf Alltag (u.a. Konkrete Nutzung bestehender Daten) * Erwartete Folgen (Diskriminierung? Chance?) * Rechtliche Auswirkungen, u.a. bzgl. d. Berufsfreiheit i.S.v. Art. 12 GG
* Welche Auswirkungen hat das?
 
* Kann es hilfreich sein so etwas zu wissen um Unterstützungsangebote zu forcieren?
'''Fragen''' * Sinnvoller Einsatz der ML Technik * Erwartbare Folgen * Methodische Ansätze * Auswirkungen * Unterstützung forcieren * Wirkung-Datenschutz-Nutzen * Machine-Learning erforderlich? -> Was wollen wir überhaupt?
* Wollen wir Studierende die Probleme mit ihrem Studium haben oder haben werden identifizieren um ihnen zu helfen? Wie würden wir dies einbetten in ein komplexes Feld von falscher Nutzung/Wirkung, Datenschutz und Nutzen?
 
* Braucht man dafür ML, oder ist das nur ein Hype?
=== Kurze Zussammenfassung von dem vorrangegangen Beitrag siehe Links ===
 
* Aufgrund von Noten in ersten beiden / bis zu drittem Semester Abbruchquote errechnen
* verpflichtende Beratungsgespräche
 
== Technische Umsetzung ==
 
* Definition Machine Learning (Deep Learning)
* Modell auf bestehenden Daten trainieren
* Testdaten einordnen
* Problematik: erforderliche Datenmenge nicht einfach zu erhalten
* Statistische Signifikanz der “Ergebnisse”
* Genauigkeit der Vorhersage nimmt durch zu exakte Zuordnung ab (Pattern Matching nicht zu spezifisch)
 
=== Welche Datenmengen wären erforderlich? ===
 
* 100000-500000 Datenpunkte erforderlich
* es gibt auch andere Ansichten (deutlich weniger Datenpunkte)
 
=== Erfoderlichkeit von ML für ein solches Verfahren ===
 
* Statistik: Regression anstelle von ML, sofern nur Noten betrachtet werden?
* bei Betrachtung von Noten vermutlich möglich, falls andere Datenmengen betrachtet werden vermutlich erforderlich (z.B. Mensa und Bib.-Besuche)
* Fallunterscheidung: ML vs. “reine Statistik” von Zielfall abhängig (Notwendigkeit der Unterscheidung wird angezweifelt, da ML im Grunde nur Statistik sei)
 
== Ethische Positionierung ==
 
* Wirtschaftliche Motivation für die Verwendung von ML (Studienabbrecher)
* Kontrahierende Positionen
* Weniger Geld in Studierende stecken, die das Studium abbrechen
* lehnt AK ab(?)
* Studieren über Regelstudienzeit hinaus kostet Uni Geld (in Niedersachsen) -> Lehre wird schlechter für alle
* Studierenden helfen, das Studium noch zu retten
* kann unintendierte Auswirkungen haben (Demotivation, Self-Fullfilling-Prophecy)
* jede Person soll selbst entscheiden, ob sie eine Prognose möchte (Opt-Out)
* Welche Daten sollen erhoben werden dürfen?
* in USA-Beispiel scheint ML sinnvoll (Daten auch bei Bewerbung schon vorhanden)
* Unterrepräsentierte Gruppen (Migrationshintergrund etc.) werden weiter diskriminiert
* Fraglich bei der Datenerhebung, welche Daten bezogen werden und wie diese interpretiert werden
* Datensammlung
* Problematik Helikoptereltern
* Fachschaftsengagement -> länger studieren
* Hessen: zwingendes Mentoring im Studienverlauf (bevor Drittsemestermodule geschrieben werden können)
* Vorschlag: Orientierungsprüfungen anstelle von anderen “Aussortierungsmechanismen”
* Mentoring verpflichtend
* Darf Wahrscheinlichkeit Grundlage für Entscheidung sein?
* Risikotstudierende erkennen und Mentoring anbieten, aber nicht
* Nutzung für automatische Aussortierung ausschließen
* Anfang des Verlaufs
* Wirtschaftliche Aspekte dürfen nicht in Vordergrund stehen, sondern Studierende
 
'''Motivationen zur Nutzung''' * bei Hochschule: Ablehnung der Erhebung von Daten * Ursachenforschung in Schule, in HS nicht sinnvoll * Gegenmeinung: in Verlauf des Studiums wird erst klar, ob Studiengang passt * Lehre * Wirtschatliche Motivation * lieber: positiven Einfluss vor Studium * Buddy-Programme für Ersties
 
'''Vertretbarkeit der Datenquellen''' * Datenerhebung * Sollen Daten für den Zweck erfasst werden, die bisher nicht erfasst wurden? (zusätzlich zu Noten, letztem Zeugnis, persönlichen Daten) * Nein (rechtlich auch kompliziert, zweckgebunden) + Ja * Sollen vorhandene Daten verwendet werden für Prediction? * Nein + Ja * Sollen Notendaten verwendet werden dürfen? * Ja mit Opt-Out (Opt-In schöner)
 
* Konsequenzen abgesehen von Gespräch werden abgelehnt
* Prüfungsordnung kann Pflichtgespräche beinhalten
* Studierende (bzw. Erwachsene?) nicht zwingen, etwas zu tun
* Frage stellen: “Willst Du eigentlich studieren, was Du studierst?”
* Beratung grundsätzlich gut, Zwang diskutabel -> zu Glück zwingen?
* Mentoring durch ältere Studis
* ganz allgemein: Datenerhebung als Opt-In
* Personenbezogene Daten anonym verwenden
* Sozialer Druck == Regelstudienzeit
* Leute in zweitem Semester kennen Angebote nicht
 
'''Gespräch mit wem? Wozu?''' * Ablehnung von Zwangsgesprächen
Bitte kopiere keine Webseiten, die nicht deine eigenen sind, benutze keine urheberrechtlich geschützten Werke ohne Erlaubnis des Urhebers!
Du gibst uns hiermit deine Zusage, dass du den Text selbst verfasst hast, dass der Text Allgemeingut (public domain) ist oder dass der Urheber seine Zustimmung gegeben hat. Falls dieser Text bereits woanders veröffentlicht wurde, weise bitte auf der Diskussionsseite darauf hin. Bitte beachte, dass alle KIF-Beiträge automatisch unter der „Namensnennung-Weitergabe unter gleichen Bedingungen 2.5 “ stehen (siehe KIF:Urheberrechte für Einzelheiten). Falls du nicht möchtest, dass deine Arbeit hier von anderen verändert und verbreitet wird, dann klicke nicht auf „Seite speichern“.
Abbrechen Bearbeitungshilfe (wird in einem neuen Fenster geöffnet)