KIF465:Vorhersage Studienerfolgswahrscheinlichkeit per Machine Learning: Unterschied zwischen den Versionen
Tb (Diskussion | Beiträge) (Die Seite wurde neu angelegt: „Szenario: Die Hochschule sagt zu einer Person die studieren möchte: Du wirst mit einer Wahrscheinlichkeit von 95% dein Studium nicht bestehen. Das hat der Com…“) |
Anno (Diskussion | Beiträge) Keine Bearbeitungszusammenfassung |
||
(3 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt) | |||
Zeile 1: | Zeile 1: | ||
''Anmerkung: die meisten Aussagen wurden nicht abgestimmt, sondern nur einzeln geäußert.'' | |||
Links: https://www.jmwiarda.de/2018/06/21/algorithmus-enthusiasmus/ https://www.jmwiarda.de/2018/06/26/algorithmus-enthusiasmus/ https://arxiv.org/abs/1606.06364 https://www.researchgate.net/publication/322919234_Predicting_Student_Dropout_a_Machine_Learning_Approach | |||
== | = Protokoll = | ||
* | |||
* | AK-Leitung übernommen Ziel: Resolution ## Kurze Vorstellungsrunde Hochschule Karlsruhe, TU Kaiserslautern, Göttingen, Uni Bonn, HTWK Leipzig, Uni Tübingen, Hochschule Emden-Leer, TU Chemnitz, TH Mittelhessen, Wiesbaden HSRheinMain, Aachen, Uni Mainz, Hamburg, Bamberg, TU Dresden | ||
* | |||
* | '''Motivation für AK-Teilnahme:''' * Machine Learning in Uni / Arbeit * Technische Motivation * Predictive Measuring / Datensammlung * Ethik * Folgen für Studierende * Realitätsabgleich / Einfluss von ML auf Alltag (u.a. Konkrete Nutzung bestehender Daten) * Erwartete Folgen (Diskriminierung? Chance?) * Rechtliche Auswirkungen, u.a. bzgl. d. Berufsfreiheit i.S.v. Art. 12 GG | ||
'''Fragen''' * Sinnvoller Einsatz der ML Technik * Erwartbare Folgen * Methodische Ansätze * Auswirkungen * Unterstützung forcieren * Wirkung-Datenschutz-Nutzen * Machine-Learning erforderlich? -> Was wollen wir überhaupt? | |||
=== Kurze Zussammenfassung von dem vorrangegangen Beitrag siehe Links === | |||
* Aufgrund von Noten in ersten beiden / bis zu drittem Semester Abbruchquote errechnen | |||
* verpflichtende Beratungsgespräche | |||
== Technische Umsetzung == | |||
* Definition Machine Learning (Deep Learning) | |||
* Modell auf bestehenden Daten trainieren | |||
* Testdaten einordnen | |||
* Problematik: erforderliche Datenmenge nicht einfach zu erhalten | |||
* Statistische Signifikanz der “Ergebnisse” | |||
* Genauigkeit der Vorhersage nimmt durch zu exakte Zuordnung ab (Pattern Matching nicht zu spezifisch) | |||
=== Welche Datenmengen wären erforderlich? === | |||
* 100000-500000 Datenpunkte erforderlich | |||
* es gibt auch andere Ansichten (deutlich weniger Datenpunkte) | |||
=== Erfoderlichkeit von ML für ein solches Verfahren === | |||
* Statistik: Regression anstelle von ML, sofern nur Noten betrachtet werden? | |||
* bei Betrachtung von Noten vermutlich möglich, falls andere Datenmengen betrachtet werden vermutlich erforderlich (z.B. Mensa und Bib.-Besuche) | |||
* Fallunterscheidung: ML vs. “reine Statistik” von Zielfall abhängig (Notwendigkeit der Unterscheidung wird angezweifelt, da ML im Grunde nur Statistik sei) | |||
== Ethische Positionierung == | |||
* Wirtschaftliche Motivation für die Verwendung von ML (Studienabbrecher) | |||
* Kontrahierende Positionen | |||
* Weniger Geld in Studierende stecken, die das Studium abbrechen | |||
* lehnt AK ab(?) | |||
* Studieren über Regelstudienzeit hinaus kostet Uni Geld (in Niedersachsen) -> Lehre wird schlechter für alle | |||
* Studierenden helfen, das Studium noch zu retten | |||
* kann unintendierte Auswirkungen haben (Demotivation, Self-Fullfilling-Prophecy) | |||
* jede Person soll selbst entscheiden, ob sie eine Prognose möchte (Opt-Out) | |||
* Welche Daten sollen erhoben werden dürfen? | |||
* in USA-Beispiel scheint ML sinnvoll (Daten auch bei Bewerbung schon vorhanden) | |||
* Unterrepräsentierte Gruppen (Migrationshintergrund etc.) werden weiter diskriminiert | |||
* Fraglich bei der Datenerhebung, welche Daten bezogen werden und wie diese interpretiert werden | |||
* Datensammlung | |||
* Problematik Helikoptereltern | |||
* Fachschaftsengagement -> länger studieren | |||
* Hessen: zwingendes Mentoring im Studienverlauf (bevor Drittsemestermodule geschrieben werden können) | |||
* Vorschlag: Orientierungsprüfungen anstelle von anderen “Aussortierungsmechanismen” | |||
* Mentoring verpflichtend | |||
* Darf Wahrscheinlichkeit Grundlage für Entscheidung sein? | |||
* Risikotstudierende erkennen und Mentoring anbieten, aber nicht | |||
* Nutzung für automatische Aussortierung ausschließen | |||
* Anfang des Verlaufs | |||
* Wirtschaftliche Aspekte dürfen nicht in Vordergrund stehen, sondern Studierende | |||
'''Motivationen zur Nutzung''' * bei Hochschule: Ablehnung der Erhebung von Daten * Ursachenforschung in Schule, in HS nicht sinnvoll * Gegenmeinung: in Verlauf des Studiums wird erst klar, ob Studiengang passt * Lehre * Wirtschatliche Motivation * lieber: positiven Einfluss vor Studium * Buddy-Programme für Ersties | |||
'''Vertretbarkeit der Datenquellen''' * Datenerhebung * Sollen Daten für den Zweck erfasst werden, die bisher nicht erfasst wurden? (zusätzlich zu Noten, letztem Zeugnis, persönlichen Daten) * Nein (rechtlich auch kompliziert, zweckgebunden) + Ja * Sollen vorhandene Daten verwendet werden für Prediction? * Nein + Ja * Sollen Notendaten verwendet werden dürfen? * Ja mit Opt-Out (Opt-In schöner) | |||
* Konsequenzen abgesehen von Gespräch werden abgelehnt | |||
* Prüfungsordnung kann Pflichtgespräche beinhalten | |||
* Studierende (bzw. Erwachsene?) nicht zwingen, etwas zu tun | |||
* Frage stellen: “Willst Du eigentlich studieren, was Du studierst?” | |||
* Beratung grundsätzlich gut, Zwang diskutabel -> zu Glück zwingen? | |||
* Mentoring durch ältere Studis | |||
* ganz allgemein: Datenerhebung als Opt-In | |||
* Personenbezogene Daten anonym verwenden | |||
* Sozialer Druck == Regelstudienzeit | |||
* Leute in zweitem Semester kennen Angebote nicht | |||
'''Gespräch mit wem? Wozu?''' * Ablehnung von Zwangsgesprächen |
Aktuelle Version vom 6. November 2018, 16:52 Uhr
Anmerkung: die meisten Aussagen wurden nicht abgestimmt, sondern nur einzeln geäußert.
Links: https://www.jmwiarda.de/2018/06/21/algorithmus-enthusiasmus/ https://www.jmwiarda.de/2018/06/26/algorithmus-enthusiasmus/ https://arxiv.org/abs/1606.06364 https://www.researchgate.net/publication/322919234_Predicting_Student_Dropout_a_Machine_Learning_Approach
Protokoll[Bearbeiten]
AK-Leitung übernommen Ziel: Resolution ## Kurze Vorstellungsrunde Hochschule Karlsruhe, TU Kaiserslautern, Göttingen, Uni Bonn, HTWK Leipzig, Uni Tübingen, Hochschule Emden-Leer, TU Chemnitz, TH Mittelhessen, Wiesbaden HSRheinMain, Aachen, Uni Mainz, Hamburg, Bamberg, TU Dresden
Motivation für AK-Teilnahme: * Machine Learning in Uni / Arbeit * Technische Motivation * Predictive Measuring / Datensammlung * Ethik * Folgen für Studierende * Realitätsabgleich / Einfluss von ML auf Alltag (u.a. Konkrete Nutzung bestehender Daten) * Erwartete Folgen (Diskriminierung? Chance?) * Rechtliche Auswirkungen, u.a. bzgl. d. Berufsfreiheit i.S.v. Art. 12 GG
Fragen * Sinnvoller Einsatz der ML Technik * Erwartbare Folgen * Methodische Ansätze * Auswirkungen * Unterstützung forcieren * Wirkung-Datenschutz-Nutzen * Machine-Learning erforderlich? -> Was wollen wir überhaupt?
Kurze Zussammenfassung von dem vorrangegangen Beitrag siehe Links[Bearbeiten]
- Aufgrund von Noten in ersten beiden / bis zu drittem Semester Abbruchquote errechnen
- verpflichtende Beratungsgespräche
Technische Umsetzung[Bearbeiten]
- Definition Machine Learning (Deep Learning)
- Modell auf bestehenden Daten trainieren
- Testdaten einordnen
- Problematik: erforderliche Datenmenge nicht einfach zu erhalten
- Statistische Signifikanz der “Ergebnisse”
- Genauigkeit der Vorhersage nimmt durch zu exakte Zuordnung ab (Pattern Matching nicht zu spezifisch)
Welche Datenmengen wären erforderlich?[Bearbeiten]
- 100000-500000 Datenpunkte erforderlich
- es gibt auch andere Ansichten (deutlich weniger Datenpunkte)
Erfoderlichkeit von ML für ein solches Verfahren[Bearbeiten]
- Statistik: Regression anstelle von ML, sofern nur Noten betrachtet werden?
- bei Betrachtung von Noten vermutlich möglich, falls andere Datenmengen betrachtet werden vermutlich erforderlich (z.B. Mensa und Bib.-Besuche)
- Fallunterscheidung: ML vs. “reine Statistik” von Zielfall abhängig (Notwendigkeit der Unterscheidung wird angezweifelt, da ML im Grunde nur Statistik sei)
Ethische Positionierung[Bearbeiten]
- Wirtschaftliche Motivation für die Verwendung von ML (Studienabbrecher)
- Kontrahierende Positionen
- Weniger Geld in Studierende stecken, die das Studium abbrechen
- lehnt AK ab(?)
- Studieren über Regelstudienzeit hinaus kostet Uni Geld (in Niedersachsen) -> Lehre wird schlechter für alle
- Studierenden helfen, das Studium noch zu retten
- kann unintendierte Auswirkungen haben (Demotivation, Self-Fullfilling-Prophecy)
- jede Person soll selbst entscheiden, ob sie eine Prognose möchte (Opt-Out)
- Welche Daten sollen erhoben werden dürfen?
- in USA-Beispiel scheint ML sinnvoll (Daten auch bei Bewerbung schon vorhanden)
- Unterrepräsentierte Gruppen (Migrationshintergrund etc.) werden weiter diskriminiert
- Fraglich bei der Datenerhebung, welche Daten bezogen werden und wie diese interpretiert werden
- Datensammlung
- Problematik Helikoptereltern
- Fachschaftsengagement -> länger studieren
- Hessen: zwingendes Mentoring im Studienverlauf (bevor Drittsemestermodule geschrieben werden können)
- Vorschlag: Orientierungsprüfungen anstelle von anderen “Aussortierungsmechanismen”
- Mentoring verpflichtend
- Darf Wahrscheinlichkeit Grundlage für Entscheidung sein?
- Risikotstudierende erkennen und Mentoring anbieten, aber nicht
- Nutzung für automatische Aussortierung ausschließen
- Anfang des Verlaufs
- Wirtschaftliche Aspekte dürfen nicht in Vordergrund stehen, sondern Studierende
Motivationen zur Nutzung * bei Hochschule: Ablehnung der Erhebung von Daten * Ursachenforschung in Schule, in HS nicht sinnvoll * Gegenmeinung: in Verlauf des Studiums wird erst klar, ob Studiengang passt * Lehre * Wirtschatliche Motivation * lieber: positiven Einfluss vor Studium * Buddy-Programme für Ersties
Vertretbarkeit der Datenquellen * Datenerhebung * Sollen Daten für den Zweck erfasst werden, die bisher nicht erfasst wurden? (zusätzlich zu Noten, letztem Zeugnis, persönlichen Daten) * Nein (rechtlich auch kompliziert, zweckgebunden) + Ja * Sollen vorhandene Daten verwendet werden für Prediction? * Nein + Ja * Sollen Notendaten verwendet werden dürfen? * Ja mit Opt-Out (Opt-In schöner)
- Konsequenzen abgesehen von Gespräch werden abgelehnt
- Prüfungsordnung kann Pflichtgespräche beinhalten
- Studierende (bzw. Erwachsene?) nicht zwingen, etwas zu tun
- Frage stellen: “Willst Du eigentlich studieren, was Du studierst?”
- Beratung grundsätzlich gut, Zwang diskutabel -> zu Glück zwingen?
- Mentoring durch ältere Studis
- ganz allgemein: Datenerhebung als Opt-In
- Personenbezogene Daten anonym verwenden
- Sozialer Druck == Regelstudienzeit
- Leute in zweitem Semester kennen Angebote nicht
Gespräch mit wem? Wozu? * Ablehnung von Zwangsgesprächen