KIF465:Vorhersage Studienerfolgswahrscheinlichkeit per Machine Learning: Unterschied zwischen den Versionen

Aus KIF
Keine Bearbeitungszusammenfassung
 
Zeile 1: Zeile 1:
Szenario: Die Hochschule sagt zu einer Person die studieren möchte: Du wirst mit einer Wahrscheinlichkeit von 95% dein Studium nicht bestehen. Das hat der Computer ausgerechnet.
''Anmerkung: die meisten Aussagen wurden nicht abgestimmt, sondern nur einzeln geäußert.''


Da die KIF sich der Informatik zuständig fühlt hat sie vielleicht eine Meinung dazu ob so etwas hilfreich ist oder nicht.
Links: https://www.jmwiarda.de/2018/06/21/algorithmus-enthusiasmus/ https://www.jmwiarda.de/2018/06/26/algorithmus-enthusiasmus/ https://arxiv.org/abs/1606.06364 https://www.researchgate.net/publication/322919234_Predicting_Student_Dropout_a_Machine_Learning_Approach


== Links ==
= Protokoll =
* https://www.jmwiarda.de/2018/06/21/algorithmus-enthusiasmus/
* https://www.jmwiarda.de/2018/06/26/algorithmus-enthusiasmus/
* Predicting Student Dropout in Higher Education https://arxiv.org/abs/1606.06364  (US university)
* Predicting Student Dropout: a Machine Learning Approach https://www.researchgate.net/publication/322919234_Predicting_Student_Dropout_a_Machine_Learning_Approach (German university)
* https://md.kif.rocks/Studierenerfolgswahrscheinlichkeit#


== Mögliche Fragen zur Diskussion ==
AK-Leitung übernommen Ziel: Resolution ## Kurze Vorstellungsrunde Hochschule Karlsruhe, TU Kaiserslautern, Göttingen, Uni Bonn, HTWK Leipzig, Uni Tübingen, Hochschule Emden-Leer, TU Chemnitz, TH Mittelhessen, Wiesbaden HSRheinMain, Aachen, Uni Mainz, Hamburg, Bamberg, TU Dresden
* Ist das methodisch ok?
 
* Welche Auswirkungen hat das?
'''Motivation für AK-Teilnahme:''' * Machine Learning in Uni / Arbeit * Technische Motivation * Predictive Measuring / Datensammlung * Ethik * Folgen für Studierende * Realitätsabgleich / Einfluss von ML auf Alltag (u.a. Konkrete Nutzung bestehender Daten) * Erwartete Folgen (Diskriminierung? Chance?) * Rechtliche Auswirkungen, u.a. bzgl. d. Berufsfreiheit i.S.v. Art. 12 GG
* Kann es hilfreich sein so etwas zu wissen um Unterstützungsangebote zu forcieren?
 
* Wollen wir Studierende die Probleme mit ihrem Studium haben oder haben werden identifizieren um ihnen zu helfen? Wie würden wir dies einbetten in ein komplexes Feld von falscher Nutzung/Wirkung, Datenschutz und Nutzen?
'''Fragen''' * Sinnvoller Einsatz der ML Technik * Erwartbare Folgen * Methodische Ansätze * Auswirkungen * Unterstützung forcieren * Wirkung-Datenschutz-Nutzen * Machine-Learning erforderlich? -> Was wollen wir überhaupt?
* Braucht man dafür ML, oder ist das nur ein Hype?
 
=== Kurze Zussammenfassung von dem vorrangegangen Beitrag siehe Links ===
 
* Aufgrund von Noten in ersten beiden / bis zu drittem Semester Abbruchquote errechnen
* verpflichtende Beratungsgespräche
 
== Technische Umsetzung ==
 
* Definition Machine Learning (Deep Learning)
* Modell auf bestehenden Daten trainieren
* Testdaten einordnen
* Problematik: erforderliche Datenmenge nicht einfach zu erhalten
* Statistische Signifikanz der “Ergebnisse”
* Genauigkeit der Vorhersage nimmt durch zu exakte Zuordnung ab (Pattern Matching nicht zu spezifisch)
 
=== Welche Datenmengen wären erforderlich? ===
 
* 100000-500000 Datenpunkte erforderlich
* es gibt auch andere Ansichten (deutlich weniger Datenpunkte)
 
=== Erfoderlichkeit von ML für ein solches Verfahren ===
 
* Statistik: Regression anstelle von ML, sofern nur Noten betrachtet werden?
* bei Betrachtung von Noten vermutlich möglich, falls andere Datenmengen betrachtet werden vermutlich erforderlich (z.B. Mensa und Bib.-Besuche)
* Fallunterscheidung: ML vs. “reine Statistik” von Zielfall abhängig (Notwendigkeit der Unterscheidung wird angezweifelt, da ML im Grunde nur Statistik sei)
 
== Ethische Positionierung ==
 
* Wirtschaftliche Motivation für die Verwendung von ML (Studienabbrecher)
* Kontrahierende Positionen
* Weniger Geld in Studierende stecken, die das Studium abbrechen
* lehnt AK ab(?)
* Studieren über Regelstudienzeit hinaus kostet Uni Geld (in Niedersachsen) -> Lehre wird schlechter für alle
* Studierenden helfen, das Studium noch zu retten
* kann unintendierte Auswirkungen haben (Demotivation, Self-Fullfilling-Prophecy)
* jede Person soll selbst entscheiden, ob sie eine Prognose möchte (Opt-Out)
* Welche Daten sollen erhoben werden dürfen?
* in USA-Beispiel scheint ML sinnvoll (Daten auch bei Bewerbung schon vorhanden)
* Unterrepräsentierte Gruppen (Migrationshintergrund etc.) werden weiter diskriminiert
* Fraglich bei der Datenerhebung, welche Daten bezogen werden und wie diese interpretiert werden
* Datensammlung
* Problematik Helikoptereltern
* Fachschaftsengagement -> länger studieren
* Hessen: zwingendes Mentoring im Studienverlauf (bevor Drittsemestermodule geschrieben werden können)
* Vorschlag: Orientierungsprüfungen anstelle von anderen “Aussortierungsmechanismen”
* Mentoring verpflichtend
* Darf Wahrscheinlichkeit Grundlage für Entscheidung sein?
* Risikotstudierende erkennen und Mentoring anbieten, aber nicht
* Nutzung für automatische Aussortierung ausschließen
* Anfang des Verlaufs
* Wirtschaftliche Aspekte dürfen nicht in Vordergrund stehen, sondern Studierende
 
'''Motivationen zur Nutzung''' * bei Hochschule: Ablehnung der Erhebung von Daten * Ursachenforschung in Schule, in HS nicht sinnvoll * Gegenmeinung: in Verlauf des Studiums wird erst klar, ob Studiengang passt * Lehre * Wirtschatliche Motivation * lieber: positiven Einfluss vor Studium * Buddy-Programme für Ersties
 
'''Vertretbarkeit der Datenquellen''' * Datenerhebung * Sollen Daten für den Zweck erfasst werden, die bisher nicht erfasst wurden? (zusätzlich zu Noten, letztem Zeugnis, persönlichen Daten) * Nein (rechtlich auch kompliziert, zweckgebunden) + Ja * Sollen vorhandene Daten verwendet werden für Prediction? * Nein + Ja * Sollen Notendaten verwendet werden dürfen? * Ja mit Opt-Out (Opt-In schöner)
 
* Konsequenzen abgesehen von Gespräch werden abgelehnt
* Prüfungsordnung kann Pflichtgespräche beinhalten
* Studierende (bzw. Erwachsene?) nicht zwingen, etwas zu tun
* Frage stellen: “Willst Du eigentlich studieren, was Du studierst?
* Beratung grundsätzlich gut, Zwang diskutabel -> zu Glück zwingen?
* Mentoring durch ältere Studis
* ganz allgemein: Datenerhebung als Opt-In
* Personenbezogene Daten anonym verwenden
* Sozialer Druck == Regelstudienzeit
* Leute in zweitem Semester kennen Angebote nicht
 
'''Gespräch mit wem? Wozu?''' * Ablehnung von Zwangsgesprächen

Aktuelle Version vom 6. November 2018, 16:52 Uhr

Anmerkung: die meisten Aussagen wurden nicht abgestimmt, sondern nur einzeln geäußert.

Links: https://www.jmwiarda.de/2018/06/21/algorithmus-enthusiasmus/ https://www.jmwiarda.de/2018/06/26/algorithmus-enthusiasmus/ https://arxiv.org/abs/1606.06364 https://www.researchgate.net/publication/322919234_Predicting_Student_Dropout_a_Machine_Learning_Approach

Protokoll[Bearbeiten]

AK-Leitung übernommen Ziel: Resolution ## Kurze Vorstellungsrunde Hochschule Karlsruhe, TU Kaiserslautern, Göttingen, Uni Bonn, HTWK Leipzig, Uni Tübingen, Hochschule Emden-Leer, TU Chemnitz, TH Mittelhessen, Wiesbaden HSRheinMain, Aachen, Uni Mainz, Hamburg, Bamberg, TU Dresden

Motivation für AK-Teilnahme: * Machine Learning in Uni / Arbeit * Technische Motivation * Predictive Measuring / Datensammlung * Ethik * Folgen für Studierende * Realitätsabgleich / Einfluss von ML auf Alltag (u.a. Konkrete Nutzung bestehender Daten) * Erwartete Folgen (Diskriminierung? Chance?) * Rechtliche Auswirkungen, u.a. bzgl. d. Berufsfreiheit i.S.v. Art. 12 GG

Fragen * Sinnvoller Einsatz der ML Technik * Erwartbare Folgen * Methodische Ansätze * Auswirkungen * Unterstützung forcieren * Wirkung-Datenschutz-Nutzen * Machine-Learning erforderlich? -> Was wollen wir überhaupt?

Kurze Zussammenfassung von dem vorrangegangen Beitrag siehe Links[Bearbeiten]

  • Aufgrund von Noten in ersten beiden / bis zu drittem Semester Abbruchquote errechnen
  • verpflichtende Beratungsgespräche

Technische Umsetzung[Bearbeiten]

  • Definition Machine Learning (Deep Learning)
  • Modell auf bestehenden Daten trainieren
  • Testdaten einordnen
  • Problematik: erforderliche Datenmenge nicht einfach zu erhalten
  • Statistische Signifikanz der “Ergebnisse”
  • Genauigkeit der Vorhersage nimmt durch zu exakte Zuordnung ab (Pattern Matching nicht zu spezifisch)

Welche Datenmengen wären erforderlich?[Bearbeiten]

  • 100000-500000 Datenpunkte erforderlich
  • es gibt auch andere Ansichten (deutlich weniger Datenpunkte)

Erfoderlichkeit von ML für ein solches Verfahren[Bearbeiten]

  • Statistik: Regression anstelle von ML, sofern nur Noten betrachtet werden?
  • bei Betrachtung von Noten vermutlich möglich, falls andere Datenmengen betrachtet werden vermutlich erforderlich (z.B. Mensa und Bib.-Besuche)
  • Fallunterscheidung: ML vs. “reine Statistik” von Zielfall abhängig (Notwendigkeit der Unterscheidung wird angezweifelt, da ML im Grunde nur Statistik sei)

Ethische Positionierung[Bearbeiten]

  • Wirtschaftliche Motivation für die Verwendung von ML (Studienabbrecher)
  • Kontrahierende Positionen
  • Weniger Geld in Studierende stecken, die das Studium abbrechen
  • lehnt AK ab(?)
  • Studieren über Regelstudienzeit hinaus kostet Uni Geld (in Niedersachsen) -> Lehre wird schlechter für alle
  • Studierenden helfen, das Studium noch zu retten
  • kann unintendierte Auswirkungen haben (Demotivation, Self-Fullfilling-Prophecy)
  • jede Person soll selbst entscheiden, ob sie eine Prognose möchte (Opt-Out)
  • Welche Daten sollen erhoben werden dürfen?
  • in USA-Beispiel scheint ML sinnvoll (Daten auch bei Bewerbung schon vorhanden)
  • Unterrepräsentierte Gruppen (Migrationshintergrund etc.) werden weiter diskriminiert
  • Fraglich bei der Datenerhebung, welche Daten bezogen werden und wie diese interpretiert werden
  • Datensammlung
  • Problematik Helikoptereltern
  • Fachschaftsengagement -> länger studieren
  • Hessen: zwingendes Mentoring im Studienverlauf (bevor Drittsemestermodule geschrieben werden können)
  • Vorschlag: Orientierungsprüfungen anstelle von anderen “Aussortierungsmechanismen”
  • Mentoring verpflichtend
  • Darf Wahrscheinlichkeit Grundlage für Entscheidung sein?
  • Risikotstudierende erkennen und Mentoring anbieten, aber nicht
  • Nutzung für automatische Aussortierung ausschließen
  • Anfang des Verlaufs
  • Wirtschaftliche Aspekte dürfen nicht in Vordergrund stehen, sondern Studierende

Motivationen zur Nutzung * bei Hochschule: Ablehnung der Erhebung von Daten * Ursachenforschung in Schule, in HS nicht sinnvoll * Gegenmeinung: in Verlauf des Studiums wird erst klar, ob Studiengang passt * Lehre * Wirtschatliche Motivation * lieber: positiven Einfluss vor Studium * Buddy-Programme für Ersties

Vertretbarkeit der Datenquellen * Datenerhebung * Sollen Daten für den Zweck erfasst werden, die bisher nicht erfasst wurden? (zusätzlich zu Noten, letztem Zeugnis, persönlichen Daten) * Nein (rechtlich auch kompliziert, zweckgebunden) + Ja * Sollen vorhandene Daten verwendet werden für Prediction? * Nein + Ja * Sollen Notendaten verwendet werden dürfen? * Ja mit Opt-Out (Opt-In schöner)

  • Konsequenzen abgesehen von Gespräch werden abgelehnt
  • Prüfungsordnung kann Pflichtgespräche beinhalten
  • Studierende (bzw. Erwachsene?) nicht zwingen, etwas zu tun
  • Frage stellen: “Willst Du eigentlich studieren, was Du studierst?”
  • Beratung grundsätzlich gut, Zwang diskutabel -> zu Glück zwingen?
  • Mentoring durch ältere Studis
  • ganz allgemein: Datenerhebung als Opt-In
  • Personenbezogene Daten anonym verwenden
  • Sozialer Druck == Regelstudienzeit
  • Leute in zweitem Semester kennen Angebote nicht

Gespräch mit wem? Wozu? * Ablehnung von Zwangsgesprächen