sprachreif 4, Schulbuch

8 Datensätzen nach Mustern suchen. Die zweite hört auf den Namen tiefe neuronale Netze ( deep neural networks , DNN); diese versuchen, die Ar- beitsweise des Gehirns mit seinen vielfältigen Verbindungen in einer Soware zu imitieren. Beide Techniken laufen darauf hinaus, dass Computer auf ähnliche Art lernen, wie es ver- mutlich auch Menschen tun. Damit aber, so hat Joanna Bryson zusammen mit der Informatike- rin Aylin Caliskan von der Princeton University gezeigt, schnappen die Maschinen auch aller- hand typisch menschliche Vorurteile, Stereotype und diskriminierende Ansichten auf. Wie genau die neuronalen Netze jeweils zu ihren Schlüssen kommen, lässt sich kaum nachvollzie- hen. Für Forscher sind sie weitgehend eine Blackbox. Zumindest aber kann man ihnen beim Lernvorgang zusehen. Füttert man eine Maschi- ne mit Texten, damit sie sich daraus die mensch- liche Sprache erschließt, geht sie nach Byrons £eorie ganz ähnlich vor wie kleine Kinder: Die lernen keine De©nitionen, sondern versuchen, die Bedeutung von Wörtern und Sätzen aus dem Zusammenhang zu erfassen. Je mehr Vergleichs- text vorliegt, desto besser. Für die Maschinen ist dank des Internets der Nachschub quasi endlos – das lädt aber auch zu Fehlschlüssen ein. So hätten frühere, regelbasierte Verfahren für Computerdolmetscher etwa das Wort compatri- otes wörtlich übersetzt (es existiert sogar buch- staben- und sinngleich im Englischen). Dagegen sucht die neue Technik nach einer Bedeutung, indem sie große Datenmengen vergleicht. Sie er- zeugt sozusagen Semantik per Statistik. Und sta- tistisch gilt für die Mehrheit aller Präsidentenan- sprachen: Wenn darin der Satz „Liebe XY, vielen Dank für Ihr Vertrauen“ vorkommt, steht XY meist für die Wörter „ fellow Americans “, ameri- kanische Mitbürger. Denn fast jede Rede eines US-Präsidenten beginnt mit dieser Floskel. Schlecht bezahlte Jobs werden automatisch Frauen zugeordnet, gut bezahlte Männern Bliebe es bei solchen gelegentlichen Kuriositäten, könnte man diese den Maschinen noch nachse- hen. Denn insgesamt ist die maschinelle Über- setzung deutlich besser geworden. Aber hier geht es um mehr. Und ein Blick in die Vorurteils- forschung hil, zu verstehen, was an der Sache heikel ist. Um unbewusste Vorurteile bei Menschen zu un- tersuchen, bedienen sich Psychologen für ge- wöhnlich des sogenannten Implicit Associations Test (IAT). Dieser misst, wie lange ein Proband benötigt, um zwei Begri e miteinander in Ver- bindung zu bringen. Kommen ihm deren Bedeu- tungen ähnlich vor, ist die Reaktionszeit kürzer, als wenn ihm die dahinterstehenden Konzepte semantisch inkompatibel erscheinen. So assozi- ieren Menschen etwa Blumennamen eher mit Adjektiven wie „schön“ oder „hübsch“, Insekten dagegen eher mit negativen Begri en. Informatiker können zeigen, dass Maschinen ganz ähnliche Assoziationen produzieren. Sicht- bar werden sie im sogenannten Word-to-Vec- Verfahren, das Bryson gewissermaßen als ma- schinelle Variante des IAT nutzt. Dieses Verfahren ist üblich in der Computerlinguistik, um Semantik zu erfassen: Wörter werden danach sortiert, welche anderen Wörter häu©g in ihrem Umfeld auauchen. Klingt abstrakt? Ein Aufsatz vonWissenschalern der Boston University und Forschern bei Microsoft Research bringt das Problem schon im Titel auf den Punkt: Man is to Computer Programmer as Women is to Homema- ker – „Mann verhält sich zu Programmierer wie Frau zu Haushaltshilfe“. Der im vergangenen Jahr verö entlichte Aufsatz wird seit Monaten unter Computerlinguisten heftig diskutiert. Zeigt er doch, dass die Algorithmen nach der statistischen Auswertung menschlicher Texte ein altmodisches Rollenbild reproduzieren. Anhand vieler solcher Beispiele haben Bryson und Caliskan untersucht, wie sich das Weltbild der Maschinen zusammensetzt. Sie fanden dabei unter anderem heraus, dass die künstliche Intelligenz Blumen ebenso wie europäisch-ame- rikanische Vornamen mit positiven Begriffen assoziiert, wohingegen Insekten genau wie afro- amerikanische Namen eher mit negativen Be- gri en verbunden werden. Die Namen junger Menschen werden eher als unangenehm einge- stu. Und vor allem: Männliche Namen werden semantisch automatisch in die Nähe von Karrie- rebegri en gerückt, weibliche Namen hingegen eher mit Familie assoziiert. Ebenso wird Mathe- matik mehr mit Männern in Verbindung ge- bracht, Kunst mehr mit Frauen – die Maschinen denken also genauso in Rollenklischees wie 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 100 102 104 106 108 110 112 114 116 118 120 122 124 126 128 130 132 134 136 138 140 142 Text- kompetenz 1 Nur zu Prüfzwecken – Eigentum des Verlags öbv