” Why do white people have thin lips?”Google i utrwalanie stereotypów za pomocą formularzy wyszukiwania auto-complete

Ta lista propozycji Auto-complete została wygenerowana w dniu 31 sierpnia 2011. Kolejne wyszukiwania tego samego terminu przyniosły nieco inne sugestie, wskazując, że Google stale aktualizuje swoje algorytmy, aby włączyć nowe informacje od użytkowników.

częstotliwości pojęć tożsamości zostały sprawdzone w 425-milionowym korpusie wyrazów współczesnego amerykańskiego angielskiego i 100-milionowym brytyjskim korpusie Narodowym, które uważaliśmy za dobrych przedstawicieli dwóch najpopularniejszych odmian języka angielskiego online. Ponieważ niektóre terminy, takie jak czarny, często nie odnosiły się do tożsamości, rozważaliśmy liczby mnogie, które miały tendencję do bardziej kolektywizacji grup społecznych. Pomogło nam to zdecydować, na które Grupy się przyjrzeć. Na przykład, odniesienia do białych i czarnych były wysokie w obu korpusach, chociaż Latynosi i Azjaci mieli niższą częstotliwość, a Latynosi byli szczególnie nisko w BNC (tylko 22 trafienia). To doprowadziło nas do wyboru Azjatów zamiast Latynosów jako trzeci termin etniczny.

chcieliśmy uzyskać co najmniej 100 pytań dla każdej grupy, ponieważ pozwoliłoby nam to omówić wyniki w ujęciu procentowym bez konieczności przewidywania procentów, gdy jest mniej niż 100 przypadków do pracy. Tylko 3 z 12 grup odpowiedziały na mniej niż 100 pytań. Termin ludzie (który wywołał 70 pytań) był naszą grupą kontrolną, a próby znalezienia innego słowa kontrolnego, takiego jak ludzie lub ludzie, były jeszcze mniej produktywne. Dwie grupy zajmujące się seksualnością (heteroseksualna i Lesbijska) również stworzyły mniej niż 100 pytań. Ostatecznie zdecydowaliśmy się przyjrzeć tym grupom, ponieważ uznaliśmy, że ważne jest porównanie ich z gejami, chociaż powinniśmy zauważyć, że mniejszy rozmiar próby oznacza, że należy zachować większą ostrożność podczas interpretowania tych grup.

ponieważ mamy do czynienia z dużą liczbą grup i kategorii i mamy tylko od 41 do 343 pytań dla każdej grupy, nie czuliśmy, że przeprowadzenie testów statystycznych na tych danych pozwoli nam na pewne stwierdzenie znaczenia. Wiele komórek w tabelach 4 i 5 jest mniejszych niż pięć, co jest zwykle minimalną częstotliwością wymaganą do testów chi-kwadrat.

Google Must Censor Google Instant In Italy For Derogatory Suggestions

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.