“ proč mají bílí lidé tenké rty?’Google a udržování stereotypů prostřednictvím automatického dokončování vyhledávacích formulářů

tento seznam návrhů automatického dokončování byl vygenerován dne 31. srpna 2011. Následné hledání stejného období produkoval mírně odlišné návrhy, což naznačuje, že Google neustále aktualizuje své algoritmy začlenit nové informace od uživatelů.

Frekvence identitu podmínky byly kontrolovány na 425 milionů eur slovo Korpusu Současné Americké angličtiny a 100 milionů slovo Britský Národní Korpus, který jsme cítili, že byli dobří zástupci dvou z nejvíce populárně použité odrůdy angličtiny on-line. Protože některé pojmy jako černá často neodkazovaly na identity, uvažovali jsme o množném čísle, které mělo tendenci kolektivizovat sociální skupiny. To nám pomohlo rozhodnout, na které skupiny se podíváme. Například odkazy na bílé a černé byly v obou korpusech vysoké, ačkoli Latinos a Asiaté měli nižší frekvenci, přičemž Latinos byl zvláště nízký v BNC (pouze 22 hitů). To nás vedlo k výběru Asiatů spíše než Latinos jako třetí etnický termín.

chtěli Jsme vyvolat alespoň 100 otázek pro každou skupinu, protože to by nám umožnilo diskutovat o výsledky v procentech, aniž by museli dělat to, co se pravděpodobně předpovědi o procenta, když tam jsou méně než 100 případů pracovat. Pouze 3 z 12 skupin vyprodukovaly méně než 100 otázek. Termín lidé (který vyvolal 70 otázek) byl naší kontrolní skupinou a pokusy najít jiné kontrolní slovo, jako jsou lidé nebo lidé, byly ještě méně produktivní. Dvě skupiny pro sexualitu (rovné a lesbické) také vyprodukovaly méně než 100 otázek. Nakonec jsme se rozhodli podívat se na tyto skupiny, protože jsme cítili, že je důležité je porovnat s homosexuály, i když bychom měli poznamenat, že menší velikost vzorku zde znamená, že při odvozování interpretací o těchto skupinách je třeba použít větší opatrnost.

Jako máme co do činění s velkým počtem skupin a kategorií, a pouze mezi 41 a 343 otázek pro každou skupinu, neměli jsme pocit, že provádění statistických testů na tato data nám umožní dělat sebevědomá prohlášení o význam. Mnoho buněk v tabulkách 4 a 5 je menší než pět, což je obvyklá minimální frekvence potřebná pro testy chí-kvadrát.

Google Must Censor Google Instant In Italy For Derogatory Suggestions

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.