Na skróty:

Przejdź bezpośrednio do treści (Alt 1) Przejdź bezpośrednio do menu głownego (Alt 2)

Obrazy i deformacje
Jak wyglądają normalni ludzie?

Co sprawia, że twarz jest normalna? W projekcie Normalizi.ng wykorzystano uczenie maszynowe, aby przeanalizować i zrozumieć, w jaki sposób decydujemy o tym, kto wygląda bardziej „normalnie”.
Co sprawia, że twarz jest normalna? W projekcie Normalizi.ng wykorzystano uczenie maszynowe, aby przeanalizować i zrozumieć, w jaki sposób decydujemy o tym, kto wygląda bardziej „normalnie”. | Fot. (fragment): © Normalizi.ng

Czym właściwie jest normalność? I co sprawia, że twarz jest normalna? Nasze mózgi analizują i klasyfikują każdą napotkaną twarz – nie jesteśmy w tym osamotnieni. Odrębna dyscyplina nauk technicznych bada te podświadome procesy poznawcze, tworząc z nich statystyczne normy. Uczenie maszynowe wykorzystuje rozpoznawanie twarzy nawet do systematyzowania i przewidywania ludzkich zachowań.

Mushon Zer-Aviv

Portret mówiony

W XIX wieku w Paryżu nastąpiły gwałtowne zmiany. Rewolucja przemysłowa skłoniła mieszkańców wsi do spróbowania szczęścia w wielkim mieście, co zapoczątkowało trwający do dziś proces urbanizacji. Zarówno rodowici paryżanie, jak i nowo przybyli po raz pierwszy znaleźli się w otoczeniu zupełnie obcych i nieznanych twarzy. Przemiany demograficzne oraz pogłębiająca się przepaść między burżuazją przemysłową a klasą robotniczą nadszarpnęły społeczną tkankę miasta. Zwiększający się dystans między mieszkańcami wzmagał poczucie strachu i przestępczość na ulicach. 

Powiedz nam, kim jesteś albo zrobi to twój portret. Od czasu wprowadzenia zdjęć policyjnych identyfikacja przestępców stała się znacznie łatwiejsza. Powiedz nam, kim jesteś albo zrobi to twój portret. Od czasu wprowadzenia zdjęć policyjnych identyfikacja przestępców stała się znacznie łatwiejsza. | Foto: © Tableau Synoptic des Traits Physionomiques: pour servir a l’étude du “Porträt Parlé”, by Alphonse Bertillon (1909) / public domain W dawnych czasach policjant zazwyczaj wiedział, kogo aresztuje, gdzie mieszka podejrzany i co powie matka na temat złego zachowania swojego dziecka. Wszystko to zmieniło się wraz z napływem nowych twarzy. Na posterunkach policji zaczęto dokumentować aresztowania za pomocą nowo powstałej fotografii, jednak zdjęcia szybko piętrzyły się w trudne do opanowania i nieprzydatne stosy. Młody paryski policjant, Alphonse Bertillon, postanowił zaprowadzić porządek w tym chaosie – rozpoczął standaryzację zdjęć policyjnych, wykonując aresztowanym portrety en face i z profilu oraz umieszczając je w standardowych kartotekach. Innymi słowy, wynalazł nowoczesne zdjęcia policyjne, będące do dziś powszechnym symbolem przestępczości. Następnie mierzył, oceniał oraz klasyfikował fizjonomię aresztowanych, uzupełniając ich kartoteki o dodatkowe cechy szczególne. Bertillon stworzył również system, który nazwał „portretem mówionym” (portrait parlé), czyli rysopis pozwalający zidentyfikować tożsamość, nawet gdy aresztowany nie chciał jej ujawnić. W tabeli wpisywał różne typy nosów, ust, oczu, uszu oraz rysów twarzy, dokonując ich systematycznej kategoryzacji.

Dla Bertillona była to po prostu technika indeksowania ułatwiająca rozpoznawanie aresztowanych. Rzeczywiście „system Bertillona” (znany również jako bertillonage) szybko rozprzestrzenił się w Europie i Stanach Zjednoczonych jako przełomowa, poparta naukowo metoda identyfikacji przestępców oparta na pomiarach antropometrycznych. Jednak już kilka lat później, ku rozczarowaniu francuskiego badacza, zastąpiono ją przez odciski palców, które okazały się znacznie prostsze i dokładniejsze.

Czym właściwie jest normalność?

Badania nad odciskami palców były jednym z wielu osiągnięć naukowych sir Francisa Galtona, wybitnego brytyjskiego intelektualisty i pioniera statystyki. Innym ważnym jego odkryciem był „rozkład normalny”. Naukowiec zauważył, że pozornie przypadkowe zjawiska często ujawniają rozkład prawdopodobieństwa wokół zakrzywionego szczytu w kształcie dzwonu – tzw. krzywej dzwonowej. Zjawiska te zwykle gromadzą się bliżej szczytu krzywej dzwonowej niż jej krawędzi.

Replika skrzynki Galtona: rozkład spadających fasolek zawsze odpowiada krzywej dzwonowej. Replika skrzynki Galtona. | Foto: © CC BY-SA 4.0 Galton zademonstrował to dość abstrakcyjne zjawisko statystyczne za pomocą osobliwego urządzenia, które przypominało automat do gry wypełniony fasolą. W górnej części deski fasolki były kierowane do pojedynczego otworu, a następnie trafiały na szereg gwoździ. Spadające fasolki odbijały się od nich na różne strony i ostatecznie lądowały w otworach rozmieszczonych równomiernie wzdłuż podstawy deski. Choć nie można było dokładnie przewidzieć, do których otworów wpadną poszczególne fasolki, ogólny rozkład zawsze wykazywał kształt krzywej dzwonowej. W środkowym otworze gromadziło się najwięcej fasolek, a po lewej i prawej stronie lądowało ich stosunkowo mniej. Ilościowe określenie rozkładu normalnego umożliwiło także ilościowe określenie odchyleń standardowych (SD), czyli stopnia rozproszenia w poszczególnych otworach. Niski poziom SD oznaczał, że otwory były bliższe normie (szczytu krzywej). W przypadku wyższego SD były one bardziej rozproszone, co zwiększało prawdopodobieństwo występowania anomalii.  

Dzięki tej praktycznej formule matematycznej kategoria normalności statystycznej stała się czymś więcej niż tylko standardem naukowym. Galton dążył do spojrzenia na każdy aspekt życia przez pryzmat statystyki, a jego koncepcja wkrótce znalazła zastosowanie również w innych dziedzinach. Przed jego odkryciami, pod koniec XIX wieku, bardzo rzadko używano słowa „normalny” na określenie zjawisk spoza nauk przyrodniczych. Jednocześnie samo pojęcie normalności szybko się upowszechniło, a dzięki pracom Émile’a Durkheima i innych socjologów przeniknęło do nauk społecznych i życia codziennego.

Twarz normalna czy odmienna? 

W 1893 roku Galton odwiedził laboratorium kryminalistyczne Bertillona, które wywarło na nim duże wrażenie. Nie interesowało go jednak, co wszystkie te narzędzia i metody mówią o odpowiedzialności za przestępstwa popełnione w przeszłości – bardziej ciekawiło go to, jak statystycznie przewidzieć przyszłe odchylenia od normy.

Fotografia przedstawiająca Francisa Galtona (w wieku 73 lat) i zapiski autorstwa Bertillona, wykonane podczas wizyty Galtona w laboratorium Bertillona w 1893 r. Fotografia przedstawiająca Francisa Galtona (w wieku 73 lat) i zapiski autorstwa Bertillona, wykonane podczas wizyty Galtona w laboratorium Bertillona w 1893 r. | Fot. © Wikipedia | domena publiczna Galton również poświęcił się systematycznemu badaniu fotografii portretowej. Zainspirowany odkryciami Bertillona dotyczącymi normalności statystycznej, opracował technikę portretu kompozytowego. Polegała ona na fotografowaniu różnych obiektów na tej samej kliszy przy niewielkim oświetleniu, dzięki czemu powstawał portret złożony. Galton tworzył zdjęcia kompozytowe oficerów armii i inżynierów królewskich, przestępców i osób chorych psychicznie, chcąc ustalić, jak wyglądają normalni ludzie oraz jak znaleźć i ostatecznie przewidzieć odchylenia standardowe w społeczeństwie.

Galton badał portrety przestępców i osób chorych psychicznie, aby dowiedzieć się, jak wyglądają normalni ludzie. Galton badał portrety przestępców i osób chorych psychicznie, aby dowiedzieć się, jak wyglądają normalni ludzie. | Fot. © Frontispiece of Inquiries into Human Faculty and its Development, Francis Galton (1883) | domena publiczna Dla Galtona statystyka była czymś więcej niż tylko intelektualnym ćwiczeniem; wierzył, że dzięki normalności statystycznej można stworzyć lepsze społeczeństwo. Założył ruch eugeniczny, który traktował ewolucję i dobór naturalny (przełomowe odkrycia naukowe dalszego kuzyna Galtona, Karola Darwina) nie jako analizę zmienności w przyrodzie, ale jako receptę na uzdrowienie społeczeństwa. Eugenicy pokroju Galtona uprawiali fizjonomikę – pseudonaukę polegającą na ocenianiu cech osobowości na podstawie wyglądu fizycznego. To tak, jakby oceniać książkę po okładce. Wykorzystywali oni klasyfikację fizjonomii oraz „datafikację” Bertillona (pomiar i zapis danych), aby analizować i przewidywać potencjalny wkład danej osoby w życie społeczne oraz jej wpływ na pulę genów przyszłych pokoleń. Eugenicy twierdzili, że to natura, a nie wychowanie (lub Bóg), decyduje o przeznaczeniu, dlatego gwarantem rozwoju ludzkości byłoby zachowanie czystości dziedzictwa i uniemożliwienie rozmnażania się tym, którzy odbiegają od normy. Wkrótce polityka eugeniczna rozprzestrzeniła się w całej Europie Zachodniej i Wielkiej Brytanii, jednak to amerykańscy eugenicy jako pierwsi uchwalili ustawy sterylizacyjne, aby zakazać osobom niepełnosprawnym posiadania dzieci.

Sam Bertillon nigdy nie chciał, aby jego technologię wykorzystywano w ten sposób. Odnosząc się do naukowych teorii rasizmu włoskiego kryminologa Cesare Lombroso, powiedział: „Nie. Nie jestem przekonany, że brak symetrii twarzy, wielkość oczodołów czy kształt szczęki czynią z człowieka złoczyńcę”. W swoim laboratorium kryminalistycznym widział wiele twarzy, dlatego argumentował, że wada wzroku wcale nie świadczy o tym, że dana osoba urodziła się przestępcą, lecz o tym, że przez swój słaby wzrok miała prawdopodobnie niewielkie szanse na rynku pracy.

Bertillon przedstawiał ciało w formie danych, aby identyfikować i zestawiać przeszłe zachowania, a nie w celu ich przewidywania czy prognozowania. Jednak to właśnie gromadzenie danych oraz kategoryzowanie zachowań i cech osobowych umożliwiły zarówno identyfikację sądową, jak i prognozowanie statystyczne. Rasizm naukowy i fizjonomika w dużym stopniu wpłynęły na kształt XX wieku. W Mein Kampf Adolf Hitler odnosił się do amerykańskiej eugeniki, upatrując w niej podstaw dla rozwoju tego, co Niemcy przekształcili później w eugenikę nazistowską. Tego rodzaju sposób myślenia i praktyki osiągnęły swoje straszliwe apogeum w postaci masowych eksterminacji i ludobójstwa Żydów, Romów, homoseksualistów, osób niepełnosprawnych i innych, których uznano za odbiegających od standardowego wyglądu rasy aryjskiej. Po klęsce nazistów w II wojnie światowej idee fizjonomiki i rasizmu naukowego spotkały się międzynarodowym potępieniem. W następnych latach zostały uśpione, ale nie zniknęły całkowicie, ponieważ były głęboko zakorzenione w tradycji statystycznej normalności.

Portret znów przemawia

Analiza twarzy przeżywa swój wielki powrót w drugiej dekadzie XXI wieku dzięki gwałtownemu rozwojowi statystyki wspomaganej komputerowo. Dzisiejsi analitycy danych (data scientists) są bezpośrednimi intelektualnymi potomkami XIX-wiecznych pionierów statystyki i datafikacji. Niektórzy z nich koncentrują się na identyfikacji osób, uaktualniając dokonania Bertillona w dziedzinie kryminalistyki poprzez porównywanie starych i nowych danych. Inni, jak Galton, skupiają się na analizie, próbując statystycznie przewidywać przyszłe zachowania na podstawie wzorców z przeszłości. Coraz częściej łączy się identyfikację i przewidywanie, aby jak najlepiej wykorzystać nowe technologie. Na przykład w listopadzie 2021 roku, po naciskach ze strony organów regulacyjnych, Facebook ogłosił, że zaprzestanie używać systemu rozpoznawania twarzy swoich użytkowników na podstawie zdjęć. Firma zapowiedziała, że wpłynie to na usługę „automatycznego tekstu alternatywnego”, która analizuje obrazy w celu automatycznego opisu ich zawartości za pomocą tekstu.
W centrach obliczeniowych gromadzi się coraz więcej danych. Tworzą one szczegółowe portrety naszych zachowań, które zasilają algorytmiczne prognozy. Podobnie jak w przypadku portretów kompozytowych Galtona, obraz normalnego zachowania tworzą nałożone na siebie wzorce różnych osób. Każda informacja przechodzi przez algorytmiczne czarne skrzynki, aby ostatecznie wylądować w „krzywej dzwonowej” przyszłych znormalizowanych zachowań. Normalizacja w oparciu o dane staje się samospełniającą się przepowiednią. Nie tylko przewiduje, ale i dyktuje przyszłość. Najbezpieczniej jest obstawiać przewidywaną ścieżkę; stawianie na odchylenia wiąże się z ryzykiem finansowym, kulturowym, a czasem także politycznym. W ten sposób prognozy oparte na danych normalizują przeszłość i zapobiegają zmianom. Algorytmy uczenia maszynowego są zatem z założenia konserwatywne: mogą przewidywać jedynie to, jak będą powtarzać się wzorce z przeszłości, ale nie to, jak będą się rozwijać.   
Dyskurs na temat prywatności w sieci wciąż wpływa na dyskusję o prawie jednostki do utajniania swoich przeszłych aktywności. Dzisiejsze algorytmiczne aparaty nadzoru niekoniecznie jednak są zainteresowane naszą przeszłością. Najbardziej interesuje je obraz wyłaniający się z naszych portretów kompozytowych, czyli ten, który wyznacza drogę normalności, a odchylenia od niej traktuje jako podejrzane.

Cyfrowa normalizacja

Podobnie jak maszyny, my również nieustannie kategoryzujemy nieznane twarze. Wychwytujemy, klasyfikujemy i analizujemy cechy fizjonomiczne napotkanych osób. Ale czy zdajemy sobie sprawę z naszych codziennych uprzedzeń oraz tego, w jaki sposób nieustannie definiujemy, co jest normalne, a co nie? Jak kategoryzujemy ludzi i jak sami jesteśmy kategoryzowani? Temu właśnie poświęcona jest internetowa platforma Normalizi.ng. To eksperymentalny projekt badawczy wykorzystujący uczenie maszynowe, który pomaga przeanalizować i zrozumieć, w jaki sposób decydujemy o tym, kto wygląda bardziej „normalnie”.

Osoby uczestniczące w projekcie Normalizi.ng przechodzą przez trzy etapy charakterystyczne dla analizy statystycznej. W pierwszym etapie – capture (pozyskanie danych) – uczestnicy są proszeni o umieszczenie twarzy w ramce i zrobienie sobie zdjęcia. W drugim etapie – classify (klasyfikacja) – oglądają zdjęcia wcześniej zarejestrowanych uczestników. Następnie przesuwają w prawo lub w lewo, aby wybrać jedno z dwóch zdjęć, decydując który nos, które usta, która para oczu i która twarz wygląda bardziej „normalnie”. W trzecim etapie – analyse (analiza) – algorytm bada twarze uczestników i ich decyzje normalizacyjne. Podobnie jak w przypadku systemu Bertillona, są one zapisywane na karcie z dynamicznymi wartościami normalizacji. Twarze badanych są następnie dodawane do algorytmicznej mapy normalności inspirowanej „portretem mówionym”.

The Normalizi.ng Map The Normalizi.ng Map | The Normalizi.ng Map Twarze o podobnych cechach grupowane są na dwuwymiarowej siatce za pomocą analizy algorytmicznej. Im wyższy stopień normalności, tym grubsza ramka portretu. W miarę dołączania kolejnych uczestników algorytm co godzinę aktualizuje mapę. Za każdym razem jednak dwie główne zbiorowości na mapie są wyraźnie oznaczone jako kobiety i mężczyźni. Pozostałe grupy tworzą się na obrzeżach: grupa ciemnoskórych (często skupiająca zarówno mężczyzn, jak i kobiety), Azjatów (czasami stopniowo przechodząca w grupę Latynosów), dzieci, seniorów, brodaczy... Co ciekawe, równomiernie na mapie rozmieszczone są twarze z maseczkami. Choć mapy są stale aktualizowane, powtarzają i wzmacniają klasyfikację. Pokazuje to, jak systematyczna dyskryminacja – ze względu na płeć, kolor skóry, wiek czy fryzurę – dokonująca się dziś na całym świecie, wygodnie skrywa się za „obiektywną” czarną skrzynką sztucznej inteligencji.

Nieznajome twarze powodują, że Paryż oraz wiele innych metropolii są tak ekscytujące i różnorodne. Paryż już nigdy nie będzie małym, jednorodnym miastem. Internet też nie. Algorytm to policjant, który widzi cię jedynie przez pryzmat stereotypów, nie zna cię osobiście i nigdy nie porozmawia z twoją matką. Zatrzymajmy się i zadajmy sobie pytanie: czy to właśnie chcemy systematyzować, automatyzować, wzmacniać? I czy normalność w ogóle powinna podlegać nadzorowi?    
 



Panel dyskusyjny (Mis)Reading Human Emotions z udziałem Mushona Zer-Aviva podczas Festiwalu When Machines Dream the Future