Gdy użytkownicy Facebooka przeglądają aktualności na swoim profilu, znajdują tam wszelkiego rodzaju treści – artykuły, komentarze znajomych, zaproszenia na wydarzenia i oczywiście zdjęcia. Większość ludzi jest w stanie od razu zobaczyć, co jest na tych zdjęciach, czy to członek ich rodziny, łódź na rzece czy obraz występującego na scenie zespołu muzycznego. Wielu użytkowników niewidomych i słabowidzących może również zobaczyć te zdjęcia, pod warunkiem, że są one oznaczone tzw. opisem alternatywnym. Czytnik ekranu może opisywać zawartość obrazów za pomocą syntetycznego głosu i tym samym umożliwić osobom z dysfunkcją wzroku zrozumienie tego, co się znajduje na zdjęciach w ich aktualnościach.
Niestety, wiele zdjęć jest publikowanych bez tekstu alternatywnego, dlatego w 2016 roku Facebook wprowadził nową technologię zwaną automatycznym tekstem alternatywnym (AAT). AAT – który został wyróżniony w 2018 roku nagrodą Helen Keller Achievement Award od American Foundation for the Blind – wykorzystuje rozpoznawanie obiektów do generowania opisów zdjęć na żądanie, aby osoby niewidome lub niedowidzące mogły w pełni cieszyć się swoim kanałem informacyjnym. Od tego czasu jest on ulepszany i właśnie teraz Facebook prezentuje następną generację AAT.
Najnowsza wersja AAT jest efektem wielu postępów technologicznych, które poprawiają jakość zdjęć dla użytkowników. Przede wszystkim zwiększono liczbę pojęć, które AAT może niezawodnie wykryć i zidentyfikować na zdjęciu ponad 10-krotnie, co z kolei oznacza mniej zdjęć bez opisu. Opisy są również bardziej szczegółowe i umożliwiają identyfikację działań, punktów orientacyjnych, rodzajów zwierząt itd. – na przykład „Może to być selfie 2 osób na świeżym powietrzu lub Krzywa Wieża w Pizie”.
Jak twierdzi Facebook, to właśnie ten portal społecznościowy jako pierwszy na świecie wprowadził możliwość umieszczenia na zdjęciu informacji o położeniu i względnym rozmiarze elementów. Zamiast więc opisywać zawartość zdjęcia jako „Może to być zdjęcie 5 osób”, możemy określić, że na środku zdjęcia znajdują się dwie osoby, a trzy inne są rozrzucone w kierunku krawędzi.
Podsumowując, te ulepszenia pomagają użytkownikom niewidomym lub niedowidzącym lepiej zrozumieć, co znajduje się na zdjęciach opublikowanych przez ich rodzinę i znajomych – oraz na ich własnych zdjęciach – poprzez dostarczanie większej ilości (i bardziej szczegółowych) informacji.
Źródło: Facebook NewsRoom