Facebook aktualizuje opcję alternatywnego tekstu do zdjęć, która ma pomagać użytkownikom niewidomym lub niedowidzącym w odbiorze treści wizualnych na platformie. Serwis wykorzysta sztuczną inteligencję do tworzenia opisów zdjęć i grafik. O zmianach Facebook informuje w swoim biurze prasowym.
Jak czytamy, serwis społecznościowy aktualizuje wprowadzoną w 2016 roku funkcję AAT (automatycznego tekstu alternatywnego) i zwiększa liczbę pojęć, które AAT może wykryć i zidentyfikować na zdjęci. Ma to sprawić, że opisy odczytywane osobom niedowidzącym lub niewidomym będą bardziej szczegółowe i umożliwią identyfikację np. działań, punktów orientacyjnych, gatunków zwierząt itd. To z kolei ma przyczynić się do tego, że w serwisie pozostanie coraz mniej obrazów, które nie zawierają treści pomocniczych.
Jak przypomina serwis, funkcja ATT wykorzystuje rozpoznawanie obiektów do generowania opisów zdjęć na żądanie – czytnik ekranu może opisywać zawartość publikowanych obrazów za pomocą syntetycznego głosu – aby osoby niewidome lub niedowidzące mogły jak najpełniej korzystać z treści w serwisie. Portal podkreśla, że ciągłe prace nad opcją pozwalają dostarczać tej grupie użytkowników szczegółowych informacji dotyczących grafik lub zdjęć. Czytamy m.in., że zamiast opisywać krajobraz słowami „może to być dom i góra”, Facebook może podkreślić, że góra jest głównym obiektem na podstawie tego, jak duża wydaje się w porównaniu z domem u swojej podstawy.
Źródło: about.fb.com
Dalej dowiadujemy się, że najnowsza aktualizacja wykorzystuje m.in. publiczne obrazy na Instagramie i ich hashtagi w wielu językach. Nowa koncepcja bierze też pod uwagę płeć, odcienie skóry i wiek. Czytamy, że powstałe w ten sposób modele są nie tylko dokładniejsze, lecz także uwzględniają uwarunkowania kulturowe i demograficzne.
Platforma wyjaśnia też, że rozmowy z użytkownikami korzystającymi z czytników ekranu pokazały, że najważniejsza jest dla nich dokładność – Facebook przyznaje, że w aktualizacji należy uwzględnić pewien margines błędu: dlatego każdy opis zaczyna się od słowa „może”, portal podkreśla też, że np. słowo „duży” może być mylące, ponieważ nawet mały obiekt może być duży, jeśli jest fotografowany z bliska, jednak dołożono wszelkich starań, by identyfikacja obiektów czy osób była jak najbardziej profesjonalna.
Serwis tłumaczy oprócz tego, że AAT używa prostych fraz dla swojego domyślnego opisu, zamiast długich zdań. Czytamy, że może nie jest to forma „poetycka”, ale na pewno funkcjonalna. Dodatkowo, jak podaje Facebook, opisy tekstu alternatywnego są dostępne w 45 różnych językach. (kd)