Polski system przeczyta osobom niedowidzącym napisy z otoczenia

infotrans
02.01.2019 13:34

SystemToucan Eye, który rozpozna w otoczeniu napisy czy symbole i przeczyta je osobomniedowidzącym, opracowują polscy innowatorzy. Do dyspozycji użytkownika będziekamerka umieszczona w urządzeniu przypominającym słuchawkę bluetooth.

WPolsce jest ok. 500 tys. osób niedowidzących. To osoby, które widzą konturyobiektów, ale nie widzą szczegółów– mówi w rozmowie z PAP Radosław Zdunek z polskiej firmy Toucan Systems.Opowiada, że takie osoby zdane były dotąd na pomoc innych osób np. naprzystanku, kiedy trzeba było rozpoznać numer zbliżającego się autobusu. Albonp. w urzędzie, kiedy szukały odpowiedniego okienka. Albo w restauracji czysklepie, kiedy nie były w stanie samodzielnie zapoznać się z menu czy z cenąproduktu. Nie mówiąc już o znalezieniu toalety.

Tymczasem nowe technologie dają takimosobom możliwość bycia niezależnymi od przypadkowych przechodniów. Firma ToucanSystems przy wsparciu z Narodowego Centrum Badań i Rozwoju pracuje nad systememToucan Eye. Pierwsze urządzenia polskiej firmy pojawić się mają na rynku podkoniec 2019 roku.

Użytkowniknaszego urządzenia nie będzie się wyróżniać w tłumie – opowiada Radosław Zdunek. Wyjaśnia, żeurządzenie wyglądać będzie jak zwykła słuchawka bluetooth zakładana na ucho.Słuchawka ta jednak wyposażona będzie w niewidoczną na pierwszy rzut okakamerkę. Połączona będzie bezprzewodowo z mobilnym komputerem wielkoścismartfonu, który zmieści się w kieszeni czy torebce.

Tam algorytmy sztucznej inteligencji (AI)przeczesywać będą obraz z kamery w poszukiwaniu napisów i symboli, a odczytanynapis przetworzą na ludzką mowę i prześlą informacje do słuchawki. Użytkownikbędzie też mógł zawęzić obszar poszukiwań i wskazać gestem ręki obszar, wktórym znajduje się interesujący go napis.

Napoczątku wydawało nam się, że nasze urządzenie przyda się bardziej osobomniewidomym. Z konsultacji w Polskim Związku Niewidomych wynikło jednak, żebardziej naszym rozwiązaniem zainteresowane byłyby osoby niedowidzące, które -w porównaniu z osobami niewidomymi – znacznie rzadziej poruszają się wtowarzystwie przewodnika– opowiada Radosław Zdunek.

Toucan AI pracować będzie offline -wszystkie obliczenia będą wykonywane w przenośnym urządzeniu. Użytkownik niebędzie się więc musiał zastanawiać czy w miejscu, do którego idzie jest zasięgsieci komórkowej. A przy wyjeździe za granicę nie będzie musiał się martwić owysokość rachunku za korzystanie z internetu. Zależało nam na tym, by użytkownik mógł zawsze i wszędzie na Toucan AIpolegać. Tak jak i na innych urządzeniach dla osób z dysfunkcjami – mówi.

Radosław Zdunek wyjaśnia, że największymwyzwaniem w pracy nad urządzeniem jest opracowanie algorytmu, który napisy isymbole – np. oznaczenie toalety – rozpoznawać będzie w przeróżnych warunkach. Problemem jest to, że w przestrzenipublicznej funkcjonuje wiele różnego rodzaju czcionek. Jedne są ozdobne, innepochylone w lewo czy w prawo. Czasem litery ustawione w pionie – jedna poddrugą – inne pod skosem… W dodatku kamera widzieć je będzie pod różnym kątemi w różnych warunkach oświetleniowych. A w zapisie pojawiać się będzie szum.Odczytywanie takich napisów to złożony problem – opowiada.

Początkowo urządzenie rozpoznawać manapisy w języku polskim. Z czasem firma chce też wprowadzić wersję dla językaangielskiego.

Dotądtylko jedna firma na świecie opracowała podobny system. Będziemy z niąkonkurowali w aspekcie skuteczności” – zapewnia Zdunek. Zapowiada, żepolski produkt ma być tańszy i skuteczniejszy w rozpoznawaniu obiektów niżprodukt dostępny już na rynku.

Twórcy Toucan Eye szacują, że jednoładowanie powinno wystarczyć na osiem godzin ciągłej pracy ich urządzenia.Radosław Zdunek jednak zwraca uwagę: Kiedyidziemy ulicą, nie interesują nas przecież wszystkie napisy, które mijamy.Użytkownik będzie więc włączał system w określonych miejscach – opowiadainnowator. Wciskając guziki na komputerku użytkownik przekaże więc urządzeniu,że potrzebuje pomocy i określi, w jakim typie scenerii się znajduje. Inny trybpracy urządzenia będzie bowiem potrzebny w kawiarni, a inny – na przystankuautobusowym.

Dopiero kolejne wersje urządzenia będą wstanie same – analizując obraz – ustalić kontekst – czy to wnętrze (gdzienależy szukać małych literek w niedużej odległości od kamery), czy może otwartaprzestrzeń (gdzie napisów szuka się daleko).