Гледајќи ја апликацијата АИ Мајкрософт за слепи лица сега и на германски - ДЕР Шпигел
Инвеститорот на Мајкрософт Сакиб Шаик

Фото: Елејн Томпсон/АП
Паметниот телефон чита рецепти, пишува фотографии од одмор и препознава пријатели на забави: пред две години Microsoft издаде дигитален придружник за лица со оштетен вид со апликацијата за iPhone „Seeing AI“. Од вторник, апликацијата е достапна на француски, шпански, холандски, јапонски и германски јазик, покрај англиската верзија.
Во интервју за Шпигел, Сакиб Шаик, главен развивач на апликацијата во Мајкрософт, објаснува кои нови функции на апликацијата се овозможени со вештачка интелигенција (АИ). Тој зборува за својата визија за дигитални придружници за лица со оштетен вид и слепи лица, но исто така и за проблемите со кои се соочуваат програмерите и зошто мора да бидете трпеливи за технологијата.
Сакиб Шеик Како главен развивач на Microsoft, тој е одговорен за апликацијата „Seeing AI“. Шаик го изгуби видот на седумгодишна возраст. Во Мајкрософт, тој помогна да се развијат пребарувачот Бинг и гласовниот асистент Кортана. Шеик сега првенствено се занимава со тоа како вештачката интелигенција може да им го олесни животот на луѓето со оштетен вид.
ОГЛЕДАЛО: Господине Шаик, пред 15 години прво сте имале идеја да развиете дигитален придружник за лица со оштетен вид. Вештачката интелигенција е технологијата што ја чекавте?
Шеик: Направивме огромни чекори во истражувањето со вештачката интелигенција. Но, многу години сме далеку од компјутерите што разгледуваат и разбираат сè што гледаат. Јас сум слепа, па сакам да одам на прошетка со сопругата и пријателите. Потоа разговараме за тоа што тие гледаат на патот. Тие ми кажуваат кога ќе откријат нешто возбудливо, или прашувам дали не можам да доделам звук. Посакувам еден ден АИ да го стори токму тоа. Како личен асистент.
ОГЛЕДАЛО: Колку долго треба да почекаме додека дигиталните помагачи не ги заменат човечките придружници?
Шеик: Многу е тешко да се види во иднината. Само диво можам да шпекулирам. Не знам дали ќе бидат потребни уште две, три, четири или пет години. Толку многу се случува на терен. Секоја година има толку многу напредок од една страна, но од друга страна наидуваме и на исклучително големи предизвици. На пример, сè уште е многу тешко за АИ да препознае што точно прават луѓето во одредена ситуација.
ОГЛЕДАЛО: Во што е навистина вештачка интелигенција?
Шеик: Во изминатите неколку години, компјутерите неверојатно брзо научија да преземаат јасно дефинирани задачи од луѓето. Пред сè, тие подобро и подобро ги препознаваат сликите и јазикот. Вештачката интелигенција е најнапредна во овие области. Благодарение на оваа технологија, „Гледање на АИ“ може да се користи за допирање фотографии, на пример. За да го направите ова, корисникот го допира екранот на неговиот паметен телефон за да открие дали може да се види текст, лице или друг предмет под неговиот прст.
ОГЛЕДАЛО: Да се види препознавањето на текстот на АИ работи доста добро. Но, препознавањето на сцената сепак е крајно со недостатоци. Апликацијата ги збунува слајдовите на децата со хидрантите, тркалезните прозорци се толкуваат како знаци за стопирање и камени клупи стануваат надгробни споменици. Што е толку тешко за препознавање предмети?
Шеик: Вештачката интелигенција може да се сфати како тригодишно дете. Му покажувате многу слики и му кажувате: "Ова е автомобил. Ова е дрво. Ова е куче". На почетокот, детето препознава само работи што веќе ги виделе. Потоа започнува да се опишуваат овие работи со реченици. Како дете, вештачката интелигенција се подобрува со текот на времето. Научниците работат и на тоа да се осигурат дека методите за обука продолжуваат да се подобруваат.
ОГЛЕДАЛО: Сосема е одговорност да ги водите слепите лица и лицата со оштетен вид преку апликација.
Шеик: Да Но, тоа е истражувачки проект. Многу функции сè уште се многу експериментални. Како и да е, сакаме да им дадеме на корисниците можност да учествуваат во новоразвиените технологии на Microsoft што е можно порано. Имаме корист од фактот дека корисниците ни кажуваат што мислат за функциите. Ние ја развиваме апликацијата заедно со нашите клиенти.
ОГЛЕДАЛО: Дали им пречи на корисниците што апликацијата продолжува да греши?
Шеик: За некои, тоа не мора да биде совршено. На пример, еден корисник ми рече дека сака да испрати фотографии од одмор на неговото семејство дома. Дури и ако апликацијата не препознае сè точно, таа може барем да ги разликува фотографиите и да ги избере точните слики. Друг ми рече дека ја скенира областа за да види дали е достапна фотографија за Фејсбук. Груб опис на апликацијата му беше доволен. Друг ни рече дека ја користи апликацијата за снимање на телевизија на фудбалски игри за да го открие резултатот. Коментаторот премногу ретко го споменуваше средниот резултат. Другите скенираат конзерви за пијалоци за да разликуваат кола од диетална кола. Сите овие мали нешта ја прават апликацијата корисен придружник.
ОГЛЕДАЛО: Компаниите како Гугл и Фејсбук прават голема врева околу нивното истражување за АИ, победувајќи во дуели против шампиони и поразувајќи професионални играчи на покер. Што прави Мајкрософт во конкуренција за надмоќ на АИ?
Шеик: Гледаме многу потенцијал во АИ за подобрување на животот на луѓето со оштетен вид со „Видување на АИ“. Но, нашите колеги развиваат и алатки за нагло слух, на пример, за прикажување на преводи во реално време. Постојат и бројни други примери како „Очен поглед“, со кој можете да контролирате компјутер со Виндоус само со движењата на очите.