Google Translate срещу Microsoft срещу IBM Watson срещу Yandex

Независимо дали искате да преведете цяла книга или само няколко статии на уебсайта си, единственият начин да постигнете 100% четим от хора текст е като преводач човек свърши работата вместо вас.

През повечето време това означава, че трябва да платите на някого на базата на дума. Например, ако искате да преведете английски на немски, ще платите някъде между 12 ¢/дума и 32 ¢/дума. Освен ако не превеждате олекотена детска книга, общите ви разходи може да станат непосилни.

Ако това беше 2010 г., дискусията щеше да приключи тук.

Добре дошли в ерата на AI и машинното обучение. През 2020 г. една машина все още не може да превежда толкова добре, колкото човек; въпреки това, една машина може просто да е в състояние да превежда достатъчно добре, за да бъде рентабилно интегрирането й в процеса на превод.

Най-евтиният начин за създаване на превод е като поставите едновременно машини и хора на задачата.

Първо подавате изходния текст към машина или API (интерфейс за програмиране на приложения). Машината връща машинно преведения текст.

След това предоставяте както изходния текст, така и превода на човешки преводач. Тяхната работа ще бъде да „хуманизират“ и редактират текста, така че да се чете така, сякаш го е написал човек.

За да бъде този процес икономически ефективен, на първо място машината трябва да върши добра работа. В противен случай човешкият преводач може да прекара повече време в редактиране, отколкото би прекарал в превод.

Тествах четирите основни API за превод, за да видя дали някой от тях върши достатъчно добра работа, за да работи този процес.

Също така бях любопитен да видя как API за превод се сравняват един с друг.

Тази статия ще отговори и на двата въпроса.

За да тествам API, взех два малки параграфа от книга (с разрешение от издателя). Важно е, че този текст и преводът му не са достъпни в интернет. Google обучава своя модел за машинно обучение за превод с публично достъпни преводи. Когато тествате модел, тестовата проба трябва да е извън обучителната проба.

По-долу ще намерите изображения на преводите на текста от немски на английски.‍

Гугъл преводач

Превод на текст на Microsoft

Езиков преводач IBM Watson

Yandex Translate

Справедливо е да се заключи, че API за превод на Google свърши по-добра работа от Microsoft, Watson и Yandex. Или, с други думи, нашият човешки редактор ще има по-малко работа предвид генерирания от Google превод.

Също така е честно да се каже, че редактирането на превода на Google ще отнеме по-малко време на преводача, отколкото да напише превод от нулата.

Обърнете внимание, че опитах само превод от немски на английски. Различните езици вероятно ще дадат различни резултати.

Първоначално публикувано на https://blog.fiveabook.com.