Google внедрила нейросеть для повышения точности перевода

Следи за нами на Facebook!

Как оказалось, машинное обучение — очень полезная вещь в сфере онлайн-переводчиков, но у него есть несколько слабых мест. Тенденция дословного перевода является одной из них и может привести к очень серьёзным проблемам.

Сотрудник отдела обработки естественного языка Google Якоб Ужкорит объяснил природу подобной проблемы в деталях на примере перевода двух предложений на английском языке:

I arrived at the bank after crossing the street.

I arrived at the bank after crossing the river.

Очевидно, «bank» означает разные объекты в каждом из предложений: в первом — финансовое учреждение, во втором — берег реки. Чтобы понять, какое именно значение имеется в виду, нужно дочитать предложение до конца, но алгоритм просто выбирает более популярный перевод слова (даже если он неправильный) и продолжает дословный перевод. Подобного сорта неоднозначности встречаются везде.

Можно попробовать полностью переписать предложение, но зачем тогда нужны онлайн-переводчики? Другой вариант — переобучить нейронную сеть. Перевод в таком случае осуществляется в два этапа. Если что-то неоднозначное встретилось во время первого прохода, то во время второго нужно попробовать исправить эту многозначность перевода.

G SUITE

ГУГЛ ИНСТРУМЕНТЫ ДЛЯ БИЗНЕСА

Google же предложила свой подход к решению — так называемый механизм внимания, встроенный в систему под названием Transformer. Она сопоставляет между собой слова предложения, чтобы узнать, как именно они влияют друг на друга, меняется ли смысл каждого отдельного слова в контексте полного предложения. При переводе на другой язык механизм вновь сопоставляет каждое слово каждому, уже добавленному в предложение.

Подобную идею использует, например, компания DeepL. Интересным «побочным» эффектом Transformer является машинная логика. Так как система даёт каждому слову оценку отношения ко всем другим словам, можно наблюдать, какие именно из них она считает связанными или потенциально связанными.

Google внедрила нейросеть для повышения точности перевода

Это ещё один пример неоднозначности. Слово «it» может относиться как к «animal», так и к «street», и лишь последнее слово ставит всё на свои места. Люди могут это определять с лёгкостью, но вот машинам ещё предстоит долгий путь к совершенству.

Источник: TechCrunch

ОБСЛУЖИВАНИЕ КОМПЬЮТЕРОВ, СЕРВЕРОВ, СЕТЕЙ (АУТСОРСИНГ)

Понравилась статья? Поделись!

Следи за нами на Facebook!

Еще статьи

5 кроків для захисту від “вірусів”: Облікові записи

Використання облікових записів При правельній побудові роботи ІТ-структури ви працюєте під обмеженним обліковим записом. Обліковий запис — це тип користувача в системі. Зазвичай використовують три типи: адміністратор, звичайний користувач і гість.

Подробнее

Sugar Community Edition 5.5.1

19 марта компания Sugarcrm объявила о выходе очередной версии - 5.5.1. В этой версии компания исправила ошибки которые накопились от версии 5.5, а также ввела следующие нововведения.

Подробнее

Google выпустила приложение Drive File Stream для Бизнеса

Гугл анонсировала запуск нового приложения для настольных компьютеров для Google Drive, назвали его Drive Stream, он доступен для G Suite пользователей. Приложение позиционируется как замена стандартного приложения Google Drive для настольных ПК, поддержку которого прекратят в следующем году, чтоб дать время бизнес пользователям для комфортного перехода.

Подробнее

Немного об IT Аутсорсинге для компании и о том как он работает

В наши дни, сотни, если не тысячи компаний используют аутсорсинг в какой-то степени, особенно если это касается технологического айти отдела. IT Аутсорсинг предусматривает отделение выполнение технических функций, третьим лицам, а точнее компании которая занимается удаленной поддержкой, а не держать специалиста на месте.

Подробнее