Функционирует при финансовой поддержке Министерства цифрового развития, связи и массовых коммуникаций Российской Федерации

Регион
29 декабря 2021, 16:54

Уинстон Черчилль в цифре: "МегаФон" создал уникального бота на основе трудов британского премьер-министра

Что угрожает экономической стабильности, как пережить кризис и какая валюта самая стабильная? На эти вопросы отвечает цифровая модель Уинстона Черчилля. Бот создан специалистами "МегаФона" и Nlogiс.

Уинстон Черчилль. Фото © Getty Images / Kurt Hutton / Picture Post / Hulton Archive

Уинстон Черчилль. Фото © Getty Images / Kurt Hutton / Picture Post / Hulton Archive

Бот, созданный на основе трудов Уинстона Черчилля, позволяет задать любой интересующий вопрос британскому премьер-министру, который стал одной из самых заметных политических фигур в XX веке.

Разработан бот для РБК, издание уже опубликовало интервью с британским политиком. Ответы на вопросы были даны на основании различных верифицированных высказываний политика. В основе проекта лежит семантическая модель на основе сиамских нейросетей и архитектуры BERT. Они были обучены на нескольких десятках книг Черчилля.

Вот так, например, британский премьер-министр советует пережить экономический кризис: "Это действительно большая проблема. Отвечая на этот вопрос в 1915 году, я бы ответил так: сегодня мы переживаем тяжелый период, и прежде чем ситуация наладится, всё наверняка станет ещё хуже. Но я ни на минуту не сомневаюсь в том, что всё поправится, если мы проявим стойкость и упорство. По прошествии 35 лет я бы сформулировал ответ следующим образом: в моменты кризисов всегда утешительно сознавать, что ты избрал путь долга, ориентируясь на зажжённые для тебя маяки. Однако наши экономические проблемы требуют от нас пребывать в тесном и постоянном контакте с реальностью. Кроме всего прочего, я могу вам сказать, из пучины страдания мы вынесем вдохновение и силу выжить".

Он также рассуждает о стабильности валюты, освоении космоса, воспитании молодёжи и многих других вещах.

Уинстон Черчилль. Фото © Getty Images / Fox Photos

Уинстон Черчилль. Фото © Getty Images / Fox Photos

По словам разработчиков, технология, лежащая в основе бота, позволит изменить представление о поисковых системах. Действующая модель поиска через строку для ввода запроса и появляющегося после этого списка релевантных ссылок устарела. Боты придут ей на смену. Они смогут не только обрабатывать запрос и самостоятельно отбирать нужные результаты сразу из нескольких источников, но и объединять их в единый связный текст, как это мог бы сделать живой ассистент.

— Когда мы услышали про идею об интервью с Уинстоном Черчиллем, мы поняли, что можем её реализовать, опираясь на наш опыт работы с нейронными сетями, — рассказал директор по правовым вопросам "МегаФона" Сергей Переверзев.

Компания не первый раз использует ботов, работающих на основе нейронных сетей в решениях для бизнеса. С их помощью удаётся оптимизировать внутренние процессы, а сотрудники освобождаются от рутинной работы.

Фото © Unsplash / Glenn Carstens-Peters

Фото © Unsplash / Glenn Carstens-Peters

Так, на основе нейросети и технологии оптического распознавания символов работает сервис "Цифровой юрист". Сотрудник пишет вводные сообщения, бот берёт информацию из запроса и дополняет её данными из корпоративной базы поставщиков. Затем он присылает в ответ готовый черновик договора. Иногда его не требуется даже корректировать. Таким образом время на подготовку документа сокращается с 30 до нескольких минут.

Первый подобный проект "МегаФон" разработал также в партнёрстве с компаний Nlogic. В 2018 году пилотную версию бота-юриста LegalApe компании публично продемонстрировали на Петербургском международном юридическом форуме. Там LegalApe состязался в мастерстве с реальным юристом Романом Бевзенко. Несмотря на то что машина проиграла человеку со счётом 178 против 243 очков, ей удалось эффектно выступить и хорошо зарекомендовать себя.

Такие проекты опираются на семантический поисковик, настроенный на работу в определённой тематике. Например, бот-юрист обучен на юридической литературе, а бот для составления договоров — на корпоративных документах и базах. Соответственно, бота Черчилля обучали на многочисленных трудах самого британского политика.

По словам технического директора проекта Андрея Богомолова, разработка началась в августе 2021 года. Специалисты "МегаФона" и Nlogic сразу сфокусировались на передовых технологиях. В дело пошла генеративная модель GPT-3 от компании OpenAI. Её дообучили на нескольких десятках книг Черчилля. Сначала казалось, что это успех. Чувствовалась стилистика автора, но появился ряд проблем. Тексты не несли в себе явных мыслей. Они выглядели как слова политика, который хочет не высказать мнение, а, наоборот, уйти от ответа. К тому же первая версия виртуального Черчилля часто путала факты.

Разработчики решили, что нужно переделывать всё с нуля. В основу нового подхода положили именно проверку фактов. Бот всегда мог подтвердить свои высказывания отсылкой к источнику — конкретной книге или выступлению Черчилля. Дата-саентисты обучили нейронную сеть на базе разработанной компанией Google архитектуры BERT на всех оцифрованных книгах Черчилля.

Уинстон Черчилль. Фото © Getty Images / Keystone

Уинстон Черчилль. Фото © Getty Images / Keystone

Получился неплохой поисковик по трудам Черчилля, но для проведения интервью этого было недостаточно. На следующем этапе улучшения бота разработчики составили датасет из нескольких тысяч вопросов на самую разную тематику. В автоматическом режиме бот генерировал ответы на вопросы, а живым людям предстояло их обработать. Это сильно помогло.

Долгая и кропотливая работа позволила сделать речь виртуального сэра Уинстона структурированной и "человечной".

Подписаться на LIFE
  • yanews
  • yadzen
  • Google Новости
  • vk
  • ok
Комментарий
0
avatar

Новости партнеров