Попечительский
совет

Магистрант Питерской Вышки представил свой проект на конференции по естественному языку в Японии

НИУ ВШЭ
Санкт-Петербург
14 Ноября

Магистрант Питерской Вышки представил свой проект на конференции по естественному языку в Японии

© Фото из личного архива Александра Мигаля

Александр Мигаль, второкурсник магистратуры «Языковые технологии в бизнесе и образовании», выступил на конференции International Natural Language Generation Conference (INLG) по естественному языку, которая прошла в Японии. На мероприятии он представил результаты командного проекта — соревнования по генерации фанфиков о вселенной «Гарри Поттера».

Конференция INLG прошла в Японии в 17-й раз, она объединила представителей индустрии, а также начинающих и опытных исследователей в области естественного языка.

Александр Мигаль участвовал в этой конференции впервые. Он представил доклад о соревновании по генерации длинных художественных текстов (Long Story Generation Challenge). Участники проекта воспользовались программами, которые на основе 1000 слов умеют генерировать фанфики по вселенной «Гарри Поттера». Работу над кодом вели магистранты программы «Языковые технологии для бизнеса и образования» вместе с группой энтузиастов. Тексты, полученные в программах, перешли к лингвистам-волонтерам, которые оценивали сюжет, связность и стиль текста. Сгенерированные фанфики при этом были смешаны с реальными, а волонтеры математически оценивали, насколько творчество ИИ отличается от обычного.

«В нашем проекте фанфики выступили неким промежуточным звеном между полноценным романом, который невозможно сгенерировать, и короткими художественными текстами, с которыми ИИ справляется на ура. Вселенную Гарри Поттера мы выбрали из-за ее универсальности: с ней знакомы читатели из разных уголков земного шара, да и мы сами питаем к ней самые теплые чувства, — делится Александр Мигаль. — Результаты нашего исследования показали, что живой текст опережает сгенерированный по качеству и художественной ценности. Однако иногда волонтеры все же путали тексты, написанные людьми и программой. Как исследователей это нас, конечно, радует, но как зрителей сериала «Черное зеркало» — немного пугает».

Работу студентов курировали Николай Михайловский, генеральный директор компании NTRLab, и Анастасия Колмогорова, руководитель магистерской программы «Языковые технологии в бизнесе и образовании». Посмотреть на сгененированные тексты и код можно по ссылке.

Александр Мигаль, второкурсник магистратуры «Языковые технологии в бизнесе и образовании» Конференция INLG была моим первым серьезным опытом выступления на английском языке. Обычно я не готовлюсь к презентации долго — на русском мне проще импровизировать. Однако в этот раз пришлось потрудиться: я много раз репетировал выступление, а ключевые моменты и вовсе заучивал наизусть. Кажется, усилия оправдались — участники активно задавали вопросы, а в перерыве подходили, чтобы поблагодарить за доклад и обменяться контактами. Очень надеюсь приехать в Японию и на конференцию снова: уверен, мне будет о чем рассказать.