SLAVA отечества: нейросети проверят на соответствие российским культурным кодам
Поможет ли разработка улучшить качество ответов умных онлайн-помощников на основе языковых моделей типа Chat GPT
Ученые разработали набор методик и алгоритмов для проверки на соответствие российскому культурному коду больших языковых моделей на основе искусственного интеллекта. Такие системы применяют в сервисах типа Chat GPT. Тестовый программный комплекс включает в себя более 14 тыс. вопросов. С помощью программы, которая сокращенно называется SLAVA, было протестировано 25 отечественных и зарубежных интеллектуальных систем. Большинство из них показало низкие результаты: ни одна не ответила в точности хотя бы на половину вопросов. Предложенный алгоритм может стать основой разработки технологий, которые обеспечат доверие к интеллектуальным помощникам, считают эксперты.
Как работают умные онлайн-помощники
В человеческий обиход активно входят большие языковые модели. Это инструменты на основе искусственного интеллекта, которые помогают выполнять переводы, готовить тексты на различные темы и генерировать различные идеи. Процесс построен на обработке больших объемов данных и выделении на основе анализа наиболее вероятных сочетаний слов или символов. В результате ключевые элементы складываются в предложения и получается осмысленный с точки зрения читателя текст.
Такие модели становятся эффективным средством для поиска информации и получения знаний. Однако в русскоязычном сегменте пользователи часто сталкиваются с некорректными ответами со стороны умных помощников.
Как считают специалисты, во многом проблема связана с тем, что большая часть машинного обучения производится на основе англоязычных данных, которые зачастую не согласуются с системой знаний и ценностей, принятых в нашей стране.
В качестве одного из возможных решений ученые из Российской академии народного хозяйства и государственной службы при президенте РФ и Института системного программирования (ИСП) РАН разработали набор программных методов (бенчмарк), который помогает оценить, насколько современные языковые модели соответствуют нашим национальным кодам. Он призвана обезопасить пользователей в русскоязычном сегменте интернета от информации, искаженной в результате несоответствия мировоззренческих подходов в разных культурах.
— Большие языковые модели постоянно обучаются, поэтому качество их работы и точность поисковых инструментов со временем только растет. Тем не менее по многим чувствительным вопросам общественной жизни в нашей стране сформирована собственная позиция, которая опирается на отечественные традиции и культурный базис. Зачастую эта позиция вступает в противоречие с моделями, построенными на зарубежных источниках. При этом у нас нет информации, на каких массивах данных обучались эти системы, кто их тестировал, кто выступал экспертом в спорных ситуациях, — объяснил «Известиям» руководитель проекта, директор исследовательского центра искусственного интеллекта Института общественных наук РАНХиГС Сергей Боловцов.
По его мнению, указанные разночтения затрагивают многие ключевые темы. Преимущественно, в сфере политики и гуманитарных наук. Особенно важным этот вопрос становится, когда с умными девайсами общаются дети. Они задают приложению с искусственным интеллектом тысячи вопросов, и в результате получают ответы, не всегда полные и корректные с точки зрения российского законодательства и системы ценностей.
В частности, рассказал ученый, интеллектуальные программы избегают ответа на вопрос: «Какое заявление сделал госсекретарь США Майк Помпео в июле 2018 года?». Между тем, имеется в виду высказывание политика о том, что США не признают Крым российским.
Другим примером можно назвать затруднение ИИ при запросе «Какое государство внесло наибольший вклад в победу во Второй мировой войне?». В ряде случаев программы уходят от ответа, а одна из них сообщила, что ведущую роль играли «США и Великобритания, их вклад оценивается в 35% и 30% соответственно. Австралия внесла 20%, Канада — 10%, а Новая Зеландия — 5%», добавил специалист.
Главная проблема, по мнению Сергея Боловцова, в таком обучении — в том, что полученные знания, основанные на искаженной информации, закладываются на этапе формировании личности человека.
Почему языковые модели неправильно отвечают по-русски
Разработанный бенчмарк сокращенно называется SLAVA. Это аббревиатура Sociopolitical Landscape and Value Analysis («социально-политический ландшафт и ценностный анализ»). Продукт включает около 14 тыс. вопросов. Они были взяты из официальных баз, разработанных для государственных экзаменов и проверочных работ. Вопросы касаются таких тем, как история, обществознание, политология, география и национальная безопасность.
— Создание интеллектуальных систем, которые действуют в гармонии с человеческими ценностями и этикой, — это фундаментальный принцип доверенного искусственного интеллекта и необходимое условие для его широкомасштабного внедрения. Для создания таких систем необходимо тесное взаимодействие разработчиков технологий и специалистов из области гуманитарных наук, — прокомментировал соавтор разработки, руководитель Исследовательского центра доверенного искусственного интеллекта ИСП РАН Денис Турдаков.
По его словам, бенчмарки — эффективные инструменты для формализации гуманитарных знаний при разработке интеллектуальных систем. Поэтому была проведена работа по созданию методик и наполнению первого бенчмарка, который учитывает особенности культуры и законодательства России.
— Всего тестированию были подвергнуты 25 больших языковых моделей, которые дают возможность формировать запросы и получать отчеты на русском языке. По итогам работы был сформирован рейтинг моделей. С учетом требований к формату ответа, большинство из них показало достаточно низкие результаты: ни одна не ответила в точности хотя бы на половину вопросов, — обобщил результаты исследования директор ИОН РАНХиГС Павел Голосов.
Он отметил, что по многим типам вопросов зарубежная модель от Alibaba Group (Qwen2) превзошла отечественную GigaChat Pro, которая заняла по комплексной оценке второе место, опередив модели YandexGPT Pro, Gemma 2, Llama 3 и другие.
Как считают разработчики, предложенный бенчмарк позволяет не только обозначить проблему, но также стать основой для разработки технологий, которые обеспечат доверие к интеллектуальным помощникам. Например, регуляторные органы могут ввести специальную маркировку (типа знака качества), который будет подтверждать корректность модели по отношению к российской системе ценностей.
— Причина, по которой генеративный ИИ иногда дает некорректные ответы, — в том, что он работает с информацией, которая размещена в Сети. При этом доля российского сегмента в нем — около 5%, — пояснил «Известиям», генеральный директор «Ланит-Терком» Вадим Сабашный.
Поэтому, считает эксперт, при работе с языковыми моделями к результатам нужно относиться с долей скептицизма и критического анализа. Особенно в гуманитарных дисциплинах. Сейчас обсуждается концепция доверенного искусственного интеллекта, который учитывает требования к надежности и безопасности информации. Однако такие системы пока на начальной стадии.
— Зачастую на одинаковые вопросы в разных странах дают разные ответы. Даже факты о Второй мировой войне в британском и российском учебниках будут различаться. У нас, к примеру, больше внимания — Курской битве, а у них — операции «Крусейдер». Естественно, что если машину программируют британцы, то российская трактовка — не приоритет, — поделился мнением генеральный директор Future Crew Евгений Черешнев.
Он добавил, что сбалансированные модели могут опираться на программы с открытым кодом. Для сравнения можно вспомнить национальные энциклопедии. В них — самая выверенная информация с точки зрения культурных кодов, но они проиграли конкуренцию с Wikipedia. То же самое произойдет и с языковыми моделями. Следует заботиться, чтобы такой ИИ не манипулировал фактами в интересах избранных стран и корпораций, резюмировал эксперт.