Ученые Сургута разработали инновационный инструмент для повышения точности онлайн-переводчиков

Общественный новости » Ученые Сургута разработали инновационный инструмент для повышения точности онлайн-переводчиков
Preview Ученые Сургута разработали инновационный инструмент для повышения точности онлайн-переводчиков

Программирование

Программирование

Ученые Сургутского государственного университета (СурГУ) разработали инновационный инструмент для выявления и анализа ошибок в работе программ-переводчиков. Эта разработка, получившая патент, нацелена на значительное улучшение качества машинного перевода, как сообщили в пресс-службе университета.

Несмотря на широкое распространение онлайн-переводчиков, их точность по-прежнему может быть нестабильной. Для оценки и корректировки ошибок в этих системах традиционно применяются специализированные метрики, как уточнили представители СурГУ.

Разработанная в СурГУ программа, по утверждению ее создателей, предлагает более глубокий и всесторонний подход к анализу качества перевода по сравнению с существующими стандартными методами.

Ярослава Бакуменко, магистрант СурГУ по направлению `Лингвистика`, объяснила, что распространенные оценочные метрики, такие как BLEU, фокусирующиеся на дословных совпадениях, часто предоставляют неполную картину качества перевода. `Наше решение предлагает комплексный анализ, способный выявить недостатки перевода как на уровне синтаксиса, так и в точности передачи смысла`, — добавила она.

Магистрант Бакуменко подчеркнула, что уникальность новой программы заключается в ее способности оценивать не только лексическое соответствие (точность выбора слов), но и семантическую точность (корректность передачи смысла), а также синтаксическую структуру предложения. Инструмент интегрирует несколько методов оценки, что является его ключевым преимуществом перед аналогами.

В рамках исследования были тщательно проанализированы переводы, выполненные ведущими онлайн-сервисами и коммерческими нейросетями. По результатам анализа для каждого перевода автоматически генерировался детальный отчет, в котором предложения с низкими показателями по любой из оценочных метрик выделялись для дальнейшего изучения.

Ученые СурГУ выявили, что, хотя некоторые системы машинного перевода демонстрируют высокую точность в подборе слов, все протестированные переводчики испытывают значительные сложности при работе со сложными грамматическими конструкциями.

Доцент кафедры лингвистики и переводоведения СурГУ Аксана Таджибова отметила: `Мы разработали инструмент, который выходит за рамки общей оценки, позволяя точно идентифицировать конкретные категории ошибок — будь то лексические, грамматические или смысловые. Такой подход значительно повышает эффективность анализа и предоставляет четкие ориентиры для дальнейшего усовершенствования систем машинного перевода`.

Технической основой новой разработки стал программный код на языке Python. В его основе лежат две ключевые библиотеки: NLTK (Natural Language Toolkit) для базовой обработки естественного языка, позволяющая компьютеру сегментировать текст на предложения и слова, и Stanza, обеспечивающая глубокий грамматический анализ и определение синтаксической роли каждого элемента предложения.

Опубликовано: 15 октября 2025 г.