Специалист должен знать английский язык и обладать профессиональными навыками перевода, необходимыми для обучения больших языковых моделей. Тренеры будут обучать генеративную модель, создавая собственные эталонные примеры, оценивать качество перевода и учить нейросеть распознавать и переводить текст с изображений и видео. При этом речь идёт об узкоспециализированных направлениях — от физики до юриспруденции, уточняет представитель «Яндекса».
Эксперты, опрошенные изданием, поясняют, что основная сложность заключается в том, что для обучения современных моделей переводчик должен произвести не дословный перевод, а собрать семантически близкие виды переводов. Поэтому в большинстве случаев сейчас нейросети делают дословный перевод.
«Яндекс» представил собственную нейросеть YandexGPT в мае 2023 года. Летом прошлого года она научилась запоминать контекст беседы и задавать уточняющие вопросы. Затем ее добавили в приложениие для генерации изображений «Шедеврум». В марте 2024 года компания представила третье поколение нейросетей YandexGPT, в том числе модель для бизнеса.
Источник: Sostav