Галлюцинации в результатах ответа Галлюцинации в ответах Больших Языковых Моделей (по-русски ЛЛМки) — штука распространённая и они как страж стоят между человечеством и бездной. Потому что пока они не устранены, использовать это толком для работы невозможно, а устранены они не будут, предположительно, никогда…
Галлюцинации в результатах ответа
Галлюцинации в ответах Больших Языковых Моделей (по-русски ЛЛМки) — штука распространённая и они как страж стоят между человечеством и бездной. Потому что пока они не устранены, использовать это толком для работы невозможно, а устранены они не будут, предположительно, никогда
Наглядный пример — картинка к посту. Любой носитель русского языка быстро считает и сам текст, и какие там ошибки. Совсем внимательные увидят, что у «Галлюцинаций» одна «л». К картинкам мало претензий и большинство подобный нейрослоп выявляют моментально — слишком странные черты лица, странные надписи на фоне и так далее
Но в целом надпись похожа. И снимали бы мы голливудский фильм, кто-нибудь бегло глянул на экран — «ну, вроде кириллица» — и пошло бы в печать, как известный Ащьф Лштшфум из Идентификации Борна
Проблема в том, что галлюцинации в тексте больше похожи на пример на экране, чем на откровенный бред из фильма. Текст выглядит гладеньким и правильненьким. Хорошо бы было, если бы спрашивали про то, какие грибы можно есть, а ответ был бы «42» или «Ржавый. Семнадцать. Рассвет». Ответ как раз будет разумный, на 80-90% верный. Но оставшиеся 10% не позволяют нам использовать ответы нейросетки в сколь угодно значимых областях. Медицина, финансы, право и тд
То он пишет, что Нижний Новгород — это такой просто небольшой район Великого Новгорода, то теряет куда-то 420 рублей в подсчётах.
И ответ в целом верный, но если мы с его помощью считаем свою годовую премию — будет некоторое разочарование
11 декабря ЧатГПТ обновил свою модель до 5.2. В тексте пресс-релиза много про то, насколько она стала революционной, точной, лучшей. И в середине текста, между словом «GPT‑5.2 Thinking hallucinates less than GPT‑5.1 Thinking». То есть стала галлюцинировать реже. Неплохой повод для гордости, но они даже не пытаются сделать вид, что они перестали галлюцинировать. А ещё нагло украли формулировку у пресс-релиза Яндекса, кстати — «Яндекс ГПТ 5.1 Реже галлюцинирует».
Задавая любой вопрос в БЯМ, всегда надо помнить, что не существует такого «золотого промпта» или любого другого способа достоверно избавиться от галлюцинаций в ответе. Я всегда отношусь к ответу, как если бы я дал стажёру-отличнику задачу и он мне принёс результат изысканий. Стал бы я это использовать в работе? Скорее да. Отправил бы я это не глядя клиенту — абсолютно точно нет