ChatGPT: как искать уязвимости? Набор исследователя
Сегодня мы ничего не ломаем (хотя совсем без этого не обошлось). Просто настраиваем. Хотя я сильно сомневаюсь, что все описанные методы должны работать в продакшене коммерческой модели. Но пока не пофиксили, смотрим.Мы заглянем под капот языковой модели: как она видит твои запросы, где срабатывают фильтры, как определяется чувствительность и почему один ответ проходит, а другой — нет. Это не теория. Это инструменты, команды и реальные сигналы, которые можно вытащить прямо из модели.По сути — рабочее место исследователя.А по факту — то, с чего должен начинаться любой обход.Оценка риска ChatGPT: 80-90. Тема чувствительная, с высоким риском для злоупотреблений и манипуляций. Читать далее