
Источник:
В последнее время в Telegram-каналах, посвященных искусственному интеллекту, появились сообщения о том, что ИИ смог набрать 90 баллов на ЕГЭ по информатике. Журналисты «Фонтанки» решили проверить аналогичные возможности нейросетей, но в области математики.

Источник:
Блогер likonit ik ранее протестировал ChatGPT на заданиях по информатике с сайта «РешуЕГЭ». Нейросеть правильно решила 26 из 29 задач, что соответствует 90 баллам из 100. В 2023 году тот же инструмент показал результат всего в 14 баллов, что свидетельствует о значительном прогрессе за три года.

Источник:
«Как хорошо, что раньше у меня в школе не было ChatGPT, иначе я получил бы знаний намного меньше», — прокомментировал блогер.

Источник:
«Фонтанка» для своего эксперимента выбрала вариант базовой математики с того же образовательного портала. Основатель «РешуЕГЭ», учитель года-2007 Дмитрий Гущин, ранее отмечал, что сайту грозит блокировка из-за инициативы Минпросвещения о запрете публикации заданий прошлых лет.

Источник:
В исследовании использовали три нейросети: ChatGPT, DeepSeek и Perplexity. Задания отправляли без дополнительных пояснений, просто с требованием «реши», чтобы имитировать поведение обычного школьника.
Все три системы справились с экзаменом на прогнозируемую оценку «отлично». Интересно, что ошибки они допустили в разных задачах.
ChatGPT правильно выполнил 17 из 21 задания базового варианта. Он не смог верно интерпретировать график, решить задачу о поездке на велосипеде, рассчитать площадь озера Великое и разобраться с отметками Пети.
DeepSeek показал результат в 18 правильных ответов из 21. Эта нейросеть ошиблась в расчете рейтинга автомобиля, определении площади озера Великое и нахождении площади поверхности многогранника.
Perplexity также дал 18 верных решений. Его ошибки касались длины отрезка в треугольнике, объема четырехугольной пирамиды и поиска четырехзначного числа, кратного 18, с произведением цифр от 0 до 12.
Таким образом, все три нейросети сдали базовый ЕГЭ по математике на оценку «5». Журналисты предположили, что при более детальной работе с каждым заданием можно было бы достичь идеального результата, но цель эксперимента была в простом копировании вопросов.
Доцент Института прикладных компьютерных наук Университета ИТМО Алексей Комиссаров в комментарии для «Фонтанки» объяснил, что сегодня правильнее говорить об ИИ-агентах, а не просто о нейросетях.
«Самое простое сравнение — это двигатель от машины и машина. До марта 2025 года мы строили двигатели, а сейчас научились строить машины, куда вставляем различные двигатели разной мощности… За последний год мир шагнул сильно-сильно дальше. Сейчас не нейросети, сейчас агенты», — заявил эксперт.
Комиссаров упомянул тест «Последний экзамен человечества», который включает 2,5 тысячи сложных вопросов для узких специалистов. По его словам, современные ИИ-системы уже показывают на нем хорошие результаты.
«Есть единственный вариант, когда ИИ не может решить ЕГЭ сейчас — это вопросы ЕГЭ поставлены некорректно или неправильно», — отметил преподаватель.
Он также добавил, что ИИ вряд ли решит какой-либо вариант ЕГЭ на 100%, поскольку содержание школьных учебников не всегда соответствует актуальным научным данным. «Возможно, если ему [ИИ] сказать, что это школьный экзамен… и там могут быть неправильные ответы с точки зрения современной науки, то, скорее всего, он сможет решить достаточно хорошо», — заключил Комиссаров.


