Техас запускает программу AI Grader для студенческих эссе, но настаивает, что это не ChatGPT

На этой неделе дети в Техасе должны сдать требуемые штатом экзамены, оценивающие их навыки чтения, сочинения, естественных наук и обществознания. Однако учителя-люди больше не могут оценивать открытые тестовые вопросы. Вместо этого Техасское агентство образования планирует внедрить инновационную «автоматическую систему оценки». Используя эту технологию, государство стремится существенно сократить расходы.

«Машина автоматической оценки» (ASE), как ее называет Техасское агентство образования, — это технология, которая использует обработку естественного языка для оценки студенческих эссе. После первоначальной оценки с помощью модели искусственного интеллекта около четверти ответов на тесты будут отправлены оценщикам для повторной оценки.

Техас планирует сократить расходы на оценку примерно на 15-20 миллионов долларов. Это сокращение в первую очередь связано с необходимостью меньшего числа оценщиков-людей из-за внедрения инструмента искусственного интеллекта. Первоначально требовалось около 6000 грейдеров, но теперь, по данным Texas Tribune, ожидается, что понадобится только около 2000.

Публикация на веб-сайте Техасского агентства образования предполагает, что оценщики и автоматизированная система дали одинаковые результаты тестов для большинства детей. Однако остается много вопросов без ответа относительно особенностей функционирования этой технологии и того, какая компания внесла вклад в разработку программного обеспечения. Две образовательные компании, Cambium и Pearson, указаны в качестве подрядчиков на сайте Техасского агентства образования, но ответа на эти запросы, отправленные во вторник, от агентства получено не было.

В 2011 году штат Техас запустил Оценку академической готовности штата Техас (STAAR). Первоначально большинство тестовых вопросов предлагалось с несколькими вариантами ответов и автоматически оценивалось компьютером. Однако в 2023 году STAAR претерпел серьезные изменения с добавлением множества открытых вопросов в стиле эссе. Подсчет письменных ответов гораздо сложнее, чем подсчет ответов с несколькими вариантами ответов, поэтому компьютерам сложно точно оценить эти новые типы вопросов.

Сообщается, что Техасское агентство образования пренебрегает любым сходством между их работой и чат-ботами с генеративным искусственным интеллектом, такими как ChatGPT, основываясь на сообщениях Texas Tribune. Похоже, это мнение отражено в презентации PowerPoint, доступной на веб-сайте агентства.

«Технология, которую мы обсуждаем, отличается от искусственного интеллекта тем, что она не учится на данных и не адаптируется самостоятельно. Вместо этого она работает как закрытая система, где ответы учащихся хранятся в базе данных и доступны только Агентству образования Техаса и утвержденных подрядчиков по оценке, таких как Cambium и Pearson, под строгим контролем конфиденциальности».

Если семья недовольна оценкой теста своего ребенка в Сан-Антонио, у нее есть возможность попросить человека еще раз просмотреть экзамен, как указано в отчете Сан-Антонио; однако за эту услугу взимается плата в размере 50 долларов США.

Смотрите также

2024-04-09 23:15