Методы и модели интеллектуального автоматизированного контроля знаний

p align="left">Таким образом, появляется возможность для данного испытуемого выбирать соответствующий его уровню набор тестовых заданий и испытуемые могут быть протестированы тестами составленными индивидуально для них. Для группы тестируемых создаются адаптивные тесты, имеющие разную длину и время выполнения для сильных, слабых и средних учащихся данной группы. Такой процесс требует компьютерной технологии создания, хранения тестов, проведения тестирования и обработки результатов тестирования. Для обработки результатов тестирования исходного и адаптивного тестов создана программа, позволяющая определить такие параметры как: надежность, погрешность измерения,, корреляция, определение значений информационной функции и др.

По сути, эта технология дает начало новой организации как тестового контроля знаний, так и учебного процесса в целом, на более высоком научном уровне. В классно-урочной форме обучения этот принцип не мог быть реализован в каких-нибудь заметных масштабах из-за отсутствия требуемых для этого программно - педагогических и программно - инструментальных средств. В условиях массового образования адаптивное обучение дает возможность эффективной практической реализации принципа индивидуализации обучения.

В качестве доказательств ценности полученных результатов исследования, подтверждающих выдвинутую гипотезу, состоящую в том, что применение адаптированных тестовых измерителей позволит повысить объективность в оценке индивидуального уровня обученности учащихся за счет снижения погрешности измерения в выборке учащихся, адаптивной предлагаемым трудностям тестовых заданий; можно привести следующие факты:

1) разработанный комплект тестовых заданий и рекомендованный кафедрой естественнонаучных дисциплин ИУУ УР для оценки усвоения знаний учащихся общеобразовательной школы по предмету “информатика”, применялся для текущего и итогового контроля знаний учащихся общеобразовательных учреждений;

2) применение адаптивных тестов для контроля знаний учащихся приводит к более точной оценки уровня знаний испытуемых с использованием меньшего количества тестовых заданий по сравнению с обычным тестированием за счет снижения погрешности измерения в выборке учащихся, адаптивной предлагаемым трудностям тестовых заданий;

3) эффективные тестовые измерители позволяют определить уровень обученности каждого испытуемого после изучения модуля курса и определить индивидуальную динамику развития учащегося по окончанию изучения всего курса;

4) в лицее, где с 1996 г. применяется адаптивное обучение, а позднее с 1998г. внедряется адаптивный тестовый контроль знаний учащихся, полученные результаты обученности учащихся характеризуются такими уровнями в когнитивной области как анализ, синтез, что обеспечивает прекрасный потенциал для их дальнейшего успешного развития в творческой эвристической оценочной деятельности (участие в олимпиадах, турнирах, научно-исследовательских конференциях и др.).

2.1.9.5 Блок системы мониторинга.
Под мониторингом в системе “учитель-ученик” мы понимаем совокупность контролирующих и диагностирующих мероприятий, обусловленных целеполаганием процесса обучения и предусматривающих в динамике уровни усвоения учащимися материала и его корректировку. Иначе говоря, мониторинг - это непрерывные контролирующие действия в системе “учитель-ученик”, позволяющие наблюдать (и корректировать по мере необходимости) продвижение ученика от незнания к знанию. Мониторинг - это регулярное отслеживание качества усвоения знаний и умений в учебном процессе.

Мониторинг отличается от обычной оценки знаний тем, что обеспечивает учителя оперативной обратной связью об уровне усвоения учащимися обязательного учебного материала. Система мониторинга включает в себя создание непосредственно инструментов контроля знаний и умений и корректирующую методику, ориентированную непосредственно на личность школьника с учетом его индивидуальных достижений в учебном процессе [18].

2.1.10 Технология рейтинговых исследований качества образования с применением нейронных сетей

Основными компонентами процесса оценки качества образования являются[ сбор исходных данных и получение результирующей информации о состоянии системы образования. Ежегодный аналитический доклад «Качество образования в выявим учебном заведении» предполагает получение данных по более чем десяти направлениям. Для выполнения аналитических отчетов и мер по повышению качества образования необходимо проведение результирующих «интеллектуальных» обработок исходных данных Задача определения качественного уровня вуза (его рейтинга) является одним из основных направлений таких обработок.

В информационной системе мониторинга качества образования (ИСМО), создаваемой в Брянском государственном техническом университете, разрабатывается информационная технология рейтинговых исследований качества образования на основе применения нейронных сетей. Программный комплекс нейрокомпьютерной обработки применяется в качестве одного из модулей финишной обработки информации. Выходная информация работа! такого мо-дуля - вычисленные «рейтинги качества» для каждого вуза.

Исследования проводятся по следующим основным направлениям:

классификация - определение принадлежности каждого вуза к конкрет-ной группе качества.

На первом этапе выявляются основные тенденции в образовании, такие, как уровень разрыва в качестве образования, плотность распределения объектов мониторинга по группам качества. При этом возможны следующие варианты реализации первого этапа:

· глобальная кластеризация -- предполагает наличие в исходной выборке данных по отечественным и зарубежным вузам;

· федеральная кластеризация - наличие в выборке данных по вузам из подчинения Министерства образования Российской Федерации;

· отраслевая кластеризация - выборка состоит из данных по однотипным вузам (техническим, педагогическим, медицинским, и т. д.);

· региональная кластеризация - выборка по вузам определенного региона.

Для адекватности кластерных исследований периодичность их проведе-ния должна быть достаточно большой.

На этапе классификации исходные данные но каждому вузу подаются на входы обученной нейронной сети, после чего определяется «рейтинг качества» данного вуза. Многие параметры, по которым происходит опенка качества об-разования, подвержены динамическим изменениям. Поэтому определение рейтинга качества образования в информационной системе будет выполняться ежеквартально.

Ряд последовательных операций на каждом этапе определяет облик соот-ветствующей информационной технологии. Информационная технология эта-па кластерных исследований определяется следующими операциями:

· получение исходных данных для проведения исследований с сервера ин-формационной системы (отдельно для каждого этапа реализация);

· проведение кластерных исследований посредством самоорганизующейся карты Кохонена;

· идентификация «групп качества образования», на которые было разбито исходное множество учебных заведений;

· присвоение «рейтингов качества» каждой «группе качества».

Завершающая операция на данном этапе может дать заключение о глобальных тенденциях в качестве образования и являться основанием для проведения мероприятий организационно-управленческого плана. Такой тенденцией может быть, например, резкое увеличение количества объектов в группах с низким рейтингом качества

В ИСМО в основу технологии классификации положено использование многослойной нейронной сети, обучаемой по методу обратного распростране-ния ошибки. В данном случае технологический облик этапа определяется осо-бенностями процесса обучения нейронной сети и состоит из следующих опе-раций:

· формирование исходной выборки для обучения нейронной сети, в которой на входы нейронной сети подаются параметры качества образова-ния, а на выходы-рейтинги качества;

· подача на входы сети нового примера, соответствующего вузу, рейтинг которого определяется;

· выполнение предыдущей процедуры для всех вузов, включенных в систему мониторинга.

Выполнение первого этапа, на котором генерируются примеры для обу-чения нейронной сети, может основываться на методе экспертных оценок. Функционирование информационной системы происходит в полуавтоматическом режиме. На персонал информационной системы возлагается обязанность пополнения базы данных параметров оценки качества образования.

Текущая обработка по этапу классификации может изменять рейтинг качества конкретного вуза, но не меняет картину качества в целом. Этим опреде-ляется небольшой период проведения итоговых обработок по этому этапу. Итоговые обработки; проводимые в рамках кластерных исследований, спо-собны изменить общую картину качества [25].

2.2 Собственные разработки
В результате трехлетней работы были разработаны некоторые методы автоматизированного контроля совместно с преподавателями кафедры «СУ и ВТ» Калининградского Технического Университета, созданы реализации теоретических выкладок, о которых хотелось бы рассказать в этой работе.
2.2.1 Тестирование по методу цепочек вопросов
Автоматизированная система контроля знаний, созданная как результат выпускной квалификационной работы и дипломного проектирования в подсистеме «Создание теста» предлагает преподавателю использовать цепочную систему вопросов, когда несколько вопросов объединяются в фиксированную последовательность (цепочку) по некоторому смысловому признаку, определяемому преподавателем, а каждому вопросу в цепочке присваивается некоторый коэффициент важности данного вопроса в данной цепочке. Этот коэффициент изменяется от 0 и сумма коэффициентов вопросов в цепочке принимается равной 1. Смысл коэффициента раскрывается при обработке результатов тестирования: оценка за ответы на вопросы, объединенные в цепочку, выставляется в зависимости от важности вопросов, на которые были даны правильные ответы . Цепочка может содержать неограниченное число вопросов, объединенных по семантическому признаку внутри выбранной темы тестирования. Вырожденным случаем цепочной структуры является наличие в цепочке всего лишь одного вопроса. В этом случае коэффициент его важности, очевидно, устанавливается равным единице.

Хочется отметить, что тест, как правило, создается по отдельной теме конкретной дисциплины, должен иметь небольшой объем, что обуславливается неразделяемостью ресурсов персонального компьютера и необходимостью проводить тестирование большого количества обучаемых в течение ограниченного времени.

2.2.2 Автоматизированный контроль знаний по методике уточняющих вопросов

Концепция базируется на автоматизации методики уточняющих вопросов, широко используемой в педагогической практике для выявления глубины знаний обучаемого. Относительная важность задаваемых вопросов определяется их весовыми коэффициентами, учитываемыми при подведении результатов тестирования. При подготовке к тестированию преподаватель имеет возможность определять или корректировать относительную важность каждого вопроса, устанавливать объем теста N, задавать время, отводимое экзаменуемому на демонстрацию своих знаний, и настраивать оценочную шкалу, по которой суммарный балл, набранный в ходе тестирования, переводится в итоговую оценку.

В ходе автоматизированного тестирования экзаменуемому предъявляется конечное множество т.н. цепочек вопросов. Каждая цепочка представляет собой последовательность близких по тематике вопросов, формулируемых для уточнения знаний экзаменуемого. Очередной вопрос в цепочке задается только после получения ответа на предыдущий вопрос. В зависимости от стратегии тестирования, избираемой организатором контроля знаний, очередной вопрос в цепочке может предъявляться до первой ошибки (“строгий” преподаватель), либо экзаменуемому предоставляется возможность демонстрировать максимум знаний, отвечая на все вопросы данной тематической последовательности.

Каждому j-му вопросу в i-й цепочке присваивается весовой коэффициент Кij, характеризующий его относительную важность в рамках этой цепочки. Значения всех коэффициентов автоматически нормируются так, чтобы их сумма внутри каждой цепочки была равна 1. В цепочку может объединяться неограниченное количество тематически близких вопросов. В вырожденном случае цепочка состоит из единственного вопроса, коэффициент важности которого устанавливается равным 1.

Процедура количественного оценивания знаний, выявленных в ходе тестирования, состоит из трех этапов. На первом рассчитываются баллы, набранные за правильные ответы в рамках каждой отдельной тематической последовательности:

где Si - балл, выставляемый за ответы на i-ю тематическую последовательность; Кij - весовой коэффициент j-го вопроса в i-й цепочке; Zij =1, если на j-й вопрос в i-й цепочке получен правильный ответ и Zij=0 - в противном случае; Li - количество вопросов в i-й цепочке.

На втором этапе рассчитывается суммарный балл S за ответы на все вопросы теста с учетом количества цепочек вопросов, на которые экзаменуемый успел ответить за отведенное время:

2 ,

где N -объем теста; Кt - количество цепочек вопросов, на которые экзаменуемый успел ответить за отведенное время t.

На третьем этапе определяется итоговая оценка знаний экзаменуемого. Для этого набранный им суммарный балл S проецируется на оценочную шкалу, имеющую вид

[0; I1; I2; I3; 1] ,

где 0< I1< I2< I3< 1 - границы интервальных диапазонов оценок, задаваемые преподавателем при организации тестирования.

Итоговая оценка за тест ОT выводится по следующим правилам:

После необходимой доработки и полного документирования демонстрационная версия программы и информация об условиях ее поставки будет опубликована на Веб-сайте Калининградского государственного технического университета [26].

2.2.4 Алгоритмы прямого тестирования в интеллектуальной автоматизированной системе контроля знаний
Прямым тестированием будем называть способ контроля знаний обучаемого, при котором структура теста (т.е. набор и порядок предъявления тестовых заданий) не зависит от фактических ответов обучаемого. Практически все существующие в настоящее время АСКЗ функционируют в режиме прямого тестирования, однако чаще всего они реализуют лишь простейшие и далеко не самые эффективные методики оценивания знаний.
Детальный анализ педагогических приемов и способов “живого” диалогового общения преподавателя и тестируемого показал, что можно выделить по крайней мере пять параметров, значения которых влияют на организацию процесса контроля и оценивания знаний.

Цель тестирования определяется основным вопросом, ответ на который должен быть получен в результате тестирования - а) обладает ли обучаемый равномерным уровнем знаний по всему материалу (проверка широты знаний) или б) обладает ли обучаемый систематическими знаниями по темам предъявляемых ему тестовых заданий (проверка глубины знаний).

Вид тестирования имеет два значения - зачетное или экзаменационное. Результаты зачетного тестирования представляются в двоичном формате: “зачет” или “незачет”. В ходе зачетного тестирования оценка “зачет” выставляется в случае, если обучаемый демонстрирует знания, превышающие некоторое априори заданное пороговое значение.

При экзаменационном тестировании по сумме баллов, набранной обучаемым при выполнении теста, рассчитывается итоговая оценка знаний обучаемого (имеющая в общем случае более двух допустимых значений), для чего сумма баллов проецируется на применяемую оценочную шкалу.

Сложность теста характеризуется уровнем знаний, которые должен продемонстрировать обучаемый при его выполнении. Она определяется степенью сложности тестовых заданий, которые могут предъявляться обучаемому. Исследования позволяют говорить о как минимум трех уровнях сложности тестов - стандартной, повышенной и пониженной.

Уровень контроля определяет степень строгости проверки глубины знаний. Изучение методик проведения зачетных и экзаменационных опросов показывает, что можно говорить о четырех различных уровнях строгости оценивания ответов на тестовые задания (строгий контроль; выявление наиболее важных знаний; выявление простейших знаний; выявление любых имеющихся знаний).

И, наконец, отслеживание условия раннего прекращения тестирования предполагает досрочное завершение теста в ситуации, когда продолжение тестирования становится нецелесообразным. В качестве первого из этих условий рассматривается превышение предельной длительности тестирования. Второе условие - прекращение тестирования и выставление неудовлетворительной оценки при получении априори заданного количества неправильных ответов.

Разнообразие возможных сочетаний значений пяти предложенных характеристик позволяет говорить о существовании весьма обширного семейства алгоритмов прямого тестирования знаний (например, экзаменационного оценивания глубины знаний с повышенной сложностью и строгим контролем, либо зачетного оценивания широты знаний со стандартной сложностью и контролем предельной длительности тестирования и т.п.).

Подсчет показывает, что в состав этого семейства входят, по крайней мере, 24 алгоритма оценивания широты знаний и 78 алгоритмов оценивания глубины знаний, что позволяет организатору тестирования выбирать в конкретной ситуации именно тот алгоритм, который наилучшим образом соответствует требованиям действующих инструктивно-методических документов, либо который он считает наиболее адекватным собственному представлению об организации контроля знаний [27].

Рис. 1 - Свойства алгоритмов прямого тестирования

2.2.5 Метод адаптивного автоматизированного тестирования знаний

Адаптивным тестированием знаний будем называть способ экзаменационного контроля уровня подготовки обучаемого, при котором процедура выбора и предъявления ему очередного тестового задания на (t+1)-м шаге тестирования определяется ответами обучаемого на предыдущих t шагах теста. Математическую основу такого учета составляет предложенная в [2] модель объединения тестовых заданий в тематические последовательности со взвешенным ранжированием как отдельных заданий, так и целых последовательностей и выведением итоговой оценки за тест с учетом нормированной суммы баллов, накапливаемой за выбранные обучаемым варианты ответов.

Пусть V = {vj}, - множество тестовых заданий, которые могут использоваться для формирования теста, VT = {vi}, VT Н V, - тестовые задания, отобранные для проверки знаний конкретного тестируемого, причем N << Nmax. Обозначим St нормированную относительно количества заданных вопросов сумму баллов, накопленную обучаемым за ответы на 1, 2, …, t-м шагах теста, причем t Ј N, а 0 Ј-- St----Ј 1. Шкалу итогового оценивания знаний ZI упрощенно представим в виде

ZI = [0; I1/O1; I2/O2; …; In/On; 1/On+1]

где 0 < I1 < I2 < …< In < 1 - границы оценочных интервалов; Oi, - оценка, которой характеризуются знания тестируемого в случае, когда накопленная им сумма баллов St попадает в интервал (Ii-1,Ii].

Поскольку N << Nmax, то согласно теории вероятностей сумма баллов St может использоваться для оценивания знаний обучаемого с доверительной вероятностью Pt < 1 и, следовательно, при выведении итоговой оценки знаний по результатам t Ј--N шагов тестирования необходимо учитывать ненулевой интервал неопределенности ±DI>0, в котором с вероятностью Pt находится истинное значение Stи: StиО[St-DI;St+DI]. C практической точки зрения это означает, что при проецировании значения St на шкалу ZI следует принимать во внимание не только сегмент этой шкалы (Ii,Ii+1], в который попадает значение St, но и его зонирование с учетом интервала неопределенности DI.

При попадании суммы баллов в интервал Ii+DI<SN<Ii+1-DI сумма баллов SNи, соответствующая истинной оценке знаний, ни при каких условиях не попадает в зоны неопределенности (Ii±DI) и (Ii+1±DI). В этой ситуации имеется достаточно оснований для выставления оценки Oi+1 сразу по завершении первого этапа тестирования, поэтому дальнейшее предъявление дополнительных или уточняющих вопросов нецелесообразно [28].

Заключение

Начавшееся в нашей стране с начала 80-х годов внедрение в учебных заведениях новых информационных технологий - обучение при помощи педагогических программных средств, а также использование тестирующих программ - дало более чем скромные результаты. Среди многих известных причин этого (финансовые, технические, организационные, методические трудности) отметим одну: психологическое неприятие учителями “компьютерных” методов обучения и контроля знаний, особенно высококвалифицированными, творчески работающими. У них для этого есть основания: налицо большое количество плохих программ, не отвечающих главным психолого-педагогическим принципам обучения, неудачно реализующих основные этапы процесса усвоения знаний; как правило, отсутствует методическое сопровождение; оказываются непомерно большими затраты времени и сил на освоение компьютеров, изучение программы, поддержку соответствующей инфраструктуры; при использовании даже хороших систем нивелируется роль учителя в учебно-воспитательном процессе, исчезает творческий характер его труда; отсутствует система поощрения педагогов-новаторов, осваивающих новые информационные технологии.

Эту ситуацию, на мой взгляд, можно и хочется изменить. Технический прогресс стремительно продвинулся вперед, современная вычислительная техника и системы телекоммуникаций достигли огромных результатов за последние несколько лет в плане быстродействия, объемов обрабатываемой и хранимой информации. Развитие систем проектирования программ (объектно-ориентированные системы визуального программирования, СУБД, системы моделирования нейронных сетей, и т.п.) дало в руки инженеров и системных аналитиков мощнейшие средства разработки и внедрения в жизнь самых фантастических проектов. Отсутствие финансирования в области образования в нашей стране тормозит, как мне кажется, процессы создания качественных программных продуктов общего применения, смещая акцент в сторону коммерческих интеллектуальных мультимедийных курсов, создание которых могут себе позволить только крупные «софтверные» компании.

В данной работе частично были проанализированы существующие методы и модели, позволяющие построить так называемую интеллектуальную автоматизированную систему контроля знаний. Практические реализации собственных теоретических разработок в этой области уже есть: на сегодняшний день готова демонстрационная версия программы, проводящей тестирование по методу цепочек вопросов. Этот метод не является «интеллектуализацией» процесса контроля знаний, а является первым шагом к созданию системы, позволяющей преподавателю проводить текущий и финальный контроль более быстро, объективно и эффективно. Реализация методов адаптивного тестирования, использование нечеткой логики и инженерии знаний позволит достичь больших результатов в этой области.

Список использованной литературы

1. Касьянова Н. В. «Cоздание системы компьютерного контроля как результат новых информационных технологий в обучении», Восточноукраинский Национальный Университет (ВНУ), Украина, г.Луганск // материалы конференции ИТО-2001;

2. Бренич С.Г. «Проблема искусственного интеллекта. Кибернетика.» // реферат;

3. Иващенко А.И. «Контроль знаний и умений учащихся по математике в школе» // дипломная работа;

4. Ваньков Е.А. «Технологии компьютерного тестирования» // реферат;

5. Кузнецов А. А. «Универсальная автоматизированная обучающая система. Подсистема контроля знаний.» // дипломный проект;

6. Соловей Е.В. «Автоматизированная система контроля знаний «Цепь знаний». Сетевая версия» // дипломный проект;

7. http://ito.edu.ru/2001/ito/VI/VI-0-28.html;

8. Моисеев В.Б., Пятирублевый Л.Г., Таранцева К.Р. «Информационный подход к выбору решений в системах адаптивного тестирования». Материалы конференции «Анализ качества образования и тестирование». 22.03.2001, Москва, МО РФ, МЭСИ

9. Моисеев В.Б., Пятирублевый Л.Г., Таранцева К.Р. «Распознавание образа обучаемых по уровням их знаний в компьютерном тестировании». Сборник материалов Интернет-конференции «Проблемы перехода классических университетов в систему открытого образования». Москва. МЭСИ, 2001

10. http://ito.edu.ru/2001/ito/VI/VI-0-19.html;

11. http://ito.edu.ru/2001/ito/VI/VI-0-27.html;

12. Моисеев В.Б., Усманов В.В., Таранцева К.Р., Пятирублевый Л.Г. «Оценивание результатов тестирования на основе экспертно-аналитических методов». Журнал «Открытое образование», №3, 2001, с.32-36.;

13. http://ito.edu.ru/2001/ito/VI/VI-0-12.html;

14. http://ito.edu.ru/2001/ito/VI/VI-0-1.html;

15. http://ito.edu.ru/2001/ito/VI/VI-0-32.html;

16. http://ito.edu.ru/2001/ito/VI/VI-0-2.html;

17. http://ito.edu.ru/2001/ito/VI/VI-0-17.html;

18. http://www.tl.ru/~gimn13/ped/doclad/shuhard.html;

19. Аванесов B.C. Композиция тестовых заданий. Учебная книга для преподавателей вузов, учителей школ, аспирантов и студентов пед.вузов. 2 изд., испр.. и доп. М.: Адепт;

20. Границкая А.С. Научить думать и действовать: Адаптивная система обучения в школе: Кн. для учителя. М.: Просвещение;

21. Казаринов А.С., Култышева А.Ю., Мирошниченко А.А. Технология адаптивной валидности тестовых заданий: Учебное пособие. Глазов: ГГПИ, 1999;

22. Майоров А.Н. Тесты школьных достижений: конструирование, проведение, использование. Издание второе - СПб.: Образование и культура, 1997;

23. Кальней В.А., Шишов С.Е. Технология мониторинга качества обучения в системе “учитель-ученик”: Методическое пособие для учителя. М.: Педагогическое общество России, 1999;

24. Челышкова М.Б. Разработка педагогических тестов на основе современных математических моделей: Уч.пособие. М.: Исследовательский центр проблем качества подготовки специалистов, 1995;

25. П.Ю. Шалимов, В.И. Попоков «Технология рейтинговых исследований качества образования с применением нейронных сетей»

26. И.Д. Рудинский, Е.В. Соловей «Автоматизированный контроль знаний по методике уточняющих вопросов». Сборник материалов конференции, 2001

27. И.Д. Рудинский, Е.В. Соловей «реализация алгоритмов прямого тестирования в интеллектуальной автоматизированной системе контроля знаний». Сборник материалов конференции, 2001

28. И.Д. Рудинский «Метод адаптивного автоматизированного контроля знаний». Сборник материалов конференции, 2001

Страницы: 1, 2, 3, 4, 5

В соцсетях