Рефераты   Доклады  Документы  
Курсовая работа  
Лекции  
Литература  

1. История возникновения тестов интеллекта

1. История возникновения тестов интеллекта



Дата публикации20.05.2015
ТипДокументы
100-edu.ru > Документы > Документы
1.История возникновения тестов интеллекта.

Первым исследователем, использовавшим в психологической экспериментатике «интеллектуальный тест», был Дж.М.Кеттел. Этот термин после статьи Кеттела «Интеллектуальные тесты и измерения», опубликованной в 1890 году в журнале, приобрёл широкую известность. В своей статье Кеттел писал о том, что применение серии тестов к большому числу индивидов позволит открыть закономерности психических процессов и тем самым приведёт к преобразованию психологии в точную науку. Вместе с тем он высказал мысль о том, что научная и практическая ценность тестов возрастёт, если условия их проведения будут однообразными. Так впервые была провозглашена необходимость стандартизации тестов для того, чтобы стало возможным сравнение их результатов, полученных разными исследователями на разных испытуемых.

Кеттел предложил в качестве образца 50 тестов, включавших различного рода измерения чувствительности, времени реакции, времени, затрачиваемого на называние цветов, количества звуков, воспроизводимых после однократного прослушивания, и др. Вернувшись в Америку после работы в лаборатории Вундта и чтения лекций в Кембридже, он немедленно стал применять тесты в устроенной им при Колумбийском университете лаборатории (1891). Вслед за Кеттелом и другие американские лаборатории начали применять метод тестов. Возникла необходимость организовать специальные координационные центры по использованию этого метода. В 1895 – 1896 гг. В США были созданы два национальных комитета, призванных объединить усилия тестологов и придать общее направление тестологическим работам.

Метод тестов получает широкое распространение. Новый шаг в его развитии был сделан французским врачом Альфредом Бине (1857 - 1911), создателем самой популярной для своего времени серии тестов.

До Бине определялись, как правило, различия в сенсомоторных качествах – чувствительности, быстроте реакции т.д. Но практика требовала информации о высших психических функциях, обозначаемых обычно термином «ум», «интеллект». Именно эти функции обеспечивают приобретений знаний и упешное выполнение сложной приспособительной деятельности.

В 1904 г. Министерство образования Франции поручило Бине заняться разработкой методик, с помощью которых можно было бы отделить детей, способных к учению, но ленивых и не желающих учиться, от страдающих прирождёнными дефектами и не способных учиться в нормальной школе. Нужда в этом возникла в связи с введением всеобщего образования. Одновременно потребовалось создание специальных школ для умственно неполноценных детей. Бине в сотрудничестве с Анри Симоном провёл серию экспериментов по изучению внимания, памяти, мышления у детей разного возраста (начиная с трёх лет). Проведённые на многих испытуемых экспериментальные задания были проверены по статистическим критериям и стали рассматриваться как средство определения интеллектуального уровня.

Первая шкала тестов Бине-Симона появилась в 1905 году. Затем она несколько раз пересматривалась авторами, которые стремились изъять из неё все задания, требующие специального обучения. Бине исходил из представления о том, что развитие интеллекта происходит независимо от обучения, в результате биологического созревания.

Шкала Бине в последующих редакциях (1908 и 1911 гг.) была переведена на немецкий и английский языки. Вторая редакция шкалы (1908) отличалась тем, что в ней был расширен возрастной диапазон детей – до 13 лет, увеличено число задач и введено понятие умственного возраста. Самое широкое распространение получила вторая редакция шкалы Бине. Третья редакция шкалы, опубликованная в год смерти Бине, не внесла существенных изменений.

Задания в тесте Бине были сгруппированы по возрастам (от 3 до 13 лет). Для каждого возраста подбирались определённые тесты. Они считались соответствующими данной возрастной ступени, если их решало большинства детей данного возраста (80-90%). Детям до 6 лет предлагалось по 4 задания, а детям старше 6 лет – 6 заданий. Задания подбирались путём исследования большой группы детей (300 чел.).
Показателем интеллекта в шкалах Бине был умственный возраст, который мог расходиться с хронологическим. Умственный возраст определялся по успешности выполнения тестовых заданий, соответствующих хронологическому возрасту ребёнка. Если он справлялся со всеми заданиями, ему предлагались задания более старшей возрастной группы. Если он решал не все, а некоторые из них, испытание прекращалось. Если же ребёнок не справлялся со всеми заданими своей возрастной группы, ему давались задания, предназначенные для более младшего возраста. Испытания проводились до тех пор, пока не выявлялся возраст, все задания которого решаются испытуемым. Максимальный возраст, все задания которого решаются испытуемым, назывался базовым умственным возрастом. Если кроме того ребёноквыполнял также некоторое количество заданий, предназначенных для более старших возрастных групп, то каждое задание оценивалось числом «умственных» месяцев.

Несовпадение умственного и хронологического возраста считалось показателем либо умственной отсталости, либо одарённости.

Вторая редакция шкалы Бине послужила основой работы по проверке и стандартизации, проведённой в Стэнфордском университете (США) коллективом сотрудников под руководством Л.М.Термена. Этот вариант тестовой шкалы Бине был предложен в 1916 году и имел так много серьёзных изменений, по сравнению с основным, что был назван шкалой Стэфорд-Бине. Основных отличий от тестов Бине было два: введение в качестве показателя по тесту коэффициента интеллектуальности (IQ) и применение критерия оценки тестирования, для чего вводилось понятие статистической нормы.

Коэффициент IQ был предложен В.Штерном, считавшим существенным недостатком показателя умственного возраста то, что одна и та же разность между умственным и хронологическим возрастом для различных возрастных ступеней имеет неодинаковое значение. Штерн предложил определять частное, получаемое при делении умственного возраста на хронологический. Этот показатель, умноженный на 100, он назвал коэффициентом интеллектуальности. Используя этот показатель, можно классифицировать нормальных детей по степени умственного развития.

Шкала Стэнфорд-Бине расчитана на детей в возрасте от 2,5 – 18 лет. Она состоит из заданий разной трудности, сгруппированных по возрастным категориям. Для каждого возраста наиболее типичный, средний показатель выполнения (х) равен 100, а статистическая мера рассеяния (среднее квадратическое, или стандартное отклонение) индивидуальных значений от этого среднего (s) равняется 16. Все индивидуальные показатели по тесту, попавшие в интервал х±s, т.е. ограниченные числами 84 и 116, считаются нормальными, соответствующими возрастной норме выполнения теста. Если тестовый показатель выше тестовой нормы (более 116), ребёнок считается одарённым, а если ниже 84 – то умственно отсталым.

Шкала Стэнфорд-Бине получила популярность во всём мире. Она имела несколько редакций (1937, 1960, 1972, 1986 гг.). В последней редакции она применяется и в настоящее время. Показатель IQ, получаемый по шкале Стэнфорд-Бине, на долгие годы стал синонимом интеллекта. Вновь создаваемые интеллектуальные тесты стали проверяться на валидность путём сопоставления с результатами шкалы Стэнфорд-Бине. И многие из них также используют стандартную шкалу с параметрами: х=100, s=16.

Следующий этап развития психологического тестирования характеризуется изменением формы проведения тестового испытания. Все тесты, созданные в первом десятилетии ХХ века, были индивидуальными и позволяли вести опыт только с одним испытуемым. Использовать их могли лишь специально подготовленные люди, имеющие достаточно высокую квалификацию.

Эти особенности первых тестов ограничивали их распространение. Практика же требовала диагностировать большие массы людей с целью отбора наиболее подготовленных к тому или иному виду деятельности, а также распределения по разным видам деятельности людей в соответствии с их индивидуальными особенностями. Поэтому в США в период первой мировой войны появилась новая форма тестовых испытаний групповое тестирование.

В то время как индивидуальные тесты, такие как шкалы Стэнфорд-Бине, в основном применялись в клинике и для консультирования, групповые тесты использовались преимущественно в системе образования, в промышленности и в армии.

20-е годы ХХ столетия характеризовались настоящим тестовым бумом. Быстрое и широкое распространение тестологии было обусловлено прежде всего её направленностью на оперативное решение практических задач. Измерение интеллекта с помощью тестов рассматривалось как средство, позволяющее научно подойти к вопросам обучения, профотбора, оценки достижений и т.д.

На протяжении первой половины ХХ века специалистам в области психологической диагностики было создано множество разнообразных тестов. При этом, разрабатывая методическую сторону тестов, они доводили её поистине до высокого совершенства. Все тесты тщательным образом стандартизировались на больших выборках; тестологи добивались того, что все они отличались высокой надёжностью и определённой валидностью. Тем не менее им свойствены известные недостатки. Валидизация выявила ограниченные возможности тестов интеллекта: необходимая точность прогнозирования на их основе успешности выполнения конкретных, достаточно узких видов деятельности часто не достигалась. Требовалось, помимо знания общего уровня интеллекта, дополнительная информация об особенностях психики человека. Возникло новое направление в тестологии – тестирование специальных возможностей, которое вначале призвано было лишь дополнить оценки тестов интеллекта, а впоследствии выделилось в самостоятельную область.

2. Оценка надежности и валидности

Тест (англ. test — проба, испытание, исследование) — стандартизированные задания, результат выполнения которых позволяет измерить психофизиологические и личностные характеристики, а также знания, умения и навыки испытуемого.

Применяемая батарея тестов (в том числе компьютерная) должна отвечать требованиям валидности (соответствия, пригодности) и надежности.

Валидность теста – понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает (А. Анастази).

Валидность теста — это критерий степени достоверности измерения психического свойства (качества, явления), которое хотят оценить с помощью данного теста. По сути, валидность теста — это показатель степени его эффективности и практической полезности.

Различают следующие основные виды валидности:

  • конструктивную валидность;

  • валидность по критерию;

  • валидность по содержанию;

  • прогностическую валидность.

Валидность лучших тестов не превышает 80 %. Следует учитывать, что валидность меняется в зависимости от контингента людей, которые подвергаются тестированию, а также характера их будущей деятельности. В результате один и тот же тест может быть высоковалидным для одной ситуации, и совершенно невалидным для другой. Рассмотрим подробнее основные виды валидности тестов.
Конструктивная валидность — это критерий качества теста, используемый при измерении какого-либо сложного психического феномена, имеющего иерархическую структуру, измерить который из-за этого одним актом тестирования невозможно. К примеру, психодиагностика интеллекта невозможна без предварительного определения понятия «интеллект» и его структуры. В данном случае степень соответствия структуры интеллекта структуре теста и будет составлять конструктивную валидность теста. В общем она нацелена на определение точности измерения сложных, устойчивых типов поведения, качеств личности, психических явлений.

Валидность по критерию — это критерий качества теста, с помощью которого можно судить об интересующем аспекте психики конкретной личности в настоящем и будущем. Для его определения сопоставляются результаты тестирования с уровнем развития измеряемого признака, качества личности на практике. Так, для теста на технические способности основным критерием их определения будет выступать техническая деятельность конкретных специалистов, оценка их технических способностей с помощью экспертов, хорошо знающих испытуемых в интересующем аспекте на протяжении достаточно продолжительного времени. Оценка при этом дается по шкале порядковой, интервальной или отношений. В целом применение теста считается оправданным, если валидность по критерию составляет минимум 0,2-0,25.

Валидность по содержанию — критерий качества теста, используемый при выяснении соответствия его области измеряемых психических явлений. Показывает, насколько полно тест охватывает исследуемое множество измеряемых параметров.

Прогностическая валидность — критерий качества теста, предсказывающий характер развития измеряемого параметра в будущем. Данный вид валидности особенно ценен с практической точки зрения. Однако существенным недостатком критерия является то, что он не учитывает неравномерность развития измеряемого параметра у различных людей в будущем.

Надежность теста — это его фундаментальная характеристика, показывающая степень стабильности результатов тестирования при неоднократном обследовании. Может определяться путем повторного тестирования через строго определенный отрезок времени и вычисления коэффициента корреляции между результатами первого и повторного тестирований. При этом важно учитывать, что надежность результатов тестирования зависит не только от качества самого теста, но и от процедуры проведения тестирования (она должна быть одинаковой в первом и последующих случаях) и социально-психологической однородности выборки. Надежность теста может быть различной, к примеру, для подростков, мужчин, женщин, представителей различных социальных групп. Таким образом, надежность теста, выражая степень неточности, возможность ошибки, возникающей при любом тестировании, заставляет искать пути уменьшения этой ошибки, более конкретного, целенаправленного применения теста. Надежность лучших тестов составляет 0,8-0,9.

В целом для того, чтобы методы отбора оказались результативными, они должны быть достаточно надежными, достоверными. Достоверность метода отбора характеризуется его неподверженностью систематическим ошибкам при измерениях, то есть состоятельностью при переменных условиях.

На практике достоверность при вынесении суждений достигается сравнением результатов двух (или более) аналогичных тестирований, проведенных в разные дни. Многие квалифицированные эксперты отмечают, что результаты теста характеризуют человека в определенное время в определенном месте.

Не следует сбрасывать со счетов и волнение кандидатов в процессе тестирования. Профессиональные специалисты, проводящие тестирование, как правило, наблюдают за состоянием тестируемых и в случае необходимости стараются их успокоить.

Другой путь повышения достоверности — сравнение результатов нескольких альтернативных методов отбора (например, тестов и собеседования). Чем более сходны результаты, полученные с помощью нескольких адекватных задачам отбора методов, тем они более достоверны.

Помимо достоверности оценок, необходима обоснованность принятых критериев отбора. Под обоснованностью критериев отбора понимают то, с какой степенью точности данный критерий предсказывает будущую результативность кандидата в конкретной профессиональной деятельности. Обоснованность методов отбора относится не к самой процедуре отбора, а к выводам, сделанным на ее основе. Иными словами, метод отбора может сам по себе быть достоверным, но не соответствовать конкретной задаче, то есть измерять не то, что требуется в данном случае.

Кстати, не только новые тесты проходят такой экзамен. В настоящее время многие исследователи заняты анализом эффективности уже известных тестов. Недавняя полемика на страницах психологических журналов поставила под сомнение эффективность таких "мэтров" психодиагностических инструментов, как тест чернильных пятен Роршаха, ТАТ (тест тематической апперцепции) и проективный тест-рисунок фигуры человека. Оказалось, что эти психодиагностические методики имеет низкую эмпирическую валидность, низкую тест-ретестовую надежность и некорректно составленные нормативные показатели.

Вышеприведенные методы оценки эффективности теста помогают психологу не только самому конструировать инструменты для измерения определенных свойств личности, но и выбирать из уже разработанных тестов наиболее качественные и надежные.
3. Области применеия тестов интеллекта.

Для диагностики умственного развития используются тесты интеллекта. Тесты интеллекта - группа тестов, предназначенных для оценки уровня развития мышления (интеллекта) человека и таких его отдельных когнитивных процессов, как память, внимание, воображение, речь, восприятие.

Использование для профессиональной ориентации. В ситуациях, касающихся оценки будущего успеха конкретного человека в его профессиональной деятельности, к интерпретации результатов теста следует подходить еще более ответственно. Корреляция между результатами тестирования и средним уровнем успеха в конкретной сфере деятельности недостаточно высока для того, чтобы можно было делать точные прогнозы в отношении конкретного человека. Таким образом, те, кто ждет от профессионального консультирования однозначного ответа на вопрос, какую профессию выбрать, будут разочарованы. Тесты дают лишь ограниченную информацию, которая должна быть дополнена сведениями из многих других источников. Тесты способностей иногда излишне рекламируются, однако во многих ситуациях, где требуется оценка каких-то специфических характеристик человека, они бесспорно полезны.
4. Что такое коэффициент интеллекта?

Коэффициент интеллекта (англ. IQ — intelligence quotient) — количественная оценка уровня интеллекта человека относительно среднестатистического человека. Коэффициент интеллекта является попыткой оценки фактора общего интеллекта.

Понятие коэффициента интеллекта ввел В.Штерн в 1912 году. Штерн обратил внимание на серьезные недостатки умственного возраста, как показателя в шкалах Бине. Штерн предложил определять относительную пару (частное, получаемое при делении умственного возраста на хронологический). IQ впервые был использован в шкале интеллекта Стенфорда-Бине в 1916 году.

Буквы IQ («Ай-Кью») являются сокращением выражения «коэффициент интеллекта», который является способом описывать результаты таких тестов математическим языком. Например, IQ шестилетнего ребенка с шестилетним возрастом умственного развития составляет 100. Возраст умственного развития делится на хронологический возраст, а затем умножается на сто. Если в пятилетнем возрасте умственное развитие соответствует шести годам, то IQ будет равен 120 (шесть разделить на пять и умножить на 100). IQ между 90 и 100 является средним; результаты же, которые превышают 110, будут превосходными.

По статистике, в XX веке средний показатель IQ у женщин был ниже, чем у мужчин. Однако в XXI веке средний показатель IQ у мужчин стал ниже, чем у женщин.
5. Основные тесты интеллекта.

Для диагностики умственного развития учащихся 7-9-х классов коллективом К. М. Гуревича разработан Школьный тест умственного развития (ШТУР).

В задания ШТУР были включены понятия, подлежащие обязательному усвоению, в учебных предметах трех циклов: математического, гуманитарного и естественно-научного. Кроме того, определялась осведомленность в некоторых понятиях общественно-политического и научно-культурного содержания.

Тест состоит из 6 субтестов: 1 и 2 - на общую осведомленность, 3 - на установление аналогий, 4 - на классификацию, 5 - на обобщение и 6 - на установление закономерностей в числовых рядах.

От традиционных тестов ШТУР отличают ряд особенностей:

- особое содержание, которое представлено в заданиях (не житейские, а школьные понятия, обязательные для усвоения);

- иные способы репрезентации и обработки диагностических результатов (отказ от статистической нормы и использование в качестве критерия оценки индивидуальных результатов степени приближения к социально-психологическому нормативу);

- коррекционная направленность методики, то есть возможность предусматривать на ее основе специальные способы исправления замеченных дефектов развития.

ШТУР соответствует высоким статистическим критериям, которым должен соответствовать любой диагностический тест. Он апробирован на больших выборках и доказал свою эффективность при определении умственного развития учащихся подросткового возраста.
Для диагностики умственного развития старшеклассников (8-10-е классы) может быть использован Тест структуры интеллекта Р. Амтхауэра. Он создан в 1953 г. (последняя редакция осуществлена в 1973 г.) и предназначен для измерения уровня интеллектуального развития лиц в возрасте от 13 до 61 года.

Тест разрабатывался в первую очередь как тест диагностирования уровня общих способностей в связи с проблемами профессиональной психодиагностики. При создании теста Р. Амтхауэр исходил из концепции, согласно которой интеллект является специализированной подструктурой в целостной структуре личности и тесно связан с такими компонентами личности, как волевая и эмоциональная сферы, интересы и потребности.

Интеллект понимается Р. Амтхауэром как единство некоторых психических способностей, проявляющихся в различных формах деятельности. В тест им были включены задания на диагностику следующих компонентов интеллекта: вербального, счетно-математического, пространственного, мнемического.

Тест содержит девять субтестов, каждый из которых направлен на измерение различных функций интеллекта: осведомленность, классификации, аналогии, обобщения, арифметические задачи, числовые ряды, пространственные представления (2 субтеста), запоминание вербального материала. Шесть субтестов диагностируют вербальную сферу, два - пространственное воображение, один - память.

Р. Амтхауэр при интерпретации результатов теста предполагал, что с его помощью можно судить о структуре интеллекта испытуемых (по успешности выполнения каждого субтеста). Для грубого анализа «умственного профиля» он предлагал подсчитать отдельно результаты по первым четырем и по следующим пяти субтестам. Если суммарная оценка первых четырех субтестов превышает суммарную оценку следующих пяти субтестов, то у испытуемого больше развиты теоретические способности. Если наоборот, то практические способности.

Кроме того, по результатам тестирования можно выделить приоритетное развитие гуманитарных (по результатам выполнения первых четырех субтестов), математических (5-й и 6-й субтесты) или технических (7-й и 8-й субтесты) способностей, что может быть использовано в проведении профориентационной работы.

Школьный тест умственного развития (ШТУР)

Школьный тест умственного развития предназначен для диагностики умственного развития подростков - учащихся 6-8 классов (это соответствует 7-9-м классам в современном исчислении).

ШТУР состоит из 6 субтестов, каждый из которых может включать от 15 до 25 однородных заданий.

Два первых субтеста направлены на выявление общей осведомленности школьников и позволяют судить о том, насколько адекватно используют учащиеся в своей активной и пассивной речи некоторые научно-культурные и общественно-политические термины и понятия.

Третий субтест направлен на выявление умения устанавливать аналогии, четвертый - логические классификации, пятый - логические обобщения, шестой - нахождение правила построения числового ряда.

Тест ШТУР является групповым. Время, отведенное на выполнение каждого субтеста, ограничено и является вполне достаточным для всех учащихся. Тест разработан в двух параллельных формах А и Б.

Тест «Прогрессивные матрицы Равена» основан на использовании графических объектов. Каждый кто проходит тест, должен будет определить недостающие сегменты, чтоб воссоздать целостность системы. Само название теста – матрицы – происходит как раз из того, что многие предметы представлены в качестве 3x3 или 2x2 матриц.

Матрицы предлагаются в трех различных формах: стандартные, цветные, расширенные.

В стандартных прогрессивных матрицах речь идет о наборе из пяти серий по 12 заданий в каждой. Особенность заключается в том, что элементы внутри каждой серии заданий становятся все более сложными, требующими все большей познавательной возможности для анализа информации. Все задания представлены в чёрно-белом цвете.

Цветные прогрессивные матрицы предназначены для детей младшего возраста, пожилых людей и людей с умеренными или тяжелыми трудностями в обучении.

Эта форма теста содержит наборы A и B от стандартных матриц и еще набор из 12 предметов. Большинство заданий представлены на цветном фоне, чтобы визуально стимулировать умственную деятельность участников теста.

Расширенные прогрессивные матрицы содержат 48 заданий, представленных как один комплект из 12 (набор I), и еще 36 (набор II). Задания вновь изображены черной краской на белом фоне, и становится все труднее к концу теста. Этот тип теста Равена подходит для взрослых и подростков интеллекта выше среднего.

Тест Векслера разработан Дэвидом Векслером в 1939 году. Это один из самых популярных тестов, применяемых для измерения уровня интеллекта. Очень распространен в англоязычных странах. При этом диагностируется не только общий интеллект, но и две его составляющие вербальный и невербальный части.

Тест Векслера имеет 11 подтестов, 5 из которых изучают невербальные способности, а 6 вербальные. В каждом тесте имеется от 10 до 30 вопросов, которые постепенно усложняются.

Что же такое вербальный интеллект?

Это способности отвечающие за понятливость, осведомленность, способность человека понять схожесть и расхождение объектов, интеллектуальные возможности воспроизводить цифровые ряды.

Под невербальными способностями понимают возможности к расшифровке, нахождению недостающего звена, определение четкой последовательности, сложение элементов в единое целое.

Оценивание результатов теста происходит в баллах, которые далее переводятся в шкальные оценки.

При этом анализироваться будет, как ответ на каждое отдельное задание, так и общий результат теста. Низкая оценка по какому-либо из субтестов свидетельствует об нарушениях в интеллекте испытуемого.

Добавить документ в свой блог или на сайт

Похожие:

Измерение коэффициента интеллекта и рисуночное тестирование детей...
Авторами проведено измерение коэффициента интеллекта детей с помощью пяти тестов [3], разработанных для детей от 5 до 11 лет, и с...

В. К. Финн к структурной когнитологии: феноменология сознания с точки...
Ки и искусственного интеллекта – полигона экспериментальной проверки научных средств имитации рациональности и продуктивного мышления....

Урок изучения нового материала
Цель. Закрепить определение и свойства тригонометрических функций. Назначение тригонометрических функций, необходимость их возникновения....

Диплом Арабица. История возникновения и распространения письменности. Особенности бытования
Арабица. История возникновения и распространения письменности. Особенности бытования

Контрольные вопросы но дисциплине «История и методология русской...
Живое взаимодействие и взаимопроникновение различных отраслей научных знаний в литературоведение (филология и философия)

Предпосылки возникновения
Реферат на тему: Предпосылки возникновения Гарвардской школы экономических учений

История возникновения иконописи
Признание художественного значения древнерусской иконы и возрождение интереса к ней

«История возникновения интервальной тренировки и её принципы»
Аэробика и фитнес-гимнастика для дошкольников, школьников, студентов и военнослужащих

В пункте 1 гос впо (требования по опд) выделены базовые вопросы,...
...

Рабочая программа дисциплины «история химии»
Целями освоения дисциплины «история химии» являются: сформировать у студентов знания по истории возникновения и развития химической...

Поиск


При копировании материала укажите ссылку © 2016

контакты
100-edu.ru
100-edu.ru