Pruebas Estandarizadas
UNIVERSIDAD PEDAGÓGICA NACIONAL
Unidad UPN- 212
Teziutlán, Puebla
Licenciatura: pedagogía
Introducción……………………………………..........................................................… 4
1. Las pruebas estandarizadas………………….........................................................….. 5
1.2 ¿Qué son las pruebas estandarizadas?.......................................................................... 5
1.3 Características de las pruebas estandarizadas….......................................................... 5
1.4 Propósito de las pruebas estandarizadas……….................................................……. 6
2. Pruebas intelectuales……………………………................................................……. 7
2.1 Escala Wechesler para preescolar y primaria…......................................................…. 7
2.2 El test de Matrices progresivas de RAVEN……..................................................…. 17
2.3 El STAN-FORD-BINET………………………….........................………………. 26
3. Pruebas de aptitudes específicas…………….........................................................….36
3.1 La Batería de Aptitudes Diferenciales y
Generales de YUSTE (BADyG)..…………………………............................………. 36
3.2Test de Naipes “G”…………………………………….................……………… 51
3.3 Aptitudes musicales de SEASHORE………………......................................…… 57
4. Pruebas de creatividad…………………………….............................................….63
4.1 TORENCE………………………………………………………………… 63
4.2TAECE…………………………………………………………………………. 71
4.3 PIC……………………………………………………………………………… 75
5. Pruebas personales…………………………………………...............................… 83
5.1 Cuestionario EYSENCK……………………………………...................….…… 83
5.2 Cuestionario de CATELL. (EPQ-J, ESPQ,
CPQ, HSPQ)…………………...…… 94
6. Pruebas socio-emocionales…………………….............................................…….102
6.1 El TAMAI…………………………………………………………………. ......102
6.2 El BAS……………………………………………………………………….... 105
7. Conclusión............................................................................................................. 113
A lo largo de la historia de la educación, se han buscado maneras de mejorar los aspectos positivos y negativos, además de potenciar las habilidades de las persona, para así, brindar la oportunidad de que tengan una mejor vida en todos lo aspectos (profesional, académico, social, personal). Así pues se cae en cuenta de que la mejor forma de ayudar a que esto pase, es a través de descubrir cuales son estas fortalezas y debilidades de cada individuo, para que así se pueda trabajar a partir de ellos, y mejorar lo mas posible cada uno de ellos, y así es que muchos estudioso e investigadores, de dan a la tarea de encontrar el como hacerlo, dando vida, a los tets o pruebas de los distintos aspectos que tiene una persona (este proceso es largo y cada uno de los autores lo concibe en un tiempo y espacio distinto). Al paso del tiempo estos van evolucionando o mejorando apegándose a las necesidades de la creciente y cada vez mas exigente sociedad; de modo que como se vera mas adelante los tests van sufriendo varios cambio y renovaciones.
De todo ello surgen las clasificaciones de estas pruebas, lo que de cómo resultado, dos ramas de pruebas, las no estandarizadas, que sirven para medir una habilidad (casi siempre de personalidad) de forma no individual, y que no tiene en si un sistema de medición concreto y rígido, sino mas bien se basa en la interpretación que el experto da a esta. Por otro lado se encuentran las pruebas estandarizadas, que son el objeto de este pequeño compendio, donde, con el afán de dar a conocer algunas de las muchas pruebas estandarizadas para medir la inteligencia, las aptitudes, la creatividad y las emociones, se han reunido diversos trabajos de investigación sobre, ellas, en si dentro de este catalogo, no se encontrara prueba o información que este interpretada por la investigadora, esto con el fin de mantener la esencia de cada trabajo, sin embargo esto no quiere decir que solo se buscaron y ya, más allá de esto, cada investigación tuvo que pasar por un análisis reflexivo, sobre la importancia y validez de su contenido, así que en algunos caso se encontraran apartados que tengan información de mas de una investigación analizada.
1. Las pruebas estandarizadas
1.2 ¿Qué son las pruebas estandarizadas? Las pruebas estandarizadas son conocidas por ser iguales para todos, es decir, estas miden una característica de un grupo en general con algunas características similares, (en especifico, algún rango de edad y escolaridad) ya sea de alguna habilidad, conocimiento, aptitud, etc. Como todo mundo sabe una prueba es un instrumento para medir alguna característica, de los sujetos, la particularidad de las pruebas estandarizadas, es precisamente eso, que son estandarizadas, es decir, manejan un patrón igual en todas las pruebas. De tal forma que se obtenga información sobre los que presentan este tipo de pruebas, y se pueda decir si, están por encima del promedio, debajo de el, o sobre el, y así el orientador o docente, pueda actuar a partir de el. “Es una tarea o conjunto de tareas dadas bajo condiciones estándar y que está diseñada para evaluar algún aspecto del conocimiento habilidades o personalidad de un individuo.”Green (1981:1001). En la cita anterior es definida más concretamente lo que es una prueba estandarizada. Cabe mencionar que estas pruebas, por lo general obtienen o son ideales para alcanzar una evaluación sumativa, que a ojos de mucho, es algo justo y equitativo para las personas que son evaluadas.
1.3 Características de las pruebas estandarizadas Estas pruebas se caracterizan por ser iguales para todos, además de que pueden o son ocupadas para diferentes grupos pero que en cierto sentido tienen una característica en común, como el grado de escolaridad, en el caso de la educación, por ejemplo hay dos grupos de 3er año de primaria, y se requiere saber cuanto conocimiento tienen de matemáticas; sin embargo un grupo pertenece a una escuela bilingüe y la otra a una zona urbana, y a pesar del contexto y de las desventajas que pueda presentar un grupo frente al otro, la prueba es la misma. En cambio si se va a evaluar a un grupo de 3ro y a uno de 4to, la prueba cambia, por el simple hecho de que los grupos no presentan el mismo grado de escolaridad. Otra característica es que estas pruebas presentan el mismo grado de dificultad en cualquier contexto, no importando el tiempo y el espacio, un ejemplo claro, es la prueba ENLACE, que se presenta año tras año, en el país. Cabe mencionar que las pruebas, por lo regular, son de preguntas de opción múltiple, que tiene una sola respuesta correcta; no hay respuestas abiertas, además de que son objetivas, y por lo tanto de origen cuantitativo, y que están orientadas a una evaluación sumativa. 1.4 Propósito de las pruebas estandarizadas Estas tienen un propósito en concreto, evaluar a un grupo de personas, para así medir su rendimiento en alguna particularidad, como el intelecto, conocimiento de algún tema, aptitudes, capacidades, etc. Para poder trabajar a partir de ahí y así poder reforzar los aspectos positivos del grupo y poder erradicar en lo posible los aspectos negativos de ellos. Además de proporcionar una o más puntuaciones cuantitativas obtenidas de manera objetiva, de modo que a cada sujeto se le evalúe del mismo modo. Otra intención consiste en proporcionar una comparación justa y equitativa entre las personas evaluadas. 2. Pruebas intelectuales 2.1 Escala Wechesler para preescolar y primaria LA ESCALA DE INTELIGENCIA PARA NIÑOS DE WECHSLER La escala de inteligencia para niños de Wechsler, WISC-R (1974; TEA, 1993), es una versión actualizada y revisada de la escala de 1949 (WISC). Está constituida, como lo estaba el WISC, por doce subtests, seis en la escala verbal y seis en la escala manipulativa, o ejecución. Dígitos, de la escala verbal, y laberintos, de la escala manipulativa, se consideran pruebas complementarias. Pueden ser aplicadas cuando el tiempo lo permita, o como sustitutas en el caso de que las otras pruebas no puedan ser utilizadas de forma conveniente o queden invalidadas por alguna razón. CARACTERÍSTICAS ESTRUCTURALES Las Escalas WAIS, WISC y WIPPSI; son escalas compuestas, formadas cada una por una Escala Verbal y una Escala de Ejecución; de modo que con la aplicación de cualquiera de ellas se obtienen tres puntuaciones: Un CI Verbal un CI de ejecución o CI Total. Estas puntuaciones reflejan que la inteligencia está constituida no solamente por la habilidad para manejar símbolos, abstracciones y conceptos; sino que también se relaciona con la habilidad para manejar situaciones y objetos concretos. Las escalas verbal y de ejecución están formadas por una serie de pruebas más específicas que se denominan subtest. Estos, a su vez, están conformados por un cierto número de ítems organizados por niveles en orden de dificultad creciente. LA ORGANIZACIÓN DE LOS SUBTETS SUBTESTS QUE COMPONEN LA ESCALA WISC-R. ESCALA VERBAL 1. Información. Evalúa la información que el sujeto puede adquirir tanto a través de la educación formal, en la escuela, como informal, en el ambiente en el que se desenvuelve.
2. Semejanzas. Mide la habilidad para seleccionar y verbalizar las relaciones entre dos conceptos, el pensamiento asociativo y la capacidad de abstracción verbal.
3. Aritmética. Evalúa la habilidad para utilizar conceptos numéricos abstractos, operaciones numéricas y la capacidad de atención y concentración.
4. Vocabulario. Requiere que el sujeto diga el significado de 32 palabras de dificultad creciente. Refleja el nivel de educación, la capacidad de aprendizaje y el ambiente en el que se desenvuelve el sujeto.
5. Comprensión. El sujeto debe explicar qué haría en determinadas circunstancias o por qué se siguen determinadas prácticas. Evalúa el juicio práctico, el sentido común y la adquisición e interiorización de elementos culturales.
6. Dígitos. (Prueba verbal complementaria). La tarea del sujeto es repetir una serie de dígitos que se le presentan oralmente. Evalúa la memoria auditiva inmediata y la capacidad de atención y resistencia a la distracción.
ESCALA MANIPULATIVA O DE EJECICIÓN
7. Figuras incompletas. La tarea del sujeto es indicar qué parte de los dibujos presentados es la que falta. Requiere la identificación de objetos y utensilios familiares y el aislamiento de los aspectos esenciales de los no esenciales.
8. Historietas. La tarea del sujeto es disponer las tarjetas en una secuencia determinada para que relaten o reflejen una historia. Evalúa la percepción, la integración visual de una serie de elementos presentados secuencialmente, y su síntesis en un conjunto inteligible.
9. Cubos. En este subtest el sujeto debe construir con cubos unos dibujos, de complejidad creciente. Evalúa la capacidad para analizar, sintetizar y reproducir dibujos geométricos abstractos.
10. Rompecabezas. La tarea consiste en ensamblar una serie de figuras, que se presentan cortadas en trozos, para formar una figura completa, dentro de un tiempo límite. Mide la capacidad para sintetizar un objeto conocido a partir de sus partes. Requiere capacidad de síntesis visual, coordinación visomotora y capacidad para trabajar imaginando lo que está construyendo.
11. Claves. La tarea del sujeto es completar, con los símbolos adecuados, los dibujos o dígitos que se le presentan. Evalúa sobre todo la destreza visomotora, el manejo de lápiz y papel y la capacidad de aprendizaje asociativo.
12. Laberintos. (Prueba manipulativa complementaria). La tarea es encontrar la salida del laberinto, señalándola con un lápiz. Mide la coordinación visomotora, la rapidez y la capacidad de planeamiento y previsión. Categorías nominales INTERPRETAR EL COCIENTE INTELECTUAL TOTAL (CIT). El CIT es una puntuación que resume la ejecución de una persona en 10 o 12 tareas y, por tanto, debe ser tomada como tal. No se debe sobreestimar como indicador de la capacidad cognitiva, sobre todo si aparecen discrepancias entre el cociente intelectual verbal (CIV) y el manipulativo (CIM) o si el perfil de puntuaciones presenta una o más diferencias significativas. Diferencias amplias entre el CIV y el CIM, fluctuaciones notables en las puntuaciones típicas de los subtests administrados, o la presencia de variables como fatiga, ansiedad o la pertenencia a grupos socioculturales deprimidos o marginales, disminuye la importancia del CIT como indicador de la capacidad cognitiva de una persona.
INTERPRETAR LAS PUNTUACIONES SEGÚN HABILIDADES Y DESVENTAJAS.
El método que se describe a continuación, tomado de Kaufman (1979, 1994), tiene por objeto generar hipótesis que permitan explicar el funcionamiento del sujeto en las tareas o subtests administrados y poner al descubierto las áreas de habilidades y fragilidades de su ejecución. Se trata de proponer explicaciones que nos permitan conocer cómo se organizan sus habilidades y dificultades. Para ello, se procede de la siguiente forma: Paso 1. Determinar las ventajas o habilidades (H) y las desventajas o debilidades (D) significativas. Lo primero que se debe comprobar es si las diferencias entre el CIV y el CIM son significativas. Si no lo son, se halla la media personal del sujeto con todos los subtests que se han aplicado. Si las diferencias entre el CIV y el CIM son significativas, se halla la media personal del sujeto para las escalas verbal y manipulativa, separadamente, y se redondea al entero más próximo. Se toma como significativa toda desviación de ±3 puntos en relación a esta media. Así, si un sujeto obtiene en la escala verbal una puntuación media personal de 11, toda puntuación de 8 o inferior representa una debilidad o dificultad (D), y toda puntuación de 14, o superior supone una habilidad (H). Paso 2. Seleccionar un subtest que represente una habilidad del sujeto y localizarlo en las tablas 5, 6, 7 y 8. Escribir todas las habilidades que comparte con otros subtests (y las influencias que afectan a la ejecución). Paso 3. Considerar cada una de las habilidades e influencias que afectan a la ejecución, y valorar si esa habilidad, o influencia, puede explicar la realización del sujeto. Para ello se debe comparar la puntuación de cada uno de los subtests que comparten una habilidad, o influencia, determinada con su media personal. Se considera que una habilidad compartida por dos o más subtests puede ser considerada un área fuerte cuando los subtests que comparten esa habilidad tienen puntuaciones típicas por encima de la media personal, desviándose significativamente, al menos uno de ellos, de la media personal del sujeto. Esta regla también se aplica a los subtests que representan áreas de debilidades o dificultades del sujeto. En este caso, las puntuaciones típicas deben situarse por debajo de la media personal y, al menos una, debe desviarse significativamente de la media personal. Se pueden considerar dos excepciones a esta regla: a) Si son tres o cuatro los subtests que comparten una habilidad, dificultad o influencia, entonces se puede aceptar que la puntuación de uno de ellos sea igual a la media personal. b) Si son cinco, o más, los subtests que comparten una habilidad, dificultad o influencia, es aceptable que la puntuación típica de uno de ellos sea igual a la media personal del sujeto, o incluso que se sitúe "en el otro lado de la media". Es decir que sea inferior a la media personal, cuando se trate de una habilidad, y superior a la media personal cuando estemos analizando una dificultad, siempre que la diferencia no sea significativa. Paso 4. Repetir los pasos 2 y 3 para cada una de las habilidades y dificultades que aparecen en el perfil de puntuaciones del sujeto. Paso 5. Integrar toda la información proveniente del análisis de las habilidades y dificultades del sujeto, con la obtenida a través de entrevistas, observaciones y otras pruebas o instrumentos de evaluación administrados. Paso 6. Si no es posible formular hipótesis explicativas de las áreas fuertes y débiles de laejecución del sujeto, basadas en dos o más subtests, entonces deberemos explicarsus habilidades o dificultades haciendo referencia a las habilidades que mide cada subtest en particular (véase tabla 9). Para ello debemos tener en cuenta la especificidad del subtest. Para interpretar las habilidades específicas subyacentes a cada subtest hay que tener en cuenta que poseen distinto grado de especificidad. La especificidad de un subtest es la porción de la varianza de las puntuaciones que es atribuible a ese subtest en particular, y que no comparte con los otros subtests de la escala. Un subtest puede ser interpretado en función de una habilidad única cuando posee un alto grado de especificidad (una desviación de ±3 puntos de la media es suficiente). Si la especificidad es adecuada conviene interpretarlo tomando algunas precauciones (una desviación de ±4 puntos de la media permite hacer inferencias). Si la especificidad es inadecuada no conviene interpretarlo como habilidad única a no ser que se observe una diferencia grande (±6 puntos) y se rechacen las hipótesis respecto a las capacidades compartidas. Kaufman (1979) estudió las varianzas específicas de los subtests del WISC-R, con la muestra deestandarización, y los clasificó según su especificidad. La tabla 4 recoge esta clasificación.
EJEMPLO DE INTERPRETACIÓN DE LAS PUNTUACIONES DEL WISC-R, SEGÚN KAUFMAN.
Este apartado trata de los pasos que se deben seguir para interpretar las puntuaciones del WISCR,según el método de habilidades y dificultades, descrito anteriormente. Para realizarlo utilizaremos las puntuaciones del WISC-R de un sujeto (Joan) de 12 años. El cociente intelectual total de Joan es medio. El intervalo en el que se sitúa su cociente intelectual, con una probabilidad del 95%, oscila entre 97 y 107. Los cocientes intelectuales verbal y manipulativo también son medios. No existen discrepancias significativas entre ellos, por lo que hallaremos su media personal a partir de la suma de las puntuaciones típicas de los 12 subtests. La suma de las puntuaciones típicas es 120 que, dividida por 12, (subtests administrados) es igual a 10. Así, la media personal de Joan en el WISC-R es 10. Todo subtest que tenga una puntuación típica de 13 o superior, se considera una habilidad o ventaja (H) y el que presente una puntuación típica de 7 o inferior, se considera una inhabilidad o desventaja (D). Los subtests que representan habilidades o puntos fuertes de Joan son vocabulario, figuras incompletas y cubos. Aritmética, dígitos y claves se consideran desventajas o puntos débiles. Una vez establecidos los puntos fuertes y débiles hemos de indagar qué habilidades e influencias pueden influir, o estar relacionadas con la ejecución de Joan en esos subtests. Para ello hemos de seguir un proceso de formulación de hipótesis. Posteriormente analizaremos estas hipótesis para retenerlas o descartarlas, como explicaciones posibles de las puntuaciones significativamente altas o bajas de Joan. El paso siguiente es elegir un subtest que sea una habilidad, o punto fuerte. A continuación, utilizando las tablas 3, 4, 5 y 6, se hace una lista de las habilidades e influencias que sustentan la ejecución en ese subtest. El cuadro siguiente recoge la lista de habilidades e influencias que pueden estar relacionadas con la ejecución de Joan en vocabulario. En el cuadro hemos señalado con un asterisco (*) las hipótesis que se pueden mantener como posible explicación de la buena ejecución de Joan en vocabulario. No podemos decir, por ejemplo, que una buena memoria a largo plazo puede ser la explicación de la puntuación de Joan en vocabulario porque este subtest comparte esta habilidad con información, cuya puntuación típica es igual a la media personal de Joan, y con aritmética, que es una desventaja. Es decir, no puedo utilizar como explicación de una buena ejecución, una habilidad que es compartida, a la vez, por subtests que se consideran puntos fuertes y débiles de la ejecución de Joan. También rechazamos la hipótesis de una buena capacidad para formar y manejar conceptos verbales porque esta habilidad la comparten vocabulario y semejanzas y este último subtest presenta una puntuación típica igual a la media personal de Joan. Sin embargo sí retenemos la habilidad para formar conceptos como una posible explicación de la buena ejecución de Joan en vocabulario, ya que de los dos subtests que comparten esta habilidad, uno es un punto fuerte (cubos) y el otro tiene una puntuación igual a la media personal (semejanzas).
2.2 El test de Matrices progresivas de
RAVEN
TEST DE MATRICES PROGRESIVAS DE RAVEN
TABLA DE DIAGNOSTICO DE CAPACIDAD INTELECTUAL
2.3 El STAN-FORD-BINET
NOMBRE: EDAD: AÑOS MESES:
FECHA DE APLICACIÓN:
OCUPACIÓN:
ESCOLARIDAD:
ANÁLISIS CUANTITATIVO PUNTAJE:
PERCENTIL:
RANGO:
DIAGNOSTICO:
ANÁLISIS CUALITATIVO EVALUACIÓN:
EXAMINADOR:
Ejemplo de una matriz
2.3 El STAN-FORD-BINET ANTECEDENTES
Los primeros esfuerzos sistemáticos tendientes a buscar una solución a la carga que significaban los individuos con menor capacidad intelectual en el sistema educacional, se remontan al año 1894, en que la Municipalidad de París encargó al psicólogo Alfred Binet que buscara un método que permitiera seleccionar de entre los educandos a aquellos que no estuviesen capacitados para los estudios. Este hecho determinó no sólo el surgimiento de los test de Inteligencia en Francia, sino un modo de enfrentar el problema orientado exclusivamente por consideraciones prácticas. Lo que la Inteligencia (o su falta) significaba conceptualmente, no preocupó a Binet, llegando éste a afirmar que inteligencia era lo que medían sus pruebas. Distinto fue el caso de Francis Galton, en Inglaterra. Llevado por su inquietud de estudiar los mecanismos de la herencia, especialmente de las capacidades intelectuales, desarrolló una serie de pruebas que publicó en 1893, tendientes a medir capacidades intelectuales, utilizando ya entonces la palabra “test" para designarlas. Aun cuando la base de la psicología de los test se debe a Galton y sus seguidores, tuvieron mayor relevancia en el campo de la educación los trabajos de Binet. Sus primeros procedimientos para medir las capacidades de los niños en edad escolar los corrigió posteriormente con Th. Simon. Durante algún tiempo colaboró con ellos también Jean Piaget. Este, al darse cuenta mientras revisaba los ítem y las respuestas de los niños, que los errores que cometían los niños de diferente edad ante un mismo ítem eran distintos, pero que eran semejantes si los niños tenían una edad similar, comenzó a interesarse por el estudio de la evolución del razonamiento en los niños, tarea a la que dedicó el resto de su vida. Una primera serie de pruebas ordenadas en función de su dificultad relativa, utilizada con el objeto de seleccionar a los alumnos que no tenían la capacidad intelectual necesaria para un aprendizaje escolar normal, fue publicada por Binet y Simón el año 1905. Comprendía 30 ítems o pruebas simples que no estaban agrupadas por edad. La idea de la edad mental estaba implícita en esta primera versión, pero no fue formulada explícitamente hasta 1908, al publicarse la segunda versión, más elaborada. ELABORACION DEL TEST La idea fundamental de estos test, según Binet y Simon, ha sido crear un gran número de pruebas fáciles de llevar a la práctica, realizables en poco tiempo, y dispuestas en orden de dificultad creciente; ensayar estos ítem en un gran número de niños de diferentes edades y anotar sus resultados; buscar las pruebas que sirven para una edad determinada, de modo que los niños más jóvenes sean incapaces de resolverlos y formar así una escala métrica de inteligencia que permita averiguar si un sujeto dado tiene el desarrollo intelectual correspondiente a su edad o está atrasado o adelantado y cuánto. Para establecer el grado de inteligencia propio de cada edad, se aplicó esta serie de pruebas a niños de distintas edades y se determinó qué proporción de ellos resolvía un determinado ítem. Si el 65% a 75% de los niños de una edad determinada resolvía bien el ítem, este será aceptado como un indicador de la inteligencia de esa edad. Se escogió este porcentaje ya que si lo resolvía menos que el 65% del ítem resultaba muy difícil y correspondía a una edad superior y si era resuelto por un porcentaje mayor que el 75%, resultaba demasiado fácil y correspondía a una edad menor. De aquí se derivo el concepto de Edad Mental (EM) que se basa en la consideración que a cada edad le corresponde un determinado grado de desarrollo intelectual o cognitivo. En este sentido, la EM indica meramente que la habilidad de un sujeto determinado, corresponde a la habilidad media de los niños de tal o cual edad. Considerando que a cada edad cronológica le corresponde en los niños normales una edad mental equivalente, propuso Binet los siguientes criterios diagnósticos: - Si la EM resultaba 2 o más años menor que la EC, había retraso intelectual - Si la EM resultaba 2 o más años superior a la EC, era adelantado o superior a lo normal - Si la EM quedaba comprendida en un rango de + 2 años la EC, el niño era normal Estos criterios presentan algunos inconvenientes: a) un mismo número de años de retraso tiene distintos significados según la edad del niño: un niño de EC= 4 años y EM= 2 años, tiene 2 años de retardo y ha logrado el 50% del desarrollo esperado, en tanto otro niño de EC= 8 años y EM= 6 años, tiene igualmente dos años de retardo (y por lo tanto la misma clasificación diagnóstica), pero ha logrado el 75% del desarrollo esperado a su edad. b) Por otra parte, expresar el nivel de desarrollo intelectual como EM, induce a pensar que un niño de EC = 9 años y EM= 6 años (con tres años de retraso) tiene las mismas capacidades que otro niño de EC= 6 años y EM= 6 años (Intelectualmente normal). Esto no es así pues la estructura de la inteligencia de un niño retrasado es diferente a la inteligencia de un niño normal. c) El concepto de “retraso” implícito en este enfoque, induce a pensar que llegar a un determinado nivel de desarrollo cognitivo es sólo una cuestión de tiempo, por lo que un niño que presenta “retraso mental” podría llegar finalmente a niveles normales de desarrollo. Esto, en general, no es así. Estos inconvenientes se resolvieron en las revisiones posteriores, con la introducción de cálculo de Coeficiente Intelectual (CI), propuesto por William Stern en 1912, y cuya fórmula es: CI = EM * 100 EC y en la cual ambas edades (mental y cronológica) se expresan en meses. REVISIONES DE BINET Binet publicó una segunda versión de su prueba el año 1908. Esta estaba constituida por un total de 59 ítem (29 más que la versión de 1905), distribuidos diferencialmente en los grupos de edad. El rango de aplicación va de 3 a 15 años y considera 5 ítem por año de edad, con un valor de 2 meses 12 días cada uno ( o 1/5 de año); salvo para los 4 años, que hay 4 ítem con un valor de 3 meses cada uno. Para la valoración de los resultados se comenzaba el cómputo a partir de la edad en que el niño resolvía todos los ítems. Por cada 5 o 6 ítem adicionales que aprobaba el niño, se le agregaba un año más a su EM. No se consideraban fracciones de año menores a un semestre y el resultado se expresaba como EM. Puesto que el test fue diseñado para determinar si los niños estaban en condiciones de ir a una escuela común, presentaba muchos ítems cuya resolución depende del grado de escolaridad del examinado. La experiencia acumulada con la aplicación de la escala de 1908 en Francia y otros países, llevó a una revisión y modificación parcial que fue publicada en 1911. En general se mantuvo la estructura de la versión de 1908, con 5 ítems para cada edad, con la excepción del año IV, que tiene 4 ítems. La diferencia radica en el criterio de selección de los ítems, que en este caso consistió en elegir aquellos que eran resueltos por el 50 a 75 % de los niños de cada edad. Esta versión de 1911 fue considerada un recurso confiable y constituyó la base sobre la cual se realizaron las revisiones posteriores. ESCALA STANFORD-BINET 5
ASPECTOS BÁSICOS DE LA STANFORD-BINET 5 El Manual del Examinador (Roid, 2003a) de la Standford-Binet 5 establece que es una prueba individualmente administrada para medir la inteligencia y las habilidades cognitivas. Es la versión más reciente de la prueba de inteligencia creada por Alfred Binet y Theodore Simon en 1905 (Sattler, 2008). La prueba fue publicada por Glen H. Roid, de la Universidad de Vandervilt en Nashville, Tennessee, EEUU, en el 2003 bajo la compañía publicadora Riverside Publishing Company. La escala total consiste de 10 subpruebas que cubren un rango de edad de 2 a +85 años. Cinco subescalas son del Dominio Verbal, las otras cinco son del Dominio No Verbal y ofrece además un cociente intelectual (CI) de la Batería de Inteligencia Abreviada. USOS DE LA SB5 Como se mencionó, la prueba SB5 se utiliza para medir inteligencia y habilidades cognitivas (Roid, 2003a). Entre sus usos además se encuentra el diagnóstico de discapacidades en el desarrollo, y excepcionalidades en niños, adolescentes y adultos. Se ha encontrado que las Escalas SB también son útiles en las evaluaciones neuropsicológicas, investigaciones sobre habilidades, evaluaciones de la niñez temprana, evaluaciones psico-educativas, evaluaciones para adultos para el seguro social y compensación de trabajadores. También tiene utilidad en el contexto forense. La SB5 provee un cociente intelectual de la escala total (Full Scale IQ), un CI No Verbal, un CI Verbal, y el rango percentil e intervalos de confianza para cada CI. Los Dominios Verbal y No Verbal se utilizan para proveer dichos cocientes, y pares de subpruebas de cada uno forman los índices por factor de razonamiento fluido, conocimiento, razonamiento cuantitativo, procesamiento visual-espacial y memoria de trabajo de la teoría de habilidades intelectuales Cattell-Horn-Carroll (CHC) (Roid, 2003b). Estos índices de factor permiten describir dimensiones específicas de las habilidades cognitivas (Sattler, 2008). Por cada factor hay subpruebas verbales y no verbales, que a su vez se dividen en actividades o tipos de reactivos que se administran según la edad del evaluado, debido al amplio rango de edad que tiene la prueba. En el Dominio No Verbal, las actividades por factor son: Series de Objetos/Matrices, Conocimiento Procesal, Láminas de Absurdos, Razonamiento Cuantitativo, Tabla de Formas, Patrones de Formas, Respuesta Retrasada y Retención de Bloques. Las actividades se presentan utilizando estímulos pictóricos o manipulables y direcciones orales breves. Las respuestas se dan señalando, con gestos, manipulando bloques, rompecabezas, juguetes o fichas, o verbalmente. En el caso del Dominio Verbal, las actividades por factor son: Razonamiento Temprano, Absurdos Verbales, Analogías Verbales, Vocabulario, Razonamiento Cuantitativo, Posición y Dirección, Memoria para Oraciones y Última Palabra. Los reactivos se presentan utilizando direcciones orales o impresas. Las respuestas se dan oralmente o señalando. Los materiales utilizados para las actividades de las subpruebas son variados, de colores llamativos y brillantes y van desde dibujos hasta los objetos a ser manipulados mencionados con anterioridad. Son presentados colocándose sobre la mesa o mostrando los libros de reactivos, los cuales pueden sostenerse de forma vertical para que las palabras o imágenes queden de frente al evaluado, y las instrucciones y respuestas correctas frente al examinador (formato de caballete o easel). Este último punto permite que el examinador no tenga que recurrir de manera seguida al manual para poder administrar las subpruebas. Las respuestas son anotadas por el examinador en una hoja de anotaciones o protocolo que consta de 16 páginas. En la primera página se provee espacio para anotar la totalidad de las puntuaciones crudas y a escala por nivel de funcionamiento y factor, y los CI. Provee además tablas que permiten observar gráficamente el perfil del evaluado en relación a las puntuaciones obtenidas. En la segunda página se ofrece un espacio para anotar observaciones generales sobre el evaluado. El protocolo muestra para las subpruebas las reglas de inicio por edad, retroceso, descontinuación, criterios basal y tope.
TIEMPO DE ADMINISTRACIÓN Roid (2003a) indica en el Manual del examinador que el tiempo de administración de la SB5 varía de 15 a 75 minutos, dependiendo de la escala administrada. La escala total toma alrededor de 45 a 75 minutos de administración. La Batería Abreviada toma entre 15 y 20 minutos. Las escalas Verbal y No Verbal toman alrededor de 30 minutos para su administración.
CORRECCIÓN DE LAS RESPUESTAS Existen dos formas para puntuar los resultados: convencional (a mano) o en computadora. El proceso convencional consiste en calcular la edad cronológica del examinado, las puntuaciones crudas, las puntuaciones a escala, puntuaciones estandarizadas, los rangos percentiles y los intervalos de confianza, y crear los perfiles por subprueba y compuesto (Roid, 2003a). Las puntuaciones crudas deben estar correctamente atribuidas, al igual que la acreditación por los reactivos anteriores al punto de inicio del examinado. Las puntuaciones por respuesta tienen un mínimo de 0 y un máximo de 1 o 2 según la subprueba. Estas deben anotarse en el protocolo, y sumarse el total de cada una en cada nivel de funcionamiento por subprueba (factor). La suma de estas puntuaciones permite obtener la puntuación cruda total por Dominio (Verbal y No Verbal) y por factor. Para cada puntuación cruda se encuentra una puntuación a escala, puntuaciones normalizadas con una media de 10 y una desviación estándar de 3, que fluctúan entre 1 y 19. La conversión se puede realizar recurriendo a las tablas que se proveen en el Manual del Examinador tomando en cuenta la edad del examinado. La suma de las puntuaciones a escala de ambos Dominios permite obtener el CI Total al recurrir a la tabla de CI del Manual y convertirla a puntuaciones estándar. Igualmente se obtienen los CI Verbal y No Verbal, y los Índices por Factor con sus tablas de conversión. Todos los CI e Índices de Factor tienen una media de 100 y una desviación estándar de 15. En las tablas también se incluyen los rangos percentiles para las puntuaciones estandarizadas, así como los intervalos de confianza. El procedimiento es básicamente igual al convencional en la corrección por computadora por medio de un programa o software. La información que provee el programa, basada en tablas de normas, conversiones y análisis de discrepancias, entre otras funciones, es mucho más rápida, y según el autor de la prueba, tiene más consistencia en la conversión de puntuaciones crudas, por lo que lo recomienda siempre que sea posible (Roid, 2003a).
CONFIABILIDAD Y VALIDEZ DE LA SB5 La SB5 cuenta con una confiabilidad excelente (Sattler, 2008). El promedio de coeficientes consistencia interna para el CI No Verbal es de .95, para el CI Verbal es .96, para el CI de Escala Total es .98 y para la Batería Abreviada es .91. El promedio de consistencia interna para los Índices de Factor es de .90 para Razonamiento Fluido, .91 para Memoria de Trabajo y .92 para Conocimiento, Razonamiento Cuantitativo y Procesamiento Visual-Espacial. La confiabilidad por subpruebas es algo menor, con un rango de .84 (Memoria de Trabajo Verbal) a .89 (Conocimiento Verbal). En cuanto a la confiabilidad temporal (test-retest), esta fue obtenida con una muestra de 356 individuos de cuatro grupos de edades, que fueron reevaluados después de un intervalo de 1 a 39 días, según el grupo de edad. Los coeficientes de estabilidad fluctuaron entre .86 y .92 para los tres CI, lo cual indica que la SB5 provee estables medidas de inteligencia por cortos periodos de tiempo. En cuanto a la validez de la SB5, se realizaron varios estudios correlacionando esta prueba con otras, como la SB4, la Forma L-M, la WPPSI-R, la WISC-III, la WAIS-III, la WJ III y la WIAT-II. Se encontró que la SB5 tiene una validez concurrente satisfactoria, con una mediana de correlación entre la Escala Total y las otras medidas de inteligencia de r=.84 (Sattler, 2008). Sin embargo, estas medidas fueron obtenidas con individuos cuyas habilidades cognitivas se encuentran dentro del rango promedio, y no se sabe si podrían ser generalizables a las poblaciones con capacidades que se encuentran en los extremos. Para establecer la validez de constructo se realizaron modelos de curvas de crecimiento (growth curves), intercorrelaciones entre subpruebas, Índices de Factor y Puntuaciones de CI, análisis de factores confirmatorios y análisis de factores cross-battery. Sattler (2008) indica que aunque en el Manual Técnico de la SB5 (Roid, 2003b) se indica que se encuentra la presencia de un factor general (g), factores de grupo y factores específicos (obtenidos mediante análisis de factor confirmatorio), otros estudios no apoyan estos hallazgos. Los estudios citados por Sattler concuerdan en que la SB5 provee una medida de inteligencia general, pero difieren en torno a la presencia de dos factores o cinco factores en los distintos grupos de edad. El apoyo para el modelo de dos factores (Dominio Verbal y No Verbal) está limitado a las edades de 2-6 años y 10-0 años. Las ínter correlaciones para subpruebas proveen evidencia para el factor general (Roid, 2003b), pero las correlaciones obtenidas entre subpruebas hacen cuestionable que estén midiendo funciones similares dentro de un mismo Dominio Verbal o No Verbal, por lo que tampoco se sostiene la presencia de estos dos factores de manera definida (Sattler, 2008). De los análisis de factores se concluye que las mejores medidas de g en la SB5 son Razonamiento Cuantitativo Verbal y No Verbal, Procesamiento Verbal-Espacial Verbal y Conocimiento No Verbal. FORTALEZAS Y LIMITACIONES DE LA SB5 La SB5 tiene, como toda prueba, varias fortalezas y limitaciones. Sattler (2008) identifica como fortaleza su excelente estandarización, la cual contó con una variedad de características en torno a edad, sexo, origen étnico, región geográfica y estatus socioeconómico. La prueba posee una buena confiabilidad y validez concurrente como fue discutido. Se entiende que los manuales, tanto el técnico como el del examinador, proveen información muy valiosa para la comprensión de las subpruebas, así como los procedimientos para obtener las propiedades psicométricas y realizar las interpretaciones de los resultados. Los materiales son claros y atractivos, y el formato de los libros de reactivos facilita la administración de la prueba. En relación con el atractivo de los materiales así como de las actividades, Garred y Gilmore (2009) se hallaron que los niños preescolares tienden a preferir la SB5 a la WPPSI-III, y aunque esto no tiene mayores implicaciones en términos de la puntuación de los sujetos, puede ser una ventaja para el establecimiento de un buen rapport con el niño. Se destaca además su uso para individuos con algunas discapacidades verbales o visomotoras, y se permiten modificaciones a las subpruebas dependiendo de la condición de la persona. El manual del examinador provee además información acerca de las precauciones a considerar al evaluar retardación mental, problemas específicos de aprendizaje, TDAH, individuos con capacidades superiores (giftedness), envejecientes, así como los que se encuentran aprendiendo inglés, tienen impedimentos ortopédicos o motores, de comunicación o auditivos. Entre otras fortalezas, Mleko y Burns (2005), destacan el sistema suplementario de corrección para las puntuaciones extremas, el aumento en el contenido no verbal y la medida de la memoria de trabajo, que se considera muy útil para la evaluación de personas con dificultades neurológicas. De hecho, en relación a este último punto, Leffard y colaboradores (2006) concluyeron que en comparación con otras pruebas de inteligencia y habilidades cognitivas, la SB5 es la única que posee potencial para cumplir adecuadamente con un modelo de memoria de trabajo. Por otro lado mencionan que las actividades que cumplen con los criterios para medir memoria de trabajo no son administradas a todos los examinados, pues responden a los niveles de funcionamiento del sujeto. Mleko y Burns (2005) también resaltan la inclusión de una prueba no verbal para realizar el procedimiento de routing, que conviene a individuos con dificultades verbales. Igualmente, Coolican, Bryson y Zweigenbaum (2007) encontraron que la Batería Abreviada, que implica la administración de la pruebas Series de Objetos/Matrices y Conocimiento Verbal para calcular un CI, puede ser representativa de la Escala Total para la mayoría de las evaluaciones con niños en el espectro autista. Sin embargo, se debe ser cuidadoso en este aspecto, ya que los niños con una puntuación mucho menor en la Escala Total pueden ser sobreestimados en la puntuación del CI de la Batería Abreviada. Entre las limitaciones de la prueba, Sattler (2008) menciona que la validez de constructo es cuestionable, debido a las dificultades en la estructura de factores. En particular, el Dominio No Verbal las subpruebas no correlacionan entre ellas tan sustancialmente como en el Dominio Verbal. Esta inconsistencia se halla en estudios como el de Garred y Gilmore (2009), quienes encontraron una mayor correlación entre la subescala no verbal de la SB5 con la subescala verbal de la WPPSI-III que con la subescala no verbal de esta última. Esto sugiere que el Dominio No Verbal requiere una mayor demanda verbal que las subescalas no verbales de otras pruebas de inteligencia. Por otra parte, Sattler (2008) indica que los procedimientos de administración son complejos, flexibles y algo imprecisos, lo que implica que el examinador necesita practicar considerablemente, y que la administración de la prueba puede afectarse en términos de la estandarización si las instrucciones son modificadas. Igualmente considera que la organización de la prueba es compleja, lo que hace que aprender a administrarla sea un reto. En una línea similar, Mleko y Burns (2005) sostienen que los cambios tan significativos que se realizaron a la prueba hacen que el examinador invierta mucho tiempo en familiarizarse con los materiales de la prueba. Sattler finalmente sostiene que la localización de las guías de administración es inconveniente, ya que algunas aparecen en los libros de reactivos y otros en el Manual del Examinador, y hay inconsistencias entre las instrucciones puestas en un lugar y otro. Otra limitación de la SB5 es la identificación de sujetos altamente dotados en capacidad intelectual. Minton y Pratt (2006) encontraron que aunque la SB5 puede discriminar entre el CI superior y altamente superior, sujetos que han cualificado para programas para los altamente dotados no cualificarían si fueran evaluados con la SB5, en comparación con la WISC III. Por ello sugieren que la SB5 debe ser utilizada con cautela, puesto a que incluso en la muestra de estandarización, la población considerada superior obtuvo una media de 123.7, 6 puntos menos que el estándar de 130. 3. Pruebas de aptitudes específicas
3.1 La Batería de Aptitudes Diferenciales y Generales de YUSTE (BAD y G) FICHA TÉCNICA Nombre: Batería de Aptitudes Diferenciales y Generales BADyG, Modalidad “E1” Renovado Origen: España Autores: Rosario Martínez Arias, José Luis Galvé Manzano y Carlos Yuste Hernanz Año: 1998 Significación: Batería que evalúa el factor “g” Puntuación: 1 punto por respuesta correcta, a excepción de las pruebas de Cálculo Numérico (Sn) y Memoria Inmediata (Ma) Aplicación: Individual y Colectiva Material: Manual, cuadernillo, plantillas de corrección Material Auxiliar: Cronómetro y lápiz Edad en la que se aplica: 1º y 2º grado de Educación Primaria (esta puede variar, ya que como se observara mas adelante, muchos autores, la han utilizado en distintos casos, con personas de diferentes edades.) ANTECEDENTES BAD Y G NIVEL E1 RENOVADO El BADyG empezó a experimentarse en los años 1978-1979, ya organizado en seis niveles de aplicabilidad denominados BADyG “A”, “B”, “C”, “E”, “M” y “S”, cada uno para determinado rango de edades. Se hicieron de todos estos seis niveles al menos, tres versiones sucesivas experimentales, con pequeñas muestras cada una, hasta adoptar la forma definitiva. La primera edición la realizó COSPA (Empresa Privada de Madrid). En 1980, empezó CEPE (Madrid), a publicarlos en su formato ya definitivo. En 1988, se revisaron los manuales y se renovaron los baremos con muestras muy amplias en algunos niveles. Durante los años de 1993 a 1997 se procedió a una revisión en profundidad, contando con la asesoría del Departamento de Metodología de las ciencias del comportamiento de la Universidad Complutense, dirigido por Rosario Martínez Arias. Tras varias pruebas experimentales se reestructuró la prueba, teniendo como resultado el BADyG renovado actual, editado por CEPE en 1998. (Yuste, 1998). CARACTERIZACIÓN Y DESCRIPCIÓN DEL BADYG NIVEL E1 RENOVADO • Según el modo de administrarlo, es un test de aplicación individual y colectiva. • Según el modo de expresión: - Es un test con el tipo de respuesta “no verbal”, ya que el sujeto no da oralmente sus contestaciones. - Es un test con material de tipo “impreso”, ya que el sujeto debe responder a cuestiones que se le plantean de manera escrita, como resolución de problemas, contestación a preguntas de vocabulario, etc. Y, al mismo tiempo, es de tipo “perceptivo-visual”, puesto que debe manipular figuras mentalmente. • Según el sector que explora el test, es una prueba de eficiencia (Test de Aptitudes), ya que estudia los aspectos intelectivos y cognoscitivos de la persona. Esta batería consta de 9 pruebas (6 pruebas básicas y 3 pruebas complementarias), cada una con 18 ejercicios o ítems (excepto alteraciones de de dificultad. Aún cuando la memoria es un factor muy complejo de la actividad mental, correlaciona con bastante intensidad con la inteligencia y con el rendimiento escolar, por lo que parece útil su inclusión en una batería de pruebas de orientación escolar. Pero, dado lo difícil de entender y diferenciar métricamente en unas pruebas de aplicación colectiva la no complejidad de este factor, no se suma con otras subpruebas para obtener la puntuación global de Inteligencia General. Por lo explicado, el autor no la incluye dentro de la batería, y por ende no se incluye en esta investigación. En el BADyG Nivel E1 Renovado, los tiempos de realización de las pruebas tienen muy poca repercusión en los resultados finales, al aplicarse la mayoría de ellas guiadas colectivamente, de manera que todos los niños tienen la posibilidad de intentar responder a cada uno de los elementos. Las pruebas se organizan de acuerdo a un modelo jerárquico de la inteligencia (véase Tabla 1, sección 1.1.2. Batería de Aptitudes Diferenciales y Generales BADyG-E1 Renovado). Inteligencia General (IG) Es la capacidad general actual para establecer relaciones entre conceptos abstractos, utilizando variedad de contenidos mentales (numéricos, verbales o figurativos); así como la facilidad para resolver problemas de diverso tipo, enfrentándose a la novedad o aplicando estrategias nuevas para resolverlos. Razonamiento Lógico (RL) Es la capacidad general actual para detectar reglas inductivas y analógicas en variedad de contenidos de información. Relaciones Analógicas (Rv) Evalúa la aptitud para establecer relaciones analógicas, además de la comprensión de los conceptos que las sustentan. Problemas Numéricos (Rn) Evalúa la aptitud para resolver diversos problemas numéricos verbales. En menor grado mide la habilidad para el cálculo numérico. Matrices Lógicas (Re) Evalúa la aptitud para relacionar figuras geométricas en ordenaciones seriales y analógicas, en un espacio de representación gráfico. Cálculo Numérico (Sn) Evalúa la rapidez y seguridad para realizar sencillos cálculos numéricos de sumar y restar. Órdenes Complejas (Sv) Evalúa la comprensión de conceptos básicos espaciales, comprobando la correcta adquisición de significados básicos para la comprensión verbal. Figuras Giradas (Se) Evalúa la habilidad para girar figuras en un espacio bidimensional y establecer su igualdad o diferencia. Memoria Inmediata (Ma) Mide capacidad retentiva de significados escuchados en una narración y seguidos visualmente en un espacio gráfico. Alteraciones de Escritura (Ae) Evalúa alteraciones en la escritura, relacionadas con dificultades de tipo disléxico. Una puntuación alta indica ausencia de alteraciones. Discriminación de Diferencias (De) Evalúa rapidez en la discriminación visual de dibujos, en la comparación de figuras para encontrar pequeñas diferencias entre ellas. Rapidez (RA) Se refiere a la velocidad con que un individuo encuentra las soluciones a los problemas planteados. Eficacia (EF) Implica acceso y procesamiento adecuado de la información retenida. Estos dos últimos puntajes adquieren un mayor significado si se les relaciona entre sí, pudiendo clasificar a los sujetos en 4 categorías: Sujetos rápidos y eficaces, rápidos e ineficaces, lentos y eficaces y lentos e ineficaces. INSTRUCCIONES PARA LA APLICACIÓN La Batería se aplicó en forma colectiva a alumnos de 1˚ y 2˚ grado de primaria. Se consideró que los niños no estén cansados ni en situación de tensión. Antes de iniciarse la aplicación de la batería, se motivó a los niños explicándoles que iban a realizar unos ejercicios que servirían para ayudarlos en las clases, que por eso tendrían que poner el máximo interés y atención para realizarlos, siguiendo las normas que se les indicaran. Antes de comenzar, propiamente, el tiempo de cada prueba, se aclararon y respondieron preguntas relacionadas con la comprensión de algún ejemplo y con la forma de responder (dónde y cómo). En ningún caso, se dieron explicaciones ni se hicieron comentarios en conjunto una vez comenzada algunas de las pruebas, no guiadas colectivamente. Los alumnos debían trabajar con suficiente independencia, distancia y separación para evitar que se copiaran unos a otros o comunicaran sus impresiones. En Primero de Primaria se desaconseja aplicar las pruebas en el primer trimestre del curso escolar, ya que no saben leer, al menos, mecánicamente. Se aconseja aplicar las pruebas en las agrupaciones y orden (si se desea aplicar todas las pruebas, tardará dos horas aproximadamente), en que aparece cada prueba en el cuadernillo. PRIMERA HORA DE APLICACIÓN Relaciones Analógicas, Rv 10 minutos aprox. Problemas numérico-verbales, Rn 10 minutos aprox. Matrices Lógicas, Re 8’ 7’ Cálculo - Numérico, Sn 7’ 5’ SEGUNDA HORA DE APLICACIÓN Memoria Auditiva Inmediata, Ma 4 minutos Alteraciones en la Escritura, Ae 12 minutos aprox. Ordenes Verbales Complejas, Sv 10 minutos aprox. Figuras Giradas, Se. 7’ 6’ Discriminación de Diferencias, De. 2.5’ 2’ Cuando los niños no estén acostumbrados a concentrarse, puede ser aconsejable, aplicar las pruebas en tres períodos. En este caso se aplicarán las tres primeras (Rv, Rn, Re), en el primer período, las tres siguientes en el segundo período (Sn, Ma, Ae) y las tres últimas en el tercer período (Sv, Se, De). Se aconseja que los niños utilicen un lápiz para responder. La marca consistirá en tachar (marcar), con una cruz la alternativa que elija cada vez y si la prueba es de respuesta abierta, en escribir la respuesta. Para corregir una equivocación se pide que borren la cruz o respuesta emitida. Es conveniente que los niños tengan doblado el cuaderno, de manera que sólo puedan ir viendo la hoja en la que trabajan. Las tareas que debe realizar el sujeto en cada prueba son las siguientes: Relaciones Analógicas (Rv): El sujeto debe encontrar relaciones analógicas entre conceptos. Una se le da completa y a la otra falta un término que debe buscar entre las cinco alternativas de respuesta. Problemas Numéricos-Verbales, Rn: Se leerá un problema numérico en voz alta y el sujeto deberá colocar la respuesta en el recuadro correspondiente. Matrices Lógicas (Re): Se debe buscar en cada ejercicio el dibujo que debe ir donde está el signo de interrogación, teniendo en cuenta que están ordenados siguiendo una lógica. Cálculo Numérico (Sn): El sujeto debe comparar las cantidades resultantes después de resolver los dos problemas numéricos que se le plantean, para determinar cuál es el mayor y marcarlo. Órdenes Verbales Complejas (Sv): Se leerá una orden y el sujeto deberá marcar de entre las cuatro figuras la que se le pide. Girar Figuras (Se): El sujeto deberá elegir de entre los cuatro dibujos el que es diferente a los otros. Aunque se le gire y se le ponga de pie, con el punto abajo, siempre queda en distinta posición que los otros tres. Memoria Visuauditiva (inmediata) (Ma): El sujeto deberá observar los dibujos que aparecen en un paisaje (hoja-presentación) durante 20 segundos, luego se retira ésta y se le ordena al niño que abra el cuadernillo en la página correspondiente. Deberá marcar con una cruz todos los dibujos que antes no estaban o ahora son distintos, en toda la hoja, en todo ese paisaje. Dado lo difícil de entender y diferenciar métricamente en unas pruebas de aplicación colectiva la complejidad del factor memoria, no se suma con otras subpruebas para obtener la puntuación de Inteligencia General. Alteraciones en la Escritura (Ae): El sujeto deberá escribir debajo de cada figura su nombre. Se realizará el dictado sólo a los sujetos de segundo grado de primaria. Discriminación de Diferencias (De): Se debe buscar en cada grupo de tres dibujos la figura que tiene alguna pequeña pero clara diferencia con respecto a los otros dos. NORMAS PARA LA CORRECCIÓN Y PUNTUACIÓN Para la corrección de cada prueba deben seguirse las instrucciones de la correspondiente plantilla de corrección. La doble marca invalida la respuesta. Cada una de las pruebas tiene 18 aciertos como máximo posible, excepto las siguientes: Alteraciones de Escritura: 18 Aciertos en Primero 30 Aciertos en Segundo Memoria Viso-Auditiva Inmediata: 30 Aciertos de puntuación máxima Normas Específicas Las pruebas Relaciones Analógicas (Rv), Problemas Numéricos (Rn), Matrices Lógicas (Re), Órdenes Verbales Complejas (Sv), Figuras Giradas (Se), la fórmula de corrección es sumar los Aciertos. Todas tienen 18 elementos, de corrección totalmente objetiva. Se pueden corregir con plantilla o bien memorizando las respuestas verdaderas y asignando el Número de Aciertos. PD = SA Las pruebas Cálculo Numérico (Sn) y Memoria Inmediata (Ma), tienen como fórmula restar los Errores a los Aciertos. El mínimo de Aciertos será cero. PD = SA - SE En la prueba de Alteraciones en la Escritura (Ae), la puntuación es la suma de los Aciertos. PD = SA o bien 18 - PD = SE (Primero). 30 - PD = SE (segundo) Se deben seguir las indicaciones de la plantilla 6. Se puede corregir sin plantilla después de interiorizar con claridad las normas para contabilizar Errores. Se contabilizan Aciertos o bien 18/30 - Errores, por ser más fácil de calcular. La puntuación resultante tiene un significado positivo, como todas las demás, es decir indica Ausencia de Alteraciones en la Escritura, y los baremos que se ofrecen también tienen en cuenta como puntuación directa el Número de Aciertos. Obtención de Puntuaciones Globales • INTELIGENCIA GENERAL (IG), se obtiene sumando los Aciertos de las seis pruebas básicas: 1.- Relaciones Analógicas, (Rv) 2.- Problemas Numéricos, (Rn) 3.- Matrices Lógicas, (Re) 4.- Cálculo Numérico, (Sn) 7.- Órdenes Verbales Complejas, (Sv) 8.- Figuras Giradas, (Se) IG = 1 + 2 + 3 + 4 + 7 + 8 El Máximo Posible de Aciertos es de 108 Para los niños que no saben leer y no han hecho la primera prueba de Relaciones Analógicas (Rv), se hace una estimación de IG con las otras cinco pruebas básicas. • RAZONAMIENTO LÓGICO (RL), se obtiene sumando los Aciertos de las tres primeras pruebas: 1.- Relaciones Analógicas (Rv). 2.- Problemas Numéricos, (Rn) 3.- Matrices Lógicas, (Re) Obtención del Cociente Intelectual (Cl) Se transformará la puntuación directa de la IG en Cl, empleando las tablas del manual correspondientes a los grados escolares. Obtención de Percentiles y Eneatipos Se transforman los puntajes directos de cada prueba en las tablas correspondientes a los grados escolares. CONFIABILIDAD Estas pruebas han sido sometidas a múltiples controles y han sido rehechas al menos en cuatro ocasiones, en función de los datos que aportaban las muestras recogidas. (Yuste, 1998) El conseguir altos niveles de confiabilidad con pruebas colectivas, sobre todo, en Primero de Educación Primaria no es nada fácil, teniendo en cuenta varios factores. Primero, la poca seguridad lectora del niño, que introduce aquí un factor de aprendizaje no fácilmente controlable: por ello sólo se ha incorporado una prueba en la que los niños necesitan saber leer, la de Relaciones Analógicas, que puede no aplicarse en Primero de Primaria, y se aconseja que las aplicaciones se hagan a partir del final del segundo trimestre escolar. Segundo, el escaso hábito de trabajar individualmente con explicaciones colectivas, por lo que se aconseja aplicar a grupos muy pequeños. Y tercero, el que las pruebas necesariamente tienen que tener muy pocos elementos, tienen que ser cortas, para no cansar a los niños y por ello los 18 elementos de que consta cada una deben estar muy cuidadosamente seleccionados. Como se indicó anteriormente, se han realizado en cuatro ocasiones análisis de elementos de las seis pruebas básicas de esta batería, para ir seleccionando los mejores, más fiables y válidos y para ordenarlos según un índice de dificultad. Para elegir o rechazar algunos elementos se han tenido también en cuenta las condiciones reales a la aplicación (reacción de los niños, dudas manifestadas, opinión de los maestros, análisis cualitativo de los psicólogos que han colaborado en la aplicación de las pruebas, entre otras.) Todos los análisis se han realizado con el programa SPSS PC+. En conjunto, los índices Alfa de fiabilidad son buenos, sobre todo dada la escasa longitud de las pruebas. En Segundo de Primaria la fiabilidad tiende a ser sistemáticamente algo más alta. Se explica porque los niños a esa edad ya han afianzado la Lecto-Escritura y algunos hábitos de trabajo individual. Por ello sus respuestas son más estables. VALIDEZ DE ESTRUCTURA Se acepta una visión jerárquica de la Inteligencia que, partiendo de un factor General, se va subclasificando en otros factores de grupo hasta llegar a los factores primarios. En especial, la subclasificación de las pruebas en Inteligencia Fluida e Inteligencia Cristalizada. La existencia de un factor General está muy bien establecida, al correlacionar las diversas pruebas que componen una batería, y más cuanto más complejas aptitudes quieran medir. También cuanto más pequeños son los sujetos a quienes se aplican las pruebas, correlacionan más alto entre sí, porque depende más de un único factor, al no haber todavía cristalizado en habilidades más específicas, cristalización que se va realizando a lo largo del desarrollo y en contacto con la experiencia. La mayoría de los análisis factoriales a que han sido sometidas estas pruebas, se resuelven en un único factor que explica un alto porcentaje de la varianza. No puede ser de otra manera: los niños son pequeños y, por otro lado, las seis pruebas de la batería básica son muy pocas pruebas para definir factores más específicos. En niveles más altos, sí se especifican más factores. En alguno de los análisis en el que se integraba también la prueba de Alteraciones en la Escritura, se detecta un segundo factor formado por Alteraciones en la Escritura y Rapidez para el Cálculo numérico. Es un factor al que llamamos Aprendizaje, formado por dos de las habilidades que los niños trabajan muy específicamente en estas edades, y son habilidades que están empezando a automatizar, pero en las que cometen errores por ser habilidades que están aún en proceso de adquisición y automatización. El factor de Razonamiento es difícil detectar en estos niveles y con tan pocas pruebas. Por otro lado los análisis factoriales diferencian mejor la diversidad de operación mental realizadas. De hecho en muchos análisis factoriales se extrae un segundo factor con numéricos o espaciales aparte del factor dominante. Validez de Pronóstico Uno de los posibles usos de los tests es realizar un pronóstico de resultados académicos de los alumnos para tratar de prevenir algunas de las dificultades que pueden encontrarse en los procesos de aprendizaje. En una muestra de niños de segundo de Primaria de tres colegios de Getafe, Moratalaz y las Rozas, en Madrid, se pidió a los maestros que evaluasen a sus alumnos con notas de 1 a 10 en rendimiento académico en Matemáticas y Lenguaje, al final del curso académico. A los alumnos se les había aplicado a principio de curso la batería de tests BADyG-E1 Renovado. Se obtuvo las correlaciones, casi todas ellas significativas a un altísimo nivel de confianza. (Yuste, 1998). USO DE LA PRUEBA COMO BATERÍA DE APTITUDES DIFERENCIALES Y GENERALES La prueba BADYG-M renovada, utilizada como batería de aptitudes diferencias, mide los siguientes aspectos (Yuste, 2002): 1) LA CAPACIDAD DE RAZONAMIENTO (RAZONAMIENTO LÓGICO) Se comprueba con los resultados obtenidos en las siguientes pruebas: – Relaciones analógicas: Es una prueba que mide el razonamiento a través de las habilidades de comprensión verbal. Por lo que podemos denominarla como prueba de razonamiento verbal – Series numéricas: Prueba específica de razonamiento numérico. La puntuación mide la capacidad de cálculo mental en el manejo de operaciones matemáticas (suma, resta multiplicación y división) y el dominio de los números enteros positivos, decimales y fraccionarios. – Matrices Lógicas: Mide el razonamiento espacial, mediante la resolución de series de figuras geométricas. 2) INTELIGENCIA GENERAL Por inteligencia general se entiende la capacidad general de razonamiento más el dominio o desarrollo de las siguientes habilidades, medidas por las pruebas: – Completar oraciones: Prueba para observar el dominio del vocabulario y los conocimientos previos del alumno. Es una prueba por lo tanto de inteligencia verbal. – Resolución de problemas: Mide la rapidez de cálculo matemático, el razonamiento numérico y cómo aplicar las operaciones numéricas a problemas. Exige por lo tanto conocimientos de matemáticas y sobre todo rapidez en la ejecución de operaciones y problemas. – Encajar figuras: Mide las habilidades espaciales del alumno. La puntuación de la inteligencia general se obtiene al operar con las puntuaciones sobre razonamiento y las obtenidas en estas tres pruebas. 3) MEMORIA Medida a través de dos pruebas: – Memoria auditiva: Evalúa la capacidad para retener significados escuchados en un relato. Se trata de una retentiva auditiva inmediatamente posterior a la escucha. – Memoria visual: Evalúa la discriminación visual ortográfica de palabras, que dependerá de la retentiva a largo plazo, así como del uso que hace de la ortografía, Indirectamente estamos evaluando el dominio ortográfico de “v/b”, “g/j”, “x/s”, “h”. 4) ATENCIÓN La capacidad de atención se evalúa mediante la rapidez en la discriminación visual de dibujos. 5) RAPIDEZ Y EFICACIA La rapidez y eficacia son dos variables añadidas en esta prueba y miden la rapidez en contes-tar, contrastada con la eficacia obtenida en las respuestas. Combinando estos dos factores obtenemos cuatro posibilidades en los resultados: – Alumnos rápidos y eficaces: Generalmente indican: • Que gozan de buena inteligencia. • De acceso rápido y adecuado a las preguntas con un buen índice de respuestas correctas. • Son muy rápidos mentalmente. – Alumnos rápidos y poco eficaces: Generalmente indican: • Desinterés en la realización de las pruebas. • Baja capacidad de razonamiento. • Aprovechan mal el tiempo dedicado al trabajo. • Dan respuestas sin entender el planteamiento. • Escasa concentración y perseverancia en resolver problemas. – Alumnos lentos y eficaces: Generalmente indican: • Excesiva autocomprobación de las respuestas. • Exceso de perfeccionismo. • Tenacidad ante las dificultades intelectuales. • Perseverancia en la búsqueda de soluciones. – Alumnos lentos y poco eficaces: Generalmente indican: • Mucha dificultad para el razonamiento. • Excesiva falta de concentración. • Notorio desinterés por el trabajo intelectual. Anexo Alumno: Curso: DESCRIPCIÓN DE LAS APTITUDES DIFERENCIALES, ANALIZADAS CON LA PRUEBA BADYG-M RELACIONES ANALÓGICAS (R.V.) EJEMPLO DEL CUADERNILLO 3.2Test de Naipes “G” INTRODUCCIÓN En el año 1988 Narciso García Nieto y Carlos Yuste Hernanz, a través de la editorial T.E.A., publicaron un manual para la realización de un test que utilizaba barajas españolas para medir la inteligencia no verbal, llamado Test de Naipes “G”. Este test se utiliza en varios ámbitos y complementariamente mide otras variables. El objetivo de este informe es desarrollar y explicar la aplicación de este instrumento, saber de donde viene y para que sirve, además de otras referencias como su llegada a Chile. Test de Naipes “G” El test de naipes “G” fue creado por dos españoles llamados Narciso García Nieto y Carlos Yuste Hernanz. El test creado por ellos, intenta medir la inteligencia general no verbal, ósea, el factor “G”. Cuando se habla de factor G, se refiere a la inteligencia como una capacidad general, la que todos los individuos tienen y utilizan al hacer cualquier tipo de tarea de aspecto intelectual. Prueba no verbal. Se pasa individual y colectivamente Aplicado a los sujetos aproximadamente en veinticinco minutos Se encuentra dividido en tres niveles distintos, separados de acuerdo a las edades de las personas a medir: 1.- El primero, el nivel “Elemental” y aplicado a individuos de diez a doce años de edad. 2.- El segundo, el nivel “Medio”, aplicado desde los trece a dieciséis años de edad. 3.- El tercero, el nivel “Superior”, que es aplicado desde los dieciséis años en adelante. El test suele ser utilizado en procesos de selección de personal en el área de recursos humanos de las empresas, a su vez también es utilizado en ámbitos escolares y clínicos. La idea principal de los autores es que el test logre medir variables tales como el factor G de cada persona, su rapidez al responder y la eficacia que logre el individuo. Las operaciones mentales incluidas son propios del razonamiento abstracto y sus componentes de Inducción-deducción, capacidad analítico-sintética y aptitud relacionante, clasificatoria o combinatoria. Si se logra un puntaje alto, ello quiere decir que la persona posee: - un excelente razonamiento lógico, - una actitud adecuada para razonar ante estímulos no verbales, - una mente ágil y flexible para lograr solucionar todo lo que tenga relacióncon aspectos abstractos, - que puede lograr un desempeño normal en el ámbito estudiantil, sin problemas de ningún tipo. Si la puntuación es baja, eso quiere decir que el sujeto tiene: - dificultades para entender ideas y todo lo que se le presente conformado porpalabras, - poca agilidad mental para asociar relaciones entre ideas, - complicación al momento de deducir o concluir sobre un tema. APLICACIÓN Cada nivel contiene 45 figuras donde aparecen un número determinado de cartas, una de ellas se coloca boca abajo: El objetivo: es que el sujeto descubra la secuencia lógica de la ordenación de los naipes, de esa manera podrá saber cual es esta. El número de cartas va en aumento, y las secuencias se van haciendo más complejas a medida que el sujeto avanza en los ítems. • Los sujetos deben tener claro que es una prueba en la cual deben poner todo su interés y atención. Para ello se requiere motivarlos dándole estas instrucciones. Es necesario cumplir con el tiempo estipulado. Cuando se inicia la aplicación, no es posible que se respondan dudas a los sujetos. Si es aplicada en grupo, es necesario que los participantes no interactúen durante la prueba. Si hay sujetos que finalizan antes de los 25 minutos, tiempo que dura la prueba, es necesario especificar los tiempos de estos para calificar con puntuaciones complementarias por eficacia y rapidez. Es necesario indicar que existe una hoja de respuestas para la prueba. Cuando finalizan los 25 minutos, la prueba finaliza impostergablemente. Primeramente es necesario que los sujetos anoten sus datos en una primera hoja, luego de esto es posible pasar a la siguiente donde aparecen los primeros ejemplos. Se debe explicar brevemente la composición del naipe español 4 “palos” (Oro, Copa, Espada, Basto) y los “números” (1 al 12). Se les indican 3 ejemplos, el primero lo realiza la persona que lo aplica y los dos segundos los sujetos para que todos puedan comprenden. Recordar que las respuestas se marcan en una hoja de respuestas, y que las marcas son una para la “pinta” y otra para el número. Luego de este proceso, es posible comenzar la prueba. La forma Superior consta de 45 ítems. Cada ítem está formado por una serie de naipes de la baraja española cuyo número total de naipes oscila entre cuatro y doce. El problema de resolver cada ítem viene determinado por la colocación y ordenación de naipes en secuencias distintas que obedecen a diferentes combinaciones de dos variables: - Los palos (Oros, Copas, Espadas y bastos). - Los números que van del uno (As) al doce (Rey) En todas las secuencias hay una carta dada vuelta cuyo Palo y Número es preciso identificar. FORMA DE CORRECCIÓN. Se otorga 1 punto por cada respuesta correcta que equivale la “pinta” y el número especificados. La puntuación máxima, sin considerar las puntuaciones por rapidez y eficacia, es de 45 puntos. Si el sujeto finaliza antes del tiempo, se bonificarán 2 puntos por cada minutos que le sobró antes de llegar a los 25 totales, siendo esta la bonificación complementaria por rapidez. Se pueden obtener tres tipos de puntuaciones: Puntuación general (factor “G”), mediante una plantilla aplicada a la hoja de respuestas con un punto por cada respuesta correcta que implica la presencia del Palo y el número. Rapidez, donde se toma en cuenta el tiempo empleado en la ejecución total de la prueba de las personas que terminaron antes y donde se bonifican dos puntos por cada minuto de menos que se haya empleado en la ejecución. Eficacia, es un cociente entre la cantidad de respuestas acertadas y la cantidad de respuestas dadas y se saca mediante fórmula. “La eficacia es un cociente entre la cantidad de respuestas acertadas y la cantidad de respuestas dadas. Para obtener la puntuación de eficacia se debe primero determinar el número de respuestas dadas por el sujeto, teniendo en cuenta que en este caso no deben contarse las omitidas, ni existe bonificación alguna por terminar antes del tiempo máximo estipulado. Por tanto, el número de respuestas dadas equivaldría al número del último elemento contestado, menos el número de respuestas omitidas (respuestas parciales son omisión”). (Interfases Consultores Ltda.) EFICACIA = NÚMERO DE ACIERTOS X 100 NÚMERO DE RESPUESTAS INTERPRETACIÓN DE LOS RESULTADOS Una vez realizados los cálculos de los resultados, existen 4 categorías donde es posible encontrar a los sujetos: VENTAJAS DEL TEST • Es estimulante para el individuo al momento de realizar el test, ya que los naipes son familiares para el sujeto, además que tienen la característica fundamental que es entretener (elementos lúdicos). Al ser un test desconocido, en comparación con los demás, resulta ser interesante, atractivo de realizar por el individuo(no predecible). Los naipes al ser conocidos por la mayoría de las personas, no hace diferenciación por el estrato social al cual pertenecen, ya que todos pueden tener acceso a una baraja de naipes españoles, por lo que podrá ser aplicado a todos por igual (instrumento transversal). No importa la edad que puedan tener distintos individuos, en todos ellos se puede evaluar el factor que mide este test, la inteligencia no verbal. Constituyen un misterio estimulante los naipes ocultos, este se entusiasma por descubrir lo que corresponde a la secuencia lógica. DESVENTAJAS A los individuos que no conozcan la baraja española, se les dificultará la realización del test, en comparación con otros que si conozcan su funcionamiento (no es necesario saber jugar, si no que se refiere a la familiarización con las figuras). Puede que el individuo al correr el tiempo de duración en la aplicación del test, se canse, por lo que no lo termine desarrollando el instrumento con el mismo ánimo, la misma eficacia que al comienzo(referente a ambas variables complementarias que sin querer ser medidas influyen, provocando error o acierto.) El individuo al no poder captar cual es el naipe que viene en la secuencia, puede que se comience a colocar nervioso, impidiendo la continuación de la aplicación del test, la cual tiene un tiempo determinado de duración. 3.3 Aptitudes musicales de SEASHORE FICHA TÉCNICA El conjunto de Test de Aptitudes Musicales -SMMT- ha sido creado por los investigadores C. E. Seashore, D. Lewis y J. G. Saetveit y adaptado en España por TEA Ediciones en 1968. La edición que aquí se utiliza es de 1992. La forma actual, procedente de -The Psychological Corporation- (Nueva York), fue revisada por Seashore en 1939. Su administración puede ser individual o colectiva y la duración es de aproximadamente una hora, incluidas las instrucciones de aplicación. El ámbito de aplicación se centra en sujetos de 9/10 años en adelante y no exige un nivel cultural previo determinado. Presenta un manual de aplicación, un disco LP de 33 r.p.m. y/o cinta cassette, hojas de respuestas y plantillas de corrección. En cuanto a su significación o finalidad, aprecia o evalúa varios aspectos de la aptitud musical: tono, intensidad, ritmo, apreciación del tiempo, timbre y memoria tonal. Los baremos se obtienen en puntuaciones centiles y eneatipos en una muestra de escolares y en otra muestra de población general de adultos. VARIABLES MEDIBLES CUANTITATIVAMENTE El psicólogo Seashore fue el creador en 1919 del primer test con significación musical llamado “Seashore Measures of Musical Talent” (Medidas de las Aptitudes Musicales), que no sólo se utilizó en música, sino también en otros campos en los que se precisa una buena agudeza y discriminación auditiva. Los tests o batería de Seashore, revisados posteriormente en 1939 y 1960, se ocupan de medir las capacidades sensoriales siguientes: • Tono: determina si el segundo de dos tonos difiere del primero por ser más grave o más agudo que el primero. • Volumen: determina si es más fuerte o débil el segundo que el primero de los dos tonos propuestos. • Tiempo o duración: determina si es más largo o más corto el segundo sonido que el primero de los dos propuestos. • Timbre: se trata de discriminar si es igual o diferente en instrumento o en armónicos el segundo de los sonidos. • Ritmo: determina la diferenciación por parte del sujeto de la estructura formal de una sucesión temporal y ordenada de sonidos. • Memoria tonal: permite considerar si un elemento -una célula melódica- puede ser idéntico a un modelo previo, una variación reconocible de aquél o un elemento nuevo. Seashore trataba de comparar unos 200 pares de tonos para conocer las aptitudes musicales de los sujetos estudiados. Más tarde su batería de tests sería usada extensamente en las escuelas, institutos y centros de estudios musicales con sujetos de 9 años en adelante. Seashore pensaba que a causa de la dificultad de determinar el “todo”, hay que tratar de encontrar, al menos, algunas de las partes del todo. Su estudio es uno de los más complejos y también completos sobre talento musical. En él aparecen como componentes: la sensibilidad musical, la acción musical, la memoria, el intelecto y el sentimiento musical. La más importante contribución de Carl Emil Seashore ha sido, quizá, la invención y tipificación de una escala para la determinación cuantitativa de cinco de los elementos básicos de la sensibilidad musical y de un elemento de la memoria musical. Los elementos básicos de la sensibilidad musical son según Seashore: el tono o altura de los sonidos, la intensidad o fuerza, el ritmo, el tiempo o duración y el timbre o cualidad. El elemento básico de la memoria musical es: la memoria tonal. Estos elementos de la sensibilidad y de la memoria musical constituyen variables independientes entre sí
. DESCRIPCIÓN DE LOS TESTS DE APTITUDES MUSICALES
La prueba consta de seis tests que miden diferentes aspectos (tono, intensidad, sentido del ritmo, tiempo, timbre y memoria tonal) de las aptitudes musicales. La descripción de los tests se prefiere presentar de forma exhaustiva en el capítulo dedicado a la metodología de esta tesis doctoral, con el fin de ayudar a la interpretación de las puntuaciones que se obtengan de los sujetos de la muestra seleccionada para esta investigación No obstante, se presenta en este apartado una síntesis de las características principales de cada prueba para contribuir a la rápida y eficaz comprensión de las mismas. CUADRO 5: Conjunto de Tests de Aptitudes Musicales -SMMT- de Seashore, El sentido del tono o altura se mide a partir de 50 pares de notas, que permite evaluar la capacidad del sujeto para determinar si el segundo tono es más agudo o más grave que el primero. Los tonos tienen alrededor de 500 ciclos de frecuencia y una duración de 0,6 segundos cada uno. El test de intensidad está compuesto por 50 pares de tonos, y el sujeto debe indicar si el segundo tono es más fuerte o más débil que el primero. La frecuencia de los estímulos se mantiene de forma constante en 440 ciclos. El sentido del tiempo o duración se mide a partir de 50 pares de notas de diferente duración. El sujeto debe determinar si la segunda nota es más larga o más corta que la primera. La frecuencia de los estímulos se mantiene de forma constante en 440 ciclos. El propósito del test de timbre es medir la aptitud para discriminar entre sonidos complejos que difieren únicamente en su estructura armónica. Consiste en 50 pares de notas. El sujeto debe juzgar en cada par si las notas son iguales o diferentes en timbre o cualidad del sonido (color). Cada nota está compuesta por un componente fundamental, cuya frecuencia es de 180 ciclos, y sus primeros cinco sobretonos. La estructura tonal se varía por medio de una alteración recíproca en las intensidades del tercero y cuarto armónicos. Para medir el sentido del ritmo se presentan 30 pares de modelos rítmicos. El sujeto debe indicar, en cada par, si los modelos son iguales o diferentes. El tiempo se mantiene constante a razón de 92 cuartos de nota por minuto. Los 10 primeros pares contienen modelos de cinco notas en compás de 2/4; los 10 siguientes son modelos de 6 notas en compás de 3/4 y los 10 últimos, modelos de 7 notas en compás de 4/1. El test de memoria tonal tiene 30 pares de secuencias de notas subdivididas en 3 grupos de 10 elementos cada uno, y con tres, cuatro o cinco notas, respectivamente. En cada par hay una nota diferente en las dos secuencias, y el sujeto debe identificar cada uno por el número de orden. Se usaron 18 pares cromáticos, hacia arriba, a partir del tono “do”. El tiempo es controlado cuidadosamente, y la intensidad se mantiene constante.
JUSTIFICACIÓN ESTADÍSTICA: FIABILIDAD Y VALIDEZ
En relación a la fiabilidad de los tests de aptitudes musicales, ésta fue estimada a partir de los coeficientes de consistencia interna (fórmula 21 de Kuder-Richardson). Este procedimiento permite alcanzar coeficientes moderados, ya que su uso es más apropiado para subestimar que para sobrestimar la fiabilidad. Los coeficientes hallados para cada test y en cada nivel de tipificación figuran en la tabla siguiente: TABLA 1: Coeficientes de fiabilidad del SMMT Los coeficientes que son relativamente bajos, subrayan la importancia de interpretar las puntuaciones en amplias categorías. Respecto de la validez, es preciso destacar cómo Seashore ha mantenido de forma enérgica que su validez interna está bien establecida y que es inapropiado todo intento de validarlos con criterios externos falibles. Manifiesta que los tests son verdaderas medidas de aptitudes específicas, lo que puede ser de gran ayuda para que el administrador de las pruebas realice predicciones. En este sentido, fueron realizados estudios de correlaciones de estos tests con criterios externos, estimaciones del alcance del éxito musical (Bienstock, 1942; Ludin, 1953, citados en el Manual de Tests de Aptitudes Musicales de Seashore editado por TEA Ediciones, 1992). Asimismo, Farnum (1950-1953), citado en el Manual de Tests de Aptitudes Musicales de Seashore editado por TEA Ediciones (1992), expone las relaciones entre las puntuaciones en su “Music Notation Test” y la ejecución instrumental.
NORMAS DE ADMINISTRACIÓN: APLICACIÓN, CORRECCIÓN E INTERPRETACIÓN
Las condiciones de examen son fundamentales para administrar los tests de Seashore. Se requiere de una sala de buenas condiciones acústicas, de tal modo que los estímulos auditivos lleguen a todas las partes de la sala de examen y donde no se produzcan, ni en la misma sala ni en lugares cercanos, ruidos que puedan perturbar la audición. Los grupos de examen pueden ser de cualquier tamaño, incluso de 100 o más sujetos, siempre que a partir de 25 sujetos se disponga de un ayudante. Dado que se trata de una prueba acústica, el examinador deberá probar con anterioridad y en la misma sala, el aparato reproductor para comprobar con suficiente antelación el grado de fidelidad: volumen, claridad, etc. También parece importante que el examinador se aplique la prueba a sí mismo antes de administrarla a otros, practicando en la evitación de repeticiones confusas de los últimos sonidos del test precedente o cortar las primeras palabras y sonidos del test que se va a administrar. Los examinandos deberán recibir una hoja de respuesta, un lapicero y una goma de borrar. Una vez que están seguros de lo que deben hacer en cada prueba, no podrán interrumpir durante la audición de los sonidos, ni podrán hacer preguntas. En cuanto a la corrección, los tests de aptitudes musicales de Seashore pueden ser corregidos a mano o usando lecturas ópticas. Hay dos plantillas de corrección, una para cada página de la hoja de respuestas. La plantilla para la cara 1ª, permite corregir las puntuaciones de los tests tono, intensidad y ritmo; la plantilla para la cara 2ª, los tests tiempo, timbre y memoria tonal. Para cada uno de los seis tests, la puntuación directa es el número de aciertos. Una vez recogidas las respuestas de los sujetos y obtenidas las puntuaciones directas, el paso siguiente es interpretar los resultados obtenidos. Para lograr una interpretación adecuada es necesario disponer de una muestra normativa con la que comparar los resultados que se obtenga en las aplicaciones prácticas. En este sentido, se utilizan las puntuaciones centiles y eneatipos (en todos los tests son deseables puntuaciones elevadas), lo que, a su vez, sirve para comparar las puntuaciones de la persona en una variable con las obtenidas en las demás variables y, por tanto, permite interpretar su modelo completo de perfil en relación a las aptitudes musicales. Se presentan tres tablas de baremos (10 años, 11-16 años y población en general). 4. Pruebas de creatividad
4.1 TORENCE EL TEST DE CREATIVIDAD DE TORRANCE
En su inicio, el Test de Torrance de Pensamiento Creativo era una serie de diez pruebas agrupadas en dos baterías. La primera batería se llama Pensando creativamente con palabras (parte verbal) e incluye siete tests (en la versión actualizada se ha eliminado el test número seis de la batería verbal ya que según Torrance la investigación ha demostrado que la Actividad 6 del Test Verbal no contribuye mucho a la validez predictiva como originalmente se pensaba. Consecuentemente, esta actividad se ha eliminado en la calificación y en el informe de la forma Verbal. La actividad consistía en preguntar al sujeto qué preguntas infrecuentes se podrían hacer sobre el objeto referido en la actividad anterior.) Las tres primeras „actividades‟ del test verbal, se basan en un dibujo al que el sujeto debe responder: 1) elaborando todas las preguntas posibles que necesitaría hacer para saber con seguridad lo que está ocurriendo. 2) anotar las posibles causas de lo representado en el dibujo. 3) anotar las posibles consecuencias que podrían ocurrir como resultado de la acción representada en el dibujo. En la cuarta actividad se le pide que anote todas las formas que se le ocurran para mejorar como juguete un elefante de peluche y hacerlo más divertido. En la quinta actividad se solicita que se elabore una lista de usos poco comunes de las cajas de cartón, y en la última actividad que indique todas las cosas que ocurrirían si una situación improbable se hiciera realidad. La segunda batería se denomina Pensando creativamente con dibujos (parte gráfica) e incluye tres actividades: 1) se le pide al sujeto que utilice una figura ovalada como punto de partida para elaborar un dibujo que cuente una historia emocionante e interesante y que escriba un título para dicha historia; 2) a partir de figuras incompletas se le pide que haga un dibujo y que igualmente, escriba un título para cada dibujo; 3) se le presentan pares de líneas para que las utilice como punto de partida, haga un dibujo y nuevamente titule. Con la finalidad de crear un clima estimulante se denomina a los tests „Actividades‟ y se recomienda que durante la aplicación se debe crear una atmósfera parecida al juego, o a una actividad de razonamiento o de solución de problemas. Lo anterior con la finalidad de evitar la situación amenazante que se asocia con frecuencia con la aplicación de tests y creando la expectativa de que las actividades pueden ser divertidas. El clima psicológico, antes y durante la administración de la prueba debe ser confortable y estimulante. La única excepción a este principio puede ser la condición en la que el examinador está llevando a cabo experimentos controlados sobre ansiedad en la situación de prueba. En el Test de Torrance la rapidez es un elemento importante. En la parte verbal se dan cuarenta minutos para realizar las seis actividades. En la parte gráfica 30 minutos. Cada actividad de ambas baterías, Verbal y Gráfica se califica para fluidez, originalidad y flexibilidad. La Fluidez es el número de ideas que una persona expresa a través de respuestas interpretables que utilizan el estímulo de manera significativa. Representa la habilidad para producir un número considerable de respuestas verbales o de imágenes gráficas. La Originalidad se basa en la baja frecuencia estadística y rareza de la respuesta. Por consiguiente, representa la habilidad que requiere fuerza creativa para producir respuestas poco comunes o únicas. La Flexibilidad implica el uso de distintas categorías utilizadas por el individuo en las que pueden clasificarse sus respuestas. Adicionalmente, la batería gráfica mide otros aspectos que Torrance considera componentes de la creatividad. La habilidad para producir títulos sintéticos que involucra los procesos de pensamiento de síntesis y organización. Al nivel más alto, está la habilidad para capturar la esencia de la información involucrada, para conocer qué es lo importante. El título, permite al observador mirar el dibujo de manera más profunda y amplia. Los títulos producidos en las Actividades 1 y 2 se califican cuando representan esta cualidad del pensamiento de la persona. Subyacen dos supuestos a la calificación de la Elaboración en el test Gráfico: El primero es que la respuesta mínima y primaria a la figura estímulo es una sola respuesta. Esencialmente el examinador debe preguntarse, “¿Cuál es el mínimo detalle que debo ver para que esto sea un ________?” El segundo supuesto es que la imaginación y la presencia de detalles en el dibujo es una manifestación de la habilidad creativa, llamada apropiadamente Elaboración. Este concepto refleja la habilidad para desarrollar, poner detalles, embellecer, adornar u otras ideas elaboradas de manera gráfica. La persona creativa es capaz de guardar un Cierre abierto y retardado lo suficientemente largo como para hacer un esfuerzo mental que genere ideas originales; es una persona abierta a la información y que considera una gran variedad de información (Torrance 1998). La persona menos creativa tiende a apresurarse en llegar a conclusiones prematuramente sin considerar la información disponible. Al responder a la Actividad 2, estas personas cierran las figuras incompletas inmediatamente con líneas curvas o rectas, coartan las oportunidades de imágenes más fuertes y originales. Además, la prueba gráfica permite identificar una serie de trece fortalezas creativas en la persona: 1. La expresividad emocional. 2. La articulación narrativa. 3. El movimiento o acción. 4. La expresividad de los títulos redactados. 5. La síntesis de figuras incompletas. 6. La síntesis de líneas. 7. La visualización poco común. 8. La visualización interna. 9. La capacidad de salirse de los límites. 10. El humor. 11. La riqueza imaginativa. 12. El colorido de la imaginación y 13. La fantasía. Lo anterior indica que Torrance desarrolla sus tests de creatividad desde el ángulo de los “aspectos psicopedagógicos del problema” (Beaudot, 1973). Los estudios que Torrance refiere sobre la validez predictiva a corto y a largo plazo del Test de pensamiento creativo de Torrance han sido efectuados en individuos de diferentes niveles educativos y, según Torrance “permiten predecir el comportamiento creativo en la edad adulta” (Torrance artículo inédito, en Beaudot, 1980). A corto plazo se ha encontrado validez predictiva de la prueba en: originalidad en los relatos imaginarios, ideas creativas en el uso de juguetes científicos, aptitud para plantear cuestiones estimulantes en clase, comportamiento creativo en clase, éxito pedagógico desde el punto de vista de la fluidez verbal, etc. En la validez predictiva a largo plazo enumera, entre otras: éxito creativo fuera del campo escolar, cantidad y calidad de los productos creativos, éxito en el campo artístico y científico, entre otros. El presente estudio se diseñó para comparar los resultados de la prueba de un grupo de estudiantes de Licenciatura en Psicología con el promedio de calificaciones escolares de los primeros años de la carrera. La correlación más alta encontrada se da entre la prueba verbal y la calificación escolar. Tal como lo señala Torrance, sería un caso de validez predictiva a corto plazo fundado en los resultados escolares. Torrance señala que en algunos casos los resultados han sido positivos, en otros han sido negativos.” (Torrance artículo inédito, en Beaudot, 1980). Atribuye esto a que no existe razón lógica para suponer una relación entre los resultados del test y las medidas del aprovechamiento escolar. ¿CUÁLES SON LAS ETAPAS DEL PROCESO CREATIVO? Suponemos que en este caso las correlaciones entre los promedios de las calificaciones escolares y las puntuaciones estándar de la prueba serán negativas. Esta es la hipótesis que se pretende comprobar. No es posible afirmar que existen etapas, sin embargo se habla de cuatro momentos que, al parecer, no son lineales. Estos momentos son la preparación, la incubación, la iluminación y la verificación. ¿Qué se entiende por preparación dentro de los momentos de la creatividad? Es el proceso de recopilar información, con la intervención de los procesos preceptúales, de memoria y de selección ¿Que se entiende por incubación dentro de los momentos de la creatividad? Es el proceso de análisis y de procesamiento de la información centrándose en la corrección y búsqueda de datos. ¿Qué se entiende por iluminación dentro de los momentos de la creatividad? Es el proceso del darse cuenta y se le identifica más como un proceso de salida de información. Ocurre después de un periodo de desequilibrio, confusión o duda ¿Qué se entiende por verificación dentro de los momentos de la creatividad? Es el proceso de evaluación sobre la utilidad temporal del objeto o proceso de creación ¿Qué es Flexibilidad? Es la característica de la creatividad mediante el cual se transforma el proceso para alcanzarla solución del problema o el planteamiento de éste. Involucra una transformación, un cambio, un replanteamiento o una reinterpretación Es la característica de la creatividad o la facilidad para generar un número elevado de ideas. ¿Qué es la Originalidad? Es la característica que define a la idea, proceso o producto como algo único o diferente Identifique sus Barreras De acuerdo al libro de Roger von Oech, "A Whack on the Side of the Head"(Warner Books, New York), las principales barreras que una persona se autoimpone al desarrollo de su propia creatividad son: Buscar la respuesta correcta. La mayor parte de nuestras vidas hemos sido enseñadas a encontrar la respuesta correcta, por lo que tenemos poca práctica y entrenamiento en generar una cantidad significativa de posibles respuestas. Cuando investigamos por múltiples respuestas normalmente tenemos más probabilidades de generar ideas creativas. Demasiada fé en la lógica. Aplicando la lógica demasiado temprano en el proceso de generación de ideas, Ud. cierra los caminos a los pensamientos que pueden producir ideas inusuales y creativas. Seguir siempre las reglas. Las reglas son importantes, pero ocasionalmente necesitan ser colocadas de lado para que pensamientos e ideas fuera de lo común puedan generarse y aparecer. Ser demasiado prácticos. Ser prácticos significa tener mucho juicio. El juicio anticipado es la muerte de las ideas. Algunas ideas que aparentan no ser prácticas, muchas veces son transformadas en resultados y ganancias imprevistas si no son eliminadas demasiado temprano Evitar siempre la ambigüedad. Cuando las ideas o hechos son ambiguos o poco claros, la mente trabaja probando por nuevas conexiones y patrones. Este proceso conduce a nuevas ideas y descubrimientos Creer que errar es incorrecto. Si usted tiene miedo de cometer errores, usted no tomará ningún riesgo. La creatividad requiere de un salto en el espacio desconocido que a menudo resulta en fracasos. Los errores no deben ser temidos, deben ser considerados como pasos intermedios para llegar a las mejores ideas. Pensar que jugar es frívolo. Jugar con ideas, pensamientos o cosas es una parte básica del proceso creativo. Pensar que el asunto no está en su campo de conocimientos o experiencia. Grandes descubrimientos han ocurrido cuando alguien estaba generando y jugando con ideas en áreas nuevas que no eran de su competencia. Temor a aparecer como tonto. Pensar como tonto en un momento, no significa que uno se convierta en tonto para siempre. Posteriormente ponga a su lógica en control de nuevo, pero durante el proceso anterior podrá haber descubierto nuevas cosas. Creer que Ud. no es creativo. ¿Cómo sabe usted que no es creativo? Usted nació con una creatividad innata y ella está allí esperándolo. Libérese de sus limitaciones y desarrolle esa creatividad.
TEST PARA CONOCER SI SE ES MÁS O MENOS CREATIVO:
La última vez que recuerdo....
1. A alguien diciéndome:
"TU NUNCA HABÍAS PENSADO O HECHO ESO ANTES"
No me acuerdo (1)
Hace más de un año (2)
En algún momento del último año (3)
El mes pasado (4)
Me ocurre con frecuencia (5)
2. .Que cambié mi rutina sin una razón particular más que el haber querido hacer otras cosas
No me acuerdo (1)
Hace más de un año (2)
En algún momento del último año (3)
El mes pasado (4)
Me ocurre con frecuencia (5)
3. Que reacomodé las cosas de mi cuarto, de mi oficina, de mi casillero o de mi mesa de noche, solo por diversión
No me acuerdo (1)
Hace más de un año (2)
En algún momento del último año (3)
El mes pasado (4)
Me ocurre con frecuencia (5)
4. A alguien que me estaba diciendo: "ESO NO SE PUEDE HACER" o "ESO NO TIENE ARREGLO" O "NO VALE LA PENA, DÉJALO ASÍ" pero yo no le hice caso y seguí intentándolo
No me acuerdo (1)
Hace más de un año (2)
En algún momento del último año (3)
El mes pasado (4)
Me ocurre con frecuencia (5)
5. Que luché por una causa, una idea, un ideal
No me acuerdo (1)
Hace más de un año (2)
En algún momento del último año (3)
El mes pasado (4)
Me ocurre con frecuencia (5)
6. Que estuve equivocado
No me acuerdo (1)
Hace más de un año (2)
En algún momento del último año (3)
El mes pasado (4)
Me ocurre con frecuencia (5)
7. Que me decían "ESTÁS EQUIVOCADO" porque intenté algo nuevo
No me acuerdo (1)
Hace más de un año (2)
En algún momento del último año (3)
El mes pasado (4)
Me ocurre con frecuencia (5)
8. Que hice algo que me puso muy nervioso
No me acuerdo (1)
Hace más de un año (2)
En algún momento del último año (3)
El mes pasado (4)
Me ocurre con frecuencia (5)
9. Que hice algo que me causó temor y al mismo tiempo emoción y alegría
No me acuerdo (1)
Hace más de un año (2)
En algún momento del último año (3)
El mes pasado (4)
Me ocurre con frecuencia (5)
10. Que salí de un aprieto que me tenía en el limbo
No me acuerdo (1)
Hace más de un año (2)
En algún momento del último año (3)
El mes pasado (4)
Me ocurre con frecuencia (5)
Si su puntuación es:
Menos de 15: Sácate de la cabeza tantas preconcepciones, haz cosas nuevas, tus ideas valen.
Entre 16 y 25: Tienes potencial pero tus rutinas necesitan agitarse, no le temas al cambio.
Entre 26 y 35: Te diriges al éxito, ten cuidado con las trampas, no te dejes encasillar, lucha por tus convicciones. Entre
36 y 50: Definitivamente tienes potencial creativo, desarróllalo, romper tantas reglas y convenciones te dará buenos frutos.
4.2TAECE
EJEMPLO DE INTERPRETACIÓN DE LA CREATIVIDAD GRÁFICA DEL TAEC
TEST DE ABREACCIÓN PARA EVALUAR LA CREATIVIDAD.
DESCRIPCIÓN DE LA PRUEBA
La PIC es una prueba para evaluar la creatividad a través del uso que el sujeto hace de su imaginación. Consta de cuatro juegos: los tres primeros evalúan la creatividad verbal o narrativa, el cuarto la creatividad gráfica. La PIC mide la creatividad considerando diversas variables, que las investigaciones más destacadas han demostrado que son relevantes para el estudio de la creatividad: • La fluidez de ideas • La flexibilidad del pensamiento • La originalidad de las producciones • La elaboración de las respuestas • El uso de detalles creativos como el color, las sombras, la expansividad… • En el juego 1 a partir de una situación que aparece reflejada en un dibujo el sujeto tiene que escribir todo aquello que pudiera estar ocurriendo en la escena. El estímulo presentado varía en función de la versión de la PIC de la que se trate: • En la PIC-N: Un niño abriendo un cofre • En la PIC-J: Un chico y una chica en un lago • En La PIC-A: Una escena ambigua en la calle en la que aparecen varios personajes. Este juego permite al sujeto expresar su curiosidad e imaginación y ha sido incluido para explorar la capacidad de los sujetos para formular hipótesis y pensar en términos de lo posible. La prueba permite al niño expresar su curiosidad y actitud especulativa; su capacidad de ir más allá de la información proporcionada por el estímulo al plantear distintas posibilidades con respecto a lo que ocurre en la escena. El juego 2 consiste en una prueba de usos posibles de un objeto. Se trata de una adaptación del Test de Guilford “Usos de un ladrillo”. En nuestro caso hemos decidido sustituir los ladrillos por un tubo de goma al pensar que los sujetos responderían de manera más creativa a estos estímulos que son más corrientes que los ladrillos en sus juegos, construcciones y diversas actividades. En este juego o subtest el estímulo presentado es el mismo tanto para la PIC-N como la PIC-J como la PIC-A. Esta prueba se incluye como una medida de la capacidad de los sujetos para liberar su mente y pensar de forma poco convencional. Permite evaluar la capacidad de “redefinición” de los problemas: es decir la capacidad para encontrar usos, funciones y aplicaciones diferentes de las habituales; de agilizar la mente y de ofrecer nuevas interpretaciones o significados ante objetos familiares para darles un nuevo uso o sentido. Esta capacidad de “redefinición” es considerada por los principales investigadores como uno de los factores esenciales del pensamiento creador (Romo, 1987) En el juego 3 se plantean a los sujetos situaciones inverosímiles. La situación planteada varía en función de la versión de la PIC: • En la PIC-N la situación planteada es la siguiente: “Imagínate qué ocurriría si cada ardilla, de repente, se convirtiera en un dinosaurio” • En la PIC-J la situación planteada es: “Imagínate qué ocurriría si el suelo fuera elástico”. • En la PIC-A: “Imagínate que ocurriría si no dejáramos de crecer”. Este juego se ha introducido en la prueba con el fin de evaluar un aspecto fantasioso de la imaginación. Esta forma de pensamiento parece muy importante en el comportamiento creativo. Evalúa, por tanto, la capacidad de fantasía y la facilidad para manejar ideas poco convencionales que probablemente el sujeto no se atrevería a expresar en situaciones más serias, así como la apertura y receptividad ante situaciones novedosas. Asimismo, la prueba permite evaluar la capacidad de “penetración” del sujeto o capacidad de profundizar sobre las experiencias. Algunas de las consecuencias de la situación presentada son obvias y sencillas de descubrir, mientras que otras más remotas requieren una mayor profundización en la materia. El juego 4 es una prueba de imaginación gráfica inspirada en items del test de Torrance, aunque por completo novedosos. En ella el sujeto tiene que completar cuatro dibujos a partir de unos trazos dados y poner un título a cada uno de ellos. Las figuras incompletas utilizadas en el juego 4 han sido seleccionadas tras la presentación de varias figuras a una muestra de sujetos considerados como muy creativos (incluidos en un programa para sujetos superdotados), seleccionándose aquellas 4 que resultaban más sugerentes para dichos sujetos. Estos dibujos son los mismos en la PIC-N, la PIC-J y la PIC-A. A través de esta prueba, intentamos investigar la capacidad del sujeto para dar una respuesta original al pedirles que intenten realizar un dibujo que ninguna otra persona pudiera imaginar. Igualmente, se anima a los sujetos a que elaboren sus respuestas pidiéndoles que aporten todas las ideas necesarias para que el dibujo resulte interesante. Esta prueba tiende a discriminar a los individuos “elaboradores” de los individuos “originales”. Es decir aquellos sujetos que tienen pocas ideas pero que, sin embargo, las trabajan mucho, con gran imaginación, de aquellos sujetos que tienen ideas muy originales pero tienen dificultad para elaborarlas. METODO Para la elaboración de la Prueba de Imaginación Creativa, revisamos las pruebas más conocidas existentes en el mercado internacional. Fundamentalmente nos centramos en el examen del Test de Torrance (1966), El Test de Guilford (1950) y el Test de Wallach y Kogan (1965). Asimismo, revisamos el TAEC (De la Torre, 1996) ya que era la única prueba publicada en España que encontramos disponible en el momento de realización de esta investigación. De esta forma, diseñamos una prueba que, recogiendo algunas de las ideas de las anteriores, fuera lo suficientemente sencilla, y a la vez completa, para evaluar la creatividad de los sujetos.
A CONTINUACIÓN SE DETALLA LO QUE MIDE CADA ESCALA.
Fantasía: es la capacidad de ir más allá del estímulo que se presenta en la lámina, de imaginar cosas que no están presentes o que derivan del estímulo presentado. Fluidez: es la aptitud del sujeto para producir un gran número de ideas. Flexibilidad: es la aptitud del sujeto para producir respuestas muy variadas, pertenecientes a categorías o temas muy diversos. Originalidad narrativa: es la aptitud del sujeto para producir ideas alejadas de lo evidente, habitual o establecido. Se caracteriza por la rareza de las respuestas dadas. Una respuesta se considera rara cuando su frecuencia de aparición en la población general es muy baja. Originalidad gráfica: es la aptitud del sujeto para producir ideas alejadas de lo evidente, habitual o establecido pero mediante la producción gráfica (dibujos). Elaboración: es la aptitud del sujeto para desarrollar, ampliar o embellecer las ideas. El grado de elaboración irá en función del número de detalles adicionales utilizados para desarrollar la respuesta, además de lo necesario para comunicar la idea base. Detalles especiales: es la aptitud del sujeto para utilizar detalles llamativos y poco frecuentes en la mayoría de los sujetos, como uniones de varios dibujos en uno, inversiones, rotaciones, expansiones (cuando traspasa el marco del dibujo), sensación de movimiento, dibujo en tres dimensiones, sensación de perspectiva, simetría, transparencia, reflejos, etcétera, en los diferentes dibujos. Título: es la aptitud del sujeto para proponer un título elaborando una frase adecuada para cada dibujo, más o menos sorprendente y no meramente descriptiva. Creatividad narrativa: es una medida del pensamiento divergente cuando se aplica a la solución de problemas de contenido verbal. Creatividad gráfica: es el grado en que un sujeto es capaz de llevar a cabo asociaciones y nuevas combinaciones a la hora de trabajar en tareas no verbales. Creatividad general: es la estimación del potencial creativo del sujeto, de su capacidad para transformar, combinar y establecer nuevas relaciones entre los elementos, generando sus propias ideas. VALIDACIÓN DE CADA PRUEBA Validación de la PIC-N: Para la validación de la PIC-N utilizamos una muestra compuesta por 637 sujetos. El rango de edades abarcó de los 8 a 12 años. La procedencia fue 5 colegios de varias comunidades autónomas. Para la validación de la PIC-N se utilizaron algunas pruebas de inteligencia general con las que explorar las correlaciones de la inteligencia con el constructo medido. En concreto, la Prueba de Factor “g” de Cattell, y el Test de Matrices Progresivas de Raven (Escala general SPM). La selección de pruebas de contraste para validar la PIC resultó complicada, ya que no existen apenas pruebas en castellano que evalúen la creatividad. Utilizamos por ello el TAEC (De la Torre, 1996)., ya que en la fecha en que se llevó a cabo la recogida de datos la CREA aun no estaba disponible. Del mismo modo, comparamos las puntuaciones obtenidas por los sujetos de la muestra en la PIC con el juicio directo del profesor sobre la creatividad de los alumnos, evaluado a través de la subescala de pensamiento divergente de la EDAC: “(Escala de Detección de Alumnos con Altas Capacidades” (Artola, Barraca, Mosteiro, Ancillo y Pina, 2003) Además, correlacionamos las puntuaciones obtenidas en la PIC con el juicio directo de los compañeros sobre la creatividad de los sujetos, evaluado a través de un cuestionario de nominación de iguales. Validación de la PIC-J: Para la validación de la PIC-J se ha utilizado una muestra compuesta por 526 sujetos procedentes de 7 centros escolares, tanto privados como concertados y públicos: 211 del primer ciclo de la ESO, 190 del 2º ciclo de la ESO y 125 de bachillerato Las pruebas aplicadas para la validación de la PIC quedan recogidas en la siguiente tabla: Como puede observarse, además de las medidas de inteligencia y creatividad, se aplicó en esta ocasión una medida de la personalidad, en concreto el NEOPIR, ya que esta prueba contiene una escala de apertura mental que cabría esperar que correlacione con las medidas de creatividad. En la actualidad estamos en fase de análisis de los datos y de baremación de esta prueba. Validación de la PIC-A: Para la validación de la PIC-A tenemos previsto utilizar una muestra compuesta por 400 sujetos universitarios y profesionales. 100 alumnos de la licenciatura de publicidad, que en principio cabría pensar que son especialmente creativos, 100 alumnos de la licenciatura de Educación, 100 alumnos de la licenciatura de Derecho y 100 adultos que desempeñen diversas profesiones. Las pruebas que se aplicarán para la validación de la PIC-A quedan recogidas en la siguiente tabla: En el momento actual, aun no se ha procedido a la aplicación de las pruebas. IMPORTANCIA DEL ESTUDIO: Los resultados obtenidos con la PIC-N han demostrado que puede constituir un prometedor instrumento para la evaluación de la creatividad, ya que sus propiedades psicométricas son notablemente aceptables. Posee una aceptable consistencia interna, tan problemática en la mayoría de las pruebas de creatividad. Su validez factorial y discriminante ha sido contrastada. Su grado de objetividad, medido a través del acuerdo interjueces, es notable, teniendo en cuenta los datos que ofrecen la mayor parte de las pruebas de este estilo. Entre sus principales aportaciones cabe destacar que evalúa la creatividad tomando en consideración tanto los aspectos verbal como gráfico, a diferencia de otras pruebas existentes en el mercado. Además, la evaluación incluye un número amplio de variables relacionadas con la creatividad, como la fluidez, la flexibilidad, la originalidad y la elaboración, no limitándose a medir sólo aspectos parciales. Sus criterios de corrección son precisos y objetivos, siendo éstos uno de los aspectos más trabajado en la prueba, lo que facilita su corrección y asegura el acuerdo entre distintos evaluadores. Finalmente ha sido diseñada y baremada específicamente para población española, lo que la convierte en un instrumento de gran utilidad para evaluar el talento creativo de los escolares españoles. Los datos de la PIC-J son aun provisionales y aun queda por llevar a cabo la validación y baremación de la PIC-A, una vez concluido este proceso podremos disponer de una medida de la creatividad aplicable a un rango muy amplio de sujetos y de gran utilidad no sólo a nivel escolar sino también de cara a la orientación vocacional y profesional de los sujetos evaluados. EJEMPLO
5. Pruebas personales
5.1 Cuestionario EYSENCK
INTRODUCCIÓN
A partir de los años cincuenta, y conforme la teoría de Hans J. Eysenck comenzaba a ser reconocida internacionalmente, los cuestionarios desarrollados a partir de su teoría comenzaron a ser adaptados a otros países y lenguas (Lynn, 1981). Estos estudios debían tener una especial significación teórica debido al modelo biológico propuesto por Eysenck. Si sus teorías eran adecuadas, los estudios realizados en otros países, lenguas y contextos culturales debían mostrar diferencias en la manifestación de las dimensiones (diferencias en las medias y variancias) pero sistemáticamente debía ser posible la replicación de la estructura trifactorial.
En la década de los ochenta los esposos Eysenck comienzan una serie de estudios transculturales con el objetivo de comprobar la adecuación de su modelo de personalidad tridimensional en otros países. Con este propósito se intentó adaptar el EPQ lo más fielmente posible a los idiomas y características culturales concretas de los diferentes países. Con el fin de homogeneizar las adaptaciones, se recomendó la realización de traducciones inversas y su posterior administración a muestras de alrededor de 500 mujeres y 500 hombres, con el propósito de realizar análisis factoriales para cada sexo (Barrett y Eysenck, 1984).
Barrett y Eysenck (1984) hacen una revisión de estos estudios transculturales en 25 países. Los resultados obtenidos parecen confirmar la idea de que, efectivamente, la estructura trifactorial se encuentra en países tan heterogéneos culturalmente como Bangladesh, China, España, Bulgaria,
Nigeria, Uganda, Puerto Rico, Brasil o Australia. A pesar de que las diferencias culturales entre países pueda influir en la manifestación de las dimensiones de personalidad, y de las dificultades en la adaptación de los cuestionarios de personalidad a otros contextos culturales (Lynn, 1981), la estructura tridimensional propuesta por Eysenck parecía replicarse en multitud de países.
En esta revisión se incluía la adaptación al castellano del EPQ para adultos (Escolar, 1981;
Eysenck y otros, 1982). Los análisis factoriales efectuados en una muestra de 435 varones y 595 mujeres confirmaban la solución trifactorial postulada por Eysenck en la muestra española. Los autores concluían, pues, que la versión española del EPQ resultaba un instrumento fiable y válido para su utilización en nuestro país. Además, los altos índices de comparación de factores obtenidos sugieren que las dimensiones E, N y P eran prácticamente idénticas en España y otros países. Por último, los varones obtenían puntuaciones significativamente mayores en la dimensión P, y significativamente menores en la N, en concordancia con lo encontrado en prácticamente todos los países estudiados.
Sin embargo, el análisis factorial de la versión española del EPQ presentaba algunas dificultades respecto a la escala P. Así, de 24 ítems que componían la escala, 6 presentaban saturaciones muy bajas. Las fiabilidades eran de 0,71 para hombres y 0,70 para mujeres, por debajo de las de E y N. Por último las puntuaciones medias para hombres y mujeres eran de 2,51 y 2,24, lo cual suponía un claro sesgo hacia el bajo psicoticismo.
Estas deficiencias eran muy similares a las que presenta la escala P del cuestionario original (ver Bishop, 1977; Block, 1977 a, b). En efecto, el cuestionario EPQ había recibido numerosas críticas tanto en los aspectos psicométricos como en los conceptuales en torno a la nueva dimensión P. Eysenck, Eysenck y Barrett (1985), con el fin de mejorar estos aspectos, desarrollan una nueva versión revisada de la antigua escala P, escala que junto a las de Extraversión, Neuroticismo y Mentiras va a conformar el EPQ-R (Eysenck y Eysenck, 1991). Así, la consistencia interna de la escala P, para hombres y mujeres, pasa de 0,74 y 0,68 en el EPQ a fiabilidades de 0,78 y 0,76 en el
EPQ-R. Las medias para hombres y mujeres también incrementan sus valores de 3,78 y 2,63 respectivamente (en una escala de 25 ítems) a 7,63 en hombres y 6,18 en mujeres (en una escala de 32 ítems) en la nueva escala P. Por último, la distribución de las puntuaciones en la escala revisada presenta una curva mejorada respecto a la escala P del EPQ, pero que dista aún de asemejarse a una distribución normal. Por tanto podemos concluir que los intentos de mejora de la escala P consiguieron su propósito inicial, aunque sólo hasta cierto punto. A pesar de que las medias, las fiabilidades y la asimetría aumentan, no alcanzan el nivel de E y N. Por lo que se refiere a las fiabilidades, Eysenck (1992 c) nos recuerda que la escala P está compuesta por diferentes rasgos relativamente poco relacionados, por lo que es hasta cierto punto aceptable que la fiabilidad, medida mediante la consistencia interna, ofrezca índices que reflejen la naturaleza heterogénea de esta dimensión. En cuanto a la distribución en la escala desconocemos si el sesgo es debido a problemas de la propia escala, de la muestra, o de la naturaleza de P (Eysenck, 1992 c).
La versión revisada del EPQ empieza a ser uno de los instrumentos más utilizados en los estudios relacionados con variables de personalidad (p.e. Lodhi y Thakur, 1993; Lolas y otros, 1991; Merten y Ruch, 1996; Strelau y Zawadzki, 1995; Yeung y Hemsley, 1996). Al mismo tiempo empiezan a publicarse diferentes adaptaciones del EPQ-R en diversos países y lenguas, como por ejemplo Países Bajos (Sanderman, y otros, 1991), Zimbabue (Wilson y Doolabh, 1992), Italia (Galeazzi y otros, 1992) o Canadá (Eysenck y otros, 1993).
El estudio realizado en España por Aguilar, Tous y Andrés-Pueyo (1990), con una muestra de estudiantes de psicología, presenta algunos aspectos que muestran discrepancias con los estudios originales sobre el EPQ-R. Fundamentalmente, el resultado más destacado del trabajo es la no replicación de la escala P tal y como es entendida por Eysenck. La solución factorial que obtienen los investigadores es de cuatro dimensiones, con la extraversión y neuroticismo prácticamente idénticos a la E y N originales, mientras que la P y la L se entremezclan formando dos factores denominados por los autores psicoticismo y rigidez social. El primer factor (psicoticismo) estaría formado por ítems de L, de P y algunos de E, y vendría descrito en función de componentes como hostilidad, crueldad, falta de empatía, paranoia, búsqueda de sensaciones, sinceridad, egoísmo o acertividad. El segundo factor (rigidez social) estaría formado por ítems de las escalas P y L, y estaría compuesto por preguntas que indican precaución, cumplimiento de reglas sociales, respeto por la ley, empatía o preocupación, entre otros. Además de esta solución factorial, el trabajo también presenta altas correlaciones entre los nuevos factores psicoticismo y rigidez social, y las dimensiones tradicionales E y N (N y psicoticismo, r= 0,42; N y rigidez social, r=0,27; E y psicoticismo, r= 0,30; E y rigidez social, r= 0,23; correlaciones para la muestra conjunta de hombres y mujeres).
Por último, el psicoticismo de esta versión correlaciona 0,41 con la escala P del EPQ en castellano, lo cual va en contra de otros estudios que presentan correlaciones entre las escalas originales P y la P revisada de 0,88 para hombres y 0,81 para mujeres (Eysenck y Eysenck, 1991). También Torrubia y Muntaner (1987) ofrecen correlaciones semejantes a las originales inglesas entre P y P revisada (0,86 para hombres y 0,79 para mujeres) utilizando una versión no publicada en catalán de la nueva escala P.
Por tanto, los resultados obtenidos por Aguilar y otros (1990) parecen indicar que su adaptación al castellano del EPQ-R no resulta del todo adecuada por diversas razones. Primero, los ítems de la escala P y de la escala L se mezclan formando nuevos factores que no se ajustan a los conceptos de psicoticismo y disimulo/conformidad de Eysenck. Segundo, las dimensiones de personalidad aparecen claramente relacionadas entre sí, contrariamente a lo propuesto por la teoría y avalado por diversos trabajos con el EPQ-R (p.e. Eysenck y Eysenck, 1991; Eysenck y otros, 1993; Wilson y
Doolabh, 1992) y el EPQ (p.e. Eysenck y Eysenck, 1975; Eysenck y otros, 1982; Eysenck y otros 1992; Hanin y otros 1991). Tercero, la escala P propuesta por estos autores presenta correlaciones muy bajas con la escala P del EPQ, en comparación con los índices de correlación obtenidos en otros estudios (ver Eysenck y Eysenck, 1991; Torrubia y Muntaner, 1987).
También en nuestro país, Chico y Ferrando (1995) han investigado ciertas cuestiones conceptuales y psicométricas referentes a la P usando la adaptación de Aguilar y otros (1990). Por una parte, la escala P debía reflejar diferencias significativas entre una muestra de delincuentes y una de jóvenes cumpliendo el servicio militar, así como debía distinguir entre presos encarcelados por delitos violentos frente a los no violentos. Los resultados presentan una media de P superior en los delincuentes que en los soldados. Esta diferencia, sin embargo, era mucho más marcada cuando se subdividía la muestra de presos en violentos y no violentos. En este caso, las medias de P eran claramente superiores en los delincuentes violentos y, de hecho, los presos no violentos presentaban puntuaciones de P semejantes a las obtenidas por los soldados. Por otra parte, si la P es considerada como una dimensión continua, el análisis dimensional debería mostrar la misma estructura en las dos muestras criterio. Los resultados obtenidos parecen confirmar este aspecto de la investigación, mostrando una estructura factorial de la escala P semejante en ambas muestras. Cabe destacar, además, que este trabajo presenta resultados similares a los obtenidos en el estudio original en cuanto a la estructura unidimensional de P, contrariamente a lo que ocurre en el estudio de Aguilar y otros (1990).
El objetivo de nuestro trabajo es el de realizar una adaptación al castellano del cuestionario revisado de personalidad de Eysenck (EPQ-R), intentando superar algunos de los problemas presentados en otras adaptaciones. Para ello vamos a desarrollar un cuestionario que se ajuste conceptual y psicométricamente lo más posible a la versión original y que, a su vez, tenga en cuenta las características lingüísticas y sociales de nuestro entorno cultural. Considerando, además, que algunos de los resultados poco satisfactorios encontrados en otras versiones pueden ser debidos a la muestra utilizada, esta adaptación será administrada a una muestra de la población que abarque un rango de edades y profesiones lo más amplio y representativo posible.
El Cuestionario de Personalidad de Eysenck (Eysenck & Eysenck 1975) se ha estandarizado en más de veinticinco países (Barret & Eysenck, 1984). Básicamente hay tres metas en los estudios transculturales. (1) Enseñar que los mismos factores mayores de Psicoticismo (P), Extroversión (E), Neuroticismo (N) y Deseabilidad Social (o Lie Scale L) existen en otros países. (2) Proveer una tabla de corrección válida al país concernido para que el uso de la prueba pueda ser recomendado para ese país. (3) Hacer comparaciones de las normas en las dimensiones de personalidad entre Inglaterra y el país particular que se estudia. Las normas generales y metodología son discutidas en detalles en otro lugar (Eysenck, 1983). Uno de los estudios transculturales exitosos de la versión Adulta del EPQ se realizó en Puerto Rico (Eysenck y Porrata, 1984) y se estimó, por tanto, deseable tratar de realizar también la estandarización de la versión Júnior del EPQ en Puerto Rico (Porrata y Eysenck, 1989-90).
Estructura del EPQR-Abreviado
CUESTIONARIO DE PERSONALIDAD PARA NIÑOS
Promedios y Desviaciones Estándares de los Niños y Niñas Puertorriqueños en las Escalas de Personalidad y Edad.5.2 Cuestionario de CATELL. (EPQ-J, ESPQ, CPQ, HSPQ) ESCALAS DEL H.S.P.Q.
R.B. Cattell y M.D. Cattell (1958, 1968), estiman que las 14 escalas del HSPQ apuntan a dimensiones cuya naturaleza, funcionalmente independiente, ha sido establecida mediante investigación factorial. Sin embargo, cada una de ellas es más que una escala factorial; representa un constructo que ha demostrado tener valor general como una estructura psicológicamente significativa dentro de la personalidad. Es preciso destacar la abundante investigación que ha servido de base para la construcción de este instrumento de evaluación de la personalidad. Las 14 escalas aluden a variables psicológicas que han sido aisladas factorialmente; cada factor representa una dimensión estadísticamente separable en el conjunto de respuestas al cuestionario. En cada escala o factor existen dos polos, y el que aparece a la izquierda corresponde siempre a las puntuaciones bajas del mismo. La descripción de las 14 escalas de primer orden y de las 4 escalas de segundo orden (polos bajo y alto) del “Cuestionario de Personalidad para Adolescentes” (H.S.P.Q.) de Cattell se desarrollará en el capítulo destinado a la metodología de esta investigación, con el fin de ayudar a la interpretación de las puntuaciones que se obtengan de los sujetos de la muestra seleccionada en este estudio. No obstante, se muestran a continuación los nombres de las escalas en su orden correspondiente: • Las escalas de primer orden son las siguientes: A- FABILIDAD. B- INTELIGENCIA. C- ESTABILIDAD EMOCIONAL. D- EXCITABILIDAD. E- DOMINANCIA. F- SURGENCIA. G- FUERZA DEL SUPEREGO. H- ATREVIMIENTO. I- SENSIBILIDAD. J- INHIBICIÓN. O- APRENSIÓN. Q2- AUTOSUFICIENCIA. Q3- INTEGRACIÓN. Q4- TENSIÓN. • Las escalas de segundo orden son: QI- ANSIEDAD. QII- EXTRAVERSIÓN. QIII- DUREZA. QIV- INDEPENDENCIA. LOS 16 FACTORES. Los factores de segundo orden. QI: Ansiedad. La ansiedad en el 16PF es el principal índice de psicopatología. La persona que puntúa alto puede presentar importantes áreas de desajuste, que es necesario investigar. Suelen ser personas cohibidas, emotivas, con tendencia a culparse y tensas. También aparecen puntuaciones elevadas en sujetos que, por algún motivo, quieren presentar una imagen negativa o están intentando pedir ayuda. Una puntuación baja indica que la persona percibe la vida como agradable y se siente adaptada. Sin embargo, no es, necesariamente, indicativa de salud mental, sobre todo si se acompaña de una puntuación alta en DM. Puede indicar falta de motivación ante tareas difíciles. QII: Introversión/Extraversión. Una puntuación baja (INTROVERSIÓN) nos presenta a una persona reservada, autosuficiente e inhibida en los contactos personales. Cuando la puntuación es moderada no es un rasgo patológico. Puede ser favorable o desfavorable, según la situación particular del, individuo. Puntuaciones de 1 ó 2 indican una posible retirada o aislamiento, y deben ser tenidas en cuenta. La puntuación alta describe a un individuo desenvuelto, no inhibido y con buena capacidad para mantener contactos sociales. Una puntuación extremadamente alta puede ser un inconveniente, por la necesidad constante de interacción con los demás, especialmente si el sujeto debe trabajar en soledad. También puede traducir un cierto descontrol, si se acompaña de E+, F+, H+ y Q1+. QIII: Poca/ mucha socialización controlada. Los sujetos que puntúan bajo se despreocupan de las normas, no aceptan obligaciones, son espontáneos, animados e impulsivos. Los sujetos con puntuaciones elevadas son responsables, organizados, escrupulosos en su manera de actuar, se rigen por las normas y se acomodan a las costumbres del entorno. QIV: Dependencia/Independencia. Puntuaciones bajas corresponden a sujetos pasivos, que se dejan llevar por las opiniones de los demás y se apoyan excesivamente en otros. Puntuaciones altas describen a personas que suelen ser críticas, agresivas, mordaces, emprendedoras e independientes. JUSTIFICACIÓN ESTADÍSTICA: FIABILIDAD Y VALIDEZ En su formato actual, los elementos del HSPQ están ordenados de modo que la tarea del sujeto resulta más interesante y la obtención de las puntuaciones se puede realizar mediante una sola plantilla de corrección. Todos los elementos tienen tres alternativas, incluyendo una alternativa intermedia de “compromiso”, para aquellos sujetos que consideran inaplicables a sus sentimientos los dos extremos de respuesta propuestos. Para minimizar efectos de distorsión, las cuestiones se redactaron de modo que fueran todo lo más “neutrales” posible en relación con la deseabilidad social. Por otra parte, se equilibró el número de respuestas aseverativas y negativas que puntúan en cada escala, para eliminar los efectos de aquiescencia. No obstante, es el aplicador quien tiene la responsabilidad de reducir los efectos de distorsión a un mínimo, haciendo que todos los sujetos se sientan confortables y exista un buen clima durante toda la aplicación. En cuanto a las características psicométricas del HSPQ en referencia a la fiabilidad, Cattell la denomina consistencia, la cual comprende diferentes enfoques de estimación de la varianza del test: fiabilidad, (incluye dependencia y estabilidad), homogeneidad (consistencia interna), y equivalencia (correlaciones inter-formas). Así pues, el HSPQ es un test de medida múltiple y simultanea de muy diversos aspectos de la personalidad, y puede ser aplicable en la predicción y evaluación de muy diferentes situaciones. Esto es así porque la construcción del HSPQ se basa en principios teóricos; sus escalas son el resultado de unas hipótesis sobre la estructura de la personalidad, y su validez vendrá a indicar tanto la bondad de la hipótesis como la adecuación de la medida de cada constructo introducido en la hipótesis; es una validez de concepto (o de constructo) cuyo proceso es complejo y surge, como se ha dicho, de las técnicas del análisis factorial. NORMAS DE APLICACIÓN, CORRECCIÓN E INTERPRETACIÓN En la aplicación, el examinador debe intentar alcanzar una comunicación efectiva con los examinandos y tratar de proporcionar una situación de examen relajada y agradable, sin interrupciones. El HSPQ fue diseñado para el empleo con grupos, aunque también puede emplearse de forma individual. Para ello, el examinador debe asegurarse de la comprensión de las instrucciones por parte de los adolescentes, tratando de evitar explicaciones con las cuestiones relacionadas con el factor B de Inteligencia. Sin tiempo limitado, su duración normal se acerca a los 40 o 50 minutos. El material con el que debe familiarizarse el examinador consta de un Manual, Cuadernillo, Plantilla de corrección, Hoja de respuestas y Hoja de perfil. En cuanto a la corrección, el examinador procederá a obtener las puntuaciones directas en las escalas o factores (A a Q4), bien de forma manual o bien de forma mecanizada que permite obtener un perfil y un informe de resultados individualizado. Ahora bien, las puntuaciones directas obtenidas no son interpretables por sí mismas; es necesario transformarlas en unos valores o escala de significación universal. La tipificación española permite la conversión de las puntuaciones directas en decatipos. Estos se distribuyen sobre una escala de diez puntos equidistantes en unidades típicas (supuesta la distribución normal), con una media en el decatipo 5,50 y una desviación típica de dos decatipos. Se puede, por tanto, considerar que los decatipos 5 y 6 son valores medios, 4 y 7 muestran una pequeña desviación (en una y otra dirección respectivamente), 2-3 y 8-9 indican una gran desviación y 1 y 10 son valores extremos, entendiendo todas estas posiciones como relativas a la población específica sobre la cual se realizó la tipificación. Todos los decatipos que presentan los baremos del HSPQ son normalizados; no han sido obtenidos mediante una mera transformación “lineal” de las puntuaciones directas, sino que han sido fruto de una transformación “superficial”, teniendo en cuenta el área o frecuencia existente en cada uno de los intervalos de amplitud unidad de las distribuciones. ELABORACIÓN DEL PERFIL INDIVIDUAL Para una mejor interpretación de los factores de primer orden (escalas A a Q4), es preciso elaborar el perfil individual del adolescente y analizarlo en función de las descripciones de los rasgos de personalidad recogidos en el manual. Las puntuaciones directas transformadas en decatipos permiten dibujar el perfil o línea quebrada resultante. Asimismo, si estos decatipos se multiplican por los pesos impresos en el gráfico, se realiza uno de los pasos más importantes (ponderación de las escalas o factores primarios) para la obtención de los factores secundarios. Para la interpretación de ambos perfiles (de primero y segundo orden) se debe atender a la altura absoluta de las escalas, pendiente o forma general del perfil, variabilidad o dispersión de las crestas y valles, y mayor validez y fiabilidad de los factores de segundo orden, es decir, el examinador deberá comenzar por interpretar las dimensiones secundarias y considerar después las diferentes escalas o factores primarios como una especificación de los factores secundarios.
No hay comentarios:
Publicar un comentario