






































































Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Os melhores documentos à venda: Trabalhos de alunos formados
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Comunidade
Peça ajuda à comunidade e tire suas dúvidas relacionadas ao estudo
Descubra as melhores universidades em seu país de acordo com os usuários da Docsity
Guias grátis
Baixe gratuitamente nossos guias de estudo, métodos para diminuir a ansiedade, dicas de TCC preparadas pelos professores da Docsity
A medida tem um papel importante na sociedade moderna. Na psicologia, em particular, existem testes para medir toda a variedade de capacidades, aptidões, ...
Tipologia: Notas de estudo
1 / 78
Esta página não é visível na pré-visualização
Não perca as partes importantes!
Agradeço à Professora Doutora Luísa Castro Loura, pela receptividade que manifestou rela- tivamente a um tema que lhe era estranho, pela curiosidade crescente, pelo incentivo e pela enorme disponibilidade.
À minha colega Dulce Gomes agradeço as tardes de trabalho em que construímos um pro- grama que, depois, sozinha, ‘assassinei’.
Agradeço à companheira de percurso, a Regina Bispo, que me fez acreditar que era possível recomeçar, pelo incentivo constante, pela amizade e pela facilidade com que resolve todos os problemas que o computador introduz na minha vida.
Aos colegas de mestrado, em particular ao Rui e ao Zé, agradeço terem tornado esta cami- nhada conjunta num alegre convívio e desafio.
Agradeço aos colegas do Ispa que contribuíram com documentos que puseram à minha disposição: Glória, Pinto Coelho e Rui Bártolo, e aos outros que simplesmente me ouviram e apoiaram: Ângela, Olívia e Marta.
Obrigada, Zé Manel, pelo apoio nos momentos de desalento e simplesmente por existires.
Ao Gonçalo e ao Miguel, agradeço o Amor que vejo nos vossos olhos.
À João agradeço tudo. Sem o teu apoio, a tua confiança em mim, as nossas gargalhadas e as nossas lágrimas, não teria concluído a caminhada.
À Alexandria, agradeço as sopas quentinhas a meio da manhã e muito mais.
A medida tem um papel importante na sociedade moderna. Na psicologia, em particular, existem testes para medir toda a variedade de capacidades, aptidões, atitudes. Que qualida- des métricas possuem esses testes, que capacidade diferenciadora lhes atribuir? A incom- preensão das ciências duras relativamente à medida que se utiliza na psicologia reabriu o diálogo inesgotável entre as Ciências Empíricas e a Matemática, daí resultando a taxionomia proposta em 1946 por Stevens estabelecendo vários níveis de medição até se chegar à moderna Teoria Representacional da Medição.
São vários os tipos de testes que se usam em psicologia, tendo sido construídos de acordo com uma ou outra corrente de pensamento. Sendo a construção de cada tipo de teste ine- rente à natureza do que se está a medir, deu-se ênfase à forma de construção das escalas de atitudes usadas preferencialmente na Psicologia Social desde os anos 20 do século pas- sado. Remonta-se assim, a Thurstone, Likert, Guttman e Osgood, encontrando em Rasch a súmula de todos eles. Simulam-se, com base nos modelos Rasch, dados de uma escala de Thurstone, e de uma escala de Likert, para se compararem os resultados e avaliar da capa- cidade de discriminação de tais instrumentos.
Pareceu-nos oportuno realizar a presente Dissertação de Mestrado numa área em que os saberes da estatística estão ao serviço da psicologia. A medição está na génese da psicologia como ciên- cia autónoma e está presente em várias áreas. A utilização de muitas escalas, umas mais divulga- das do que outras, umas mais cuidadas na construção do que outras, gerou a curiosidade neces- sária para focalizarmos o nosso trabalho nas escalas de atitudes.
Para se estudarem as propriedades métricas das escalas de atitudes há que explorar a questão dos fundamentos da medição, tentando compreender argumentos de dois lados: os que defendem que a medição é possível em psicologia e os seus detractores.
Uma das opções feitas à partida foi não explorar campos específicos da psicologia, assim, sabe- mos ser a atitude uma noção complexa com várias abordagens e várias expressões limitando-nos, neste trabalho, ao estudo das capacidades métricas das escalas.
Por várias vezes nos encontrámos em encruzilhadas onde os caminhos pareciam igualmente váli- dos. Havendo vários modelos de construção de escalas de atitudes impôs-se partir à sua desco- berta. Thurstone surgiu como o nome que se impõe ao estudar as escalas de atitudes, por ser o pioneiro: acreditando nessa medição, propondo um modelo e uma forma de construção do instru- mento de medida. Likert, que simplifica o processo de construção do instrumento proposto por Thurstone, contribuiu para a grande explosão de utilização das referidas escalas. Perseguindo sempre o objectivo do estudo das capacidades métricas das escalas de atitudes comparam-se estes dois tipos de escalas com base em dados simulados.
A simulação dos dados conduziu-nos à descoberta das teorias mais modernas da medição em psicologia que se nos afigurou como indispensável aprofundar. Sendo uma área vastíssima em pleno desenvolvimento constituiu a parte mais estimulante do trabalho, que foi necessário delimitar e restringir ao papel que lhe havíamos atribuído à partida: um modelo para alicerce da simulação de resultados de escalas hipotéticas seja ao estilo de Thurstone, ou de Likert.
As escalas de atitudes, utilizadas em larga escala na psicologia social, conduziram ao estudo da sua construção e das teorias subjacentes à medição. Na construção de uma escala de atitudes estão envolvidos vários saberes que se entrecruzam: a psicologia que define os constructos e analisa a relação entre os processos mentais e as manifestações comportamentais que são sus- ceptíveis de medição; a teoria da medição, dando fundamento à existência de uma escala, isto é, analisando as relações entre os processos mentais, por forma a legitimar as correspondências com sistemas numéricos mais ou menos complexos; a estatística que dá fundamento matemático aos instrumentos de medida e a computação, permitindo a elaboração de cálculos cada vez mais complexos.
Thurstone, em 1929, propõe uma teoria sobre a medição das atitudes baseada nos modelos da psicofísica. Se, por um lado, os instrumentos de medida se desenvolviam e permitiam o nascimen- to de novas ciências, por outro, debatia-se a qualidade e pertinência de se efectuarem essas medições. Em 1946, Stevens apresenta a proposta de classificação das escalas de medição em vários níveis, de acordo com o tipo de transformações válidas. Só com a teoria representacional da medição, que surge no final do século, se tem um enquadramento teórico para a construção de escalas. Axiomatizar a medição é um complemento aos métodos de avaliação, pois permite per- ceber quais as variáveis que podem e as que não podem ser medidas e permite fazer escolhas sobre a melhor forma de medir.
Ao modelo proposto por Thurstone outros se sucederam: Guttman e Osgood, são dois nomes indissociáveis das escalas de atitudes, mas é Likert, que apenas propôs uma forma alternativa de construção das escalas, que se associa mais frequentemente à medição na psicologia social. Os diversos tipos de escalas de atitudes são apresentados e comparados, nos seus fundamentos e resultados. Havendo actualmente dois grandes paradigmas na medição em Psicologia, a teoria clássica dos testes (TCT), em que se enquadram os modelos referidos, e a teoria da resposta ao item (TRI), as duas abordagens são comparadas, ainda que superficialmente. É na teoria de res- posta ao item que se ancora a simulação de dados, em particular nos modelos Rasch, por serem modelos com plasticidade, que decorrem da proposta de Thurstone e por haver vários estudos que deles se socorrem para analisar a complexidade da medição de atitudes.
Evidenciam-se as capacidades métricas de escalas de atitudes do tipo Thurstone ou Likert, contri- buindo para uma utilização melhor e mais consciente da medida em psicologia.
descrevendo uma hierarquia na estrutura matemática e classificando posteriormente os procedi- mentos estatísticos admissíveis em cada uma delas. As Estatísticas “permitidas” serão as que se mantêm invariantes para as transformações matemáticas que cada um dos níveis de mensuração admite. A classificação é feita com base nas propriedades do grupo de transformações associado a cada escala o que gerou alguns malentendidos por se confundir as transformações “permitidas” com mudanças de escala (Luce et al. , 1990)^1. De acordo com Stevens (1968, p. 699): é uma convenção útil definir a medição como a atribuição de números a objectos ou acon- tecimentos segundo uma regra rigorosa. Uma vez que há diferentes regras, há diferentes formas de medida; mas para cada uma delas obtém-se um certo grau de isomorfismo entre as relações empíricas dos objectos e as relações formais dos números.
A medida é tratada como um isomorfismo ( s ) entre dois conjuntos: o dos objectos (no caso: obser- vações psicológicas) que se passa a designar por O, e um conjunto de categorias simbólicas que
se designa por C.
A natureza das diferentes escalas reside no conceito de invariância: “como se podem transformar os números sem que haja perda de informação empírica? (…) cada uma das quatro escalas pos- sui um grupo característico de transformações permitidas” (Stevens, 1968, p.700). Será nominal qualquer escala que admita transformações biunívocas, se as transformações permitidas forem estritamente monótonas a escala será ordinal, as transformações afins são as de uma escala de intervalos e as do tipo f(x)=cx (c>0) definem uma escala de razão.
As escalas nominais não requerem uma associação a valores numéricos, são invariantes para qualquer transformação que preserve a relação entre os objectos e as categorias. Neste nível de medida apenas se estabelecem relações de equivalência entre os objectos, a cada classe de equivalência de O corresponde um símbolo de C:
O conjunto C pode ser constituído por números, mas apenas enquanto numerais (significantes sem significado matemático). Então uma escala nominal é um isomorfismo de (O, ~) em (C, =)
O exemplo que Stevens apresentou é o da numeração dos jogadores de futebol americano. Entre as escalas de atitude, são escalas nominais as que determinam apenas o grupo a que o sujeito pertence, como por exemplo a escala de atitudes face à polícia (Lima, 2000) que se apresentará mais à frente.
(^1) “A unidade é uma convenção do cientista à cerca da dimensão e, mudá-la é uma questão meramente numérica; ao passo que uma mudança automórfica é uma substituição sistemática no próprio estímulo, não na sua representação”(p. 94).
escala que mantém a mesma relação:
Um dos exemplos que Stevens apresentou foi a escala de dureza dos minerais. Há diversas esca- las de atitudes com este nível de mensuração, em particular as construídas de acordo com os princípios de Likert como a escala de atitudes face ao ambiente desenvolvida por Soczka em 1983 (Lima, 2000) e que se apresentará mais à frente.
Uma escala de intervalos envolve a noção de distância. Os elementos de uma sequência mantêm sempre o mesmo espaçamento (Luce, 2001) mas a origem e o zero são arbitrários. “Os números podem servir para representar as diferenças ou as distâncias entre os elementos” (Stevens, 1968, p.700). Qualquer transformação em C deve preservar tanto a ordem como as diferenças entre os objectos, ou seja, apenas se devem efectuar transformações lineares porque só estas mantêm as distân- cias:
A designação advém de as razões entre intervalos se manterem invariantes:
α β α β
α β α β. (^) (5)
nição de ○ designada por concatenação. A concatenação entende-se de forma simples nalgumas medições físicas como por exemplo o comprimento: considerando duas varetas (a e b) de com-
ticular na Psicologia, em que a concatenação (também referida como aditividade) não é válida ou
Apesar desta taxionomia não ser exaustiva, apesar de deixar, do ponto de vista formal, algumas questões em aberto, dir-se-á com Velleman & Wilkinson (1993) que é errado concluir que não tem valor. Efectivamente era necessário diferenciar as variáveis qualitativas (nominais e ordinais) das quantitativas (intervalares e de razão) e discutir a aplicabilidade das técnicas estatísticas aos diversos níveis de mensuração.
A terminologia de Stevens é tão universalmente difundida que se torna necessária quando se abordam as questões de medição em geral, e em particular no âmbito da psicologia. Contra os seus detractores Stevens argumentava que o facto de as sensações não poderem ser separadas em partes constituintes ou colocadas uma após a outra, obtendo-se ainda uma sensação (alusão à concatenação) não era argumento contra a possibilidade da sua medição pois a distinção entre os aspectos formais, arbitrários, vazios lúdicos das matemáticas e as investigações das disciplinas “concretas” fez aparecer claramente que o domínio da medição se estendia a tudo onde o nosso engenho podia conceber regras sistemáticas permitindo associar números a coisas. O sistema numérico tornou-se um modelo que se pode utilizar de forma arbitrá- ria. É um modelo rico, certamente, de que se pode usar um ou outro dos aspectos da sua sintaxe para explicar uma ou outra das propriedades dos objectos ou dos aconteci- mentos. (Stevens, 1968, p.700)
Stevens tentava dar suporte à escala de sonoridade que acabara de criar e justificar a legitimidade da medição em psicologia com os mesmos critérios das escalas usadas noutras ciências mais desenvolvidas. “O trabalho que Stevens começou desenvolveu-se numa especialização da mate- mática que produz resultados que confirmam alguns aspectos que Stevens intuiu, e infirmam outros aspectos do seu trabalho” (Teghtsoonian, 2001). Neste esforço de sistematizar e dar forma matemática às diversas formas de medir encontram-se, entre outros, Krantz, Luce, Suppes e Tversky (1971; 1989; 1990) que se propuseram “organizar os resultados centrais de uma forma cumulativa” (1971, p. xviii).
Nos três volumes de Foundations of Measurement estão organizados os principais resultados matemáticos usados para construir representações numéricas de estruturas qualitativas, cobrem exemplos da física, da geometria, da utilidade e também da psicologia, e axiomatizam a teoria da medição. Dão portanto sentido às diversas formas de medir que se desenvolveram nas ciências empíricas. Retomam a taxionomia de Stevens dando uma definição matemática a cada um dos níveis de medida e discutindo algumas lacunas. Criam assim uniformidade nas várias formas de
medir permitindo que se tenha um corpo teórico onde as diversas ciências empíricas podem fun- damentar as, também diversas, formas de medir.
A axiomatização da medição baseia-se em dois resultados:
A representação: se uma estrutura de relação empírica satisfaz um determinado conjunto de axiomas, então pode ser construído um homomorfismo dessa estrutura para uma estrutura rela- cional numérica escolhida.
mente uma relação de um para um: duas varetas terem o mesmo comprimento não quer dizer que as duas varetas sejam iguais.
“Um homomorfismo no conjunto dos números reais é frequentemente referido como uma escala na literatura da medição psicológica” (p. 9).
O conceito de transformações permitidas que Stevens usou, torna-se muito mais claro quando se faz a análise dos homomorfismos do que das escolhas arbitrárias no procedimento da medi-
A unicidade que determina o tipo de escala de medida resultante do processo de medição. A escolha do termo unicidade é justificada por Suppes & Zinnes (1963, p.10): “do ponto de vista da matemática a determinação do tipo de escala de medida resultante de um dado sistema de rela- ções empíricas consiste em determinar a maneira como quaisquer dois sistemas numéricos estão relacionados quando usam a mesma relação numérica e são homomorfos de dado siste- ma empírico”.
Esta noção percebe-se melhor quando ilustrada com um exemplo. No caso do peso, as quatro afirmações seguintes são equivalentes (Suppes & Zinnes, 1963): (1) O peso mede-se numa escala de razão.
Axiomatizar a medição é um complemento aos métodos de avaliação, pois permite perceber quais as variáveis que podem e as que não podem ser medidas e permite fazer escolhas sobre a melhor forma de medir. Mais do que identificar o nível de medida de cada escala importa conhecer intrin- secamente o atributo e as relações que aí se podem estabelecer para se construir o instrumento de medida que fará corresponder a medição a números interpretáveis. “Por exemplo, na aptidões, inteligência ou atitudes sociais, os resultados de testes ou classificações numéricas são usualmen- te interpretados como medidas do atributo em questão. Mas na ausência de um homomorfismo bem definido está longe de ser claro como interpretar tais números” (Krantz, 1971, p. 33).
A identificação do nível de medida de uma escala faz-se portanto a montante, isto é, antes mesmo da sua construção. Os utilizadores de uma escala, que não a construíram, deveriam reportar-se ao nível de medida que o autor lhe atribui. Não havendo essa indicação, é tarefa árdua identificar o nível de medida de uma escala, sendo que alguns atributos são medidos sem que tenha havido o cuidado de atribuir propriedades métricas à escala.
Michell (2002) analisa alguns dos autores mais citados na área de tratamento de dados na psico- logia para dar a conhecer o papel das escalas de medida definidas por Stevens na psicologia moderna, chamando a atenção para o facto de a taxionomia de Stevens ser largamente difundida enquanto que os recentes trabalhos de Luce, Krantz, Suppes, Tversky, Zinnes, ou Narens, entre outros, são completamente ignorados. Dá conta de que modernamente se continua a afirmar com Stevens que de facto, a maioria das escalas usadas extensa e efectivamente pelos psicólogos são escalas ordinais. Para ser estritamente correcto, as estatísticas usuais envolvendo médias e desvios padrão não deveriam ser usadas nestas escalas (…). Por outro lado, (…) pode-se evocar uma espécie de confirmação pragmática: em inúmeras situações o seu uso conduziu a resultados frutuosos. (Stevens, 1946, p. 679)
Ora, no volume III dos Foundations of Measurement (Luce, 1990), partindo da ideia de que nem todo o enunciado quantitativo é forçosamente admissível enquanto descrição de um fenómeno ou de uma situação empírica, isto é, baseando-se no conceito de significado^3 , os autores reafirmam e provam que algumas estatísticas (ou tratamentos estatísticos) são desapropriadas para alguns níveis de mensuração e recomendam que se prefiram os tratamentos estatísticos adequados ao nível de medição.
(^3) Em inglês meaningfulness : “requer que a forma de uma lei científica não seja alterada por uma mudança de unidades da escala de medição”(Falmagne, 2004, p. 1341)
A teoria de Stevens apenas levantava o problema, mas não fornecia ao investigador um guia explícito de como identificar o tipo de escala e foi (é) usada sem que se investigue cientificamente a questão do tipo de escala, dando origem a que se considere que a atribuição das propriedades de uma escala de intervalos ou de razão é sempre uma convenção (Michell, 2002).
A partir dos anos 50, vários autores adoptaram a taxionomia de Stevens “talvez porque apareceu para constituir um guia simples e proteger analistas ingénuos de dados, de erros ao aplicar a esta- tística” (Velleman & Wilkinson, 1993, p. 5) e grande parte dos manuais de estatística para as Ciên- cias Humanas referem os procedimentos adequados a cada um dos tipos de escalas de medida (cf. Siegel, 1956/1988). Recentemente, alguns dos packages de estatística exigem que o utilizador identifique o nível de medida de cada uma das variáveis antes de se proceder a qualquer trata- mento estatístico estando vedadas algumas abordagens em concordância com as limitações pre- conizadas na taxionomia de Stevens.
O que é importante salientar é que o nível de medida não é inerente aos dados, está antes ligado à estrutura do atributo que se mede e também à experiência que se pretende efectuar (Velleman & Wilkinson, 1993).
O desafio para as novas gerações de psicólogos é deixarem de pretender que podem medir sem se preocuparem com a questão fundamental dos fundamentos da medição (Michell, 2002).
A construção de um instrumento de medida exige um profundo conhecimento do atributo e das relações que se podem estabelecer, como se viu anteriormente.
Na construção de uma escala de atitudes também os três campos estão envolvidos. A noção de atitude tem evoluído ao longo do tempo, mas tem à partida um conteúdo que lhe é atribuído espontaneamente que decorre da palavra existir na linguagem corrente.
Uma atitude é muitas vezes definida como uma tendência para reagir relativamente a uma designada classe de estímulos tais como um grupo étnico ou nacional, um hábito ou uma instituição. (…) Na prática actual, o termo ‘atitude’ é frequentemente associado ao estímu- lo social e às respostas matizadas emocionalmente. Também envolve frequentemente juí- zos de valor. (Anastasi, 1990, p. 405)
A atitude é um constructo que se tenta avaliar através da expressão favorável ou desfavorável, o que indica que as atitudes não são directamente observáveis. (Lima, 2000).
Por trás do observável escondem-se por vezes as verdadeiras razões e atitudes dos sujeitos e por isso se desenvolveram várias técnicas (umas mais deontológicas do que outras) para se ter aces- so a esse mundo que insistimos em preservar do olhar dos outros (Garcia-Marques, 2000).
A atitude intervém em todas as relações do sujeito com o exterior: a nível físico, social, abstracto… e estas relações são observáveis. São estas relações que se tornam o objecto de medição quando se constrói uma escala de atitudes.
Apesar de não haver uma distinção clara entre opinião e atitude, em termos metodológicos há diferenças. Os inquéritos de opinião são constituídos por diversas questões que podem estar ou não relacionadas e destinam-se preferencialmente a identificar as causas de determinadas esco- lhas. As escalas de atitudes geram um score total que indica a intensidade do sentir do sujeito relativamente a um determinado objecto.
A maior parte das escalas de atitudes foram desenvolvidas para serem usadas em projec- tos de investigação particulares. Algumas foram desenhadas para a investigação de atitu- des e moral de funcionários. Outras foram usadas para aceder aos resultados de progra- mas educacionais ou de treino. (…) Uma das aplicações mais importantes da medida das atitudes encontra-se na investigação em psicologia social. Praticamente todos os textos de psicologia social contêm secções referentes às atitudes e à sua medição. (…) Foram publicadas relativamente poucas escalas de atitudes, se bem que a maioria esteja descrita de forma exaustiva na literatura de investigação. (Anastasi, 1990 p. 407)
É longo o caminho percorrido na construção de tais escalas. Referindo apenas as questões meto- dológicas e as limitações que a matemática impõe, apresentam-se várias abordagens dessa cons- trução, desde a preconizada por Thurstone em 1929, passando por Likert, Guttman e Osgood.
As escalas tipo Thurstone são constituídas por um conjunto de frases (itens) em relação às quais o sujeito avaliado deve manifestar o seu acordo ou desacordo.
Mede-se a atitude do sujeito fazendo a média ponderada dos itens em que houve acordo. Os fac- tores de ponderação são calculados na fase de construção da escala.
Exemplo: Escala de Thurstone para medir atitudes face à igreja (Lima, 2000).