Home | Business News | Browse by Publication | A | Alfa: Revista de Linguistica

Frequencia de palabras: um diagnostico do vocabulario de redacoes de vestibular./Frequency of words: a diagnostic of the vestibular compositions vocabulary.

Publication: Alfa: Revista de Linguistica
Publication Date: 01-JAN-03
Format: Online
Delivery: Immediate Online Access

Article Excerpt
* RESUMO: Este artigo discute resultados de pesquisa lexico-estatistica, realizada com base em um corpus de 450 redacoes de vestibular (1999 e 2000), de duas universidades do interior do Estado de Sao Paulo, uma publica e outra particular. Os resultados estatisticos dessa amostra do vocabulario de ingressantes universitarios assemelham-se aos dados de outras pesquisas dessa natureza, sobretudo quanto a alta concentracao da frequencia sobre um pequeno numero de unidades lexicais: 11.151 unidades lexicas diferentes totalizaram 113.638 ocorrencias do corpus. O confronto dos dados dessa pesquisa com os do Dicionario de frequencias do lexico do portugues brasileiro contemporaneo, de Biderman (1998), aponta um pequeno grupo de palavras (pouco mais de trezentos) comuns nas duas bases de dados e com indices de frequencia similares, o que indica a existencia de um possivel nucleo do vocabulario analisado que reune palavras, provavelmente, usadas em qualquer tipo de texto. Esse fenomeno e marcado, sobretudo, nos vinte verbos mais frequentes no corpus. Dados resultantes de recortes e de cruzamentos sociolinguisticos, a partir de variaveis como universidade de ingresso dos estudantes; conclusao do Ensino Medio em escola particular ou publica; sexo e renda familiar confirmam esse fenomeno. Dessa analise, dois fatores merecem particularmente destaque: a amplitude maior do vocabulario daqueles que ingressam na universidade publica e a "escolaridade" como variavel que suplanta todas as demais.

* PALAVRAS-CHAVE: Lexico-estatistica; vocabulario; redacoes de vestibular; estudantes universitarios; verbos.

* ABSTRACT This paper presents the results of a lexical-statistical research on a corpus formed by 450 "vestibular" compositions (1999 and 2000) from a private and a public university in Sao Paulo state. The statistical results from this sample of the university applicants vocabulary resemble the data from another researches in the same area, specially when it comes to the high frequency level of the small amount of lexical units: 11,151 different types totaling I13,638 tokens in the corpus. The confrontation of this research data to the data from the Frequency Dictionary of Contemporary Brazilian Portuguese lexicon, by Biderman (1998), shows a small amount of words (a slight more than three hundred) which were common in the two databases and which shared similar frequency levels. This indicates the existence of a possible nucleus of the analyzed vocabulary which might gather words probably used in any kind of text. This phenomenon is, above all, marked by the twenty most frequent verbs in the corpus. Data resulting from different samples and from sociolinguistic crossings of a few variables such as the university the students applied for; public or private high school graduation, gender and family income, confirm this phenomenon. From this analysis, two findings deserve to be highlighted: the superiority of the vocabulary from those applying for a private university and the "school background" as a variable that overcomes all the others.

* KEYWORDS: Lexical-statistical; vocabulary; "vestibular" compositions; university applicants; verbs.

Preliminares

Uma serie de previsoes e de constatacoes sobre o funcionamento da lingua e sobre os elementos gramaticais presentes nos discursos orais ou escritos pode ser feita por meio da lexico-estatistica, comprovando que "0 quantitativo e uma das propriedades do vocabulario" e que "a frequencia e uma caracteristica tipica da palavra". Des venda-se, assim, a norma lexical vigente, descrita por Biderman (1998, p.162) como "a media dos usos frequentes das palavras que sao aceitas pela comunidade de falantes".

Entretanto, a lingua nao pode ser diretamente observavel, por isso, de acordo com a equipe de pesquisadores portugueses que atuaram no projeto do Portugues Fundamental, quando se pretende verificar a frequencia de uso das palavras e a afericao da sua media, e necessario "tentar apreender e isolar, atraves de uma amostragem, o lexico comum de uma comunidade linguistica" (CRUZ, 1987, p.314).

Tomando por base parametros teorico-metodologicos fornecidos pela lexico-estatistica, realizamos uma pesquisa lexicografica (NASCIMENTO, 2001) que estudou uma amostragem do vocabulario de estudantes universitarios, aqui referido por VEU, registrado em 450 redacoes de vestibular de duas instituicoes de ensino superior do interior do Estado de Sao Paulo, uma publica--Unicamp/Campinas, 170 redacoes do vestibular de 1999--e uma particular--Faculdades Toledo/Aracatuba, 280 redacoes do vestibular de 2000--, que tiveram como tema "A comemoracao dos 500 anos do Brasil".

De um modo geral, os resultados apurados sao bastante semelhantes aos dados obtidos por outros trabalhos voltados ao estudo da face quantitativa da linguagem e, de um modo muito especial, aos constantes do Dicionario de frequencias do lexico do portugues brasileiro contemporaneo, de Biderman (1998), doravante DIF, tambem elaborado mediante utilizacao de metodos estatisticos e computacionais. Nos dois trabalhos, observa-se que um determinado grupo de palavras--pouco mais de trezentos--registra um indice muito elevado de frequencia, ocupando, de forma quase identica, o topo das diversas listas de classificacao. Esse fenomeno confirma as declaracoes de Biderman (1998, p.178-9) de que "por enorme que seja o lexico de uma lingua, e reduzido o repertorio efetivamente utilizado pelos falantes, ate mesmo na lingua escrita, que e a variante da lingua que se serve de um vocabulario mais rico e mais variado".

Essas palavras com indice elevado de frequencia, possivelmente, constituem o nucleo do vocabulario das redacoes dos ingressantes universitarios, fenomeno que corrobora a constatacao de Biderman (1998, p.169) de que existem "palavras multiuso que aparecem em qualquer texto, independentemente de seu conteudo tematico".

Os procedimentos estatisticos nao fornecem apenas dados objetivos, mas tambem indicam, por meio das escolhas de determinados itens lexicais feitas pelos falantes, a competencia linguistica e a visao de mundo dos individuos. O fato de serem "escolhidas" determinadas...

View this article FREE - Now for a Limited Time, try Goliath Business News
Free for 3 Days!



More articles from Alfa: Revista de Linguistica
De metrificacao e poesia Latina./Latin meter and poetry., January 01, 2003
A desumana neutralidade da metrica./The inhuman neutrality of metrics., January 01, 2003

Looking for additional articles?
Search our database of over 3 million articles.

Looking for more in-depth information on this industry?
Search our complete database of Industry & Market reports by text, subject, publication name or publication date.

About Goliath
Whether you're looking for sales prospects, competitive information, company analysis or best practices in managing your organization, Goliath can help you meet your business needs.

Our extensive business information databases empower business professionals with both the breadth and depth of credible, authoritative information they need to support their business goals. Whether it be strategic planning, sales prospecting, company research or defining management best practices - Goliath is your leading source for accurate information.