Mostrando postagens com marcador L.B; transcrição; LS. Mostrar todas as postagens
Mostrando postagens com marcador L.B; transcrição; LS. Mostrar todas as postagens

30 de nov. de 2010

Softwares para tratamento de dados em Línguas de Sinais

De volta à publicação dos trabalhos que foram apresentados no CELSUL 2010, hoje quero mostrar o que foi apresentado pela equipe da UFSC sobre softwares para identificação e tradução de línguas de sinais. No congresso, conversei com a Ms. Janine Soares de Oliveira (já havíamos divulgado a dissertação de mestrado dela, a respeito de ed. matemática para surdos aqui), a respeito dos trabalhos, e os achei muito interessantes! 
Janine Soares de Oliveira, com os
pôsteres dos trabalhos
Um dos trabalhos intitula-se "Desenvolvimento de software para Identificação de Sinais na transcrição de vídeos em Libras" e foi apresentado como pôster. Confira o resumo:

Janine Soares de Oliveira (janinemat@gmail.com) – UFSC
Ronice Müller de Quadros – UFSC; Ramon Dutra Miranda – UFSC; Rundesth Sabóia Nobre – UFSC
Desenvolvimento de software para Identificação de Sinais na transcrição de vídeos em Libras
A pesquisa em Aquisição da Língua de Brasileira de Sinais – Libras – requer o tratamento e análise de dados em vídeos. O Grupo de Pesquisa em Aquisição da Língua de Sinais Brasileira da Universidade Federal de Santa Catarina está constituindo um banco de dados com transcrições de vídeos em Libras. Todavia, dadas as especificidades dos dados, observou-se a necessidade de desenvolver um procedimento eficaz para que pesquisadores possam localizar corretamente os sinais. Adotou-se, a padronização nas glosas utilizadas na transcrição, isto é, uma correspondência de um pra um entre sinal e glosa que o identifica em português. O volume de dados revelou ainda a necessidade de criar um sistema de busca específico para estas glosas que identificam os sinais. O software para Identificação de Sinais deverá ser utilizado na composição do corpus da Libras, tendo como objetivos: reunir, organizar e permitir a busca dos sinais e/ou das glosas. A Identificação de Sinais funciona como um sistema de busca que tem como filtros parâmetros da Libras, tais como, configurações de mãos e localização do sinal, além da glosa em português. O sistema, desenvolvido em plataforma php com acesso via web, está em fase de alimentação e por enquanto é acessado somente pelos usuários cadastrados no grupo de pesquisa, mas em breve estará disponível online, sem restrição de acessos para visualização e busca, e os usuários poderão ainda enviar sugestões de sinais com vídeo para os administradores através de ferramenta disponibilizada no próprio sistema.

Software Identificador de Sinais (UFSC)

Não vejo a hora em que o sistema estiver pronto e disponível on-line para todos, não será muito legal? 
Outro trabalho apresentado pela mesma equipe fala do uso de uma ferramenta de anotação multimídia, já conhecida, o ELAN. Veja o resumo do trabalho:

Janine Soares de Oliveira (janinemat@gmail.com) – UFSC
Ronice Müller de Quadros–UFSC; Franz Kafka Porto Domingos–UFSC; Karina Elis Christmann. –UFSC
O software ELAN como ferramenta para transcrição, organização de dados e pesquisa em Aquisição da Língua de Sinais 
Devido aos avanços tecnológicos, pesquisadores da área de linguística têm a possibilidade de reunir e observar um número cada vez maior de dados. Os bancos de dados das línguas orais já se encontram consideravelmente desenvolvidos e em constante expansão, principalmente no que se refere ao registro escrito destas línguas. Com relação às línguas de sinais, em particular, a Língua Brasileira de Sinais – Libras – tem-se como barreiras a carência de materiais e a ausência de ferramentas de busca que atendam às
especificidades da modalidade visual-espacial. Assim, o trabalho do Grupo de Pesquisa em Aquisição da Língua de Sinais Brasileira da Universidade Federal de Santa Catarina está constituindo um banco de dados com transcrições de vídeos em Libras. Esta tarefa é realizada utilizando como ferramenta o software ELAN, uma ferramenta de anotação multimídia desenvolvida pelo Instituto de Psicolinguística Max Planck. O software permite a criação, edição, visualização e busca de anotações através de dados de vídeo e áudio. Além de apresentar o tempo associado aos trechos transcritos permite um número ilimitado de registros, através das trilhas de anotações criadas pelos pesquisadores em função dos objetivos da pesquisa. No caso das línguas de sinais, podem ser visualizados: vídeos em Libras, glosas, traduções das glosas, marcas não-manuais, sons associados aos sinais, contexto, comentários, entre outros. Cada anotação selecionada permite a localização do vídeo e o trecho é reproduzido de maneira sincronizada. Esta ferramenta constitui-se em um grande avanço na investigação da Aquisição da Língua de Sinais.

Eu e Janine no CELSUL


Para quem quiser saber mais sobre o ELAN pode acessar o site do projeto: http://www.lat-mpi.eu/tools/elan/.
Outros softwares citados em trabalhos acadêmicos: ANVIL (Annotation of vídeo and language data)CLAN (Computerized Language Analysis)SIGNSTREAM e TRANSAMA. Em outro post, já havíamos falado um pouco sobre esses softwares, com as devidas referências a alguns trabalhos que o citam.

Obrigada pela atenção, Janine, e parabéns a toda a equipe pelos excelentes trabalhos!

31 de mar. de 2009

Transcrição de Línguas de Sinais

Olá pessoal
Quando se faz um estudo científico que envolva usuários de Línguas de Sinais, a transcrição deles é sempre um desafio. Abaixo exemplifico alguns sistemas de transcrição, manuais ou informatizados, e no final do post as bibliografias utilizadas e links para copiar estes arquivos.
Em estudos feitos no Brasil onde a utilização de sistemas de transcrição de LS foi necessária, encontramos basicamente dois tipos de sistemas: o Sistema de Transcrição em Sinais, exposto por Quadros e Karnopp (2004) e o Sistema de Notação em Palavras, desenvolvido e utilizado pela Federação Nacional de Educação e Integração de Surdos (FENEIS). Levando em conta alguns fatores, como a necessidade de um sistema simples e de fácil compreensão para não-usuários de LS, este trabalho baseia-se na escolha adotada por Maria do Socorro Correia Lima (2004) em sua tese de doutorado. A autora explica que utilizou na pesquisa apenas uma parte do Sistema de Notação em Palavras, para efeito de simplificação, e também discorre que este se denomina assim porque as palavras de uma língua oral (no caso, Língua Portuguesa) serão utilizadas para representação aproximada dos sinais da LIBRAS.
Simplificadamente, o Sistema de Notação em Palavras funciona assim:
· Os sinais em LIBRAS, para efeito de simplificação, são representados por itens lexicais do português em letras maiúsculas. Exemplos: BRINCADEIRA, ESCOLA, SURDO.
· A datilologia (alfabeto manual), que é utilizada para expressar nome de pessoas, de localidades e outras palavras que não possuem um sinal específico, é representada pela palavra separada por hífen. Exemplos: E-S-C-O-V-A-R, M-I-S-S-Ã-O.
· Para os sinais não manuais (expressões facial e corporal) que são realizados simultaneamente com um sinal, para simplificação, são utilizadas, para a representação de frases nas formas exclamativas e interrogativas, os sinais de pontuação usados na escrita de línguas orais, ou seja: !, ? e !?.
· A língua oral, que é utilizada pelos sujeitos investigados (professora ouvinte, pesquisadora ouvinte, alunos surdos), é representada em letra minúscula e escrita em itálico.
· Os comentários explicativos utilizados no decorrer da transcrição tanto dos sinais como das falas, são representados em letra minúscula entre parênteses.
· A pantomima[1] é representada em letra maiúscula, escrita em negrito
e em itálico.
· A mímica[2] é representada em letra maiúscula, escrita em negrito.
· A tradução da língua de sinais é representada entre colchetes.

Na língua de sinais não existem desinências para gêneros (feminino e masculino) e número (plural), portanto, o sinal, representado por palavra do português e que possui estas marcas, recebe o símbolo @ para demarcar a idéia de ausência e não causar confusão quanto a estes aspectos. Exemplos: meu@ (meu[s] e minha[s]), amig@ (amigo[s] e amiga[s]), fri@ (frio[s] e fria[s]). As marcas de plural podem ser visualizadas através da repetição do sinal, e a representação será feita por um sinal de mais localizado no lado direito do sinal que está sendo repetido. Exemplos: CASA+, ÍNDIO+.
McCleary e Viotti (2007) listam algumas ferramentas que possibilitam a transcrição de dados em LS de maneira informatizada, onde é possível visualizar gravações de vídeo e realizar anotações simultaneamente, como o ANVIL (Annotation of vídeo and language data), ELAN (EUDICO Language Annotator), CLAN (Computerized Language Analysis), SIGNSTREAM e TRANSAMA. No Brasil, o ELAN[3] tem sido utilizado com sucesso em pesquisas onde a transcrição detalhada da LIBRAS é fundamental.

[1] Representação de uma história exclusivamente através de gestos, expressões faciais e movimentos, especialmente no drama ou na dança; mímica. A arte de representar exclusivamente por meio de movimentos corporais (Lima, 2004, p.114).

[2] A gesticulação que acompanha a fala oral (Lima, 2004, p.114).

[3] “Criado pelo Instituto Max Planck de Psicolingüística especificamente para análise lingüística, está sendo desenvolvido junto a um grupo de pesquisadores de línguas de sinais. Permite múltiplas trilhas customizáveis para anotações e vídeos simultâneos. Distribuído gratuitamente para plataformas PC, Mac e Unix. Sítio: ” (McCleary Viotti, 2007, p.18).
BIBLIOGRAFIA