jueves, 4 de marzo de 2010

Problemas pendientes con el Anglizador

Para que el Anglizador pueda rendir al nivel correcto, necesitamos ampliar suficientemente el acceso al lexicón que proveen estos predicados DCG. Esto significa codificar (o recodificar si se les consigue ya etiquetados) listas de 1) verbos, 2) sustantivos y 2) spec con las correspondientes marcas de número y género. Se podrían escribir programas para aprovechas los corpus existentes, como el que está en:

http://www.tesisenxarxa.net/TESIS_UPF/AVAILABLE/TDX-0307105-134028//cd_anexo.zip
  695 verbo(verbo(singular)) --> [anunció].
  696 
  697 n(n(singular, masculino)) --> [enlace].
  698 n(n(singular, masculino)) --> [cortafuegos].
  699 n(n(plural,femenino)) --> [pasarelas].
  700 n(n(plural,masculino)) --> [puentes].
  701 n(n(plural,masculino)) --> [servidores].
  702 n(n(plural,masculino)) --> [conmutadores].
  703 n(n(singular,masculino)) --> [protocolo].
  704 n(n(singular,femenino)) --> [tecnología].
  707 
  708 spec(spec(N,G)) --> det(det(N,G,_)).
  709 spec(spec(plural,femenino)) --> [algunas].
  710 spec(spec(singular,masculino)) --> [ningún].
  711 spec(spec(plural,masculino)) --> [varios].
  712 

No hay comentarios:

Publicar un comentario