06/G485

GeneSys_IDE: Entorno integral de desarrollo de gramáticas orientadas a la generación de textos. Software para la especificación de gramáticas sistémico-funcionales en el marco del modelo de Cardiff. Las lenguas española e inglesa como casos testigos.
GeneSys_IDE: Integrated Development Environment of Text Generation Oriented Grammars. Software for the specification of systemic-functional grammars within the Cardiff Grammar model. English and Spanish as test cases.

Director: CASTEL, Víctor Miguel
Correo Electrónico: vcastel@lab.cricyt.edu.ar

Co-Director: MIRET, Ana María

Integrantes: BOCCIA, María Cristina; VILLAR, Mayra Aixa; GIL, José María; GARCIA, Adolfo Martín; FAWCETT, Robin P.

Resumen Técnico: El desarrollo de gramáticas a gran escala es una tarea ardua y compleja, especialmente cuando las técnicas de generación de textos (NLG) basadas en conocimiento lingüístico son utilizadas en proyectos colectivos o en aplicaciones para la solución de problemas concretos de comunicación o documentación. Por otra parte, la declaración de gramáticas, proceso de especificación sensible al modelo lingüístico subyacente en el entorno de desarrollo, suele exigir al escritor de gramáticas un esfuerzo conceptual grande y una familiarización refinada con el lenguaje de especificación. Los problemas que enfrenta hoy un escritor de gramáticas orientadas a NLG resultan entonces, básicamente, de las demandas de modelización formal e implementación computacional de procesos inherentemente complejos como las situaciones de comunicación en lengua natural. Incluso en entornos completamente declarativos, esto es, cuando el escritor no necesita saber programar para desarrollar una gramática, es igualmente complejo y arduo especificarla en términos de lenguajes de marcado como, por ejemplo, XML. El objetivo general del proyecto es desarrollar un entorno integral de desarrollo (IDE) de gramáticas sistémico-funcionales orientadas a NLG en el marco del modelo de mente comunicativa subyacente en la Gramática de Cardiff (GC). Se espera que este IDE provea al usuario, típicamente un lingüista, de las funcionalidades necesarias para la construcción, evaluación, mantenimiento y utilización de sistemas de NLG en dominios cognitivos restringidos. Los objetivos específicos del proyecto son tres: (1) Construir GeneSys_IDE, esto es, un software para el desarrollo de (léxico-)gramáticas orientadas a la generación de oraciones-texto en el marco sistémico-funcional de GC; (2) Definir GeneSys_IDE para facilitar y potenciar la construcción, evaluación, mantenimiento y utilización de (léxico-)gramáticas a gran escala de cualquier idioma, a los usuarios del software; y (3) Demostrar la versatilidad descriptiva de GeneSys_IDE mediante el desarrollo de una (léxico-)gramática del español rioplatense orientada a NLG de acuerdo con la tipología de reglas de GC. Se pretende que GeneSys_IDE sea una herramienta que contribuya a la comprensión de la naturaleza de las lenguas naturales, en particular, en lo que concierne a los procesos de NLG en el marco del modelo de mente comunicativa de Cardiff. En efecto, GeneSys_IDE proyecta simplificar el desarrollo de gramáticas de cualquier idioma desde la perspectiva sistémica funcional del modelo lingüístico subyacente en GC. Se espera que la gramática del español rioplatense resultante del proyecto sea el punto de partida que ilustre pormenorizadamente cómo desarrollar una (léxico-) gramática del español a gran escala desde la perspectiva de GC. Las gramáticas (de cualquier) idioma construidas mediante GeneSys_IDE deberían poder integrarse en proyectos de investigación que persigan el desarrollo de aplicaciones para NLG en dominios cognitivos acotados. Por otra parte, GeneSys_IDE podría ser utilizado en la enseñanza de Lingüística Sistémica Funcional y NLG.

Summary: The development of large scale grammars is an extremely hard and complex task, in particular, when the techniques of natural language generation (NLG) based on linguistic knowledge are used in team projects or applied to the solution of concrete communication or documentation problems. On the other hand, grammar declaration consists in a process of specification which is sensitive to the underlying linguistic model and which demands of the grammar writer a big effort of conceptualization and refined familiarization with the specification language. Basically, the problems a writer of NLG grammars is confronted with are the result of the demands of formal modelization and computational implementation of inherently complex processes such as communicative situations in natural language. In fact, even when there is no need for the writer to master programming languages or know how to computationally implement the grammar, it is as hard and complex to specify a grammar in terms of mark-up languages such as XML. The general objective of this project is to develop an integrated developmental environment (IDE) of NLG oriented systemic functional grammars within the Cardiff Grammar (CG) which is a core component of the Model of a Communicating Mind (Fawcett 2008c). This IDE is meant to provide the user, typically a linguist, with the necessary functionalities for the construction, evaluation, maintenance and use of NLG systems, preferably, in restricted cognitive domains. There are three particular objectives in this project: (1) To build GeneSys IDE, i.e. the software required for the development of text generation oriented (lexico)grammars within the CG framework; (2) To define GeneSys IDE so as to facilitate and enhance the software users' construction, evaluation, maintenance and use of large scale (lexico)grammars of any language; and (3) To demonstrate the descriptive versatility of GeneSys IDE through the development of an NLG oriented River Plate Spanish (lexico)grammar according to the CG typology of rules (Castel 2007c). In essence, GeneSys IDE should constitute a tool capable of contributing to the understanding of the nature of natural languages, in particular, in relation to NLG processes within the Cardiff Model of a Communicating Mind. Indeed, GeneSys_IDE should simplify grammar development of any natural language from the systemic functional perspective underlying CG. The grammar of River Plate Spanish resulting from this project should be the starting point that illustrates in refined detail how to develop a large scale Spanish grammar from the CG perspective. It is expected that the grammars of any natural language constructed by means of GeneSys_IDE should be capable of being used in research projects that pursue the development of NLG applications in restricted cognitive domains. It should also be possible to use GeneSys_IDE in the teaching of Systemic Functional Linguistics and NLG.