|

24/01/2008
Denodo obtiene una ayuda del Ministerio de Industria, Turismo y Comercio para el proyecto INIENE: Integracion de Informacion Estructurada y No Estructurada.
Denodo obtiene una ayuda del Ministerio de Industria, Turismo y Comercio para el proyecto INIENE: Integracion de Informacion Estructurada y No Estructurada (FIT-340000-2007-216).
Este proyecto se enmarca dentro de la convocatoria PROFIT - S.I. General 1/2007, regulada por Resolución 2 de febrero de 2007 de la Secretaría de Estado de Telecomunicaciones y para la Sociedad de la Información.
Objetivos:
Este proyecto pretende investigar nuevos modelos de datos capaces de representar de forma consistente tanto información estructurada como no estructurada.
Uno de los paradigmas dominantes en la actualidad para la integración de información son los sistemas EII. Estos sistemas son capaces de integrar en tiempo real información de fuentes heterogéneas y distribuidas, tanto estructuradas como semi-estructuradas.
El objetivo principal de este proyecto es extender este paradigma para soportar la inclusión de fuentes de información no estructurada. Esto implica la extensión de los modelos, lenguajes y algoritmos utilizados en los sistemas EII para soportar este nuevo tipo de fuentes. En particular:
- Se extenderá el lenguaje de consulta para soportar construcciones propias de los sistemas de tratamiento de información no estructurada tales como la búsqueda por palabra clave, la clasificación en taxonomías o la extracción automática de los conceptos más relevantes de elementos de datos escritos en texto libre.
- Se extenderán los algoritmos de generación y optimización de planes de consultas distribuidas.
- Se diseñarán nuevos modelos que permitan incluir el concepto de taxonomía utilizado habitualmente para clasificar contenidos no estructurados dentro de un ámbito estructurado. Esto obligará también a considerar el lugar en la arquitectura de los algoritmos de clasificación automática utilizados habitualmente con información documental.
Novedades tecnológicas:
Las principales novedades tecnológicas que introducirá este proyecto son:
- Un nuevo modelo de datos capaz de representar de forma consistente tanto información estructurada como no estructurada dentro del paradigma de integración de información de mediador (conocido en la industria como sistemas EII).
- Nuevos modelos, lenguajes y algoritmos para soportar el tratamiento de información no estructurada en sistemas EII. Más concretamente:
a) Extensiones en los lenguajes de consulta de los sistemas EII para soportar construcciones propias de los sistemas de tratamiento de información no estructurada tales como la búsqueda por palabra clave, la clasificación en taxonomías o la extracción automática de los conceptos más relevantes de elementos escritos en texto libre.
b) Nuevos algoritmos de generación y optimización de planes de consultas distribuidas adaptados para tener en cuenta las peculiaridades de la información no estructurada.
c) Nuevos modelos que permitan incluir el concepto de taxonomía utilizado habitualmente para clasificar contenidos no estructurados dentro de un ámbito estructurado. Dentro de este modelo, será necesario encuadrar los algoritmos de clasificación automática utilizados habitualmente con información documental.
Proyecto cofinanciado por el Ministerio de Industria, Turismo y Comercio (MITYC) y por el Fondo europeo de Desarrollo Regional (FEDER)
|