Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/610
Ordenamiento basado en ejemplos para la recuperación de información geográfica
ESAU VILLATORO TELLO
LUIS VILLASEÑOR PINEDA
MANUEL MONTES Y GOMEZ
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Information retrieval
Markov processes
Geographics information systems
problem of dealing with the excess of information. Web’s search machines are convincing examples of their utility and popularity. Hence, Web’s users see the task of information retrieval as an everyday activity. Search machines are employed to find information about almost every area of knowledge. However, a considerable part of this information is known to be geographically delimited, that is, in their content refers to some spatial aspects, or some geographical places (for instance, names of cities, countries, towns or streets, etc.). As a consequence of this fact, users looking for this type of information tends to include in their queries some geographical references when they are doing some search in the Web. In this work we focus on this particular type of queries, this is, users looking for apartments, hotels, restaurants, archeological information, touristic activities, industrial places, interchange universities, etc. This problem is known as Geographic Information Retrieval. Recent research in the area of Geographic Information Retrieval (GIR) has shown that the problem is partially solved through traditional Information Retrieval (IR) techniques. It has been possible to observe that traditional IR machines are able to retrieve the majority of relevant documents to some geographical queries; however, these IR machines are not capable of generating a pertinent ranking of retrieved documents, which turns out into a bad system performance. One of the main reasons for the inappropriate ranking is the lack of information in the given query. For this reason many research groups have tried to fill this lack of information employing robust geographical resources (e.g., geographic ontologies), while some others have tried to do the same by means of query reformulation strategies via relevance feedback. As an alternative, in this work we propose a strategy for re-ranking the output of GIR systems. Given that retrieving relevant documents to geographic queries seems to be a minor problem for traditional IR machines, our work focuses on the problem of improving the initial ranking of a set of documents by employing information obtained through a relevance feedback process, i.e., re-ranking via relevance feedback. Additionally, since geographic queries tend to include implicit information requirements, we propose the use of complete documents instead of isolated terms to perform the process of re-ranking; such documents are called example documents.
Las técnicas de recuperación de información actuales representan un avance importante para tratar con el problema del exceso de información. Los motores de búsqueda en la Web son ejemplos convincentes de su utilidad y popularidad. Gracias a esto, para los usuarios de la Web, la tarea de recuperación de información se ha vuelto una actividad cotidiana. Los motores de búsqueda son utilizados para localizar información referente a casi todos los dominios del conocimiento humano. Ahora bien, gran parte de toda esta información está acotada o es considerada como perteneciente a un espacio geográfico, es decir, en su interior, se hace referencia a diferentes aspectos espaciales y/o datos geográficos, como consecuencia muchos usuarios especifican una referencia geográfica (nombre de una ciudad, provincia, avenida, etc.) como parte de su consulta al buscador. Dentro de esta tesis nos enfocaremos en el manejo de este tipo de consultas, por ejemplo, usuarios buscando departamentos en renta, reservación de hoteles, restaurantes, información sobre sitios arqueológicos, atractivos turísticos, sitios industriales, universidades, etc. Problema que intenta resolver un área conocida como Recuperación de Información Geográfica (GIR). Avances recientes en el área de recuperación de información geográfica han mostrado que el problema está parcialmente resuelto a través de técnicas tradicionales de recuperación de información (IR). Se ha podido observar que maquinas tradicionales de IR son capaces de recuperar la mayoría de los documentos relevantes para la mayor parte de las consultas geográficas, sin embargo, presentan dificultades al momento de generar un orden pertinente de los documentos recuperados, lo cual resulta en un desempeño deficiente. Una de las razones por las que el ordenamiento es inapropiado es la falta de información en la consulta. Es por esta razón que grupos de investigación han tratado de cubrir esta falta de información empleando recursos geográficos robustos (e.g. ontologías geográficas), mientras que algunos otros grupos de investigación lo han intentado por medio de estrategias de reformulación de consultas a través de técnicas de retroalimentación de relevancia. Como una alternativa, en este trabajo proponemos una estrategia reordenamiento para sistemas GIR.
Instituto Nacional de Astrofísica, Óptica y Electrónica
2010-10
Tesis de doctorado
Español
Estudiantes
Investigadores
Público en general
Villatoro-Tello E.
CIENCIA DE LOS ORDENADORES
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Doctorado en Ciencias Computacionales

Cargar archivos:


Fichero Tamaño Formato  
VillatoroTeE.pdf1.4 MBAdobe PDFVisualizar/Abrir