Por favor, use este identificador para citar o enlazar este ítem:
http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/610
Ordenamiento basado en ejemplos para la recuperación de información geográfica | |
ESAU VILLATORO TELLO | |
LUIS VILLASEÑOR PINEDA MANUEL MONTES Y GOMEZ | |
Acceso Abierto | |
Atribución-NoComercial-SinDerivadas | |
Information retrieval Markov processes Geographics information systems | |
problem of dealing with the excess of information. Web’s search machines are
convincing examples of their utility and popularity. Hence, Web’s users see the task
of information retrieval as an everyday activity. Search machines are employed to
find information about almost every area of knowledge. However, a considerable part
of this information is known to be geographically delimited, that is, in their content
refers to some spatial aspects, or some geographical places (for instance, names of
cities, countries, towns or streets, etc.). As a consequence of this fact, users looking for
this type of information tends to include in their queries some geographical references
when they are doing some search in the Web.
In this work we focus on this particular type of queries, this is, users looking
for apartments, hotels, restaurants, archeological information, touristic activities, industrial
places, interchange universities, etc. This problem is known as Geographic
Information Retrieval.
Recent research in the area of Geographic Information Retrieval (GIR) has shown
that the problem is partially solved through traditional Information Retrieval (IR)
techniques. It has been possible to observe that traditional IR machines are able to
retrieve the majority of relevant documents to some geographical queries; however,
these IR machines are not capable of generating a pertinent ranking of retrieved
documents, which turns out into a bad system performance. One of the main reasons
for the inappropriate ranking is the lack of information in the given query. For this
reason many research groups have tried to fill this lack of information employing
robust geographical resources (e.g., geographic ontologies), while some others have
tried to do the same by means of query reformulation strategies via relevance feedback.
As an alternative, in this work we propose a strategy for re-ranking the output of
GIR systems. Given that retrieving relevant documents to geographic queries seems
to be a minor problem for traditional IR machines, our work focuses on the problem
of improving the initial ranking of a set of documents by employing information obtained
through a relevance feedback process, i.e., re-ranking via relevance feedback.
Additionally, since geographic queries tend to include implicit information requirements,
we propose the use of complete documents instead of isolated terms to perform
the process of re-ranking; such documents are called example documents. Las técnicas de recuperación de información actuales representan un avance importante para tratar con el problema del exceso de información. Los motores de búsqueda en la Web son ejemplos convincentes de su utilidad y popularidad. Gracias a esto, para los usuarios de la Web, la tarea de recuperación de información se ha vuelto una actividad cotidiana. Los motores de búsqueda son utilizados para localizar información referente a casi todos los dominios del conocimiento humano. Ahora bien, gran parte de toda esta información está acotada o es considerada como perteneciente a un espacio geográfico, es decir, en su interior, se hace referencia a diferentes aspectos espaciales y/o datos geográficos, como consecuencia muchos usuarios especifican una referencia geográfica (nombre de una ciudad, provincia, avenida, etc.) como parte de su consulta al buscador. Dentro de esta tesis nos enfocaremos en el manejo de este tipo de consultas, por ejemplo, usuarios buscando departamentos en renta, reservación de hoteles, restaurantes, información sobre sitios arqueológicos, atractivos turísticos, sitios industriales, universidades, etc. Problema que intenta resolver un área conocida como Recuperación de Información Geográfica (GIR). Avances recientes en el área de recuperación de información geográfica han mostrado que el problema está parcialmente resuelto a través de técnicas tradicionales de recuperación de información (IR). Se ha podido observar que maquinas tradicionales de IR son capaces de recuperar la mayoría de los documentos relevantes para la mayor parte de las consultas geográficas, sin embargo, presentan dificultades al momento de generar un orden pertinente de los documentos recuperados, lo cual resulta en un desempeño deficiente. Una de las razones por las que el ordenamiento es inapropiado es la falta de información en la consulta. Es por esta razón que grupos de investigación han tratado de cubrir esta falta de información empleando recursos geográficos robustos (e.g. ontologías geográficas), mientras que algunos otros grupos de investigación lo han intentado por medio de estrategias de reformulación de consultas a través de técnicas de retroalimentación de relevancia. Como una alternativa, en este trabajo proponemos una estrategia reordenamiento para sistemas GIR. | |
Instituto Nacional de Astrofísica, Óptica y Electrónica | |
2010-10 | |
Tesis de doctorado | |
Español | |
Estudiantes Investigadores Público en general | |
Villatoro-Tello E. | |
CIENCIA DE LOS ORDENADORES | |
Versión aceptada | |
acceptedVersion - Versión aceptada | |
Aparece en las colecciones: | Doctorado en Ciencias Computacionales |
Cargar archivos:
Fichero | Tamaño | Formato | |
---|---|---|---|
VillatoroTeE.pdf | 1.4 MB | Adobe PDF | Visualizar/Abrir |