Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Dynamic Query Completion Through Search Result Clustering
KTH, School of Computer Science and Communication (CSC).
2015 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Dynamiska sökordsförslag genom klustring av sökresultat (Swedish)
Abstract [en]

Query completion is a feature employed by most modernsearch engines. These completions can be derived by different means. The most popular algorithm ranks completions by the frequency with which it appears in a database of old query logs. This project aims to investigate a new method for finding completions: namely through clustering search results and extracting terms from the clusters. To test the capabilities of this method, the project implemented the back-end to a search system, which includes the search result clustering algorithm Lingo. The system uses the output cluster labels as query completions. Two experiments were conducted, one for Informational queries and one for Navigational queries, each comparing the system to Apache Solr’s Suggester component. For Informational queries, a new way of scoring query completions was invented. The experiments showed that clustering performedbetter than the Suggester component for Informational queries, the results were inconclusive for Navigational queries.

Abstract [sv]

Sökordsförslag är en funktion som erbjuds av de flesta moderna sökmotorer. Dessa sökordförslag kan framkallas på olika sätt. Den metod som används mest ordnar sina sökordsförslag efter antalet gånger förslagen förekommer i en databas av gamla sökordsloggar. Målet med detta projekt är att undersöka en ny metod för att hitta sökordsförslag, nämligen genom att klustra sökresultat och extrahera termer från klustren. För att testa möjlighetetrna med denna metod implementerade vi ett bakomliggande system, vilket inkluderade sökresultatsklustringsalgoritmen Lingo. De resulterande klusterrubrikerna från Lingo användes som sökordsförslag. Två experiment utfördes, en för Informativa sökningar och en för Navigerande sökningar. I båda experimenten jämfördes systemet med Apache Solr’s Suggester komponent. Inför experimentet för Informativa sökningar kom vi fram till ett helt nytt sätt att poängsätta sökordsförslag. Resultaten från experimenten visade att klustringsmetoden presterade bättre än Suggester komponenten för Informativa sökningar. Det gick inte att dra några slutsatser från resultaten av experimentet för Navigerande sökningar.

Place, publisher, year, edition, pages
2015.
National Category
Computer Science
Identifiers
URN: urn:nbn:se:kth:diva-166382OAI: oai:DiVA.org:kth-166382DiVA: diva2:810655
Subject / course
Computer Science
Educational program
Master of Science in Engineering - Computer Science and Technology
Supervisors
Examiners
Available from: 2015-05-28 Created: 2015-05-07 Last updated: 2015-05-28Bibliographically approved

Open Access in DiVA

fulltext(1952 kB)414 downloads
File information
File name FULLTEXT01.pdfFile size 1952 kBChecksum SHA-512
93d5b736e484eb3f4405642ce5fc9928672b036bcfca2decba6f51d1c36c5e40600f0c333fc1d6952d3d7a41d70842ca5499ed61dcb42acc2e118a7fa1718bf4
Type fulltextMimetype application/pdf

By organisation
School of Computer Science and Communication (CSC)
Computer Science

Search outside of DiVA

GoogleGoogle Scholar
Total: 414 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 724 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf