Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Dictionary-based Amharic-French information retrieval
Stockholms universitet, Samhällsvetenskapliga fakulteten, Institutionen för data- och systemvetenskap.
Stockholms universitet, Samhällsvetenskapliga fakulteten, Institutionen för data- och systemvetenskap.
SICS.
SICS.
Visa övriga samt affilieringar
2006 (Engelska)Ingår i: Accessing multilingual information repositories: 6th workshop of the Cross-Language Evalution Forum, CLEF 2005, Vienna, Austria, 21-23 September, 2005, revised selected papers / [ed] Carol Peters, Fredric C. Gey, Julio Gonzalo, Henning Müller, Gareth J. F. Jones, Michael kluck, Bernardo Magnini, Maarten de Rijke, Berlin: Springer Berlin/Heidelberg, 2006, 83-92 s.Konferensbidrag, Publicerat paper (Övrigt vetenskapligt)
Abstract [en]

We present four approaches to the Amharic - French bilingual track at CLEF 2005. All experiments use a dictionary based approach to translate the Amharic queries into French Bags-of-words, but while one approach uses word sense discrimination on the translated side of the queries, the other one includes all senses of a translated word in the query for searching. We used two search engines: The SICS experimental engine and Lucene, hence four runs with the two approaches. Non-content bearing words were removed both before and after the dictionary lookup. TF/IDF values supplemented by a heuristic function was used to remove the stop words from the Amharic queries and two French stopwords lists were used to remove them from the French translations. In our experiments, we found that the SICS search engine performs better than Lucene and that using the word sense discriminated keywords produce a slightly better result than the full set of non discriminated keywords.

Ort, förlag, år, upplaga, sidor
Berlin: Springer Berlin/Heidelberg, 2006. 83-92 s.
Serie
Lecture notes in computer science, ISSN 0302-9743 ; 4022
Nationell ämneskategori
Språkteknologi (språkvetenskaplig databehandling)
Identifikatorer
URN: urn:nbn:se:su:diva-37937ISBN: 978-3-540-45697-1 (tryckt)ISBN: 978-3-540-45700-8 (tryckt)OAI: oai:DiVA.org:su-37937DiVA: diva2:305621
Konferens
6th workshop of the Cross-Language Evalution Forum, CLEF 2005, Vienna, Austria, 21-23 September, 2005
Tillgänglig från: 2010-03-24 Skapad: 2010-03-24 Senast uppdaterad: 2013-09-26Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas

Övriga länkar

http://download.springer.com/static/pdf/978/chp%253A10.1007%252F11878773_9.pdf?auth66=1380369933_afe62ce97aef353261b8c7c804515486&ext=.pdf

Sök vidare i DiVA

Av författaren/redaktören
Asker, LarsSahlgren, Magnus
Av organisationen
Institutionen för data- och systemvetenskap
Språkteknologi (språkvetenskaplig databehandling)

Sök vidare utanför DiVA

GoogleGoogle Scholar

Totalt: 137 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf