Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Matching in MySQL: A comparison between REGEXP and LIKE
Linnaeus University, Faculty of Science and Engineering, School of Computer Science, Physics and Mathematics.
2012 (English)Independent thesis Basic level (university diploma), 10 credits / 15 HE creditsStudent thesis
Abstract [en]

When needing to search for data in multiple datasets there is a risk that not all da-tasets are of the same type. Some might be in XML-format; others might use a re-lational database. This could frighten developers from using two separate datasets to search for the data in, because of the fact that crafting different search methods for different datasets can be time consuming.

One option that is greatly overlooked is the usage of regular expressions. If a search expression is created it can be used in a majority of database engines as a “WHERE” statement and also in other form of data sources such as XML.

This option is however, at best, poorly documented and few tests have been made in how it performs against traditional search methods in databases such as “LIKE”.

Multiple experiments comparing “LIKE” and “REGEXP” in MySQL have been performed for this paper. The results of these experiments show that the possible overhead by using regular expressions can be motivated when considering the gain of only using one search phrase over several data sources.

Abstract [sv]

När behovet att söka over flertalet typer av datakällor finns det alltid en risk att inte alla datakällor är av samma typ. Några kan vara i XML-format; andra kan vara i form av en relationsdatabas. Detta kan avskräcka utvecklare ifrån att använda två oberoende datakällor för att söka efter data, detta för att det kan vara väldigt tidskrävande att utveckla två olika vis att skapa sökmetoderna.

Ett alternativ som ofta är förbisett är att använda sig av reguljära uttryck. Om ett sökuttryck är skapat i reguljära uttryck så kan det användas i en majoritet av data-basmotorerna på marknaden som ett ”WHERE” påstående, men det kan även an-vändas i andra typer av datakällor så som XML.

Detta alternativ är allt som ofta dåligt dokumenterat och väldigt få tester har ut-förts på prestandan i jämförelse med ”LIKE”.

Som grund för denna uppsats har flertalet experiment utförs där ”LIKE” och ”REGEXP” jämförs i en MySQL databas. Försöken visar på att den eventuella försämringen i prestanda kan betala sig vid användande av multipla datatyper.

Place, publisher, year, edition, pages
2012. , 31 p.
Keyword [en]
Regular Expression Database Comparison MySQL
National Category
Computer Science
Identifiers
URN: urn:nbn:se:lnu:diva-20598OAI: oai:DiVA.org:lnu-20598DiVA: diva2:538412
Subject / course
Computer Science
Educational program
Web Development Programme, 120 credits
Uppsok
Technology
Supervisors
Examiners
Available from: 2012-07-03 Created: 2012-06-29 Last updated: 2012-07-03Bibliographically approved

Open Access in DiVA

Matching in MySQL(721 kB)1032 downloads
File information
File name FULLTEXT01.pdfFile size 721 kBChecksum SHA-512
6ebb3f8095bdf9159490c4d7ea1194f81bd86699f4a5c5427c1fc2f7065fb6a440845e69f83da8a4cbb92861d2761597d44dfd0fd9a3cf26c861ecb73f0794f8
Type fulltextMimetype application/pdf

Search in DiVA

By author/editor
Carlsson, Emil
By organisation
School of Computer Science, Physics and Mathematics
Computer Science

Search outside of DiVA

GoogleGoogle Scholar
Total: 1035 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 484 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf