Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Protein Level Probabilitiesfor Shotgun Proteomics Experiments
KTH, School of Computer Science and Communication (CSC).
2013 (English)Independent thesis Basic level (degree of Bachelor), 20 credits / 30 HE creditsStudent thesis
Abstract [en]

There exist many techniques to perform the analysis of proteins.

Current Shotgun Proteomics based methods assign

peptide level scores to peptide-spectrum matches obtained

by matching observed spectra against a database of theoretically

generated spectra from a set of known proteins. This

set of peptide-spectrum matches is ranked according to a

score based on the quality of the match. Subsequently, the

candidate present proteins can be inferred from the confidently

identified peptides. This process seems straightforward

and out of the box, however, it has some notable

weaknesses. The imperfections of the set of scores given by

the database search engine tool lead to the need to apply

a post-processing tool that can give more accurate scores

yielding more precise information of the number of peptides

believed to be present in the sample. However, the set

of proteins believed to be present in the analyzed sample

should not be inferred directly from the set of high scored

peptides. For example, in cases where there are peptides

that form part of more than one protein, or when there is a

protein that contain both high and low scored peptides, or

when there is a high scored peptide that indicates that the

protein is present but it is a false positive, etc. Therefore,

there is a need for a tool to infer the list of confident proteins

from the set of scored peptides and assign confidence

scores to the inferred proteins accounting for the problems

described. We present in this thesis work a software tool

for the analysis of proteins. This tool is based on the integration

of the protein inference tool Fido with the postprocessor

Percolator as a combined PSM post-processing

and protein inference package that efficiently estimates protein

level probabilities and confidence scores. We show that

our integration of Fido and Percolator surpasses the stateof-

the-art protein inference tool Protein prophet in terms of

calibration, sensitivity, specificity and number of proteins

correctly identified.

Abstract [sv]

Proteomik har på senare tid blivit ett mycket viktigt område

inom molekylär cellbiologi. Det kan beskrivas som läran

om proteiner, hur de modifieras, när och var de uttrycks,

hur de är involverade i de metaboliska vägarna samt hur

de interagerar med varandra. Det finns många tekniker för

analys av proteiner, men

"Shotgun Proteomics" är den mest

etablerade och anses vara det primära verktyget att studera

protiners primärstruktur i stor skala. Nuvarande

"Tandem

Mass Spectrometry

" baserade metoder tilldelar peptidnivåpoäng

till peptidspektrumträffar vilka erhålls genom sökning

av spektra mot en databas av teoretiskt genererade

spectra från kända proteiner. Detta set av peptidspektrumträffar

kommer att rangordnas baserat på poäng vilka baseras

på kvaliteten på matchningen. Proteinkandidater kan

härledas ur ett subset av proteiner identifierade med hög

konfidensgrad. Denna process verkar vara simpel, men har

dock påvisat uppenbara svagheter vilka vi kommer att beskriva

i kommande stycken. Bristerna i poänguppsättningen

givna av databasens sökmotor leder till behovet av att

applicera ett verktyg för efterbehandling vilket kan ge en

mer korrekt poänguppsättning, vilket i sin tur ger mer korrekt

information om antalet peptider vilka förväntas finnas

i provet. Huvudtanken bakom efterbehandlingsverktyg är

att kombinera olika poäng och funktioner givna av sökmotorn

för att kunna uppskatta bättre poängrankning av

peptider efter deras sannolikhet att befinna sig i provet.

Uppsättningen av proteiner vilka tros existera i provet ska

dock inte härledas direkt ut ett sett med proteiner med

höga poäng. Till exempel, i fall där flera pepetider bildar

en del av fler än ett protein, eller när ett protein innehåller

peptider med både höga och låga poäng, eller när det finns

en peptid med högt poängtal vilket indikerar att proteinet

är närvarande, men är egentligen ett falskt positiv, osv.

Ett efterbehandlingsverktyg på proteinnivå behövs därför

för att tilldela konfidenspoäng till en lista av proteiner vilka

tros existera i provet och står för problemet beskrivet

ovan.

Place, publisher, year, edition, pages
2013.
Series
Trita-CSC-E, ISSN 1653-5715 ; 13:1003
National Category
Computer Science
Identifiers
URN: urn:nbn:se:kth:diva-137425OAI: oai:DiVA.org:kth-137425DiVA: diva2:678956
Educational program
Master of Science in Engineering - Computer Science and Technology
Supervisors
Examiners
Available from: 2013-12-13 Created: 2013-12-13 Last updated: 2013-12-13Bibliographically approved

Open Access in DiVA

Protein Level Probabilities for Shotgun Proteomics Experiments(9558 kB)32 downloads
File information
File name FULLTEXT01.pdfFile size 9558 kBChecksum SHA-512
1c78c94fd1c1d9e0307e868bcba817a6868afeae9b0a5715b09af4b7473c58fd946fb8580b6fcc15a75447f7c3e5ef4abc3d8290453cb475c756bdd40be11517
Type fulltextMimetype application/pdf

Other links

http://www.nada.kth.se/utbildning/grukth/exjobb/rapportlistor/2013/rapporter13/fernandez_navarro_jose_13018.pdf
By organisation
School of Computer Science and Communication (CSC)
Computer Science

Search outside of DiVA

GoogleGoogle Scholar
Total: 32 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 84 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf