Change search

Cite
Citation style
• apa
• ieee
• modern-language-association-8th-edition
• vancouver
• Other style
More styles
Language
• de-DE
• en-GB
• en-US
• fi-FI
• nn-NO
• nn-NB
• sv-SE
• Other locale
More languages
Output format
• html
• text
• asciidoc
• rtf
A Comparison of Regression Models for Count Data in Third Party Automobile Insurance
KTH, School of Engineering Sciences (SCI), Mathematics (Dept.), Mathematical Statistics.
2014 (English)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesis
##### Abstract [en]

In the area of pricing insurances, many statistical tools are used. The number

of tools that exist are overwhelming and it is dicult to know which one to choose.

In this thesis ve regression models are compared on how good they t the number

of reported claims in third party automobile insurance. The models considered

are OLS, Poisson, Negative Binomial and two Hurdle models. The Hurdle models

are based on Poisson regression and Negative Binomial regression respectively, but

with additional number of zeros. The AIC and BIC statistics are considered for all

the models and the predicted number of claims are calculated and compared to the

observed number of claims. Also, a hypothesis test for the null hypothesis that the

Hurdle models are not needed is performed. The OLS regression is not suitable for

this kind of data. This can be explained by the fact that the number of claims are

not normally distributed. This is the case because many policyholders never report

any claims and the data therefore includes an excess number of zeros. Also, the

number of claims can never be negative. The other four models are considerably

better and all of them t the data satisfactory. The one of them that performs

best in one test is inadequate in another. The Negative Binomial model is a bit

better than the other models, but the model choice is not obvious. The conclusion

is not that a specic model is preferable, but that one need to choose model critically.

Keywords: Regression Models, Insurance, Count Data, Regression Analysis, Hurdle

Regression

##### Abstract [sv]

Det finns många statistiska hjälpmedel att använda inom prissättning av forsäkringar.

Antalet hjälpmedel är överväldigande och det är svårt att veta vad man ska använda

sig av. I den har studentuppsatsen kommer fem regressionsmodeller att jämforas i hur

bra de passar for antalet anmälda skador inom trafikförsäkring. De fem modellerna

är OLS, Poisson, Negative Binomial och två Hurdle-modeller. Hurdle-modellerna är

baserade på Poisson och Negative Binomial respektive, men de är anpassade för ett

större antal nollor. Värdena av AIC och BIC jämförs för de olika modellerna och

hypotestest är också utfort for att testa nollhypotesen att Hurdle-modellerna inte

behövs. Den modell som passar sämst till datan ar OLS. Det kan forklaras av att

antalet anmälda skador inte ar normalfordelade som man antar vid OLS. Det kan

bero på att många försäkringstagare aldrig anmäler någon skada och att det därfor

finns ett överskott av nollor i datan. Det kan även bero på att antalet anmälda skador

aldrig kan bli negativt. De andra fyra modellerna är mycket bättre och de kan anpassas

till datan på ett acceptabelt sätt. Den av modellerna som är bäst i ett test

är sämre i ett annat. Negative Binomial-modellen är aningen bättre än ovriga modeller,

men det ar inte självklart vilken modell som bör anvandas. Slutsatsen är att

det inte finns någon perfekt modell, utan att man maste välja genom att vara kritisk.

Nyckelord: Regressionsmodeller, Forsäkring, Raknedata, Regressionsanalys, Hurdleregression

2014. , p. 45
##### National Category
Engineering and Technology
##### Identifiers
OAI: oai:DiVA.org:kth-147239DiVA, id: diva2:729147
##### Supervisors
Available from: 2014-06-25 Created: 2014-06-25 Last updated: 2014-06-25Bibliographically approved

#### Open Access in DiVA

##### File information
File name FULLTEXT01.pdfFile size 269 kBChecksum SHA-512
Type fulltextMimetype application/pdf
##### By organisation
Mathematical Statistics
##### On the subject
Engineering and Technology

#### Search outside of DiVA

The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available
urn-nbn

#### Altmetric score

urn-nbn
Total: 471 hits

Cite
Citation style
• apa
• ieee
• modern-language-association-8th-edition
• vancouver
• Other style
More styles
Language
• de-DE
• en-GB
• en-US
• fi-FI
• nn-NO
• nn-NB
• sv-SE
• Other locale
More languages
Output format
• html
• text
• asciidoc
• rtf
v. 2.33.0
|