Czy zgodziłbyś się na
zamontowanie w swoim samochodzie czujnika, który zbierałby dane o Twoim
położeniu, prędkości i obrotach silnika? A co jeżeli Twój ubezpieczyciel
zaoferowałby w zamian duże zniżki?
Montowanie w samochodach
czujników zbierających dane stało się w ostatnich latach coraz bardziej
popularne. Jest to oczywiście związane z rozwojem branży IT. Najstarsze znane
mi przypadki łączenia branży samochodowej z branżą IT dotyczą produkcji
samochodów. Już przed kilkoma laty niemiecki koncern BMW zdecydował się na
wykorzystanie modeli predykcyjnych w procesie produkcji samochodów celem szybszego
i bardziej precyzyjnego wykrywania usterek. Sukces projektu spowodował, że współpraca firm
BMW i IBM coraz bardziej się zacieśnia: IBM Analytics Improve BMW Auto Quality.
Tropem BMW zaczeli podążać
kolejni producenci aut, już nie tylko z Europy, ale także z Japonii. Analityka
stosowana jest już nie tylko w procesie produkcji, ale także w fazie eksploatacji
samochodów. Skoro producenici samochodów zdecydowali się montować urządzenia
śledzące pracę samochodu w pojazdach, to czemu nie mogą tego zrobić inne firmy?
Możliwość taką zauważyły firmy
ubezpieczeniowe wprowadzające zniżki na zasadzie pay as you drive, zgodnie z którą, o wielkości zniżki decyduje
sposób prowadzenia auta przez kierowcę. Najprostszy sposób wyliczenia takiej
opłaty, to po prostu iloczyn przejechanych kilometrów i stawki kilometrowej.
Dalszym rozszerzeniem tej metody może być budowanie bardziej zaawansowanych
profili użytkowania pojazdów. Do tego jednak potrzebne jest zamontowanie w
samochodach specjalnych urządzeń zbierających dane, co najmniej o położeniu i
prędkości pojazdu.
Wracając do pytania postawionego
na początku artukułu, zgodnie z raportem insuranceQuotes.com 51% amerykanów odpowiada, że zdecydowanie nie zgodziłaby się na
zamontowanie rzeczonych czujników. Amerykanie obawiają się przede wszystkim, że
owe urządzenia mogą być wykorzystane przez policję do namierzania np. pijanych
kierowców. Istotną obawą jest także ochrona zbieranych informacji. Firmy
ubezpieczenowe przekonują, że dane klientów są całkowicie bezpieczne, nie mogą
być współdzielone z podmiotami trzecimi oraz nie mogą stać się podstawą
zwiększania składki dla poszczegółnych kierowców. W zamian za zgodę na zamontowanie
czujników oferują zniżki rosnące w kolejnych latach do 20%, a nawet do 50%.
Niektóre z firm oferują od razu 5%-10% zniżki za samą zgodę na zamontowanie
urządzenia. Dodam jeszcze, że krótki wywiad pozwolił mi stwierdzić, że oferty pay as you drive dostępne są już w co najmniej następujących krajach: Wielka Brytania,
Stany Zjednoczone, Hiszpania i Włochy. Rozszerzenie pomysłu na kolejne kraje
wydaje się nieuchronne.
Przejdźmy
teraz do meritum, czyli do analizy danych. W ostatnim czasie miałem
okazję zapoznać się z danymi pewnej firmy z USA. Dane te dotyczyły prawie 3500
pojazdów i zbierane były przez 15 dni. Czytniki zamontowane w pojazdach
zbierały następujące informacje: Data i
godzina, Długość geograficzna, Szerokość geograficzna, Kierunek jazdy, Prędkość, Przyspieszenie, Obroty
silnika.
Dane te wczytalem do narzędzia IBM SPSS Modeler. Następnie, korzystając głownie z dostępnych w
narzędziu węzłów Wyliczanie, Filtrowanie,
Agregacja oraz Flagowanie, wyliczyłem
prawie 430 nowych predyktorów. Predyktory te posłużyły mi do sworzenia
następująych czynników ryzyka: prowadzenie
w godzinach nocnych w weekendy, jazda
w godzinach szczytu, przekraczanie
dozwolonej prędkości. wysoka średnia
prędkość, odbywanie długich podróży, gwałtowne
przyspieszanie, korzystanie z pojazdu
głównie od poniedziałku do piatku. Zdefiniowane czynniki ryzyka zostały
przeze mnie wykorzystane do zbudowania modelu segmentacyjnego. W tym przypadku
najlepsze rezultaty otrzymałem korzystając z modelu Sieci Kohonena.
Wielką zaletą narzędzia IBM SPSS Modeler jest sposób
prezentacji wyników modeli analizy skupień i ich automatyczna interpretacja. Jak widać na zamieszczonym wykresie,
zbudowany model podzielił klientów firmy ubezpieczeniowej na 8 grup, gdzie
wielkość największej grupy wynosi 35,5%, a najmniejszej 1,5%.
Następnie skorzystałem z wizualizacji,
która w mojej ocenie stanowi najlepszą formę podsumowania modelu
segmentacyjnego i znacząco ułatwia jego interpretację. Zaprezentowane
zestawienie dla każdej cechy o charatkerze ciągłym automatycznie wylicza
średnią wartość w poszczególnych segmentach, a dla zmiennych nominalnych
dominantę. Segmenty zaprezentowane są w
kolejnych kolumnach, a zmienne posortowane są względem istotności w modelu.
Kluczowym czynnikiem ryzyka jest gwałtowne przyspieszanie.
Czynnik ten występuje aż w 4 grupach. Najwięcej czynników ryzyka występuje w
grupie szóstej, a najmniej w grupie pierwszej. Przeprowadzona analiza pozwala
mi określić, że klienci z grupy pierwszej, która stanowi 35,5% wszystkich
klientów, dostaną największą dodatkową zniżkę. Najwięcej za ubezpieczenie płacić
będzie, licząca 2,8% ubezpieczonych, grupa klientów z segmentu szóstego.
To oczywiście tylko
jednen z przykładów analiz, które można wykonać w oparciu o zebrane dane.
Alternatywą dla takiego podejści może być np. zastosowanie dedykowanej
procedury wykrywania anomalii
i dokonywanie podziału klientów na grupy w zależności od
tego jak mocno odstają od „normy”. Warto zaznaczyć, że norma ta wyznaczana jest
analitycznie i nie musi być definiowana
a-priori.
Idąc krok dalej oczywistym jest, że oprócz narzędzia stricte
analitycznego jakim jest SPSS Modeler
firmy chcące wdrożyć opisywane rozwiązanie będą potrzebowały także narzędzia do
strumieniowej analizy danych w czasie rzeczywistym oraz składnicy danych, która będzie jednocześnie silnikiem dla zaawansowanych analiz. Składniaca taka umożliwi
analizę danych historyczych o dowolnym wolumenie. Przykładem takich narzędzi są
odpowiednio: IBM Streams oraz IBM PureData for Analytics.
Podsumowując, wprowadzenie ubezpieczeń pay as you drive wydaje się być nieuniknione. Firmy ubezpieczeniowe mogą zostać wyposażone w technologię, która umożliwi bardzo szczegółową analizę zachowań kierowców. Dla dużej części
klientów taka forma ubezpieczenia może oznaczać dodatkowe zniżki. Na koniec jednak chciałbym
zadać pytanie, czy w wyniku wzrostu powszechności zniżki, fakt braku prawa do
niej, nie staje się de facto zwyżką..
Ciekawym byłoby skorelowanie danych dot. kolizyjności kierowców z powyższymi metrykami, choć zdrowy rozsądek podpowiada, że są to trafnie określone ryzyka.
OdpowiedzUsuńCo do samej idei - nie bagatelizowałbym obaw ludzi dot. zbierania danych o ich położeniu. Pomimo, iż niektórzy giganci systemów mobilnych pozwalają/li sobie robić to po cichu, jednak czym innym jest wyrażenie świadomej zgody na tego typu agregację danych. Myślę, że w Polsce procent przeciwników byłby wyższy niż w Stanach.
Inną rzeczą byłoby ograniczenie spektrum danych do tych stricte związanych ze stanem pojazdu (szybkość, obroty silnika, etc.). Takie podejście moim zdaniem byłoby bardziej akceptowalne, choć nie pozwalałoby ubezpieczycielowi, określić czy przekroczyliśmy dozwoloną prędkość w zakresie 0-140.
Pozdrawiam,
LM
Jeśli chodzi o ryzykam to szukałem inspiracji na stronach zagranicznych firm ubezpieczeniowych np. http://www.nationwide.com/smartride.jsp.
UsuńProblemu poufności informacji na pewno nie należy bagatelizować, aczkolwiek musimy być świadomi, że coraz więsza liczba producentów aut będzie montować w autach czujniki zbierające dane. Znane mi są przypadki producentów z Niemiec, Japonii i Francji.
Moim zdaniem większym zagrożeniem jest udostępnianie danych różnym firmom za pośrednictwem aplikacji mobilnych np. Yanosik. Myślę, że tylko śladowa część korzystających czyta regulamin i zasady poufności serwisów, którym udostępnia dane o położeniu i prędkości pojazdu.
pozdrawiam i dziękuję za opinię,
JT