Transcript Document

Business Intelligence
ve finančních institucích
Ing. Luboš Mrázek, MBA
Seminář BI, 24.3.2006
Agenda
•
•
•
•
•
•
•
Úvod
Profil BI služeb (road map)
Architektura DWH
Data marts, Výstupy
Profitabilita
Čištění dat
Data minig
Seminář BI 24.3.2006
Představení přednášejícího
– 1999-2002, Finanční skupina GE Capital (GE Money)
• DWH pro: GE Capital Bank, GE Capital Leasing, GE Capital
Multiservis
• Pozice: DWH Analytik, DWH Project Manager, DWH Business
Owner
– 2002-4, Finanční skupina České spořitelny
• DWH pro: Česká spořitelna, Penzijní fond CS, Stavební
spořitelna CS, Leasing CS, Pojišťovna CS, …
• Pozice: DWH Project Manager
– 2004, eBanka, a.s.
• DWH pro: eBanka, karetní produkty České pojišťovny a
Homecredit (skupina PPF)
• Pozice: ředitel divize Business Intelligence
Seminář BI 24.3.2006
Profitabilita v Kč
Profitabilitní potenciál 1
Zaměřte na B
?
Potenciál
?
A
B
Klienti
Seminář BI 24.3.2006
Profitabilita
v Kč
Profitabilitní potenciál 2
Zaměřte na A
Potenciál
A
B
Klienti
Segment 1
Segment 2
Seminář BI 24.3.2006
!
Výchozí charakteristiky
• Přechod od produktově orientovaných systému
na klientsky orientované systémy
• Více systémů v organizaci
• Čistota dat
–
–
–
–
Jména, Příjemní, Tituly, RČ
Názvy firem, Právní formy, IČO, DIČ, OKEČ
Adresy a komponenty adres
Telefonní čísla, maily, SPZ, …
• Velké množství dat, ale málo informací
Seminář BI 24.3.2006
Business Intelligence Road map
Část
CDWH
Popis
CRDM
Core reporting datamart – základní mart pro analýzy a
reporting, architektura: Star
BI tools
Reportovací nástroje pro datové analýzy a distribuci dat,
portály, cockpity, ...
Profitabilita
Detailní profitabilita na úroveň jednotlivých klientů, jejich
účtů, apod.
Cleansing
Čištění dat dle veřejných seznamů (adresy, jména, ...)
Mining
Data Mining – netriviální hledání skrytých závislostí mezi
daty (např. náchylnost ke koupi, k odchodu, apod.)
Centrální úložiště analytických dat, architektura: Inmon,
3.NF
(external)
Seminář BI 24.3.2006
Transakční x Analytická data
OLTP
CDWH
Transakční
data
Transakční
systémy
 Optimalizova
né pro
transakční
zpracování
 Nevhodné
pro analýzy
(R)OLAP
Analýzy
Reporty
Centrální DWH
 Jednotná
historizace
 Sjednocení
příbuzných dat
 Optimalizované
pro velká data
(partitioning,
bitmap. indexy)
Data Mart
 Multidimenzionál
ní pohledy
 Star schémata
Seminář BI 24.3.2006
Architektura – Kimbal
DWH
dimenze
dimenze
dimenze
dimenze
dimenze
dimenze
dimenze
Data
Mart
Data
Mart
Data
Mart
Data
Mart
dimenze
dimenze
dimenze
dimenze
dimenze
dimenze
dimenze
Stage Area
ETL
Datový
zdroj
Datový
zdroj
Datový
zdroj
Datový
zdroj
dimenze
Architektura - Inmon
Data
mart
Data
mart
Data
mart
Aplikace
DWH
ODS
Aplikace
Stage Area
ETL
Datový
zdroj
Datový
zdroj
ETL
Datový
zdroj
Seminář BI 24.3.2006
Další příklad architekury - MODEL 1
Konsolidovaný
DWH
DWH
Banka
Datové
zdroje
DWH
DWH
DWH
Dceřinná
společnost 1
Dceřinná
společnost 2
Dceřinná
společnost 3
Datové
zdroje
Datové
zdroje
Datové
zdroje
Seminář BI 24.3.2006
Další příklad architektury - MODEL 2
Zdroje:
Účty depozitní
Účty úvěrové
Debetní karty
Transakční
CRM
Kreditní karty
ADC - HB, IB
ADC - PH.B.
Účetní Data (GL)
Data Marts
Personální systém
Dceřinná společnost 1
Dceřinná společnost 2
Dceřinná společnost 3
ODS
DWH
(Analytické CRM)
Veřejné zdroje:
- RES
- OVEL
- Black-lists
- Adresy
- Jména, Tituly
- ...
Seminář BI 24.3.2006
Obecný princip – Star schéma
HOUSEHOLD
DATE_TIME
o ACCOMODATION_TYPE
o INCOME
o NUMBER_OF_PERSONS
has
of_a
Snímek D-1
belongs_to
Stabilní
Variabilní
CURRENCY
CS_GROUP_ORGANISATION
o
o
o
o
Insert
ID
NAME
PARENT_ID
TYPE
PP_ACCOUNT_FACT
has
belongs_to
Delete
ACCOUNT
Snímek D
Update OWR
Update Hist
Stabilní
has
Dimenze
o
o
o
o
o
o
o
o
o
o
o
GENERAL_LEDGER_CODE
BLOCK_CODE
CLOSURE_TYPE
DATE_CLOSED
DATE_OPENED
LIMIT
LIMIT_TYPE
MANAGED_ACCOUNT
NUMBER
STATUS
TYPE
o
o
o
o
o
o
o
o
o
o
o
o
BALANCE_CZK
BALANCE_FC
COST
CREDIT_TURNOVER_CZK
CREDIT_TURNOVER_FC
DATE_LAST_ACTIVE
DEBIT_TURNOVER_CZK
DEBIT_TURNOVER_FC
FEE_INCOME
INTEREST_INCOME
WRITE_OFF_CZK
WRITE_OFF_FC
is_in
o CODE
o NAME
has
PRODUCT
of_a
is_in
is in
of an
belongs_to
Variabilní
CLIENT_TYPE
DESCRIPTION
EXP ERT_FCGS_CODE
FEE_TYPE
FEE_VALID_FROM
FEE_VALID_TO
ID
NAME
SALES_VALID_FROM
SALES_VALID_TO
SERVICE_VALID_FROM
SERVICE_VALID_TO
PRODUCT_TYPE
has
Fakta
o
o
o
o
o
o
o
o
o
o
o
o SUB TYPE_NAME
o TYPE_NAME
has
o NAME
is_in
belongs_to
of_a
has_a
of_a
CLIENT
SEGMENT
* ID
o BIRTH_NUMBE R
o BRA NCH
o CITIZENSHIP
o CLEARING_CODE
o COMPA NY_NAME
o CONSUMER_BUSINESS_CUSTOMER
o CONSUMER_CEILING_LIMIT
o COUNTRY_OF_BIRTH
...
o
o
o
o
o
DATE_OF_LAST_CHANGE
ID
NAME
SERVICE_CATEGORY
SUBSEGMENT_NAME
Seminář BI 24.3.2006
Data Marty ve Star schématu
FAKTA (Metriky)
výnos
výnos CZK,
počet účtů,
počet klientů, ...
Poplatky za vedení
klientských účtů
Poplatky z karetních
operací
Úrokové výnosy
z úvěrů
březen
únor
leden
Movití
Segment
Aktivní
s
Ča
Studenti
Účtová osnova
DIMENZE
Seminář BI 24.3.2006
Výstupy
Topology:
DWH
Data Mining
SQL Interface
SQL, PL/SQL
:
Cognos, BO,
Oracle BI, ...
(selection of products, branches, ...)
ASP, PHP,
Viewer, ...
r's
Dynamic Reports
ef
fo
Analytical Tools
SAS, SPSS, ...
rt
Out Detail data
se
ODS
Out Specialized data
U
In
Data
marts
Static Reports
(predefined fixed reports)
Data Exports
XLS, PDF,
HTML, ...
Data files, ...
Seminář BI 24.3.2006
Profitabilita
• Profitabilita
+ Úrokové výnosy (úroky přijaté)
– Úrokové náklady (úroky vyplacené)
• => Úroková marže
+ Neúrokové výnosy (poplatky, kursové zisky, sankce)
– Neúrokové přímé náklady (poplatky, ABC, …)
• => CV
– Opravné položky (ztrátové úvěry)
• => RACV
– Nepřímé náklady
• => NIBT (Zisk před zdaněním)
– Daň z příjmu
• => NI (Čistý zisk)
Seminář BI 24.3.2006
Řízení finančních institucí
• Finanční řízení
– ROE, Finanční výkazy často nedostatečné
– Profitabilita a Profitabilitní potenciál (viz dále)
• Řízení Rizik
– Rizika: Kreditní, Úrokové, FX, Likvidní, Kapitálové,
Operační
• Marketing
– Cross-selling ratio, Response rate, …
• Obchod
– New Volume, Attrition, Running rate, „Packages“, …
Seminář BI 24.3.2006
Čištění dat
• Klasifikace chyb a opatření
– Chyby porušující integritu
• Duplicitní parametry k účtu, 32.13.2007, částka 10128 , ...
• >> Zpracování DWH se zastaví a čeká na opravu
– Chyby neporušující integritu, ale proti logice systému
• Datum otevření větší než datum uzavření
• >> Reportují se na sestavách kvality dat k opravě ve zdroji
(„oprava příčiny ne následku“)
– Nekvalitní data s možností čištění
• Jména, Příjemní, Tituly, RČ, Názvy firem, Právní formy, IČO,
DIČ, OKEČ, Adresy a komponenty adres, Telefonní čísla,
maily,…
• >> Ukládají se jak originální data, tak i data vyčištěná.
– Na trhu se nabízí řada komerčních aplikací pro čištění (dle
pravidel, dle seznamů: adresy, křestní jména, tituly, RES, OVEL, …)
– Off-line x On-line
Seminář BI 24.3.2006
Unifikace Klienta
Products in Source Systems
Clients Instances
Unified Client Base
S1
S1
Unified client
S2
Unified prospect
S2
S3
Card 1
S3
Card 2
Seminář BI 24.3.2006
Praktické přínosy
• Marketingové kampaně
– vyšší response rate, správný segment (data mining)
– snížení počtu vrácených zásilek (správnost adresy)
• Obohacování informací (geokódy)
– efektivní plánování pobočkové sítě a sítě bankomatů
– geomarketing (vazba na demografické ukazatele)
• Basel II
– konsolidovaný rating, opravné položky
– řízení rizik
Seminář BI 24.3.2006
Data Mining
• Hledání skrytých
závislostí v datech
• Porovnávání vzorců
chování
• Predikce za pomocí
segmentačních
metod, neuronových
sítí, apod.
• Hledání příležitostí,
predikce rizik
Seminář BI 24.3.2006
Critical Success Factors
•
•
•
•
Inkrementální přístup
„Public relation“
Silná podpora managementu
Diverzifikovaný team, Team spirit,
motivace, klíčoví hráči
• Business analýza (často podceněna)
• Zkušený dodavatel, technologie
• Čištění dat, testování
Seminář BI 24.3.2006
Dotazy
?
Luboš Mrázek
[email protected]
Tel. +420 222 115 450
Seminář BI 24.3.2006
Příloha 1 – Stav před DWH
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Some of data were missing (e.g.: cross-selling ratios, number of sold packages)
Reporting represents a lot of manual work.
Some of data were aggregated only, missing detail view of products, segments, clients (e.g.:
profitability)
Difficult and time consuming to obtain data. For example all competencies mentioned bellow
are needed if an analyst wants to summarise for example accounts accrued interest of one
client: HW platforms (PC, SUN, VAX, AS/400, MainFrame), Operating systems (Windows NT,
Open VMS, UNIX, OS/400, OS/390), Databases (Access, Oracle, DB/2), Tools and
programming (Cobol, SQL, PL/SQL, RPG, Query)
Obtained data are often not suitable for further processing.
Historical data were almost missing.
It is difficult (or impossible) to merge of data from different operating systems.
Data have lower frequency (available data are only on monthly basis, but business needs them
weekly or daily).
Data delivery is delayed (e.g.: June data are ready about the mid of July)
Reports distributed as a hard copy or excel reports are not compatible.
It is difficult drill-down detail data.
Reporting is depending on a few skilled people, which causes the risk of bottleneck.
Several analysts can see only their parts, assembling a full picture is rare.
There is a risk of human factors (data manual calculations and processing).
Seminář BI 24.3.2006
Příloha 2 – Benefits - General
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
General:
Companies have much more information for decision-making process
Integration of data from different legacy systems stored on a single platform
Transformation of data based on similar architecture and data model
Availability of historical data which are stored in the same structure as recent data
Data are stabilised for reporting and analyses
Automation of regular reports, reduction of manual work and defects
Detail data are available (balanced, transactions), possibility of drill-down
The whole company can use the same data, agreed definitions
Most data are available on daily basis, load process is relatively fast
Day to day monitoring
Possibility of flexible querying and data mining
Prediction of future based on historical data
Automation of routine processes, automatically calculated indicators
Data consolidation into one database allows central administration which is cheaper
Access to data in real time for all users, one tool is enough
High complexity of stored data and keeping data optimised for querying
Analysts can now spend time on analysis rather than data gathering
Analysts can access data without affecting performance of processing the operational systems
Seminář BI 24.3.2006
Příloha 3 – Benefits - Finance, Risk
•
•
•
•
Finance:
More precise planning
Profitability of individual account, client, segment, branch, product and channel (It has
enormous importance for decision-making, marketing, sales, etc. Without DWH only
profitability of biggest corporate clients was available.)
Support of accounting reconciliation
•
•
•
•
•
•
Risk:
Improvement of existing models (e.g. Marcov’s model of portfolio quality prediction)
New strategies based on DWH data (collection strategy, tuning of risk scorecards)
Fraudulent activities detection (overdrawing, bounced checks, money laundering prevention)
Prediction of future events (e.g.: probability of default)
Automatic calculation of creditworthiness
Seminář BI 24.3.2006
Příloha 4 – Benefits – MKT, Sales, …
•
•
•
•
•
•
•
Marketing / Sales:
Consolidated customer view, 360-degree view (i.e. customer-centric approach)
Automatic evaluation of marketing campaigns, return rate
Automatic selection of mailing lists based of success prediction
Mining of cross-selling and up-selling opportunities (of both products and services)
Analysis of accounts (or contracts) closed ahead of schedule (i.e. how to prevent customer
attrition)
Incentives to sales people based on sold products, new volume, profitability, etc. (i.e. building
a reward system on measured results rather than feelings)
Customer life cycle and segmentation, retention programmes selection
Branch network optimisation based on profitability and workload
Customer relationship management based on profitability, creditworthiness and other
indicators
Identification and exploitation of business opportunities
•
•
•
Quality:
Process parameters monitoring
DPMO and sigma calculations
•
•
•
•
Seminář BI 24.3.2006