Business Intelligence
Istilah intelijen bisnis (bahasa Inggris: business intelligence, BI) merujuk pada teknologi, aplikasi, serta praktik pengumpulan, integrasi, analisis, serta presentasi informasi bisnis atau kadang merujuk pula pada informasinya itu sendiri. Tujuan intelijen bisnis adalah untuk mendukung pengambilan keputusan bisnis.
Sistem BI memberikan sudut pandang historis, saat ini, serta prediksi
operasi bisnis, terutama dengan menggunakan data yang telah dikumpulkan
ke dalam suatu gudang data dan kadang juga bersumber pada data operasional. Perangkat lunak
mendukung penggunaan informasi ini dengan membantu ekstraksi, analisis,
serta pelaporan informasi. Aplikasi BI menangani penjualan, produksi,
keuangan, serta berbagai sumber data bisnis untuk keperluan tersebut,
yang mencakup terutama manajemen kinerja bisnis. Informasi dapat pula diperoleh dari perusahaan-perusahaan sejenis untuk menghasilkan suatu tolok ukur.
Definisi
Terdapat beberapa pendapat mengenai definisi dari Business Intelligence, diantaranya :
- Secara umum Business Intelligence (BI) merupakan sebuah proses untuk melakukan ekstraksi data-data operasional perusahaan dan mengumpulkannya dalam sebuah data warehouse yang selanjutnya diproses menggunakan berbagai analisis statistik dalam proses data mining, sehingga didapat berbagai kecenderungan atau pattern dari data (Choirul, 2006).
- Business Intelligence adalah rangkaian aplikasi dan teknologi untuk mengumpulkan, menyimpan, menganalisis, dan menyuguhkan akses data untuk membantu petinggi perusahaan dalam pengambilan keputusan (Stevans, 2008).
- Business Intelligence (BI) merupakan representasi dari aplikasi dan teknologi untuk mengumpulkan, menyimpan, menganalisa dan menyediakan akses terhadap data untuk membantu user dalam suatu perusahaan untuk mengambil keputusan yang lebih baik (Nirwasita,2008).
- Business Intelligence adalah proses mengekstrak, transformasi, mengelola, dan menganalisis data bisnis untuk mendukung pengambilan keputusan. Dalam proses ini pada umumnya melibatkan data set dalam jumlah besar yang tersimpan dalam datawarehouse. Proses business intelligence meliputi lima tahapan yaitu Pengumpulan data, Analisis data, Kesadaran situasi, Penilaian resiko, dan Dukungan pengambilan keputusan. (Niu, 2009)
Karakteristik Business Intelligence
Sistem Business Intelligence yang baik mempunyai berbagai karakteristik (Stevans,2008), diantaranya :
- Tujuan utama
Seluruh sistem komputer mempunyai tujuan utama bagi seluruh pengguna sesuai dengan kebutuhan penguna masing-masing. - Ketersediaan data yang relevan
Masalah ketersediaan data merupakan poin yang paling penting dalam sistem business intelligence yang efektif. Dalam proses pembuat keputusan sering terjadi penyampaian informasi yang tidak lengkap atau bahkan yang tidak sebenarnya. Namun dengan dukungan BI, ketersediaan data yang relevan dapat diatasis ehingga dapat menyuguhkan data-data yang relevan. - Kemampuan
Dalam hal ini terdapat kemampuan BI yang paling utama yaitu dapat memberikan kemudahan akses untuk informasi terbaru dari bisnis yang berjalan serta peluang yang diproyeksikan, selain itu Bi dapat memenuhi kapabilitas untuk melakukan analisis dan memenuhi permintaan pengguna - Struktur Pendukung
Dalam BI, sistem pendukung didalamnya tidak hanya terdiri dari hardware dan software, namun juga terdiri dari suatu proses yang dibuat untuk pengambilan keputusan yang lebih baik serta untuk menentukan strategi untuk misi dan tujuan kedepan.
PENGERTIAN BUSINESS INTELLIGENCE
Business intelligence, biasa disebut BI adalah teknologi yang
menggunakan komputer yang berguna untuk mencari, menggali, dan
menganalisis informasi dari data bisnis misalnya hasil penjualan suatu
produk atau pendapatan/pengeluaran salah satu anak perusahaan.
Business Intelligence Software (BI) secara
singkat juga dikenal sebagai dashboard. Ini karena secara umum BI
berfungsi seperti halnya dashboard pada kendaraan. BI memberikan metrik
(ukuran-ukuran) yang menentukan performa kendaraan (organisasi). BI juga
memberikan informasi kondisi internal, seperti halnya suhu pada
kendaraan. Dan BI juga memberikan sinyal-sinyal pada pengemudi bila
terjadi kesalahan pada kendaraan, seperti bila bensin akan habis pada
kendaraan. Semuanya berguna bagi pengemudi agar mampu mengendalikan
kendaraannya dengan lebih baik dan mampu membuat keputusan yang tepat
dengan lebih cepat.
Pada prakteknya, BI akan berfungsi sebagai analis, penghitung scorecard,
sekaligus memberikan rekomendasi pada user terhadap tindakan yang sebaiknya diambil. Dengan menjalankan fungsi dashboard, user BI akan mengenali potensi ketidakberesan pada perusahaan sekaligus dengan penyebabnya sebelum hal tersebut berkembang menjadi masalah yang besar. BI akan berfungsi memberikan advance alarm, memberikan informasi trend dan melakukan benchmark.
Pada prakteknya, BI akan berfungsi sebagai analis, penghitung scorecard,
sekaligus memberikan rekomendasi pada user terhadap tindakan yang sebaiknya diambil. Dengan menjalankan fungsi dashboard, user BI akan mengenali potensi ketidakberesan pada perusahaan sekaligus dengan penyebabnya sebelum hal tersebut berkembang menjadi masalah yang besar. BI akan berfungsi memberikan advance alarm, memberikan informasi trend dan melakukan benchmark.
Komponen Dasar BI
Pada dasarnya komponen BI mencakup, gathering, storing, analysing dan providing access to data.Berbagai macam contoh Masalah yang bisa diatasi hanya dengan menggunakan Bisnis Intelligence antara lain sebagai berikut:
a. Manager Promosi ingin menganalisis pengaruh tiap jenis media iklan di koran, majalah, dan TV terhadap penjualan produk.
b. Manager HRD dapat menganalisis pengaruh kenaikan gaji terhadap peningkatan produktivitas pekerja di lantai pabrik.
c. Manajer Penjualan ingin mengetahui pengaruh musim dan kepadatan penduduk terhadap penjualan es krim di tiap daerah
Keuntungan Bisnis Intelligence:
Ada 7 keunggulan utama BI yang akan memberikan value bagi perusahaan adalah sebagai berikut:
a. Konsolidasi informasi Dengan BI dijalankan di dalam perusahaan, data akan diolah dalam satu platform dan disebarkan dalam bentuk informasi yang berguna (meaningful) ke seluruh organisasi. Dengan ketiadaan information assymmetry, kolaborasi dan konsolidasi di dalam perusahaan dapat diperkuat. Dengan konsolidasi, maka dapat dimungkinkan pembuatan cross-functional dan corporate-wide reports. Meskipun harus diakui, benefit ini juga mampu disediakan oleh software ERP.
b. In-depth reporting Software Business Process Management (BPM) memang mampu memberikan report dan analisis, namun cukup sederhana dan hanya bertolak pada kondisi intern. Sedangkan BI mampu menyediakan informasi untuk isu-isu bisnis yang lebih besar pada level strategis.
c. Customized Graphic User Interface (GUI) Beberapa ERP memang berusaha membuat tampilan GUI yang user friendly, namun
BI melangkah lebih jauh dengan menyediakan fasilitas kustomisasi GUI.
Sehingga tampilan GUI jauh dari kesan teknis dan memberikan view of business sesuai dengan keinginan masing-masing user.
d. Sedikit masalah teknis Ini karena -pertama- sifatnya yang user
friendly meminimasi kemungkinan operating error dari user, dan -kedua-
BI hanya merupakan software pada layer teratas (information processing)
dan bukan business process management.
e. Biaya pengadaan rendah Karena BI hanya software yang bekerja pada
layer teratas dari pengolahan informasi, harga software-nya tidak
semahal ERP. Biaya pengadaannya pun menjadi lebih murah dibandingkan
ERP. Apalagi saat ini banyak ditunjang juga oleh produk BI yang open
source.
f. Flexible databank BI membuka kemungkinan untuk berkolaborasi
dengan ERP sebagai pemasok databank yang akan diolah menjadi reports dan
scorecard, namun BI juga dapat bekerja dari databank yang dibuat
terpisah. BI pun menjadi terbuka untuk digunakan oleh analis profesional
dan peneliti, yang data olahannya bersifat sekunder.
g. Responsiveness Sifat BI lain yang tidak dimiliki oleh ERP adalah
dalam hal kecepatan (responsiveness). Misalnya pada penghitungan service
level sebagai salah satu Key Performance Indicator (KPI). Fungsi BI
akan memberikan peringatan kepada user sebelum batas bawah dalam service
level (lower limit) terlampaui. Akibatnya masalah bisa ditangani
sebelum benar-benar muncul ke permukaan. Salah satu contoh
padResponsivenessa industri kesehatan, penggunaan BI berjasa mencegah
penyebaran suatu penyakit/wabah secara luas (outbreak). Nama-nama vendor
BI memang masih asing di Indonesia.
Pengaplikasian Bisnis Intelligence:
Hingga saat ini, organisasi yang telah mengimplementasikan komponen
dari Enterprise Performance Management System dan Business Intelligence
Oracle pada tahun fiskal 2008 di antaranya Bank of Communications
(Cina), CJ Entertainment (Korea), GM Daewoo Auto & Technology
(Korea), Huadian Power (China), Hyunjin Materials (Korea), Kolon
(Korea), Korea Investment & Securities (Korea), Korea Land
Corporation, Korea Zinc (Korea), MIDEA (China), New World Department
Stores (Hong Kong), Samsung Electronics (Korea), Sterlite Industries
(India) Ltd. (India), Vedanta Resources plc (India), dan Woori Bank
(Korea).
PT Coca Cola Distribution Indonesia dan Ayala Corporation dari Filipina tercatat telah mengadopsi komponen software Enterprise Performance Management (EPM) dan Business Intelligence (BI) dari Oracle.
Alternatif lain menggunakan produk BI open source yang saat ini makin populer, yaitu Pentaho.PT Coca Cola Distribution Indonesia dan Ayala Corporation dari Filipina tercatat telah mengadopsi komponen software Enterprise Performance Management (EPM) dan Business Intelligence (BI) dari Oracle.
Pentaho Corporation didirikan pada tahun 2004 oleh Richard Daley. Richard sebelumnya telah bekerja di IBM dan bertanggung jawab terhadap bagian BI. Pentaho dalam perjalanannya melakukan akuisisi terhadap berbagai proyek open source terkenal dan melakukan perbaikan terhadapnya seperti JFreeReport. Disusul oleh Mondrian, Kettle dan Weka dimana semua lead developer dari proyek ini tetap dipertahankan.
Dengan demikian stack solusi BI untuk Pentaho semakin lengkap dan bisa dibilang tahun 2007 dan 2008 merupakan tahun keemasan Pentaho dengan peningkatan penjualan lisensi (Pentaho menerapkan opsi dual lisensi: gratis dan berbayar) dan meraih banyak penghargaan.
Menurut Inmon (2002) yang dikutip oleh Niu (2009), pada umumnya sistem business intelligence terdiri dari empat level komponen dan modul manajemen metadata. Arsitektur general dari sistem business intelligence terlampir pada gambar 1. Komponen-komponen saling berinteraksi untuk memfasilitasi fungsi dasar business intelligence: mengekstrak data dari sistem operasional perusahaan, menyimpan data yang sudah diekstrak kedalam datawarehouse, dan menarik data yang disimpan untuk berbagai aplikasi analisis bisnis.
- Level sistem operasional.
Sebagai sumber data dari sistem business intelligence, sistem operasional bisnis pada umumnya menggunakan sistem online transaction processing (OLTP) untuk
mendukung kegiatan bisnis sehari-hari. Pada umumnya sistem OLTP adalah
sistem penerimaan order pelanggan, sistem keuangan, dan sistem sumber
daya manusia.
- Level akuisisi data.
Pada level ini adalah komponen pra proses terdiri dari 3 tahapan
yaitu : ekstraksi, transformasi, dan memasukkan (ETL). Sebuah perusahaan
memiliki beberapa sistem OLTP yang menghasilkan jumlah data yang sangat
besar. Data tersebut pertama kali diekstrak dari sistem OLTP oleh
proses ETL dan kemudian ditransformasi sesuai dengan aturan
transformasi. Apabila data yang sudah ditransformasi maka data tersebut
dimasukkan ke data warehouse. ETL merupakan komponen dasar dari sistem business intelligence
karena kualitas data dari komponen lain tergantung pada proses ETL.
Dalam perancangan dan pengembangan ETL, kualitas data, fleksibilitas
sistem dan kecepatan proses adalah perhatian utama.
- Level penyimpanan data.
Data yang telah diproses oleh komponen ETL disimpan dalam data warehouse dimana biasanya diimplementasikan dengan menggunakan tradisional sistem manajemen database (RDMS). RDMS didesain untuk mendukung proses transaksi, sangat bertolak belakang dengan data warehouse berfokus kepada subyek, varian waktu dan disimpan secara terintegrasi. Skema star dan snowflake merupakan skema data warehouse yang paling populer. Apapun skema yang dipakai, tipe tabel pada data warehouse adalah fact tables dan dimension tables.
- Level analitis.
Berdasarkan data warehouse, berbagai macam aplikasi analitikal telah dikembangkan. Sistem business intelligence mendukung 2 tipe dasar dalam fungsi analitikal: pelaporan dan online analytical processing (OLAP).
Fungsi pelaporan menyediakan manajer berbagai jenis laporan bisnis
seperti laporan penjualan, laporan produk, dan laporan sumber daya
manusia. Laporan dihasilkan dari menjalankan queries kedalam data warehouse. Data warehouse queries pada umumnya sudah didefinisikan oleh pengembang data warehouse. Laporan yang dihasilkan oleh sistem business intelligence biasanya memiliki format yang statis dan berisi tipe data yang pasti.
Analitikal business intelligence yang paling menjanjikan
adalah OLAP. Menurut Codd et al (1993) yang dikutip oleh Niu (2009),
OLAP memungkinkan manajer untuk secara efisien mendalami data bisnis
dari berbagai dimensi analisis melalui operasi pengirisan, pemotongan
dan pendalaman. Sebuah analisis dimensi merupakan perspektif melalui
bagaimana data tersebut dipresentasikan, sebagai contoh: tipe produk,
lokasi penjualan, waktu dan pelanggan. dibandingkan dengan fungsi
laporan, OLAP mendukung analisis data sesuai dengan kebutuhan. OLAP
merupakan model data multidimensional yang dikenal sebagai skema snowflake dan star. Sebagai tambahan dari laporan dan OLAP, terdapat banyak tipe analitikal yang lain yang dapat dibuat berdasarkan sistem data warehouse seperti data mining, executive dashboards, customer relationship management, dan business performance management.
- Manajemen metadata.
Metadata merupakan data khusus mengenai data lain seperti sumber data, penyimpanan data warehouse, peraturan bisnis, otorisasi akses, dan bagaimana data diekstrak dan ditransformasi. Metadata sangat penting dalam menghasilkan informasi yang akurat, konsisten dan pemeliharaan sistem. Manajemen metadata mempengaruhi semua proses dari perancangan, pengembangan, pengujian, penyebaran dan penggunaan sistem business intelligence.
ONLINE
CUSTOMER
Pada
era globalisasi yang telah dikemukakan sebelumnya, bahwa kompetisi antar
perusahaan semakin meningkat dan ketat. Maka setiap perusahaan berusaha
untuk dapat melayani dan memenuhi kebutuhan para konsumen-konsumennya dengan
semaksimal mungkin. Perusahaan bersikap demikian agar tetap dapat
mempertahankan bisnisnya yang tidak pasti keadaannya pada tiap harinya karena
pengaruh kompetisi yang besar di lingkungannya. Kadang hari ini statusnya
bersifat aman tetapi siapa tahu hari esok akan berubah menjadi sebaliknya.
Perusahaan era sekarang telah beralih dari cara marketing tradisional ke arah
fokus pada pelanggan. Jadi tidak hanya berkutat pada 4P: Price, Product, Place,
dan Promotion. Tetapi sudah berusaha menerapkan metode get, keep, and grow
pelanggan, karena mereka menyadari jika tidak ada pelanggan maka produk atau
jasa yang mereka tawarkan tidak laku dijual di pasaran yang berarti nantinya
berakibat pada tidak adanya pendapatan bagi perusahaan dan akan mengalami
kebangkrutan.
Menurut
Dr. Philip Kotler, fokus pada pelanggan ialah strategi bisnis baru yang dapat
memenangkan pasar nantinya. Apalagi jika perusahaan telah mengintegrasikan
metode get, keep, and grow dengan teknologi yang dapat mendukungnya. Hal ini
sesuai dengan yang saya pikirkan, teknologi dapat menunjang metode-metode
tersebut agar berjalan dengan lebih baik. Berikut ini ada beberapa teknologi
yang dapat membantu mengatur interakasi perusahaan dengan pelanggannya agar
lebih mudah yaitu:
Enterprise Resource Planning (ERP)
Perencanaan
sumber daya perusahaan, atau sering disingkat ERP dari
istilah bahasa Inggrisnya, enterprise resource planning,
adalah sistem informasi yang diperuntukkan bagi perusahan manufaktur
maupun jasa yang berperan mengintegrasikan dan mengotomasikan proses bisnis
yang berhubungan dengan aspek operasi, produksi maupun distribusi di
perusahaan bersangkutan. ERP sering disebut sebagai Back Office System yang
mengindikasikan bahwa pelanggan dan publik secara umum tidak dilibatkan dalam
sistem ini. Berbeda dengan Front Office System yang langsung
berurusan dengan pelanggan seperti sistem untuk e-Commerce, Customer
Relationship Management (CRM), e-Government dan lain-lain.
Mindmap proses enterprise resource planning
2
Supply Chain Management (SCM)
Supply Chain Management (SCM)
Supply
Chain Management adalah suatu konsep yang menyangkut pola pendistribusian produk yang mampu menggantikan pola-pola pendistribusian produk secarat
radisional. Pola baru ini menyangkut aktivitas pendistribusian, jadwal
produksi, dan logistik. SCM menekankan pada pola terpadu menyangkut proses
aliran produk dari supplier, manufaktur, retailer hingga pada konsumen akhir.
Dalam konsep SCM ingin diperlihatkan bahwa rangkaian aktivitas antara supplier
hingga konsumen akhir adalah dalam satu kesatuan tanpa sepakat yang besar.
Mekanisme informasi antara berbagai komponen
tersebut berlangsung secara transparan.
Mindmap
proses Supply Chain Management
3
Sales Force Automation (SFA)
Sales Force Automation (SFA)
Sales Force
Automation adalah sistem informasi yang digunakan oleh bagian Sales atau Sales
Management untuk membantu melakukan otomatisasi fungsi-fungsi sales force
management. Koombinasi antara modul SFA dengan modul Marketing Automation (MA)
inilah yang biasanya membentuk sebuah aplikasi CRM (Customer Relationship
Management). Sales Force Automation berfungsi dalam mengelola kinerja
sales force perusahaan, mulai dari mengelola leads yang didapatkan, me-manage potensial
penjualan, mengatur aktifitas penjualan, meng-otomatisasi sales quotation, dan
seterusnya.
Mindmap
proses Sales Force Automation
4
Data
Warehouse
Datawarehouse adalah
kumpulan macam-macam data yang subject oriented, integrated, time variant,
dan nonvolatile. dalam mendukung proses pembuatan keputusan.
Tujuan utama dari pembuatan data
warehouse ada;ah untuk menyatukan
data yang beragam ke dalam sebuah tempat penyimpanandimana pengguna dapat dengan mudah menjalankan query (pencarian data), menghasilkan laporan, dan melakukan analisis.
Adapun karakteristik Data
warehouse adalah sebagai berikut:
Subject Oriented (Berorientasi subject)
Tabel 5. Data Operasiaonal dan Data Warehouse
Data Operasional | Data Warehouse |
Dirancang berorientasi hanya pada aplikasi dan fungsi tertentu | Dirancang berdasar pada subjek-subjek tertentu(utama) |
Focusnya pada desain database dan proses | Focusnya pada pemodelan data dan desain data |
Berisi rincian atau detail data | Berisi data-data history yang akan dipakai dalam proses analisis |
Relasi antar table berdasar aturan terkini(selalu mengikuti rule(aturan) terbaru) | Banyak aturan bisnis dapat tersaji antara tabel-tabel |
Integrated (Terintegrasi)
Data Warehouse dapat menyimpan data-data yang berasal dari
sumber-sumber yang terpisah kedalam suatu format yang konsisten dan
saling terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa
dipecah-pecah karena data yang ada merupakan suatu kesatuan yang
menunjang keseluruhan konsep data warehouse itu sendiri. Syarat
integrasi sumber data dapat dipenuhi dengan berbagai cara sepeti
konsisten dalam penamaan variable,konsisten dalam ukuran
variable,konsisten dalam struktur pengkodean dan konsisten dalam atribut
fisik dari data. Contoh pada lingkungan operasional terdapat berbagai
macam aplikasi yang mungkin pula dibuat oleh developer yang berbeda.
Oleh karena itu, mungkin dalam aplikasi-aplikasi tersebut ada variable
yang memiliki maksud yang sama tetapi nama dan format nya berbeda.
Variable tersebut harus dikonversi menjadi nama yang sama dan format
yang disepakati bersama. Dengan demikian tidak ada lagi kerancuan karena
perbedaan nama, format dan lain sebagainya. Barulah data tersebut bisa
dikategorikan sebagai data yang terintegrasi karena kekonsistenannya.
Time-variant (Rentang Waktu)
Seluruh data pada data warehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu. Untuk melihat interval waktu yang digunakan dalam mengukur keakuratan suatu data warehouse, kita dapat menggunakan cara antara lain :
Time-variant (Rentang Waktu)
Seluruh data pada data warehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu. Untuk melihat interval waktu yang digunakan dalam mengukur keakuratan suatu data warehouse, kita dapat menggunakan cara antara lain :
- Cara yang paling sederhana adalah menyajikan data warehouse pada rentang waktu tertentu, misalnya antara 5 sampai 10 tahun ke depan.
- Cara yang kedua, dengan menggunakan variasi/perbedaan waktu yang disajikan dalam data warehouse baik implicit maupun explicit secara explicit dengan unsur waktu dalam hari, minggu, bulan dsb. Secara implicit misalnya pada saat data tersebut diduplikasi pada setiap akhir bulan, atau per tiga bulan. Unsur waktu akan tetap ada secara implisit didalam data tersebut.
- Cara yang ketiga,variasi waktu yang disajikan data warehouse melalui serangkaian snapshot yang panjang. Snapshot merupakan tampilan dari sebagian data tertentu sesuai keinginan pemakai dari keseluruhan data yang ada bersifat read-only.
Non-Volatile
Karakteristik keempat dari data warehouse adalah non-volatile,maksudnya data pada data warehouse tidak di-update secara real time tetapi di refresh
dari sistem operasional secara reguler. Data yang baru selalu
ditambahkan sebagai suplemen bagi database itu sendiri dari pada sebagai
sebuah perubahan. Database tersebut secara kontinyu menyerap data baru
ini, kemudian secara incremental disatukan dengan data sebelumnya.
Berbeda dengan database operasional yang dapat melakukan update,insert
dan delete terhadap data yang mengubah isi dari database sedangkan pada
data warehouse hanya ada dua kegiatan memanipulasi data yaitu loading
data (mengambil data) dan akses data (mengakses data warehouse seperti
melakukan query atau menampilan laporan yang dibutuhkan, tidak ada
kegiatan updating data).
Data warehouse merupakan pendekatan untuk menyimpan data dimana sumber-sumber data yang heterogen(yang biasanya tersebar pada beberapa database OLTP) dimigrasikan untuk penyimpanan data yang homogen dan terpisah. Keuntungan yang didapatkan dengan menggunakan data warehouse tersebut dibawah ini (Ramelho).
Sedangkan kombinasi data mining verifikasi dan penemuan merupakan perkembangan data mining di masa depan akan mengkombinasikan pendekatan hipotesis dan penemuan. Perkembangan ini menggunakan penalaran yang sama yang mendasari konsep Sistem Pendukung Keputusan (Decision Support System – DSS). Konsep tersebut memungkinkan pemakai dan komputer bekerja sama untuk memecahkan suatu masalah. Pemakai menerapkan keahliannya dalam hal masalah, dan komputer melakukan analisis data yang canggih untuk memilih data yang tepat dan menempatkannya dalam format yang tepat untuk pengambilan keputusan. Menurut Fayyad Usama (1996), proses KDD secara garis besar dapat dijelaskan sebagai berikut:
Data Selection
Pemilihan (seleksi) data daru sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional.
Pre-processing/ Cleaning
Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data yang menjadi fokus KDD.
Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi).
Juga dilakukan proses enrichment, yaitu proses “memperkaya” data yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eksternal.
Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data
Data mining
Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan.
Interpretation/ Evaluation
Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut dengan interpretation. Tahap ini mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya.
Proses KDD secara garis besar memang terdiri dari 5 tahap seperti yang telah dijelaskan sebelumnya. Akan tetapi, dalam proses KDD yang sesungguhnya, dapat saja terjadi iterasi atau pengulangan pada tahap tahap tertentu. Pada setiap tahap dalam proses KDD, seorang analis dapat saja kembali ke tahap sebelumnya. Sebagai contoh, pada saat coding atau data mining, analis menyadari proses cleaning belum dilakukan dengan sempurna, atau mungkin saja analis menemukan data atau informasi baru untuk “memperkaya” data yang sudah ada.
KDD mencakup keseluruhan proses pencarian pola atau informasi dalam basis data, dimulai dari pemilihan dan persiapan data sampai representasi pola yang ditemukan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Data mining merupakan salah satu komponen dalam KDD yang difokuskan pada penggalian pola tersembunyi dalam basis data
Data warehouse merupakan pendekatan untuk menyimpan data dimana sumber-sumber data yang heterogen(yang biasanya tersebar pada beberapa database OLTP) dimigrasikan untuk penyimpanan data yang homogen dan terpisah. Keuntungan yang didapatkan dengan menggunakan data warehouse tersebut dibawah ini (Ramelho).
Sedangkan kombinasi data mining verifikasi dan penemuan merupakan perkembangan data mining di masa depan akan mengkombinasikan pendekatan hipotesis dan penemuan. Perkembangan ini menggunakan penalaran yang sama yang mendasari konsep Sistem Pendukung Keputusan (Decision Support System – DSS). Konsep tersebut memungkinkan pemakai dan komputer bekerja sama untuk memecahkan suatu masalah. Pemakai menerapkan keahliannya dalam hal masalah, dan komputer melakukan analisis data yang canggih untuk memilih data yang tepat dan menempatkannya dalam format yang tepat untuk pengambilan keputusan. Menurut Fayyad Usama (1996), proses KDD secara garis besar dapat dijelaskan sebagai berikut:
Data Selection
Pemilihan (seleksi) data daru sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional.
Pre-processing/ Cleaning
Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data yang menjadi fokus KDD.
Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi).
Juga dilakukan proses enrichment, yaitu proses “memperkaya” data yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eksternal.
Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data
Data mining
Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan.
Interpretation/ Evaluation
Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut dengan interpretation. Tahap ini mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya.
Proses KDD secara garis besar memang terdiri dari 5 tahap seperti yang telah dijelaskan sebelumnya. Akan tetapi, dalam proses KDD yang sesungguhnya, dapat saja terjadi iterasi atau pengulangan pada tahap tahap tertentu. Pada setiap tahap dalam proses KDD, seorang analis dapat saja kembali ke tahap sebelumnya. Sebagai contoh, pada saat coding atau data mining, analis menyadari proses cleaning belum dilakukan dengan sempurna, atau mungkin saja analis menemukan data atau informasi baru untuk “memperkaya” data yang sudah ada.
KDD mencakup keseluruhan proses pencarian pola atau informasi dalam basis data, dimulai dari pemilihan dan persiapan data sampai representasi pola yang ditemukan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Data mining merupakan salah satu komponen dalam KDD yang difokuskan pada penggalian pola tersembunyi dalam basis data
Data warehouse
bukan hanya tempat penyimpanan data, Datawarehouse adalah Business
Intelligence tools, tools to extract, merubah (transform) dan menerima
data (load) ke penyimpanan (repository) serta mengelola dan
menerima metadata.
Sedangkan fungsi utama dari data
warehouse meliputi :
a. Pengambilan dan pengumpulan data(termasuk data dari luar organisasi yang dibutukan)
b. Mempersiapkan data(transforming), seperti membersihkan dan mengintegrasikan data
c. Penyimpanan data (loading)
d. Penyediaan data untuk analisis (query
& reporting)