Sabtu, 19 Oktober 2013

Business Intelligence

Business Intelligence

        Istilah intelijen bisnis (bahasa Inggris: business intelligence, BI) merujuk pada teknologi, aplikasi, serta praktik pengumpulan, integrasi, analisis, serta presentasi informasi bisnis atau kadang merujuk pula pada informasinya itu sendiri. Tujuan intelijen bisnis adalah untuk mendukung pengambilan keputusan bisnis.
        Sistem BI memberikan sudut pandang historis, saat ini, serta prediksi operasi bisnis, terutama dengan menggunakan data yang telah dikumpulkan ke dalam suatu gudang data dan kadang juga bersumber pada data operasional. Perangkat lunak mendukung penggunaan informasi ini dengan membantu ekstraksi, analisis, serta pelaporan informasi. Aplikasi BI menangani penjualan, produksi, keuangan, serta berbagai sumber data bisnis untuk keperluan tersebut, yang mencakup terutama manajemen kinerja bisnis. Informasi dapat pula diperoleh dari perusahaan-perusahaan sejenis untuk menghasilkan suatu tolok ukur.

Definisi

Terdapat beberapa pendapat mengenai definisi dari Business Intelligence, diantaranya :
  1. Secara umum Business Intelligence (BI) merupakan sebuah proses untuk melakukan ekstraksi data-data operasional perusahaan dan mengumpulkannya dalam sebuah data warehouse yang selanjutnya diproses menggunakan berbagai analisis statistik dalam proses data mining, sehingga didapat berbagai kecenderungan atau pattern dari data (Choirul, 2006).
  2. Business Intelligence adalah rangkaian aplikasi dan teknologi untuk mengumpulkan, menyimpan, menganalisis, dan menyuguhkan akses data untuk membantu petinggi perusahaan dalam pengambilan keputusan (Stevans, 2008).
  3. Business Intelligence (BI) merupakan representasi dari aplikasi dan teknologi untuk mengumpulkan, menyimpan, menganalisa dan menyediakan akses terhadap data untuk membantu user dalam suatu perusahaan untuk mengambil keputusan yang lebih baik (Nirwasita,2008).
  4. Business Intelligence adalah proses mengekstrak, transformasi, mengelola, dan menganalisis data bisnis untuk mendukung pengambilan keputusan. Dalam proses ini pada umumnya melibatkan data set dalam jumlah besar yang tersimpan dalam datawarehouse. Proses business intelligence meliputi lima tahapan yaitu Pengumpulan data, Analisis data, Kesadaran situasi, Penilaian resiko, dan Dukungan pengambilan keputusan. (Niu, 2009)

Karakteristik Business Intelligence

Sistem Business Intelligence yang baik mempunyai berbagai karakteristik (Stevans,2008), diantaranya :
  1. Tujuan utama
    Seluruh sistem komputer mempunyai tujuan utama bagi seluruh pengguna sesuai dengan kebutuhan penguna masing-masing.
  2. Ketersediaan data yang relevan
    Masalah ketersediaan data merupakan poin yang paling penting dalam sistem business intelligence yang efektif. Dalam proses pembuat keputusan sering terjadi penyampaian informasi yang tidak lengkap atau bahkan yang tidak sebenarnya. Namun dengan dukungan BI, ketersediaan data yang relevan dapat diatasis ehingga dapat menyuguhkan data-data yang relevan.
  3. Kemampuan
    Dalam hal ini terdapat kemampuan BI yang paling utama yaitu dapat memberikan kemudahan akses untuk informasi terbaru dari bisnis yang berjalan serta peluang yang diproyeksikan, selain itu Bi dapat memenuhi kapabilitas untuk melakukan analisis dan memenuhi permintaan pengguna
  4. Struktur Pendukung
    Dalam BI, sistem pendukung didalamnya tidak hanya terdiri dari hardware dan software, namun juga terdiri dari suatu proses yang dibuat untuk pengambilan keputusan yang lebih baik serta untuk menentukan strategi untuk misi dan tujuan ked
    epan.
  5.  
       
PENGERTIAN BUSINESS INTELLIGENCE
      Business intelligence, biasa disebut BI adalah teknologi yang menggunakan komputer yang berguna untuk mencari, menggali, dan menganalisis informasi dari data bisnis misalnya hasil penjualan suatu produk atau pendapatan/pengeluaran salah satu anak perusahaan.

         Business Intelligence Software (BI) secara singkat juga dikenal sebagai dashboard. Ini karena secara umum BI berfungsi seperti halnya dashboard pada kendaraan. BI memberikan metrik (ukuran-ukuran) yang menentukan performa kendaraan (organisasi). BI juga memberikan informasi kondisi internal, seperti halnya suhu pada kendaraan. Dan BI juga memberikan sinyal-sinyal pada pengemudi bila terjadi kesalahan pada kendaraan, seperti bila bensin akan habis pada kendaraan. Semuanya berguna bagi pengemudi agar mampu mengendalikan kendaraannya dengan lebih baik dan mampu membuat keputusan yang tepat dengan lebih cepat.

          Pada prakteknya, BI akan berfungsi sebagai analis, penghitung scorecard,
sekaligus memberikan rekomendasi pada user terhadap tindakan yang sebaiknya diambil. Dengan menjalankan fungsi dashboard, user BI akan mengenali potensi ketidakberesan pada perusahaan sekaligus dengan penyebabnya sebelum hal tersebut berkembang menjadi masalah yang besar. BI akan berfungsi memberikan advance alarm, memberikan informasi trend dan melakukan benchmark.


BI berfungsi untuk membantu dalam membuat keputusan perusahaan atau bisnis secara cepat dan akurat.

Komponen Dasar BI

Pada dasarnya komponen BI mencakup, gathering, storing, analysing dan providing access to data.
bi basic components
 
Contoh Masalah dalam Bisnis Intelligence
Berbagai macam contoh Masalah yang bisa diatasi hanya dengan menggunakan Bisnis Intelligence antara lain sebagai berikut:
a. Manager Promosi ingin menganalisis pengaruh tiap jenis media iklan di koran, majalah, dan TV terhadap penjualan produk.
b. Manager HRD dapat menganalisis pengaruh kenaikan gaji terhadap peningkatan produktivitas pekerja di lantai pabrik.
c. Manajer Penjualan ingin mengetahui pengaruh musim dan kepadatan penduduk terhadap penjualan es krim di tiap daerah


Keuntungan Bisnis Intelligence:
Ada 7 keunggulan utama BI yang akan memberikan value bagi perusahaan adalah sebagai berikut:
a. Konsolidasi informasi Dengan BI dijalankan di dalam perusahaan, data akan diolah dalam satu platform dan disebarkan dalam bentuk informasi yang berguna (meaningful) ke seluruh organisasi. Dengan ketiadaan information assymmetry, kolaborasi dan konsolidasi di dalam perusahaan dapat diperkuat. Dengan konsolidasi, maka dapat dimungkinkan pembuatan cross-functional dan corporate-wide reports. Meskipun harus diakui, benefit ini juga mampu disediakan oleh software ERP.

b. In-depth reporting Software Business Process Management (BPM) memang mampu memberikan report dan analisis, namun cukup sederhana dan hanya bertolak pada kondisi intern. Sedangkan BI mampu menyediakan informasi untuk isu-isu bisnis yang lebih besar pada level strategis.

c. Customized Graphic User Interface (GUI) Beberapa ERP memang berusaha membuat tampilan GUI yang user friendly, namun
BI melangkah lebih jauh dengan menyediakan fasilitas kustomisasi GUI.
Sehingga tampilan GUI jauh dari kesan teknis dan memberikan view of business sesuai dengan keinginan masing-masing user.

d. Sedikit masalah teknis Ini karena -pertama- sifatnya yang user friendly meminimasi kemungkinan operating error dari user, dan -kedua- BI hanya merupakan software pada layer teratas (information processing) dan bukan business process management.


e. Biaya pengadaan rendah Karena BI hanya software yang bekerja pada layer teratas dari pengolahan informasi, harga software-nya tidak semahal ERP. Biaya pengadaannya pun menjadi lebih murah dibandingkan ERP. Apalagi saat ini banyak ditunjang juga oleh produk BI yang open source.


f. Flexible databank BI membuka kemungkinan untuk berkolaborasi dengan ERP sebagai pemasok databank yang akan diolah menjadi reports dan scorecard, namun BI juga dapat bekerja dari databank yang dibuat terpisah. BI pun menjadi terbuka untuk digunakan oleh analis profesional dan peneliti, yang data olahannya bersifat sekunder.




g. Responsiveness Sifat BI lain yang tidak dimiliki oleh ERP adalah dalam hal kecepatan (responsiveness). Misalnya pada penghitungan service level sebagai salah satu Key Performance Indicator (KPI). Fungsi BI akan memberikan peringatan kepada user sebelum batas bawah dalam service level (lower limit) terlampaui. Akibatnya masalah bisa ditangani sebelum benar-benar muncul ke permukaan. Salah satu contoh padResponsivenessa industri kesehatan, penggunaan BI berjasa mencegah penyebaran suatu penyakit/wabah secara luas (outbreak). Nama-nama vendor BI memang masih asing di Indonesia.


Pengaplikasian Bisnis Intelligence:
         Hingga saat ini, organisasi yang telah mengimplementasikan komponen dari Enterprise Performance Management System dan Business Intelligence Oracle pada tahun fiskal 2008 di antaranya Bank of Communications (Cina), CJ Entertainment (Korea), GM Daewoo Auto & Technology (Korea), Huadian Power (China), Hyunjin Materials (Korea), Kolon (Korea), Korea Investment & Securities (Korea), Korea Land Corporation, Korea Zinc (Korea), MIDEA (China), New World Department Stores (Hong Kong), Samsung Electronics (Korea), Sterlite Industries (India) Ltd. (India), Vedanta Resources plc (India), dan Woori Bank (Korea).
PT Coca Cola Distribution Indonesia dan Ayala Corporation dari Filipina tercatat telah mengadopsi komponen software Enterprise Performance Management (EPM) dan Business Intelligence (BI) dari Oracle.
Alternatif lain menggunakan produk BI open source yang saat ini makin populer, yaitu Pentaho.

           Pentaho Corporation didirikan pada tahun 2004 oleh Richard Daley. Richard sebelumnya telah bekerja di IBM dan bertanggung jawab terhadap bagian BI. Pentaho dalam perjalanannya melakukan akuisisi terhadap berbagai proyek open source terkenal dan melakukan perbaikan terhadapnya seperti JFreeReport. Disusul oleh Mondrian, Kettle dan Weka dimana semua lead developer dari proyek ini tetap dipertahankan.

Dengan demikian stack solusi BI untuk Pentaho semakin lengkap dan bisa dibilang tahun 2007 dan 2008 merupakan tahun keemasan Pentaho dengan peningkatan penjualan lisensi (Pentaho menerapkan opsi dual lisensi: gratis dan berbayar) dan meraih banyak penghargaan.


Arsitektur Sistem Business Intelligence
      Menurut Inmon (2002) yang dikutip oleh Niu (2009), pada umumnya sistem business intelligence terdiri dari empat level komponen dan modul manajemen metadata. Arsitektur general dari sistem business intelligence terlampir pada gambar 1. Komponen-komponen saling berinteraksi untuk memfasilitasi fungsi dasar business intelligence: mengekstrak data dari sistem operasional perusahaan, menyimpan data yang sudah diekstrak kedalam datawarehouse, dan menarik data yang disimpan untuk berbagai aplikasi analisis bisnis.
  • Level sistem operasional.
      Sebagai sumber data dari sistem business intelligence, sistem operasional bisnis pada umumnya menggunakan sistem online transaction processing (OLTP) untuk mendukung kegiatan bisnis sehari-hari. Pada umumnya sistem OLTP adalah sistem penerimaan order pelanggan, sistem keuangan, dan sistem sumber daya manusia.
  • Level akuisisi data.
      Pada level ini adalah komponen pra proses terdiri dari 3 tahapan yaitu : ekstraksi, transformasi, dan memasukkan (ETL). Sebuah perusahaan memiliki beberapa sistem OLTP yang menghasilkan jumlah data yang sangat besar. Data tersebut pertama kali diekstrak dari sistem OLTP oleh proses ETL dan kemudian ditransformasi sesuai dengan aturan transformasi. Apabila data yang sudah ditransformasi  maka data tersebut dimasukkan ke data warehouse. ETL merupakan komponen dasar dari sistem business intelligence karena kualitas data dari komponen lain tergantung pada proses ETL. Dalam perancangan dan pengembangan ETL, kualitas data, fleksibilitas sistem dan kecepatan proses adalah perhatian utama.
  • Level penyimpanan data.
       Data yang telah diproses oleh komponen ETL disimpan dalam data warehouse dimana biasanya diimplementasikan dengan menggunakan tradisional sistem manajemen database (RDMS). RDMS didesain untuk mendukung proses transaksi, sangat bertolak belakang dengan data warehouse berfokus kepada subyek, varian waktu dan disimpan secara terintegrasi. Skema star dan snowflake merupakan skema data warehouse yang paling populer. Apapun skema yang dipakai, tipe tabel pada data warehouse adalah fact tables dan dimension tables.
  • Level analitis.
       Berdasarkan data warehouse, berbagai macam aplikasi analitikal telah dikembangkan. Sistem business intelligence mendukung 2 tipe dasar dalam fungsi analitikal: pelaporan dan online analytical processing (OLAP). Fungsi pelaporan menyediakan manajer berbagai jenis laporan bisnis seperti laporan penjualan, laporan produk, dan laporan sumber daya manusia. Laporan dihasilkan dari menjalankan queries kedalam data warehouse. Data warehouse queries pada umumnya sudah didefinisikan oleh pengembang data warehouse. Laporan yang dihasilkan oleh sistem business intelligence biasanya memiliki format yang statis dan berisi tipe data yang pasti.
Analitikal business intelligence yang paling menjanjikan adalah OLAP. Menurut Codd et al (1993) yang dikutip oleh Niu (2009), OLAP memungkinkan manajer untuk secara efisien mendalami data bisnis dari berbagai dimensi analisis melalui operasi pengirisan, pemotongan dan pendalaman. Sebuah analisis dimensi merupakan perspektif melalui bagaimana data tersebut dipresentasikan, sebagai contoh: tipe produk, lokasi penjualan, waktu dan pelanggan. dibandingkan dengan fungsi laporan, OLAP mendukung analisis data sesuai dengan kebutuhan. OLAP merupakan model data multidimensional yang dikenal sebagai skema snowflake dan star. Sebagai tambahan dari laporan dan OLAP, terdapat banyak tipe analitikal yang lain yang dapat dibuat berdasarkan sistem data warehouse seperti data mining, executive dashboards, customer relationship management, dan business performance management.
  • Manajemen metadata.
       Metadata merupakan data khusus mengenai data lain seperti sumber data, penyimpanan data warehouse, peraturan bisnis, otorisasi akses,        dan bagaimana data diekstrak dan ditransformasi. Metadata sangat penting dalam menghasilkan informasi yang akurat, konsisten dan pemeliharaan sistem. Manajemen metadata mempengaruhi semua proses dari perancangan, pengembangan, pengujian, penyebaran dan penggunaan sistem business intelligence.
Picture17
Gambar 1. Arsitektur sistem business intelligence secara umum



 ONLINE CUSTOMER
Pada era globalisasi yang telah dikemukakan sebelumnya, bahwa kompetisi antar perusahaan semakin meningkat  dan ketat. Maka setiap perusahaan berusaha untuk dapat melayani dan memenuhi kebutuhan para konsumen-konsumennya dengan semaksimal mungkin. Perusahaan bersikap demikian agar tetap dapat mempertahankan bisnisnya yang tidak pasti keadaannya pada tiap harinya karena pengaruh kompetisi yang besar di lingkungannya. Kadang hari ini statusnya bersifat aman tetapi siapa tahu hari esok akan berubah menjadi sebaliknya. Perusahaan era sekarang telah beralih dari cara marketing tradisional ke arah fokus pada pelanggan. Jadi tidak hanya berkutat pada 4P: Price, Product, Place, dan Promotion. Tetapi sudah berusaha menerapkan metode get, keep, and grow pelanggan, karena mereka menyadari jika tidak ada pelanggan maka produk atau jasa yang mereka tawarkan tidak laku dijual di pasaran yang berarti nantinya berakibat pada tidak adanya pendapatan bagi perusahaan dan akan mengalami kebangkrutan.
Menurut Dr. Philip Kotler, fokus pada pelanggan ialah strategi bisnis baru yang dapat memenangkan pasar nantinya. Apalagi jika perusahaan telah mengintegrasikan metode get, keep, and grow dengan teknologi yang dapat mendukungnya. Hal ini sesuai dengan yang saya pikirkan, teknologi dapat menunjang metode-metode tersebut agar berjalan dengan lebih baik. Berikut ini ada beberapa teknologi yang dapat membantu mengatur interakasi perusahaan dengan pelanggannya agar lebih mudah yaitu:
               Enterprise Resource Planning (ERP)
Perencanaan sumber daya perusahaan, atau sering disingkat ERP dari istilah bahasa Inggrisnya, enterprise resource planning, adalah sistem informasi yang diperuntukkan bagi perusahan manufaktur maupun jasa yang berperan mengintegrasikan dan mengotomasikan proses bisnis yang berhubungan dengan aspek operasi, produksi maupun distribusi di perusahaan bersangkutan. ERP sering disebut sebagai Back Office System yang mengindikasikan bahwa pelanggan dan publik secara umum tidak dilibatkan dalam sistem ini. Berbeda dengan Front Office System yang langsung berurusan dengan pelanggan seperti sistem untuk e-Commerce, Customer Relationship Management (CRM), e-Government dan lain-lain.
Mindmap proses enterprise resource planning
2
             Supply Chain Management (SCM)            
Supply Chain Management adalah suatu konsep yang menyangkut pola pendistribusian  produk yang mampu menggantikan pola-pola pendistribusian produk secarat radisional. Pola baru ini menyangkut aktivitas pendistribusian, jadwal produksi, dan logistik. SCM menekankan pada pola terpadu menyangkut proses aliran produk dari supplier, manufaktur, retailer hingga pada konsumen akhir. Dalam konsep SCM ingin diperlihatkan bahwa rangkaian aktivitas antara supplier hingga konsumen akhir adalah dalam satu kesatuan tanpa sepakat yang besar. Mekanisme informasi antara berbagai komponen  tersebut  berlangsung  secara transparan.
Mindmap proses Supply Chain Management
3
       Sales Force Automation (SFA)
Sales Force Automation adalah sistem informasi yang digunakan oleh bagian Sales atau Sales Management untuk membantu melakukan otomatisasi fungsi-fungsi sales force management. Koombinasi antara modul SFA dengan modul Marketing Automation (MA) inilah yang biasanya membentuk sebuah aplikasi CRM (Customer Relationship Management). Sales Force Automation berfungsi dalam mengelola kinerja sales force perusahaan, mulai dari mengelola leads yang didapatkan, me-manage potensial penjualan, mengatur aktifitas penjualan, meng-otomatisasi sales quotation, dan seterusnya.
Mindmap proses Sales Force Automation


4            Data Warehouse
Datawarehouse adalah kumpulan macam-macam data yang subject oriented, integrated, time variant, dan nonvolatile.  dalam mendukung proses pembuatan keputusan.
Tujuan utama dari pembuatan data warehouse ada;ah untuk menyatukan data yang beragam ke dalam sebuah tempat penyimpanandimana pengguna dapat dengan mudah menjalankan query (pencarian data), menghasilkan laporan, dan melakukan analisis.
Adapun karakteristik Data warehouse adalah sebagai berikut:
       Subject Oriented (Berorientasi subject)
      Tabel 5. Data Operasiaonal dan Data Warehouse
Data Operasional
Data Warehouse
Dirancang berorientasi hanya pada aplikasi dan fungsi tertentu
Dirancang berdasar pada subjek-subjek tertentu(utama)
Focusnya pada desain database dan proses
Focusnya pada pemodelan data dan desain data
Berisi rincian atau detail data
Berisi data-data history yang akan dipakai dalam proses analisis
Relasi antar table berdasar aturan terkini(selalu mengikuti rule(aturan) terbaru)
Banyak aturan bisnis dapat tersaji antara tabel-tabel
     Data warehouse berorientasi subject artinya data warehouse didesain untuk menganalisa data berdasarkan subject-subject tertentu dalam organisasi,bukan pada proses atau fungsi aplikasi tertentu. Data warehouse diorganisasikan disekitar subjek-subjek utama dari perusahaan(customers,products dan sales) dan tidak  diorganisasikan pada area-area aplikasi utama(customer invoicing,stock control dan product sales). Hal ini dikarenakan kebutuhan dari data warehouse untuk menyimpan data-data yang bersifat sebagai penunjang suatu keputusan, dari pada aplikasi yang berorientasi terhadap data. Jadi dengan kata lain, data yang disimpan adalah berorientasi kepada subjek bukan terhadap proses.
      Integrated (Terintegrasi)      Data Warehouse dapat menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa dipecah-pecah karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep data warehouse itu sendiri. Syarat integrasi sumber data dapat dipenuhi dengan berbagai cara sepeti konsisten dalam penamaan variable,konsisten dalam ukuran variable,konsisten dalam struktur pengkodean dan konsisten dalam atribut fisik dari data. Contoh pada lingkungan operasional terdapat berbagai macam aplikasi yang mungkin pula dibuat oleh developer yang berbeda. Oleh karena itu, mungkin dalam aplikasi-aplikasi tersebut ada variable yang memiliki maksud yang sama tetapi nama dan format nya berbeda. Variable tersebut harus dikonversi menjadi nama yang sama dan format yang disepakati bersama. Dengan demikian tidak ada lagi kerancuan karena perbedaan nama, format dan lain sebagainya. Barulah data tersebut bisa dikategorikan sebagai data yang terintegrasi karena kekonsistenannya.
Time-variant (Rentang Waktu)
   Seluruh data pada data warehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu. Untuk melihat interval waktu yang digunakan dalam mengukur keakuratan suatu data warehouse, kita dapat menggunakan cara antara lain :
  •     Cara yang paling sederhana adalah menyajikan data warehouse pada rentang waktu tertentu, misalnya antara 5 sampai 10 tahun ke depan.
  •      Cara yang kedua, dengan menggunakan variasi/perbedaan waktu yang disajikan dalam data warehouse baik implicit maupun explicit secara explicit dengan unsur waktu dalam hari, minggu, bulan dsb. Secara implicit misalnya pada saat data tersebut diduplikasi pada setiap akhir bulan, atau per tiga bulan. Unsur waktu akan tetap ada secara implisit didalam data tersebut.
  •     Cara yang ketiga,variasi waktu yang disajikan data warehouse melalui serangkaian snapshot yang panjang. Snapshot merupakan tampilan dari sebagian data tertentu sesuai keinginan pemakai dari keseluruhan data yang ada bersifat read-only.
Non-Volatile Karakteristik keempat dari data warehouse adalah non-volatile,maksudnya data pada data warehouse tidak di-update secara real time tetapi di refresh dari sistem operasional secara reguler. Data yang baru selalu  ditambahkan sebagai suplemen bagi database itu sendiri dari pada sebagai sebuah perubahan. Database tersebut secara kontinyu menyerap data baru ini, kemudian secara incremental disatukan dengan data sebelumnya. Berbeda dengan database operasional yang dapat melakukan update,insert dan delete terhadap data yang mengubah isi dari database sedangkan pada data warehouse hanya ada dua kegiatan memanipulasi data yaitu loading data (mengambil data) dan akses data (mengakses data warehouse seperti melakukan query atau menampilan laporan yang dibutuhkan, tidak ada kegiatan updating data).
Data warehouse merupakan pendekatan untuk menyimpan data dimana sumber-sumber data yang heterogen(yang biasanya tersebar pada beberapa database OLTP) dimigrasikan untuk penyimpanan data yang homogen dan terpisah. Keuntungan yang didapatkan dengan menggunakan data warehouse tersebut dibawah ini (Ramelho).
Sedangkan kombinasi data mining verifikasi dan penemuan merupakan perkembangan data mining di masa depan akan mengkombinasikan pendekatan hipotesis dan penemuan. Perkembangan ini menggunakan penalaran yang sama yang mendasari konsep Sistem Pendukung Keputusan (Decision Support System – DSS). Konsep tersebut memungkinkan pemakai dan komputer bekerja sama untuk memecahkan suatu masalah. Pemakai menerapkan keahliannya dalam hal masalah, dan komputer melakukan analisis data yang canggih untuk memilih data yang tepat dan menempatkannya dalam format yang tepat untuk pengambilan keputusan. Menurut Fayyad Usama (1996), proses KDD secara garis besar dapat dijelaskan sebagai berikut: 
Data Selection
Pemilihan (seleksi) data daru sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional. 
Pre-processing/ Cleaning
Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data yang menjadi fokus KDD.
Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi).
Juga dilakukan proses enrichment, yaitu  proses “memperkaya” data yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eksternal. 
Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data 
Data mining
Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan. 
Interpretation/ Evaluation
Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut dengan interpretation. Tahap ini mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya.
Proses KDD secara garis besar memang terdiri dari 5 tahap seperti yang telah dijelaskan sebelumnya. Akan tetapi, dalam proses KDD yang sesungguhnya, dapat saja terjadi iterasi atau pengulangan pada tahap tahap tertentu. Pada setiap tahap dalam proses KDD, seorang analis dapat saja kembali ke tahap sebelumnya. Sebagai contoh, pada saat coding atau data mining, analis menyadari proses cleaning belum dilakukan dengan sempurna, atau mungkin saja analis menemukan data atau informasi baru untuk “memperkaya” data yang sudah ada.
KDD mencakup keseluruhan proses pencarian pola atau informasi dalam basis data, dimulai dari pemilihan dan persiapan data sampai representasi pola yang ditemukan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Data mining merupakan salah satu komponen dalam KDD yang difokuskan pada penggalian pola tersembunyi dalam basis data
Data warehouse bukan hanya tempat penyimpanan data, Datawarehouse adalah Business Intelligence tools, tools to extract, merubah (transform) dan menerima data (load) ke penyimpanan (repository) serta mengelola dan menerima metadata.
Sedangkan fungsi utama dari data warehouse meliputi :
a. Pengambilan dan pengumpulan data(termasuk data dari luar organisasi yang dibutukan)
b. Mempersiapkan data(transforming), seperti membersihkan dan mengintegrasikan data
c. Penyimpanan data (loading)
d. Penyediaan data untuk analisis (query & reporting)







 

4 komentar: