penggalian data, dan Modeling

proses penting yang harus jelas digambarkan untuk penggalian data, analisis dan Modeling adalah:

Data model: Apa data akan tersedia dan bagaimana ia akan mengalir?
Pengumpulan Data: bagaimana data akan dikumpulkan kedua dalam ketentuan teknologi dan fisik?
Mengumpulkan data: apa yang akan mengumpulkan data?
Tipe data: Apa jenis data akan dikumpulkan?
Format Data: bagaimana data akan diselenggarakan?
Pergudangan Data: di mana data akan diselenggarakan?
Pertambangan Data: bagaimana kita mengambil data dari gudang?
Pemodelan Informasi: bagaimana kita akan membuat model, dan apa?
Akses Informasi: bagaimana kita akan mengakses model data dan laporan-laporan?
Presentasi & melaporkan: pada apa yang akan laporan kami?

Kebanyakan perusahaan yang ingin mengetahui informasi penting tentang pelanggan di setiap titik kontak, misalnya:

nilai seumur hidup
X menjual dan potensi upgrade
Biaya Akuisisi

Kesetiaan preferensi saluran/
Pembelian penahan pola perilaku

banyak data yang telah mereka akan mempunyai frekuensi yang berbeda dari mengubah, menyegarkan atau terjadi. Ia akan dipelihara untuk periode yang berbeda. Dalam beberapa kasus, data gabungan dapat dipelihara daripada sumber data. Semua dari faktor-faktor ini mempengaruhi latihan modeling data dan penggantian yang modeling persyaratan perangkat lunak.

Memutar data ke informasi berguna memerlukan:

Mengidentifikasi masalah(s)
berkumpul data setel(s)
Pengembangan model
Verifikasi
penafsiran model
Otomasi hasil pengiriman yang

setelahnya, alat bantu modeling dan teknik-teknik harus digunakan. Ini dapat dibagi menjadi dua kelompok: teori didorong dan data driven.

Teori didorong modeling (pengujian hipotesis) berusaha sahkan atau membantah gagasan. Teori didorong modeling tools mengharuskan pengguna untuk menetapkan kebanyakan model yang berdasarkan pada pengetahuan sebelumnya dan kemudian tes untuk melihat jika model yang sah.

Data driven modeling tools secara otomatis membuat model berdasarkan pola-pola mereka menemukan dalam data. Ini juga harus diuji sebelum ia dapat diterima sebagai sah.

Modeling adalah sebuah proses kursus dengan model terakhir biasanya sebagai kombinasi dari pengetahuan sebelumnya dan informasi yang baru ditemukan. Mesin(s) tools dan teknik-teknik termasuk:

teknik Statistik
Data driven
korelasi alat bantu
analisis Cluster
t-
analisis faktor tes
Analisis Berlawanan
CHAID (Chi-Interaksi Otomatis persegi Detector) pohon keputusan
regresi Linear
Visualisasi

jaringan syaraf regresi logistik alat bantu
analisis Discriminant

 

Leave a Reply

Your email address will not be published. Required fields are marked *