Secara intutitif, baik volume data kemarin(ukuran absolut) maupun hari ini tidak dapat di definiskan sebagai "besar". Selain itu, "besar" hari ini dapat menjadi "kecil" besok. Untuk memperjalas istilah Big Data secara tepat dan menyelesaikan debat, kami dapat menyelidiki dan memahami fungsi definisi berdasarkan kombinasi pendekatan Robert Baird dan Irving Copi. Berdasarkan pendekatan definisi Baird atau Irving, pertama-tama kita akan menyelidiki defini historis dari perspektif evolusi (makna leksikal). Kemudian, kami memperpanjang istilah dari 3Vs menjadi 9Vs atau 32Vs berdasarkan pada motivasinya (makna pengaturan), yaitu menambahkan lebih banyak atribut untuk istilah tersebut. Akhirnya, kami akan menghilangkan ambiguitas dan ketidakjelasan istilah dan membuat konsep lebih tepat dan bermakna.
Definisi Gartner - 3Vs sejak 1997, banyak atribut telah ditambahkan ke Big Data. Di antara atribut-atribut ini tiga di antaranya adalah yang paling populer dan telah banyak dikutip dan diadopsi. Yang pertama disebut interprestasi Gartner atau 3V akar dari istilah ini dapat ditelusuri kembali ke Febuari 2001. Itu dilemparkan oleh Douglas Laney dalam bukunya. Buku putih yang diterbitkan oleh grup Meta, yang kemudian diakuisisi Gartner pada tahun 2004. Douglas memperhatikan bahwa karena melonjaknya aktivitas e-commerce, data telah tumbuh kumulatif data 2. Velocity, yang mewakili kecepatan data yang digunakan untuk mendukung interaksi dan dihasilkan oleh interaksi 3. Variety, yang menandakan berbagai format data dan struktur data yang tidak kompatibel dan tidak konsisten menurut sejarah timeline Big Data, Douglas Laney's Definisi 3Vs telah secara luas dianggap sebagai atribut "umum" dari Big Data tetapi ia berhenti menetapkan atribut ini untuk istilah "BIg Data".
Definisi IBM -4Vs IBM menambahkan atribut lain atau "V untuk "Veracity" di atas notasi 3Vs Douglas Laney, yang dikenal sebagai 4V Data Besar. Ini mendefinisikan setiap "V" sebagai berikut:
- Volume adalah singkatan dari skala data
- Velocity menunjukkan analisis data streaming
- Varetas menunjukkan berbagai bentuk data
- Veracity menyiratkan ketidakpastian data
Zikopoulos et Al menjelaskan alasan dibalik dimensi "V" atau veracity tambahan, yaitu "sebagai respons terhadap masalah kualitas dan sumber yang mulai dihadapi klien kami dengan inisiatif Big Data mereka". Merka juga mengetahui beberapa analis termasuk deskriptor berbasis V lainnya untuk Big Data, seperti variabilitas dan visibilitas.
Microsoft - definisi 6V Demi memaksimalkan nilai bisnis, Microsoft memperluas atribut 3Vs Douglas Laney menjadi 6Vs, yang menambahkan variabilitas, kebenaran, dan visibilitas:
- Volume adalah singkatan dari skala data
- Velocity menunjukkan analisis data streaming
- Varetas menunjukkan berbagai bentuk data
- Veracity berfokus pada kepercayaan sumber data
- Variabilitas mengacu pada kompleksitas set data. Dibandingkan dengan "Variety" (atau format data yang berbeda), itu berarti jumlah variabel dalam set data
- Visibilitas menekankan bahwa anda perlu memili gambaran penuh data untuk membuat keputusan informatif.
Definisi Data Besar 5Vs juga diusulkan oleh Yuri Damchenko pada 2013. Dia menambahkan dimensi nilai bersama dengan definisi IBM 4Vs. Sejak Douglas Laney menerbitkan 3V pada tahun 2001, ada tambahan "Vs", bahkan sebanyak 11, Semua definisi ini, seperti 3Vs, 4Vs, 5Vs, atau bahkan 11Vs, pada dasarnya mencoba mengartikulasikan aspek data. Kebanyakan dari mereka adalah definisi yang berorientasi data, tetapi mereka gagal untuk mengartikulasikan Big Data dengan jelas dalam hubungan dengan esensi BDA. Untuk memahami makna penting, kita harus mengklarifikasi apa itu data. Data adalah segalanya di dalam alam semesta. Ini berarti bahwa data berbeda dalam batasan kapasitas teknologi yang ada,. Jika kapasitas teknologi diizinkan, tidak ada batasnya.
Komputasi adalah tahap-tahap untuk mendapatkan sebuah hasil fungsi dari input yang diberikan
Contoh:
- Input -> Proses -> Output
- Table Basis Data -> SQL - Hasil Kueri
- Dokumen -> Google -> Dokumen relevan dengan kueri
- Bilangan Bulat -> Konversi Suhu -> Bilangan suhu dalam satuan celcius
Segala sesuatu yang dapat dikomputasi dengan mesin disebut “computable”, Hal ini membentuk sebuah teori komputablilitas (computability theory), atau menyatakan kebalikan yaitu menunjukkan apa yang tidak dapat diselesaikan dengan komputasi (non computable function) dan komputasi sangat erat hubunganya dengan Algoritma.
Untuk menyelesaikan masalah suatu fungsi
F: X -> Y, dimana x anggota himpunan X dan Y hasil Maka kita memerlukan Algoritma A untuk menyelesaikannya, Algoritma A adalah langkah-langkah berhingga yang harus dicapai untuk menemukan solusi.
Jika nilai x diberikan, fungsi berhenti = computable, fungsi tidak berhenti menghitung (running forever) = non computable function
Komputasi; Program; Algoritma
Contoh 1
F: x -> x^2 + 2x
Nilai masukan x diterapkan langkah-langkah
t1 = x * x
t2 = 2 * x
t3 = t1 + t2
f(x) = t3
Noncomputable Functions:
- Ada fungsi yang tidak bisa dibuat algoritmanya
- Tidak ada output yang mungkin dihasilkan
- Running forever
Komputasi Modern memiliki ciri:
- Sumber daya yang disediakan bersifat heterogenous (terdiri dari berbagai jenis perangkat keras, sistem operasi, serta aplikasi-aplikasi lain)
- Komputer – komputer terhubung ke jaringan yang luas kapasitas badwidth yang beragam
- Komputer maupun jaringan tidak terdeteksi, bisa hidup atau mati sewaktu-waktu tanpa jadwal yang pasti
Tokoh yang berpengaruh pada perkembangan komputasi modern adalah John Von Neumann (1903-1957), Ilmuwan yang peletak dasar model kerja komputer.
Masalah yang dipecahkan pada Komputasi Modern:
- Akurasi (Floating Point)
Tipe data floating point memiliki range penyimpanan numerik yang besar, sehingga dapat digunakan oleh komputer untuk melakukan komputasi yang akurat.
- Kecepatan (Hz)
Komputasi harus dapat dilakukan dalam waktu yang cepat ketika mengolah suatu data. Sehingga perlu metode kecepatan untuk mengolah perhitungan dalam waktu singkat.
- Problem Volume Besar (Down Sizzing/Pararel)
Data yang besar dapat menjadi masalah jika ada yang
terlewatkan. Digunakan metode Down
Sizzing atau paralel pada komputasi modern untuk menangani masalah volume
yang bersar.
Modelling (NN & GA)
Perlu memodelkan algoritma tertentu untuk menyelesaikan masalah yang komplek. Seperti: Neural Network (Jaringan Syaraf Tiruan) / Gneetic Algorithm).
Kompleksitas
Kompleksitas komputasi adalah cabang dari teori komputasi dalam ilmu komputer yang berfokus pada mengklasifikasikan masalah komputasi sesuai dengan kesulitan inheren mereka.