454977663-Karakteristik lima(5)V-Big-Data.pptx

HendraLodang 8 views 22 slides Oct 31, 2025
Slide 1
Slide 1 of 22
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22

About This Presentation

Good learning for you guys


Slide Content

Big Data

Big Data Big data adalah sekumpulan beberapa set data besar dan complex yang akan menjadi susah untuk diproses sehingga membutuhkan database serta perangkat tertentu untuk memprosesnya. (wikipedia, 2014). Sekumpulan data tersebut akan dianalisa menjadi sekumpulan data yang kecil akan tetapi nampak menjadi data yang besar. Big Data telah digunakan untuk menyam- paikan segala macam konsep termasuk jumlah data yang sangat besar, anal- isis media sosial, penerapan next generation dalam hal manajemen data, data real-time, dan lain-lain. Big data memiliki dua tipe data yaitu data struktural dan data Unstruktural. Data Struktural adalah sejumlah data yang dapat dengan mudah untuk dikategorikan dan dianalisis. Data-data ini biasanya dihasilkan oleh perangkat jaringan sensor yang tertanam pada peragkat elektronik, smartphone dan GPS. Data struktural juga mencakup hal-hal seperti angka penjualan, saldo rekening dn data transaksi. Data Unstruktural biasanya data informasi yang bersifat lebih kom- pleks seperti halnya ulasan pelanggan pada situs komersial, foto, dan multimedia lainnya serta jejaring sosial. Data ini tidak dapat dengan mudah untuk dipisahkan kedalam kategori atau dianalisis secara numerik.

Sebuah problem domain di mana teknologi tradisional seperti relational database tidak mampu lagi untuk melayani M embantu kita mengubah apa yang akan dilakukan, bagaimana mendapatkan wawasan, membuat keputusan ( tetapi perubahan tidak menjadi pengganti ataupun ekstensi ) Definisi Big di sini adalah volume, velositas dan variasi datanya . Big Data

Big Data vs Tradisional Data

Taksonomi Big Data

Big Data - Data Dimensi 4V: Volume, Velocity, Variety, dan Veracity Volume, Berhubungan dengan skala ukuran data yang digunakan. Vol- ume data berkembang pesat karena adanya beberapa aplikasi bisnis, sosial, web dan eksplorasi ilmiah. Velocity, Berhubungan dengan kecepatan akses data yang berkaitan dengan kebutuhan data streaming yang bersifat real time. Variety, Berhubungan dengan beberapa bentuk data yang digunakan dalam proses analisis data. Veracity, Berhubungan dengan ketidakpastian dan keakuratan suatu data. Pada beberapa kondisi tingkat akurasi akan didapatkan apabila dilakukan adanya proses filtering dan selecting data.

Big Data - Teknologi Teknologi yang digunakan pada Big Data secara umum diklasifikasikan menjadi 3 bagian yaitu File System Framework Komputasi Frameworks yang digunakan dalam proses komputasi pada Big data yang bersifat open source diantaranya: Apache Hadoop Spark Komersial Google, Amazon, Microsoft T ools Key-Value Store : Key-value pair (KVP) digunakan pada noSQL Document Oriented Database  JSON Big Table Database  Hbase, Casandra Graph Database  Neo4j

Prinsip Big Data tidak membuang data apapun karena residu tersebut mungkin akan menjadi penting sejalannya waktu.

Big Data Processing Software Pengolahan Big Data diklarifikasi menjadi 2 jenis metode : Pengolahan data berbasis batch Pengolahan data berbasis real-time

Big Data Processing Software (Google) Google memiliki teknologi canggih yang memungkinkannya mampu mengolah dan memanfaatkan Big Data dengan tepat. Teknologi : Google Bigtable Google MapReduce Google File System ( GFS)

Google Bigtable S ystem penyimpanan data terdistribusi yang ditujukan untuk mengelola data yang terstruktur dan didesain sebagai system yang handal untuk mengelola data dalam skala petabytes dan dalam ribuan mesin (komputer )

Google Bigtable (Cont..) Google menggunakan Bigtable dalam lebih dari 60 produk dan proyeknya termasuk : Google web indexing, Google Analytics, Google Finance, Orkut, Personalize Search, Writely dan Google Earth. 

Google MapReduce M odel pemrograman rilisan Google yang ditujukan untuk memproses data berukuran raksasa secara terdistribusi dan paralel dalam cluster yang terdiri atas ribuan komputer.

Google File System (GFS) Salah satu jenis dari media penyimpanan data seperti halnya hard disk drive (HDD), flash disk, DVD-R dan sebagainya. Bedanya, GFS menyimpan data-nya secara terdistribusi pada komputer-komputer dalam suatu cluster. GFS bisa menyimpan data super besar yang tidak bisa disimpan dalam suatu HDD paling besar sekalipun.

Hadoop Apache telah merilis software open source yang dikenal dengan nama Hadoop untuk mengebangkan dan menjalankan aplikasi MapReduce. Secara garis besar Hadoop terdiri atas HDFS (Hadoop Distributed File System) dan Hadoop MapReduce. HDFS adalah versi open source-nya GFS (Google File System), dan Hadoop MapReduce adalah versi open source dari Google MapReduce.

Hadoop(Cont..) Keunggulan : Sederhana Fleksibel dalam Ukuran Handal , anti Gagal

Mengapa perlu mengintegrasikan Big Data untuk bisnis? Melihat tren membantu menganalisis kegiatan pelanggan yang telah lalu untuk menjelaskan perilaku masa depannya. Menetapkan patokan - Solusi CRM dengan big data terpadu memungkinkan perusahaan menetapkan pembiayaan selama periode waktu dibandingkan dengan pesaingnya.

Perusahaan yang menggunakan Big Data Yahoo!, Amazon, IBM, Microsoft, Facebook, Twitter, Hewlett-Packard, LinkedIn, RECRUIT, Rakuten Japan, dan masih banyak lagi . Contoh : Microsoft (Windows Azure Hadoop) Oracle (Big Data Appliance) SAP (Hana) EMC (GreenPlum Hadoop) 

Privacy isn’t dead Kata lain dari aturan dalam informasi. Private tidak selalu berarti rahasia, tetapi memastikan bahwa privasi data adalah mendefinisikan suatu masalah dan menegakkan aturan informasi. Aturan tersebut juga tidak selalu mengenai aturan tentang pengumpulan data tetapi juga tentang penggunaan data dan retensinya. Etika Big Data

Etika Big Data(Cont..) Shared private information can still remain confidential . (berbagi informasi tetapi tidak menghilangkan nilai kerahasiaan dari informasi tersebut) Setiap data/informasi yang dibuat dan dishare tidak berarti bahwa nilai kerahasiaan pada data tersebut bisa dilihat oleh banyak orang .

Etika Big Data(Cont..) Big data requires transparency. Big data akan berpengaruh ketika penggunaan sekunder dari set data yang menghasilkan prediksi baru dan kesimpulan.

Terimakasih
Tags