Mahata adalah penggunaan seluruh kisaran data yang
tersedia untuk mentransformasi suatu layanan atau organisasi. Netflix
menunjukkan bagaimana suatu perusahaan video tayang sesuai permintaan (video on
demand) bisa menempatkan mahadata di intinya. Layanan seperti Netflix
melibatkan lebih banyak kominikasi dua arah dibanding siaran konvensional.
Perusahaan itu tau siapa yang menonton apa, kapan, dan dimana. Sistemnya dapat
melakukan pengukuran lintas indeks atas minat seorang penonton, dan memberi
umpan balik. Kesukaan orang bisa mengubah proses pembuatan seri itu
Mahadata
juga berpotensi mengubah pekerjaan polisi dengan memprediksi kemungkinan lokasi
kejahatan, menggerakkan foto yang diam, memberi wahana demokrasi sejati untuk
pertama kali, memprediksi buku laris berikutnya, memberi pemahaman mengenai
struktur dasar alam dan merevolusi dunia kedokteran
Kedigdayaaan
mahadata berasal dari pengumpulan banyak sekali informasi dan menganalisisnya
dalam cara yang tak dapat dilakukan manusia tanpa komputer, suatu upaya
melakukan hal yang tampak mustahil. Data sudah ada sejak 6000 tahun ke awal
masyarakat petani untuk melihat konsep data menjadi tulang punggung peradaban.
Data berevolusi pada abad ke 17 dan ke 18 untuk menjadi alat pembuka jendela
masa depan. Namun upaya itu selalu dibatasi sempitnya data yang tersedia dan
keterbatasan kemampuan menganalisisnya, mahadata membuka dunia baru, kadang
caranya mencolok seperti komputer Amazon Echo yang berinteraksi dengan suara.
Kadang ada di balik layar, seperti kartu pelanggan pasar swalayan. Yang jelas
penerapan mahadata makin banyak dan berpotensi besar berdampak baik maupun
buruk bagi kita.
Menurut
kamus, data berasal dari bentuk jamak kata Latin datum artinya benda yang
diberi,. Sebagian besar saintisi menganggap paham bahasa Latin dan memberitahu
data adalah kata jamak jadi dalam bahasa Inggris, kata mereka yang benar itu “the
data are convincing” bukan “the data is convincing. Namun Oxford English
Dictionary yang biasanya konservatif mengakui bahwa penggunaan data sebagai
kata benda tunggal massal merujuk ke satu kumpulan sekarang biasanya dianggap
baku. Jelas kedengarannya lebih wajar, jadi dianggap data sebagai kata benda
tunggal massal. Benda yang diberi itu sendiri tampak tak jelas. Paling sering
dimaksud adalah angka dan ukuran, walau bisa berupa apapun yang bisa dicatat
dan digunakan belakangan
Data
bisa dianggap sebagai dasar piramida pemahaman : pengetahuan, informasi, data
Dari
data membangun informasi. Informasi mengumpulkan koleksi data terkait agar memberitahu
sesuatu yang berarti mengenai dunia. Dari informasi membangun pengetahuan,
pengetahuan adalah tafisr atas informasi agar bisa emnggunakannya dengan
membaca buku, lalu mengubah informasi untuk membnetuk gagasan, pendapat, dan
tindakan masa depan, mengembangkan pengetahuan
Data
bisa jadi berupa kumpulan angka, penataannya dalam tabel yang menunjukkan,
misalnya jumlah ikan di daerah tertentu di laut, pada tiap jam, bakal memberi
informasi. Seseorang yang menggunakan informasi untuk memutuskan kapan waktu
terbaik untuk pergi menangkap ikan disebut memiliki pengetahuan
Sejak
peradaban manusia bermula, manusia sudah memajukan teknologi untuk mengelola
data dan mendaki piramida. Awalnya adalah tablet lempung, yang digunakan di
Mesopotamia setidaknya 4000 tahun lalu. Tablet memungkinkan data disimpan
secara praktis dan bisa di gunakan kembali, bukan disimpan dalam kepala atau
dicoretkan ke dinding gua. Tablet adalah penyimpanan data yang bisa dibawa.
Pada waktu yang sama, pengolah data pertama dikembangkan, berupa sempoa yang
sederhana tapi sangat berdaya, sempoa, yang awalnya menggunakan batu bertumpuk,
kemudian manik di kawat, memungkinkan pengolaan data angka sederhana. Namun
meski kemampuan pengelolaan data meningkat dari abad ke abad, arti mahadata baru
tampak pada akhir abad ke 19 akibat ada masalah dalam penanganan sensus
Pada
hari awal pelaksanaan sensus di USA, makin besarnya jumlah data yang harus
disimpan dan diolah tampak bisa menghabiskan sumber daya yang tersedia untuk
menanganinya. Keseluruhan prosesnya tampak akan kacau. Ada periode 10 tahun
antarsensus tapi waktu makin panjang untuk tabulasi data sensus. Tak lama
kemudian ketika 1 sensus berikutnya sudah tiba, masalah itu dipecahkan dengan
mekanisasi, alat elektromekanis memungkinkan pengunaan kartu berlubang, masing
mewakili sepotong data untuk dimanipulasi otomatis jauh lebih cepat daripada
yang dapat dilakukan manusia. Menginjak akhir 1940, kebangkitan komputer
elektronik, peralatan mencapai tingkat kedua piramia. Pengolahan data berganti menjadi
teknologi informasi. Sudah ada penyimpanan data sejak penciptaan tulisan. Buku
adalah penyimpanan informasi
Untuk
beberapa lama tampakmya seolah tahap terakhir otomatisasi piramida mengubah
informasi menjadi pengetahuan berharga, bakal memerlukan sistem berbasis
pengetahuan. Program komputer itu mencoba menangkap aturan yang manusia gunakan
untuk menerapkan pengetahuan dan menafsirkan data. Namun sistem berbasis
pengetahuan yang bagus terbukti sukar dicapai karena 3 alasan, pertama, para
pakar manusia tak buru membuat diri sendiri jadi tak diperlukan dan jarang mau
bekerjasama. Kedua pakar manusia sering tak tau bagaimana mereka mengubah
informasi menjadi pengetahuan dan tak dapat menyatakan aturannya untuk orang
TI, kalaupun mereka mau dan terakhir, aspek realitas yang dibuat modelnya
dengan cara itu terbukti terlalu kompleks untuk memberi hasil berguna
Dunia
nyata sering kacau (khaotik) dalam arti matematis. Bukan berarti yang terjadi
itu acak justru sebalikmnya,artinya ada banyak sekali interaksi antarbagian
dunia yang dipelajari sehingga perubahan kecil sekali sekarang bisa menghasilkan perubahan besar pada hasil
masa depan. Prediksi masa depan secara signifikan jadi praktis mustahil
Namun
sekarang tersedianya internet dan komputer yang puter terbaru, karena
tersedianya internet dan komputer yang mudah dibawa, mahadata memberi
alternatif, pendekatan lebih pragmatis untuk menuju puncak piramida data,
informasi pengetahuan. Sistem mahadata mengambil volume besar data, data
biasanya mengalir cepat dan tak berstruktur, lalu menggunakan teknologi
informasi terbaru untuk menangani dan menganalisis data dengan cara yang kurang
kaku dan lebih tanggap, sampai baru ini, itu mustahil. Penanganan data di skala
itu tak praktis, jadi orang yang mempelajari suatu bidang bakal mengandalkan
sampel
Contoh
pengambilan sampel adalah jajak pendapat, dimana para pelakunya mencoba
menyimpulkan pendapat suatu populasi berdasarkan sampel kecil. Kelompok kecil
dipilih dengan cermat (kalau jajak pendapatnya bagus) agar mewakili keseluruhan
populasi, tapi selalu ada asumsi dan tebak – tebakan yang tak terlibat.
Beberapa pemiluhan umum baru ini sudah menunjukkan bahwa jajak pendapat tak
bisa memberi lebih daripada tebakan bagus mengenai hasilnya, pemilihan umum
Kerajaan Inggris 2010 jajak pendapat keliru. Referendum Brexit 2016 dan
pemilihan presiden USA 2016, teknologi yang sekarang dipunyai bisa mengakses
data terus – menerus, bukan melalui mekanisme mahadata gaya lemas yang kikuk
dan lembut seperti sensus atau pemilihan umum
Bagi
para pecinta data, masa lalu, masa kini, dan masa depan punya nuansa tertentu.
Secara tradisional, data dari masa lalu menjadi satunya kepastian, data paling
awal utamanya merupakan catatan masa lalu mengenai pertanian dan perdagangan.
Para tukang hitunglah yang mengerti nilai data. Yang mereka garap kala itu
tidak selalu dipegang, karena konsep angka itu sendiri masih belum tetap
Kota
Uruk yang berdiri sekitar 6000 tahun lalu ditempat yang sekarang Irak. Orang
Uruk segera mendapat data dari perdagangan mereka, tetapi mereka belum
menyadari bahwa angka bisa diterapkan untuk segala benda. Data bergandengan
dengan perdagangan, juga dengan pendirian negara. Kata statisik punya asal yang
sama dengan state (negara) aslinya statistik adalah data mengenai negara, entah
data dikumpulkan untuk perdagangan atau pajak atau penyediaan barang, masa lalu
dianggap penting untuk diketahui, dalam pengertian itu, ketergantungan kepada
data masa lalu bukan solusi sempurna, melainkan cerminan pragmatis atas
kemungkinan, idealnya adalah mengetahui negara aslinya statistik adalah data
mengenai negara. Data dikumpulkan untuk perdagangan atau pajak atau penyediaan
barang masa lalu dianggap penting untuk diketahui
Ketergantungan
kepada data masa lalu, cerminan pragmatis atas kemungkinan. Idealnya adalah
mengetahui masa kini juga, namun hanya mudah untuk transaksi lokal, sampai
mekanisme mahadata tersedia menjelang akhir abad ke 20, banyak organisasi masih
menganggap masa kini tidak ada. Masa kini menjadi bagian mahadata pokok untuk
masa depan
Penulis
menerima laporan penjualan untuk misalnya 6 bulan dari Januari ke Juni pada
akhir September dan akan mendapat royalti pada Oktober, sistem pencatatan
penjualan tidak ada, tapi tidak diintegrasikan. Penerbitan menggunakan
penjualan atau retur, buku tercatat, terjual, bila dikirim ke toko buku tapi
bisa diretur/dikembalikan dan data penjualannya dihapus kapan saja pada masa
depan, perjanjian komersial berakar pada masa lalu, dan berubah ke pendekatan
mahadata adalah tantangan besar. Pada abad ke 17, ada kesadaran bahwa data yang
dikumpulkan dari masa lalu dapat diterapkan untuk masa depan, menggunakan data
dari pengalaman untuk membantu bersiap untuk menghadapi berbagai kemungkinan
pada masa depan, namun yang baru adalah penggunaan data sedemikian dengan sadar
dan tersurat
London
abad ke 17 dengan seorang pembuat kancing John Graunt, karena rasa ingin tau
saintifik. Graunt mendapatkan catatan mortalitas, dokumen yang berisi rincian
kematian di London antara 1604 – 1661. Graunt hanya tertarik mempelajari angka melainkan
juga memadukan apa yang dia dapat darinya dengan sebanyak mungkin sumber data
lain. conton rincian kelahiran. Dia melihat bagaimana perubahan populasi London
(tak ada sensus) dan pengaruh berbagia faktor terhadap harapan hidup. Kombinasi
data masa lalu dan spekulasi masa depan itulah yang membantu bermulanya satu
industri yang mendunia di warung kopi London, berdasarkan perhitungan Graunt
buat, data dipelajari secara sadar dan digunakan untuk membuat rencana, data akan membentuk rantai bercahaya,
menautkan apa yang sudah terjadi dan apa yang akan terjadi. Yang dikuantifikasi
kemudian bukan hanya harapan hidup, meski berguna buat bisnis asuransi. Sains
prakiraan (forecasting), prediksi data masa depan, penting bagi segalanya dari
meteorologi sampai perkiraan volume penjualan, prakiraan berarti memperkirakan
masa depan, dengan mengumpulkan data dari masa lalu dan sebanyak mungkin dari
masa kini, gagasan prakiraan adalah melempar angka ke masa depan. Kualitas
upaya semacam itu sangat beragam, mengeluhkan ketepatan prakiraan cuaca sudah
menjadi hobi nasional Kerajaan Inggris sejak prakiraan cuaca mulai dimuat di
The Times pada 1860, walau sekarang
sudah jauh lebih baik dibanding 40 tahun lalu, dalam tiap bisnis angka tak
akurat, dan perusahaan biasanya mengadakan pemeriksaan apa yang salah dengan
bisnisnya, pemeriksaan mengabaikan kenyataaan bahwa prakiraan pasti salah, yang
terjadi adalah prakiraan tak sama dengan penjualan, tapi pemeriksaan berusaha
mencari tau mengapa penjualan tak sama dengan prakiraan
Pola
adalah mekanisme utama yang digunakan untuk mengerti dunia, tanpa membuat
kesimpulan berdasarkan pola untuk mengindentifikasi pemangsa dan kawan, makanan
atau ancaman, tak bakal bertahan lama. Sains sendiri sola penggunaan pola tanpa pola perlu teori baru untuk tiap atom,
tiap benda, tiap hewan, guna menjelaskan perilakunya
Ketika
wahana antariksa Viking 1 pada 1976 memotret rincian permukaan planet Mars, ada
satu fotonya yang langsung ditafsirkan otak pengenal pola sebagai wajah, ukiran
wajah berukuran besar. Foto lebih baru menunjukkan bahwa itu ilusi,
disebabkan bayangan ketika Matahari ada
di sudut ruangan, bebatuan yang menimbulkan bayangan tak mirip wajah tapi
hampir mustahil untuk tidak melihat wajah di foto asli. Bahkan ada kata melihat
gambaran sesuatu yang tidak benar ada disana: pareidolia. Dengan cara yang
sama, keseluruhan usaha prakiraan didasari pola
yang menjadi kekuatan dan kelemahan terbesarnya
Peristiwa
acak tak terjadi merata, ada pengumpulan dan kekosongan. Ketika penyakit pola
muncul, sukar menolak gejala kuatnya, alasan perusahaan lotre menyediakan
statistik adalah karena banyak orang percaya bahwa satu bola yang belum keluar
akhir ini sudah waktunya keluar, tidak ada hubungan yang mengaitkan satu undian
dengan undian lain. lotre tak punya ingatan. Di sebagian besar, entah cuaca,
perilaku bursa saham, atau penjualan sepatu bot karet, masa depan tak
sepenuhnya tak berhubungan dengan masa lalu, di situ ada hubungan yang
diteliti, sampai batas tertentu bisa menggunakan data untuk membuat prakiraan
bermakna, namun masih perlu berhati untuk mengerti batas proses prakiraan
Cara
tergampang menggunakan data untuk memprediksi masa depan adalah berasumsi
keadaan akan sama seperti kemarin. Metode paling sederhana bisa bekerja dengan sangat
baik, memerlukan sedikit saja daya
komputasi
Pada
2016, Hukum Moore, yang memprediksi bahwa jumlah translator di komputer akan
mengganda setiap satu atau dua tahun sudah berlaku selama 50 tahun lebih, Hukum
Moore akan berlaku lagi pada satu titik, dan berharap kegagalannya terjadi
segera selama setidaknya 20 tahun, lebih banyak lagi hal yang sama sudah
lumayan ampuh sejauh ini
Sepanjang
sebagian besar masa sejarah telah terjadi inflasi. Nilai uang turun terus,
pernah ada periode deflasi, dan masa ketika redefinisi satuan mata uang
menggeser standar, tapi secara keseluruhan nilai uang turun terus bekerja baik
sebagai alat prediksi. Bagi pemrakira, sedikit sistem yang seserdahana itu.
Efek musim hanya satu pengaruh yang tercermin dalam data masa lalu yang bisa
memengaruhi masa depan. Bila ada variabel seperti itu, prakiraan bisa kacau,
apalagi jika sekumpulan masukan saling berinteraksi hasilnya bisa berupa sistem
khaotik matematik yang tidak bisa diprediksi melebihi beberapa hari ke depan,
sistem cuaca secara keseluruhan punya
banyak sekali faktor kompleks, semuanya saling berinteraksi, sehingga
perbedaan kecil di konsisi awal bisa menghasilkan perbedaan besar kemudian
Istilah
angsa hitam dikenal karena Nassim Nicholas, The Black Swan, walau konsepnya
lebih tua. Sejak 1570, angsa hitam digunakan sebagai metafora untuk kelangkaan
ketika seseorang bernama T Draunt menulis Captaine Cornelius is a blacke swan
in this generation, angsa hitam dalam statistik adalah bahwa pembuatan prediksi
berdaar data statisik adalah pembuatan prediksi berdasar data tak lengkap dan
itu hampir selalu terjadi dalam kenyataan mengandung risiko terjadi sesuatu
mendadak dan belum pernah ada pada masa lalu, penggunaannya dalam statisik
merujuk ke fakta bahwa Eropa, sampai mulai meneliti fauna Australia, dapat
membuat prediksi, semua angsa itu putih, yang selalu berlaku, namun sesudah
melihat satu angsa hitam Australia, keseluruhan premis buyar. Angsa hitam
mencerminkan perbedaan antara dua teknik logika, deduksi dan induks, berkat
Holmes prakiraan sebagai deduksi, mengenai apa yang sudah terjadi, namun proses
deduksi berdasarkan set data lengkap, tanpa ketersediaan deduksi kembali ke
induksi
Tujuan
mahadata adalah meminimalkan risiko kegagalan prakiraan dengan mengumpulkan
sebanyak mungkin data, memungkinkan para pengendali mahadata melakukan hal yang
dulu belum mungkin. Prakiraan meteorologi adalah yang pertama menyambut
mahadata. Met Office adalah pengguna super komputer terbesar di Kerajaan
Inggris, melahap banyak data seban hari untuk memproduksi sejumlah prakiraan
yang dikenal sebagai ensembel, prakiraan dipadukan untuk memberi probabilitas
terbaik hasil tertentu di lokasi tertentu dan prakiraannya jauh lebih baik
daripada dulu, namun tak bisa mengandalkan sepanjang waktu atau mendapat
prakiraan yang berguna untuk lebih daripada 10 hari ke depan. Mahadata bisa
menghilangkan bahaya salah satu alat prakiraan berbahaya, upaya memberi kesan
punya mahadata padahal hanya ada sebagian kecil data
Pernah
ada masa ketika mahadata hanya dapat ditangani sekali karena butuh waktu dan
upaya yang sangat banyak untuk mengolahnya, sensus atau pemilihan umum dapat
menanyakan data semua orang tapi tidak dimungkinkan untuk hal lain dengan
sistem penanganan data manual yang tersedia, mengembangkan konsep sampel.
Mencakup memilih sebagian populasi, mengambil datanya lalu mengeksploitasi
temuannya ke populasi secara keseluruhan
Pembayaran
PLR di Kerajaan Inggris PLR (Public Lending Right) adalah mekanisme untuk
membayar penulis bila buku karyanya dipinjam dari perpustakaan, karena tidak
ada sistem yang mengumpulkan data pinjaman di seluruh negara, diambil sampel 36
perpustakaan, seperempat dari seluruh perpustakaan senegara, kemudian sampel
dikalikan 4 untuk menggambarkan peminjaman buku senegara, beberapa angka akan
tak akurat, jika menulis buku mengenai Swindon, buku itu akan dipinjam lebih
dari sering di Swindon daripada Hampshire, yang perpustakaannya dijadikan
sampel, akan ada banyak alasan lain mengapa sekumpulan perpustakaan tertentu
mungkin tak mewakili secara akurat peminjaman buku tertentu, sampel lebih baik
daripada tidak ada sama sekali, tapi tak bisa dibandingkan juga dengan
pendekatan mahadata yang mengambil data dari semua perpustakaan. Sampel bukan
hanya pendekatan yang digunakan untuk jajak pendapat dan memperoleh statistik
Hanya
sedikit yang melibatkan populasi secara keseluruhan, sampai akhir ini,
diambillah sampel yang mewakili untuk mengecek dampak suatu perlakuan atau diet
terhadap orang yang ada disampel, ada 2 masalah dengan pendekatan, satu sangat
sukar mengisolasi dampak perlakuan tertentu, dan dua sangat sukar memilih
sampel yang mewakili, mengumpulkan cukup banyak orang dengan proporsi yang
tepat untuk mencakup variasi akan mempengaruhi hasil penelitian atau jajak pendapat
Jika
mengetahui apa saja faktor signifikannya, ada mekanisme untuk menentukan ukuran
sampel yang tepat agar mewakili. Namun banyak penelitian medis, hanya mampu
menyediakan sebagian kecilnya, makanya sering mendapat hasil penelitian yang
bertentangan. Banyak survei dan jajak pendapat yang kurang memadai jumlah
sampel maupun keterwakilannya untuk mengatasi itu, para pelaku jajak pendapat
mencoba mengoreksi perbedaan antara sampel dan apa yang dianggap seharusnya.
Angka jajak pendapat bukan nilai sebenarnya, melainkan hasil koreksi dengan
menebak angka seharusnya
Penggunaan
sampel akan berlanjut di banyak bidang karena alasan biaya dan kepraktisan,
walau kepercayaan terhadapnya bakal lebih terbantu kalau konsumen hasil
dipermudah untuk mengetahui asumsi dan pembobotannya. Mahadata menawarkan
kesempatan untuk menghindari jebakan sampel dan mengambil masukan dari kelompok
besar sehingga ada lebih sedikit ketidakpastian, secara tradisional, kiranya
memerlukan pemilihan umum yang persiapan dan pengambilan hasilnya butuh
berminggu kalau pemberi suara bersedia menjalani prosesnya, berkali dalam satu
tahun, sistem modern membuat relatif mudah mengumpulkan beberapa jenis data,
bahkan pada skala besar, dan organisasi makin melakukannya. Menggunakan proksi,
gagasannya memulai dengan data yang bisa dikumpulkan dengan mudah, data yang
bisa diambil tanpa harus membuat populasi melakukan sesuatu. Dulu data hasil
pengamatan sangat sukar di dapat para ahli statisik, kemudian datanglah
internet, biasanya pergi ke satu situs web berniat melaukan sesuatu, menemukan
suatu informasi di mesin pencari, atau membeli sesuatu di toko daring, namun
para pemilik situs bisa menangkap jauh lebih banyak data daripada yang disadari
bagi apa yang dicari, memperkenalkan data digunakan memberikan kepraktisan tapi
memberi sumber data hebat bagi perusahaan
Para
pemilik mesin pencari dominan dapat mengumpulkan segala macam informasi untuk
memprediksi niat kita dalam pemilihan umum, penetapan mahadata tidak seperti
sistem berbasis pengetahuan, tak ada yang harus memberitahu sistem mengenai apa
saja aturannya, dengan mencocokan kuantitas besar data dan hasil, sistem dapat
belajar seiring waktu untuk menghasilkan gambaran populasi yang makin akurat
Gigo
adalah singkat populer, kepanjangannya, garbage in, garbage out, masuk sampah,
keluar sampah. Premisnya sederhana sebagus apapun sistem, jika data yang
diberikan itu sampah, keluarannya juga sampah, satu potensi masalah mahadata
adalah apabila data masukan kurang besar, memang bisa menggunakan data
pencarian untuk mencari tau hal mengenai sebagian populasi, tapi hanya bagian
populasi yang menggunakan mesin pencari. Tanpa mekanisme untuk mendeteksi
sampah dan memodifikasi sistem agar menghindarinya, GIGO membuat sistem
memelihara kekeliruan. Sistem mulai berfungsi dalam dunianya sendiri, bukan
mencerminkan populasi yang hendak dimodelkan
Para
pembangun sistem mahadata prediktif gampang mendapat kompleks Hari Seldon, Hari
Seldon ialah tokoh utama novel fiksi sains klasik Isaac Asimov, Foundation, dalam
seri itu, Hari Seldon membentuk kelompok ahli matematika yang menggunakan sains
psikosejarah untuk membangun model masa depan imperium galaktik, tujuan mereka
mengurangi periode barbarisme yang tak terhindarkan apabila imperium runtuh,
sebagaimana terjadi sepanjang sejarah, dramanya tapi di dunia nyata tak ada
yang namanya psikosejarah. Tidak peduli sebanyak apapun data yang dimiliki,
bisa memprediksi masa depan negara dan bangsa seperti cuaca, negara dan bangsa
adalah sistem khaotik sistematis. Ada terlalu banyak interaksi antar komponen
sistem sehingga mustahil membuat prediksi bagus melebihi cakrawala waktu
singkat dan tiap individu manusia bisa menjadi angsa hitam, menghasilkan sistem
yang benar kompleks, para pembuat sistem mahadata perlu berhati agar tak merasa
seperti Hari Seldon yang menganggap teknologi memungkinkannya memprekdiksi masa
depan manusia dengan akurat karena mereka akan gagal
Data
tak mesti hanya kumpulan data. Data bisa bermacam. Dalam sains, data biasanya
disajukan bukan sebagai nilai spesifik, melainkan kisara yang disajikan dengan
batas kesalahan, bukannya mengatakan bahwa nilainya adalah 1 bisa dikataan 1 = 0,05 pada tingkat
kepercayaan 99% artinya berharap menemukan nilainya pada kisaran antara 0,95
dan 1,05 dalam 99 dari 100 kesempatan. Ketiadaan presisi hadir dalam data, tapi
jarang ditunjukkan dan berarti bisa membaca hal yang sebenarnya tak ada pada
data
Jika
mengerjakan mahadata dengan benar, diatasi bukan hanya ketidakakuratan yang
selalu ada akibat pengambilan sampel, melainkan juga perluasan pandangan diatas
data yang berguna dari masa lalu agar mencakup masa kini, memberi gambaran
terbaik atas masa depan yang dekat, itu karena analisis statistik konvensional
mahadata bisa terus diperbaharui mengikuti tren. Mahadata memperkenankan
menangani irama dan variasi yang lebih rinci, bisa menghadirkan banyak tambahan
dan melihat apakah ada gunanya dalam membuat prakiraan jangka pendek
Pengamat
kereta dan penulis buku harian menggunakan pendekatan mahadata sebelum ada
teknologi maju. Penulis buku harian sebagai pengumpul mahadata purba karena
mereka mampu mengumpulkan hal kecil yang tak bakal dicatat orang lain, untuk
mengisi buku harian menjadi mahadata hanya diperlukan penataan. Dari 1937
sampai 1949 di Kerajaan Inggris, satu program yang dikneal sebagai Mass
Observation melakukan itu, satu panel penulis nasional menulis buku harian,
menjawab pertanyaan, dan mengisi survei. Pada waktu yang sama, satu tim
peneliti dibayar untuk ikut serta mencatat kegiatan dan percakapan publik,
pertama di Bolton lalu di seluruh negeri. Hasil kegiatan dikumpulkan dalam 3000
lebih laporan yang menyajikan rangkuman data luas tingkat tinggi, semua data
tersedia untuk publi, menjadi sumberdaya yang luar biasa, proyek kedua semacam
itu dimulai pada 1981 dengan panel lebih kecil sekitar 450 sukarelawan yang
memasukkan informasi ke kumpulan data
Charles
Babbage berhubungan erat dengan komputer, dan meski Babbage tidak pernah
berhasil membuat teknologinya bekerja dan mesin komputasinya hanya berhubungan
secara konseptual dengan komputer sungguh sesudahnya, ia tak diragukan lagi
bahwa Babbage berperan membuat mahadata menjadi praktis
Babbage
sedang menolong kaean lama, John Herschhel, putra ahli astronomi, dan pemusik
kelahiran Jerman William Herschel, waktu itu musim panas 1821 dan Herschel
meminta Babbage ikut bersamanya mengecek buku tabel astronomi sebelum dicetak,
baris demi baris angka yang harus diperiksa ketepatannya amat sangat
membosankan. Selagi Babbage menggarap tabel dengan cermat memeriksa tiap nilai.
Babbage tidak dapat melakukannya secara praktis dengan mesin komputasi mekanis
tapi dia punya gagasan dengan Herman Hollerith, orang Amerika yang
menyelamatkan sensus AS dengan mekanisasi data, keduanya dilhami alat tenun
Jacquard, alat tenun Jacquard adalah ciptaan zaman Ratu Victoria yang
memungkinan pola tenun sustra diprogram di sekumpulan kartu, masing dengan pola
lubang tertentu untuk menandakan warna apa yang digunakan. Babbage ingin
menggunakan kartu seperti itu pada komputer untuk umum, tapi tak bisa
menyelesaikan rancangannya yang jelimet. Hollerith mundur selangkah dari
pengolah informasi Babbage menyebutnya mill, bagian tercerdas rancangan namun
Hollerith menyadari bahwa misalnya tiap baris informasi dari sensus diterakan sebagai
lubang di kartu, alat elektromekanis dapat menata dan mengumpulkan kartu untuk
menjawab berbagai pertanyaan dan mulai mendapatkan manfaat yang bisa diberikan
mahata
Alat
yang terlibat disebut tabulator. Penggunaan tipikal mungkin untuk menghitung berapa
orang yang ada dalam berbagai kelompok umur, jenis kelamin, ras, dan
sebagainya. Kartu di lewatkan di tabulator (awalna secara manual belakangan
secara otomatis), dimana paku logam menyambungkan rangkaian listrik dengan
mencelup ke air raksa ketika melewati lubang di kartu. Tiap denyut listrik
memajukan satu jarum petunjuk. Operator kemudian menaruh kartu ke laci tertentu
di meja penataan, sebagaimana di arahkan tabulator (bagian dalam proses juga
kemudian diotomatisasi. Tabulator Hollerith diproduksi perusahaan Tabulating
Hollierith diproduksi perusahaan Tabulating Machine Company miliknya, yang
berubah menjadi International Business Machines, IBM menjadi raksasa teknologi
informasi. Pendekatan mekanis adalah laju pengolahan datanya selalu terbatas, pendekatan
itu memungkinkan sensus dikelola dalam 10 tahun masa antarsensus tapi tak dapat
menyediaka analisis dan manipulasi luwes. Satu alasan mahadata bisa dimudahkan
adalah karena kecepatan beralih dalam 2 dasawarsa berakhir ke teknologi
berjejaring berkecepatan ultratinggi yang memungkinkan operasi mahadata sejati.
Hollerith string untuk sebaris informasi di kartu masih bisa dipakai. Pada
1995, komputer personal, salah satu alat wajib mahadata, sudah lazim, meski
belum gampang dibawa seperti hp, alat wajib kedua, konektivitas lewat
internet,bagian teka teki mahadata, algoritma
Walau
Oxford English Dictionary bersikeras bahwa algoritma berasal dari Yunani kuno
untuk angka (agak mirip Aritmetika), sebagian besar sumber lain memberitahu
bahwa algoritma kebanyakan data berawalan Al berasal dari bahasa Arab, kata itu
berasal dari nama penulis buku matematika berpengaruh pada zaman pertengahan,
al – Khwarizmi, algoritma merujuk ke satu set prosedur dan aturan yang
memungkinkan menangani data dan melakukan sesuatu dengannya. Aturna yang sama
bisa diterapkan ke berbagai set data. Mirip sekali definisi program komputer
dan banyak program menggunakan algoritma tapi tak perlu komputer untuk
algoritma dan program komputer tidak harus mencakup algoritma, algoritma Fibonacci,
1,1,2,3,5,8,21,34,55,89,144
Deretnya
panjang tak berhingga, tapi algoritma untuk membuatnya pendek seperti awali
dengan dua angka satu, tambahkan angka terakhir di deret dengan angka
sebelumnya untuk menghasilkan nilai berikutnya. Algoritma untuk mahadata bisa
jauh lebih canggih. Namun algoritma deret Fibonacci, intinya aturan dan
prosedur yang memperkenankan sistem menganalisis atau membangkitkan data. Dari
satu deret, ambil hanya angka ganjil, jika diterapkan algoritma ke deret
Fibonacci mendapat; 1,1,3,5, 13, 21, 55, 89
Data
itu tak memiliki nilai. Namun jika data aslinya adalah mengenai pembayar pajak
dan menggunakan algoritma untuk angka ganjil
Tantangan
bagi layanan konsumen efektif berbasis data berasal dari cara data menghadap
kedua arah: ketoko atau bank ke konsumen, toko ingin mengetahui sebanyak
mungkin mengenai konsumen, supaya bisa mempertahankan dan mendapat sebanyaknya
uang dari kita. Data memungkinkan toko memberi layanan lebih baik dan hadiah
pribadi, kalau dilakukan dengan benar, mahadata bisa memberi keuntungan ke
semua pihak, dan satu kesempatan pertama melakukannya berupa kartu kesetiaan
Situs
perbandingan harga tidak menjual sendiri, jadi agar dapat uang, situs harus
mendapat bayaran dan peritel yang dituju dari sana, tidak ada situs
perbandingan di beberapa bagian pasar, komisi membuka kemungkinan disesatkan,
atau diberi informasi tak lengkap. Situs perbandingan mengarahkan konsumen ke
peritel yang memberi komisi besar, baik itu paling cocok atau bukan dan tidak
ada gunanya mengarahkan ke peritel yang tak memberi komisi. Situs perbandingan
harga adalah senjata mahadata yang lebih banyak bermanfaat bagi konsumen yang
tak punya wakty mencari diantara berbagai kemungkinan. Langkah berikutnya dari
aplikasi yang menggunakan data untuk membantu konsumen adalah mekanisme yang
memungkinkan mahadata menjadi konsumen, membentuk pasar otomatis
Di
Amazon bisa membeli banyak produk dari penjual lain. Amazon bertindak sebagai
pasar, mengambil sedikit hasil penjualan sebagai imbalan mewujudkan transaksi
tapi harga ditetapkan penjual, penjual tergoda untuk melakukan 2 hal :
menaikkan harga jika tidak ada pesaing, dan menurunkan harga jika bukan penjual
berharga termurah
Robot
toko, algoritma secara teratur menyesuaikan harga. Pada prinsipnya berarti
penjual dijaga agar selalu berada pada posisi terbaik, namun jika aturannya tak
dibatasi dengan baik atau frekuensi pengecekan harga oleh robot terlalu sering
pendekatan mahadata bisa lepas kendali, penurunan harga berlebihan menyebabkan
terlalu banyak produk berharga sangat rendah bahkan ketika sudah merugikan
Sistem
mahadata bisa bereaksi jauh lebih cepat daripada manusia, dalam 36 menit
terjadi kekacauan sebelum manusia sadar apa yang terjadi dan menghentikan
algoritma. Mahadata hanya sebagus algoritma yang menangani, kalau ada
kesalahan, kecepatan, dan pengulangan algoritma bisa menyebabkan kerusakan
besar sebelum efeknya disadari
Cookie,
file kecil yang digunakan untuk situs web untuk menyimpan data kunjungan
American
Airlines dulu fokus ke sistem pemesanan Sabre sehingga mengaku sebagai
perusahaan sistem pemesanan juga menerbangkan pesawat
Bidang
riset operasi (operational research, OR) berawal pada Perang Dunia II, parah
ahli fisika dan matematika didatangkan untuk membantu memecahkan masalah
militer, mereka menghasilkan mekanisme matematis untuk mencari pola bom laut
yang melumpuhkan kapal selam, namun sesudah perang, keahlian diserap industri,
dan para analisis OR adalah ahli algoritma. Tim OR mengumpulkan data distibusi
statistik orang batal terbang, selagi gambaran mahadata terbentuk, mereka
memprediksi dengan akurat bahwa 10% pemesanan di penerbangan tak bakal
digunakan, sistem menjual 110% tiket di penerbangan
Bank
menggunakan mahadata dalam sejumlah cara berdampak ke konsumen. Sistem mahadata
memantau kegiatan kartu kredit dan debit untuk mencari tindakan mencurigakan
Mahadata
dalam kehidupan langsung melalui internet, khususnya World Wide Web keduanya
dicampuradukkan media, sering menyatakan bahwa Tim Berners Lee, saintis komputer
Britania yang bekerja di CERN Jenewa, menciptakan internet, sebenarnya tidak
sumbangan Berners Lee adalah web. Internet infrastruktur untuk menghubungkan
komputer, secara harfiah artinya jejaring antarkomputer, internet berkembang
secara organik pada 1970, tumbuh dari jejaring militer AS bernama ARPAnet, yang
sejak 1960 sudah hadir di Universitas AS, jejaring itu awalnya digunakan untuk
menyambungkan komputer terminal ke mainframe yang terletak jauh jadi peneliti
di LA, dapat berinteraksi dengan komputer di Boston tanpa perlu pergi ke
Boston. Langkah besar pertama maju dari interkonektivitas dasar terjadi pada
September 1973 ketika seorang lupa membawa pisau cukur. Dia saintis komputer AS
Len Kleinrock, yang menghadiri satu konferensi di Sussex University di Inggris
lalu pulang ke LA dan menyadari pisau cukurnya ketinggalan di Brighton, karena konferensi Brighton dihubungkan ke
jejaring seperti ARPANet, jejaring itu diperpanjang untuk sementara,
mengantarkan sinyal melalui stasiun komunikasi satelit Goonhilly Downs di
Cornwall yang biasanya menangani panggilan telepon lintas Samudra Atlantik dan
TV
Sejak
1970 surat elektronik menyebar, kemudian ada papan pesan dan mekanisme
komunikasi lain yang menggunakan internet atau jejaring komersial seperti
Compuserve dan AOL. Namun mahadata masih belum masuk ke kehidupan sehari,
selain bagi penggemar, sampai Berners Lee membuat keajaiban. Meski nama World
Wide Web kedengaran besar, Berners Lee hanya mencoba mempermudah akses atas
perpustakaan dokumen elektronik melalui internet, dia membuat mekanisme standar
untuk melakukan itu sebagaimana para pendiri internet membuat protokol
komunikasi yang memungkinkan komunikasi antarkomputer terjadi. Berners Lee
menggunakan konsep hyperlink (pranala)
yang bisa diklik untuk melompat dari dokumen ke dokumen yang diajukan
konsepnya oleh Ted Nelson pada 1960 dan sudah digunakan secara luas di sistem
bantuan Microsoft dan program Mac Hypercard, Berners Lee mewujudkan
fungsionalitas web lokal pertama di CERN pada akhir 1990 dan membukanya kepada
dunia pada 1991. Situs CERN, situs itu utamanya dokumen, teks, hanya sedikit
gambar tak mengherankan, mengingat bahwa di luar organisasi besar, akses
terhadapnya adalah melalui modem yang memutar nomor telepon, sekitar 1000 kali
lebih lambat daripada koneksi internet modern biasa, belum ada Google atau
mesin pencari lain (mesin pencari besar pertama, Altavista, baru ada pada 1995).
Sebagian besar isinya teks, dan ada beberapa gambar beresolusi rendah
Internet
sebagai pusat mahadata universal, sumber segala informasi yang diperlukan yang
bisa diakses dimana saja kalau memerlukannya. Harus ada pertimbangan mengenai
apa yang faktual dan apa yang bohongan. Belum pernah ada ensiklopedia serinci
wikipedia, dan banyak informasi di dalamnya akurat, terutama untuk topik sains
dan teknologi, analisis pada masa lalu telah menunjukkan bahwa tidak lebih
banyak kesalahan artikel sains wikipedia dibanding Encylopaedia Britannica tapi
wikipedia berisi jauh lebih banyak informasi. Namun artikel tentang topik yang
diperdebatkan
Bocketts
Farm salah satu kompleks pertama di dunia yang merekayasa genetika dinosaurus
yang pertama adalah bronchosaurus (sic) 19 ton bernama Stuart, yang tinggal di
padang 16 acre di ujung utara Farm Park, makanannnya jerami, voda Martini, dan
piring terbang, Stuart bilang dia kelak mau berkarir di bidang akuntansi
Internet
telah menyadikan revolusi data dalam pemberian informasi dan masyarakat belum
sepenuhnya menyesuaikan diri dengan lingkungan. Kunci akses informasi adalah
mesin pencari yang bagus, suatu pasar yang selain Microsoft Bing di dominai
satu nama: Google
Dalam
sepersekian detik Google menyatakan sudah menemukan sekitar 564000 hasil.
Google meliputi antara 47 – 49 miliar halaman (perbandingan Bing,meliputi 16
sampai 17 miliar, walau secara realistis sebagian besar perbedaan jumlahnya di
sebabkan halaman yang akan jarang digunakan. Hanya ada 50 miliar halaman di
web, ada banyak lagi dokumen yang tak bisa dilihat Google karena merupakan
bagian situs komersial atau berpengaman. Kisaran halaman Google cakup masih
cukup besar sehingga sukar percaya Google benar benar mencari melalui segala
bahan. Google tak mencari di seluruh web
tiap kali mengajukan permintaan pencarian. Agen perangkat lunak, disebut
crawler, terus – menerus berkeliaran web, mencari bahan baru untuk ditambahkan
ke indeks, dan itulah yang dicocokan ke permintaan pencarian, bukan data
mentah. Meski indeks Google mencapai 100 petabyte data. Satu petabyte setara
sejuta gigabyte
Menemukan
tanggapan dari indeks sebagiannya adalah saol mencocokan kata di permintaan
pencarian dengan kata di halaman web, sesuatu yang dipercepat dengan mengawali
prosesnya begitu mulai mengetik tapi Google menggunakan beraneka data untuk
mengurutkan hasilnya. Pemilik situs membayar untuk ditaruh di atas. Muncul
karena baru, karena situs bertauran dengan situs penting lain karena Google
menganggap situsnya bermutu tinggi, dll. hasil pencarian bahkan berstruktur
beda, tergantung apapun yang bisa disimpulkan sistem Google mengenai orang yang
telah mengajukan permintaan pencarian berdasarkan riwayat pencarian atau karena
terhubung ke fasilitas lain Goog,e telah tumbuh satu industri yang mencoba
merekayasa bahan algoritma Google dan mendorong posisi situs ke atas dalam
pencarian, untuk menghadapi search engine optimisation, optimasi mesin pencari,
para insinyur Google terus – menerus mengotak – atik algoritma penyusunan
peringkat. Google bisa digunakan untuk lebih daripada hiburan. Banyak pencarian
dilakukan untuk membeli sesuatu, atau tujuan bisnis dan pendidikan, namun tak
ada keraguan bahwa sisi mahadata bermain di internet terutama di streaming
video, Netflix, Amazon Prime
Satu
DVD berisi beberapa gigabyte data, besarnya jumlah data yang terlibat situs
streaming melayani jutaan konsumen, mahadata tingkat industrial. Satu penerapan
mahadata yang cukup berbeda di TV dan film adalah dalam membuat gambar, sudah
ada sistem kecerdasan buatan yang dilatih untuk memproduksi gambar bergerak
sebagai semacam teka – teki apa yang terjadi berikutnya dari gambar diam.
Sistem MIT menggunakan dua algoritma terpisah, satu sebagai pengkritik mutu
hasil yang lain, mencari variasi dari harapan berdasarkan semua film yang
diserap. Membuat deduksi atau induksi berdasarkan pengetahauan lebih luas.
Sistemnya masih terbatas dalam hal resolusi dan kemampuan maju. Pada prinsipnya
sistem itu dapat digunakan untuk mengisi beberapa gambar yang hilang di film,
alasan para peneliti mencoba melakukan adalah sebenarnya para peneliti mencoba
melakukan itu adalah memberi pemahaman lebih baik kepada sistem kecerdasan
buatan mengenai apa yang berikutnya terjadi sesuatu yang esensial bila ingin
teknologi bekerja mandiri. Musik dan penerbitan buku masih seperti studio tua
dalam menanggapi mahadata : kerepotan dengan cara kerja baru
Mobil
swakemudi sutdah di tes dijalanan, dalam memutuskan tindakan, sistem kecerdasan
buatan yang mengendalikan mobil harus memantau lingkungan sekitar dan
memprediksi hasil untuk mengurangi risiko kecelakaan. Sistem MIT dapat menjadi
satu langkah ke arah penyempurnaan kemampuan
Hakikat
data digital adalah lebih mudah disalin daripada data analog yang disimpan
secara fisik. Dokumen digital dapat
disediakan untuk dunia dalam hitungan detik, dan layanan berbagi gratis eeprti
Napseter menghancurkan laba secara drmatis
Penerbitan
buku sudah punya model mapan untuk mendapat laba sebanyak mungkin dari
penjualan buku, pertama penerbit mengeluarkan edisi sampul keras, yang tak
terjual banyak tapi margin keuntungannya lebih tinggi daripada buku sampul
lunak jadi ingin mendapatkan buku secepat mungkin bisa membeli harga lebih
tinggi, bisa sampai setahun, edisi sampul lunak diterbitkan lagi bagi para
pembaca lain yang tidak mau membayar. Pada permulaan banyak penerbit
memperlakukan buku elektronik sebagai buku sampul lunk, terbit ditahan beberapa
bulan, daripada menggunakan pendekatan mahadata untuk memudahkan mendapat versi
legal, mereka mempersulit, pembajakan merajarela di bidang yang belum pernah
mengalami. Riset menunjukkan tidak ada logika menunda keputusan menahan
penerbitan buku elektronik karena pasar untuk buku cetak sampul keras dan buku
elektronik tidak tumpang tindih. Walau penjualan buku sampul keras tak
terpengaruh penerbitan buku elektronik pada waktu bersamaan, penjualan buku
elektronik turun signifikan jika riilisnya ditunda, penerbit buku elektronik
suka mendapat produk secepat mungkin jadi pendekatan tradisional pra mahadata
bukan melindungi angka penjualan, malah menguranginya. Sebagian besar merilis
buku elektronik berbarengan dengan edisi sampul keras, beberapa menjual buku
elektronil dengan harga sedikit dibawah buku sampul keras, menurunkan harganya
ketika buku sampul lunak, sudah tersedia. Strategi berbahaya, kembali
mengundang pembajakan. Menunjukkan bahwa mereka masih tak mengerti konsumen
digital
Pemain
dominan di pasar buku elektronik ialah Amazon dengan platform Kindle menguasai
75% pasar AS dan 95% pasar Kerajaan Inggris. Amazon seperti Netflix menggunakan
data konsumen untuk mengendalikan produk yang ditampilkan di situs web dan
memudahkan akses konsumen ke buku elektronik. Amazon punya keunggulan besar
dibanding penerbit, karena penerbit buku tak punya banyak kontak langsung
dengan basis konsumen. Di dunia mahadata, ketiadaan kontak langsung membuat
berada di posisi berbahaya. Mencoba menggunakan mahadata untuk mencoba mencari
tau apa yang menjual buku menjadi baru
Penerbit
buku tak punya akses mahadat ke konsumen seperti dipunyai media hiburan namun
mereka memang punya akses ke konten, buku yang dicetak serta naskah diterima,
dan telah di usulkan bahwa bisa digunakan untuk memprediksi atau bahkan
merumuskan buku laris berikutnya . buku laris karena faktor sosial dan tren
sehingga sukar di prakirakan dengan baik. Banyak buku yang menurut sistem
adalah buku laris, tapi kenyataannya tidak laris, jenis informasi juga
diperlukan untuk menilai keefektifan algoritma
Jika
memiliki telepon pintar atau komputer modern, bisa berbicara dengan algoritma,
perangkat lunak seperti Siri dan Contana mensimulasikan suara dan kecerdasan
manusia, mencoba memberi jawaban cerdas bagi pertanyaan yang diajukan dengan
pembicaraan, mahadata jelas berada pada inti kerja teknologi, akan dilakukan
menggunakan kombinasi kosakata dan aturan tata bahasa seperti belajar bahasa
asing di sekolah. Jenis pembelajaran ini ada batasnya, siapapun sudah beralih
dari belajar di kelas ke menggunakan langsung suatu bahasa asing menyadari
betapa banyak yang bisa didapat dari paparan langsung terhadap percakapan
betulan dan bahan tertulis dibanding daftar kata dan aturan dan bagi komputer
sama saja
Pendekatan
mahadata untuk menangani bahasa asing bagi komputer, semua bahasa manusia
adalah bahasa asing adalah imersi, pembiasaan. Komputer punya akss ke banyak
teks sungguhan yang dituls manusia, dari sana komputer bisa berusaha
menyimpulkan apa terjemahannya, sistem menaruh kata dalam konteks, memberinya
kemungkinan lebih baik untuk mengerti dan berbicara seperti alami di banding
kalau mencoba menggunakan aturan saja. Perancang sistem pengenal pembicaraan
seperti Siri membuatnya lebih mengesankan dengan membuat kode keras untuk
beberapa tanggapan terhadap pertanyaan yang mungkin sering di dapatkan dan
mengembangkannya seiring waktu. Makin banyak mahadata yang terlibat, makin baik
kemungkinan mendikte dengan tepat begitu juga, perangkat lunak penerjemah
seperti yang ada di Google bukan menggunakan terjemahan kata per kata dari
kamus. Melainkan kumpulan data terjemahan mengambil frase dan kalimat agar
mendapat konteks. Alexa mengintegrasikan
mahadata dengan rumah. Echo masih tahap awal, kalau bertanya sesuatu ke Alexa,
permintaannya diteruskan ke sistem mahadata amazon yang menafsirkannya lalu
berusaha memberi tanggapan layak. Echo bekerja sama dengan sejumlah sistem
otomasi rumah , memberikan fungsionalitas yang jumlahnya mengejutkan. Echo
memantau mikrofon. Seperempat juga orang telah mencoba melamar Alexa, sementara
100.000 orang per hari mengucap selamat pagi kepadanya. Kadang sukar untuk
mengatakan Terima kasih kepada Alexa bila sudah membantu. Namun perlu memandang
statistik dengan hati – hati, kecil kemungkinan banyak orang serius mengajak
nikah Alexa, sementara Amazon mendorong orang mengucap selamat pagi dengan
memberi tanggapan berupa fakta seru tentang hari itu, namun seberapapun
seriusnya menganggap Aleza, mahadata sudah berdampak besar kepada sesuatu yang
selalu punya, lama sebelum masuk ke internet jejaring sosial
Dampak
jenis jejaring mahadata ke kemampuan berkonsentrasi berinteraksi secara normal
dengan orang lain, terutama bagi pengguna muda yang hidupnya dihabiskan di
media sosial, memandang telepon, mengecek sosmed rata 100 kali sehari.
Mengapresiasi penemuan informasi sebagaimana mendapat kesenangan dari berburu
sesuatu secara fisik memberi kenimatan kecil, melepas domain untuk memicu
bagian otak yang pas, mencerminkan asal usul sebagai hewan dengan gaya hidup
pemburu – pengumpuk, namun kombinasi media sosial, terus memompa informasi ke
kota dan telepon seluler, yang membuat informasi bisa terus – menerus diakses,
menyebabkan perilaku kecandua, bila mendapat pelepasan neurotransmitter jenis
itu terlalu sering, otak kehilangan kepekaan, jadi butuh makin banyak demi
memuaskan diri dalam hitungan menit, mengecek media sosial
Sejak
zaman dulu ada kecenderungan mengkritik kemampuan orang muda berkonsentrasi,
namun dmapak media sosial bisa diukur. Sistem mahadata telah ditunjukkan
menghasilkan penurunan kapabilitas jelas, terlalu banyak media sosial membuat
kurang mampu melaksanakan tugas yang memerlukan masukan mental. Mahadata
menghadirkan pro dan kontra
Membuat
media sosial bekerja bagi kita pertama memerlukan kesadaran bahwa ada masalah,
dan pemecahan masalah adalah tempatnya mahadata berkesempatan bekerja mandiri,
asalkan mengetahui kenetralannya, tergantung apa yang dilakukan dengannya,
mahadata bisa membantu menata masalah atau memperbesar dampak masalah
Mencapai
keseimbangan dengan mahadata yang berpotensi menganggu memerlukan kesadaran
akan potensi masalah dan upaya sadar untuk melakukan sesuatu terhadapnya, bisa
mendapat manfaat dari media sosial sadar dengan kemungkinan masalahnya dan
memegang kendali, jangan biarkan media sosial mengusai kita atau gawai kita
World
Wide Web dikembangkan di laboratorium CERN (Conseil Europeen Pour la Recherche
Nucleaire, Organisasi Riset Nuklir Eropa) pusat riset nuklir multinasional yang
berlokasi dekat Jenewa, Swiss itu adalah tempatnya Large Hadron Collider (LHC),
percobaan besar menabrakan proton berkecepatan tinggi satu sama lain, salah
satu temuannya adalah boson Higgs : boleh jadi tampak anah kalau alat data
sehebat Web tidak berasal dari pakar perangkat lunak seperti IBM atau
Microsoft. Namun percobaan besar di CERN, teruama yang menggunakan LHC,
menghasilkan data luar biasa banyak, dan lab seperti CERN harus bisa menangani
serta menganalisis mahadata setara dengan ilmu fisika zarah. LHC memproduksi
kira 30 petabyte data yang bisa digunakan per tahun, walau hanya sekitar sepertiga
ukuran indeks Google, itu jumlah sangat besar, dan baru sebagian dari seluruh
data LHC hasilkan, sebagian besar
datanya dibuang, bila tabrakan terjadi dalam detektor LHC, bisa terjadi
semburan besar zarah, masing berpotensi meluruh, menghasilkan sekitar 600 juta
peristiwa atau 25 gigabyte per detik untuk disimpan
Sistem
CERN tak bisa menyimpan 25 gigabytes per detik, jadi satu set algoritma
digunakan untuk menyeleksi data yang berpotensi tampak menarik, pertama
mengurangi dari 600 juta peristiwa per detik ke 100.000 kemudian mengurangi
lagi ke antara 100 dan 200 peristiwa perdetik. Data didistribusikan ke seluruh
dunia untuk digarap banyak komputer dalam proses lambat menapis dan
menganalisis, sebagai gambaran kecepatannya, data yang bakal menyebabkan
pengumuman penemuan Boson Higgs mulai dikumpulkan pada 2010, tapi penguman itu
baru terjadi pada 2012. Penemuan Boson Higgs merupakan peristiwa mahadata
murni. Tak ada yang melihat Boson Higgs. Bahkan tak ada yang mendeteksi,
peristiwa yang digunakan untuk memastikan keberadannya hanya sekumpulan data
mengenai zarah yang dianggap hasil peluruhan Boson Higgs, dianalisis dari
aliran besar informasi keluaran LHC, penemuan itu jadi berita di seantero
dunia, meski fisika di balik penemuannya kompleks dan tak mudah dimengerti
Ukuran
byte adalah penyimpanan di komputer biasanya diukur dengan byte, satu byte
terdiri atas 8 bit, tiap bit bisa menyimpan informasi 0 dan 1. Suatu telepon
pintar biasanya punya penyimpanan antara 8 dan 129 gigabyte; satu gigabyte sekitar
1 miliar byte. (sekitar karena satu kilobyte adalah 1.024 byte bukan 1000, satu
megabyte adalah 1024 x 1024 dst) satu Pc bisa menampung satu terabyte, sekitar
1000 miliar byte awalannya menunjukkan ukuran yang makin besar
Kilo
= 1000
Mega
= 1.000.000
Giga
= 1,000.000.000
Tera
= 1.000.000.000.000
Peta
= 1.000.000.000.000.000
Eksa
= 1.000.000.000.000.000.000
Fisika
zarah adalah tambahan baru dalam pemahaman manusia tapi mahadata juga
menjangkau cabang sains yang barangkali paling tua, astronomi. Organisasi
seperti CERN mengetahui sejak awal mengenai betapa pentingnya mahadata bagi
sains tapi kesadaran itu belum ada di semua tempat, bukannya komputer tidak
digunakan
James
H Simons, mantan ahli matematika yang menjadi miliarder sesudah bekerja sebagai
manajer dana lindung nilai, telah mendirikan Flatiron Institute di New York
untuk fokus ke pembangunan infrastruktur dan metode komputasi guna menopang
mahadata di sains, di awali dengan astronomi dan biologi, seperti ditunjukkan
Simons, bila komputer digunakan dalam sains, dengan kekecualiaan seperti Tim
Berners Lee di Cern, sebagian besar pemrogramman diserahkan ke mahasiswa
pascasarjana nonspesialis yang biasanya bukan ahli pemrograman, perangkat lunak
mereka sering hanya digunakan untuk satu proyek lalu ditinggalkan
Jika
ingin menggunakan mahadata dengan
efektif, maka para pemrogram perlu
keahlian yang jarang ditemukan di departemen biologi atau fisika universitas
Simons berharap yayasannya akan memberi dorongan untuk mengubah keadaan, proyek
mahadata yang telah muncul dalam biologi adalah analisis sinyal listrik yang
dikumpulkan dari alat pemantau di otak hewan, banyak universitas melakukan
riset semacam itu tapi masing menggunakan perangkat lunak sendiri yang biasanya
dibuat amatir untuk menangani data, perangkat lunak Flatiron telah dikembangkan
untuk mengumpulkan data dari banyak kelompok peneliti, memberi potensi
pemahaman yang jauh lebih baik. Edward Merricks yang bekerja di Columbia
University menggarap satu proyek otak, Merricks mengusulkan bahwa pemrogram
berdedikasi hanya akan efektif jika bekerja sama dalam jarak dekat, masalah
potensial mengajak pemrogram murni menganggarap alat adalah data rill sering
mencakup situasi aneh yang belum pernah terpikir siapapun dan untuk mengurai
masalah bakal banyak diperlukan pemahaman relatif bagus atas biologi yang
mendasari, bukan masalah pemrograman murni namun jika ada kerja sama betulan
sepanjang proses, tak bakal jadi masalah besar, dan standarisasi prosedur
analitis di seluruh bidang kiranya bakal fantastis, di bidang lain ahli astrofisika yang tak bisa
melakukan percobaan langsung di bintang harus mengandalkan simulasi komputer
terjadinya supernova, interaksi antara lubang hitam, cara galaksi terbentuk,
dan masalah komputasi kompleks lain. pendekatan mahadata Flatiron di rancang
untuk penggunaan juga dalam cara yang tak bakal bersedia bagi ahli astrofisika
biasa yang membuat program. Dalam kedua penerapan di Flatiron Institute juga di
CERN, mahadata digunakan pada proyek individual berskala besar namun manfaat
analisi mahadata juga bida diambil secara lebih luas, contohnya memperbaiki
kemampuan mobil
komputer di mobi modern bisa berguna selain mengendalikan kunci, lampu,
menyalakan mesin, dll. sistem bisa memantau penggunaan bahan bakar dan emisi, memberi
informasi dari pemantau terpasang, jumlah oli atau cairan pembersih kaca dan
secara umum menjaga kondisi produk teknik mesin paling kompleks yang dimiliki
sebagian besar, padukan dengan data GPS dan segala jenis informasi mengenai
gaya menyetir, penggunaan bahan bakar, keandalan, serta banyak lainnya bisa
didapat
sebagian
informasi bisa disediakan. Kotak hitam digunakan peruasahaan asuransi untuk
menurunkan premi bagi pengemudi yang berhati – hati, namun sedikit menggunakan
data, perusahaan membatasi akses dengan perangkat lunak sendiri, seperti
pemutar musik elektronik sering mengandalkan perangkat lunka khusus Itunes.
Sebagian lagi bisa karena perusahaan lebih suka konsumen tak mudah mengakses
data performa dan keandalan. Namun tak ada keraguan mengenai arah yang dituju.
Datanya bukan hanya akan bisa memberitahu bagaimana memperbaiki cara mengemudi,
dengan algoritma yang membandingkan antisipasi rem dengan orang lain tapi
menggunakan mahadata dari semua mobil serupa. Kiranya dimungkinkan memberi prediksi
kapan onderdil tertentu rusak, serta bantuan teknik lain, mobil akan mengejar
orang, selagi teknologi sandang (wearable technology) yang mengukur data
kebugaran sudah menjadi bagian revolusi mahadata
pembagian
data bersifat sukarela, tapi manfaatnya besar karena bisa memantau performa
dalam konteks dan menunjukkan tanda risiko kesehatan atau memberi saran untuk
cara berolahraga yang lebih tepat sehingga banyak yang akan mau dibagi. Walau
biasanya dipasarkan untuk penyuka olahraga gawai seperti itu sebenarnya bagian
kecil kehadiran mahadata yang makin besar di bidang medis
secara
tradisional tidak banyak tumpah tindih antara mengenai kedokteran termasuk
sains, keduanya: banyak perawatan medis mengandalkan desas – desus dan harapan
dibanding data saintifik kuat, sekarang kedokteran berbasis bukti cukup langka
sehingga bisa diberi label bukan hanya kedokteran. Namun keadaan berubah,
dengan bantuan mahadata. Satu masalah peneliti medis tak bisa menaruh manusia
dalam kotak dan mengisolasinya dari segala pengaruh luar, itu membuat sulit
memastikan apa yang menjadi penyebab sesuatu, menyebabkan banyaknya klaim bahwa
berbagai makanan dan gaya hidup menyebabkan perbaikan atau pemburukan
kesehatan, orang yang menjalani gaya hidup Laut Tengah dna makan diet Laut
Tengah lebih kecil kemungkinan menderita masalah jantung dibanding Skotlandia,
orang yang mengonsumsi lebih banyak minyak zaitun lebih kecil kemungkinannya
mengalami masalah jantung,itu mencerminkan satu masalah lama sains yang
dirangkum sebagai korelasi bukan sebab akibat, hanya karena dua hal naik atau
turun berbarengan bukan berarti A menyebabkan B
satu
pendekatan mahadata tingkat pertama yang sekarang makin lazim di riset medis
adalah metariset (metastudies) satu penelitian mengenai makanan dan kesehatan kesulitan mendapat data
bermutu dari peserta berjumlah memadai dan menemukan hubungan sebab akibat.
Makin banyak data makin andal deduksi, makin besar peluang mengontrol beberapa
penyebab potensial lain sehingga bisa disisihkan, metariset memadukan hasil
sejumlah penelitian, biasanya memberi pembobotan berdasarkan mutu data.
Pendekatan mahadata sudah mempermudah memastikan banyak pengobatan alternatif
tak lebih manjur daripada plasebo, misalnya atau untuk mengetahui sumbangan
diet tertentu bagi kesehatan. Tiap orang punya catatan medis tradisional
bersifat lokal dan tidak dibagi. Lembaga rumah sakit punya sebagian data tapi
biasanya disimpan di satu tmepat, jika data medis bisa dibagi ada peluang lebih
besar dapat menggunakannya untuk memastikan keampuhan penanganan dan
mengembangkan cara baru. Data medis sensitif dan diperlukan penangan cermat
untuk memastikan anonimitas sebisa mungkin, pasien bisa dimengertie nggan
menyerahkan data, bahkan bila dijanjikan mendapat manfaat nyata. Beberapa orang
yang tidak eprcaya orang terlibat atau tidak mengerti konsep anonim, tetap
menolak dalam survei atas 2000 pasien sekitar 17% tak bakal setuju kalau data
anonim mereka dibagi ke pihak ketiga dengan aalsan apapun
Februari
2016 grup DeepMind mulai bekerja sama dengan Royal Free Hospital London untuk
menggunakan mahata guna membantu menemukan pasien dengan risiko penyakit
jantung, itu melibatkan pengumpulan data dari 1,6 juta rekam audiens pasien,
namun para pasien tak diberitahu bahwa itu terjadi dan hasilnya reaksi negatif
kuat dari pers. Pasien diyakinkan
mengenai manfaat data anonim yang kemudian bisa menjadi patokan agar algoritma
bisa bekerja mengecek data seorang pasien yang bersedia untuk mengetahui risiko
penyakit ginjal, misalnya masalah pendekatan DeepMind adalah bahwa para
peneliti Google menganggap mereka bakal mendapat akses catatan medis penuh tak
anonims, ketika mencoba mempromosikan pendekatannya. Google menjabaran job
pasien dimana pasien dna dokter mengakses catatan medis dan menambahnya tanpa menyadari
bahwa pasein jadi tidak membukanya ke Google
Pada
waktu sama, rumah sakit mungkin enggan berbagi data jika statistik kelihatan
buruk, selain itu ada potensi mahadata disalahgunakan secara medis, obat
dipasarkan lebih cepat, penangana dikembangkan lebih efektif dan pada dasarnya
lebih banyak nyawa terselamatkan, meski memang wajib berhati – hati jangan
sampai menghalangi kemajuan luar biasa berharga yang dibuat
Satu
masalah mahadata dan kedokteran adalah menanggung reaksi keras terhadap Genome
Project (HGP). HGP adalah proyek besar dulu yang diawali pada 1990 dan selesai
2003, karena genom, keseluruhan DNA satu individu atau dalam hal HGP bagian DNA
sejumlah individu belum 100% lengkap keti ka diumumkan, sebagian penyebab
adalah karena proyek komersial pesaing yang mengajak balapan penelitian yang
didanai negara (walau akhirnya kedua pesaing membuat pengumuman bersama).
Proyek disebut terobosan besar dalam kedokteran, mengubah praktik melalui
penanganan bersasaran personal, dan teknologinya sudah makin maju biaya
memetakan satu genom manusia sudah turun dari ongkos proyek asli yang $3 miliar
sampai dibawah $1000 orang, namun sedikit kemajuan media yang muncul dan
sebagian besar praktisi meski masih sangat antusias dengan manfaat jangka
panjang, menerima bahwa dapat dibutuhkan puluhan tahun sebelum sebagian besar
kedokteran praktis akhirnya dipengaruhi proyek, ketiadaan hasil langsung
mungkin telah menyebabkan keraguan publik yang cukup besar mengenai proyek
mahadata di kedokteran, namun dalam jangka panjang, tak banyak keraguan bahwa
mahadata bisa memungkinkan sains kedokteran membantu kehidupan pasien, manfaat
memecahkan masalah jenis itu jelas, namun solusi masalah lain bisa sangat
beragam hasilnya misal di bisnis asuransi
Pada
2012, Uni Eropa menyebabkan kehebohan dengan membuat putusan bahwa menetapkan
premi asuransi kendaraan yang beda antara laki dan perempuan itu diskriminatif,
ada data tegas yang menunjukkan pengemudi wanita muda menghadapi risiko lebih
kecil dari pengemudi laki muda, yang akibatnya dikenal premi sampai 3 kali
lebih tinggi, dan menunjukkan sekali lagi betapa pentingnya dimensi moral dalam
keputusan mahadata. Algoritma tak bisa membuat penilaian moral namun hingga
kini masih membuat penilain moral namun hingga kini masih kesulitan mendapat
pendekatan yang bisa diterima untuk menghadapi implikasi moral
Jika
premi tidak dinaikkan di daerah berisiko tinggi, orang yang tinggal di daerah
berisiko rendah jadi dikenai premi terlalu tinggi. Jika seseorang didiagnosis
penyakit jantung misal orangtuanya meninggal karena sakit jantung, perusahaan
asuransi akan menaikkan premi asuransi jiwa. Perusahaan asuransi belum
mempertimbangkan rincian data genetis
Di
AS, daftar U.S.News tabel klasemen universitas yang pertama menggunakan nilai
SAT (Scholastic Aptitude/Assesment Test) SAT adalah test yang diberikan ke
murid SMA dan digunakan untuk penerimaan di universitas, beberapa universitas
membayar mahasiswa agar mengulang test
dengan harapan mendapat hasil lebih baik yang lain mainnya lebih kasar
dan mengirim hasil palsu ke survei. Satu ukuran yang digunakan daftar U.S.News
adalah penggalangan dana. Sistem U.S.News tidak menyertakan biaya kuliah
mendukung kredibilitas tabel klasemen. Sistem perangkat U.S. News berkaitan
dengan kesadaran mereka, di Inggris ada Oxford dan Cambridge, sementara di As
mencakup perguruan tinggi Ivy League seperti Harvard, Yale, dan Princeton. Di
Inggris biaya kuliah tidak jadi masalah dalam proses seleksi, karena tidak
banyak bedanya antar universitas, namun di AS, universitas paling terkenal
sangat tinggi biaya kuliahnya, jadi jika biaya tinggi dipertimbangkan selain
prestasi universitas di tabel, bakal menyebabkan perguruan tinggi. Ivy League
terdorong turun peringkatnya sehingga kredibilitas tabel secara keseluruhan turun.
Solusi sederhana: abaikan biaya kuliah. Salah satu alasan kenaikan biaya kuliah
di Universitas AS sangat tinggi dalam beberapa dasawarsa belakangan adalah tak
dipertimbangkannya biaya dalam tabel klasemen, jadi dengan menarik uang kuliah
lebih besar lalu menyalurkannya ke dalam bentuk pemberian fasilitas,
universitas bisa menaikkan peringkat. Pada waktu yang sama, lembaga lain
mendapat untung dari membimbing siswa agar lolos dari sistem penerimaan
mahasiswa, sistem juga memanfaatkan algoritma yang berusaha membedah algoritma
pendaftaran yang ada, dan memilih calon siswa yang paling berpotensi membuat universitas meraih peringkat tertinggi, bukan
calon yang paling berpotensi menerima manfaat jika kuliah disana
Rapuhnya
keseimbangan yang hendak dicapai dalam pemanfaatan mahadata untuk memecahkan
masalah adalah perkara demokrasi
John
Bunner tahun 1975 : The Shockwave Ridel
juk buku merujuk pada non fiksi Alvin Tofferm Future Shock (1970) yang mencoba
memprediksi kehidupan tahun 2000 tapi meleset, namun Brunner melangkah lebih
jauh dia mengembangkan gagasan jejaring komputer universal dan mahadata untuk
menjabarkan sistem dimana penduduk bisa memberi masukan bagi cara pemerintah
menjalankan negara. Bunner menggunakan prinsio Delphi, gagasan yang dibuat lembaga
think tank AS Rand Corporation di Delphi, satu kelompok membuat pilihan.
Statistik keputusan mereka ditunjukkan ke kelomok, dan para anggota bisa
berubah pikiran, proses bisa diulang beberapa kali, ada bukti bahwa untuk
beberapa keadaan, jenis pendekatan kebijaksanaan khalayak berulang itu
menghasilkan keputusan lebih bagus daripada memberi suara satu kali. Dalam
novel Bunner, pendekatan pemungutan suara punya komponen taruhan agar
membuatnya lebih melibatkan pemilih,walau dalam praktiknya Delphi digunakan
untuk mengendalikan penduduk bukan sebagai mekanisme pemerintahan sejati, yang
ditangani secara tradisional
Mahadata
berpotensi membuat demokrasi sejati, lebih praktis pada skala negara untuk
pertama kalinya, namun tampaknya tak ada yang buru ingin mewujudkannya, mereka
sinis bisa berkata karena orang berkuasa, politikus terpilih, bakal kehilangan
kekuasaan. Memberi kendali kepada massa karena mengarah hasil tak mesti sejalan
dengan nasihat pakar
Inggris
menghapus hukuman mati pada 1965, walau pendapat masyarakat sudah beralih
menentang hukuman mati sekarang selama puluhan tahun keputusan untuk
menghapuskannya tak didukung masyarakat pada umumnya, jika punya sistem
demokrasi murni masyarakat bisa menghadirkan lagi hukuman mati. Mereka
berargumen bahwa lebih baik punya sistem perwakilan secara efektif mendukung
semacam oligarki, di mana kekuasaan berada pada segelintir orang yang diharap
bisa lebih baik mempertimbangkan keputusan daripada massa
Demokrasi
sejati bisa dianggap harus menggunakan kemampuan mahadata untuk melibatkan
semua orang secara langsung dalam membuat keputusan tapi hanya bisa memuaskan
jika bisa memberi mekanisme yang membuat masyarakat pemberi suara cukup
berpengetahuan untuk mengambil keputusan bagus sesuatu yang dapat didukung atau
disangkal juga oleh mahadata, tapi belum terjadi. Mahadata untuk keperluan
politik perlu dipikirkan baik, bila data dan politik bercampur, selalu ada
kemungkinan Bung besar datang, penggunaan mahadata bisa menghasilkan
pemerintahan lebih baik atau kendali totaliter
Bung
besar (Big Brother) gambaran sisi gelap mahadata merujuk ke pemerintah tiran
yang maha melihat dalam novel distopia 1984
karya Google Orwell, kecurigaan dampak mahadata sudah ada sejak
sebelumnya, barangkali upaya mahadata pertama adalah sensus. Ketika Kerajaan
Inggris berencana mengadakan sensus pada 1753 gagasan itu ditolak parlemen,
sebagian karena kata sensus berkonotasi negatif di Alkitab, sensus Raja Daud
disusul wabah dan sensus Romawi yang menemukan tempat lahir Yesus mengarah ke
pembantaian anak tak berdosa oleh Herodes, namun ada kekhawatiran realistis
dari rakyat dan pemerintah mengenai bagaimana data akan digunakan. Dari sudut
pandang pemerintah walau berguna dirasakan bahwa data sensus bakal mengungkap
statistik penting ke negara musuh, diketahui bahwa ketika Swedia pertama kali
mempublikasikan statistik kelahiran 1744 nama kota tempat penelitiannya,
Uppsala disembunyikan rakyat Britania juga khawatir negara tau lebih banyak
tentang mereka, kiranya hampir pasti hasilnya adalah lebih banyak pajak, dan
tentara lebih mudah melakukan wajib militer, menarik laki muda dari pertanian
dan usaha keluarga, baru ketika ada kekurangan pangan senegara pada 1800 ada
dorongan kuat untuk melakukan sensus pertama di Kerajan Inggris pada 1801 terkadang
akuisisi data oleh Bung Besar lebih tak kentara seperti dalam hal meteran
energi pintar
Cara
manfaat mahadata ditawarkan kepada pengguna akhir tapi yang mendapat manfaat
lebih besar adalah suatu perusahaan adalah meteran listrik pintar yang sekilas
tampak tidak berbahaya. Meteran listrik tradisional adalah alat sederhana yang
melakukan hanya satu hal, mengukur jumlah listrik yang digunakan, meteran
listrik berada di rumah, jadi perusahaan listrik harus mengirim orang untuk
membacanya guna menghitugn tagihan, namun banyak rumah sekarang sudah dipasangi
meteran generasi baru, meteran listrik pintar. Satu program besar dan mahal
sedang berlangsung di Kerajaan Inggris dengan tujuan memasang meteran pintar di
26 juta lebih rumah sampai 2020, meteran pintar akan memungkinkan pengurangan
tagihan listrik karena menampilkan berapa persisnya energi yang digunakan dan
biaya sehingga mempermudah penghematan, karena pintar, meteran bisa menggunakan
tarif spesial yang memasok energi lebih murah pada berbagai waktu dalam sehari,
jadi pelanggan mengurangi tagihan, namun alasan meteran pintar jadi populer
diantara pemasok energi
Manfaat
teknologi mahadata lebih banyak bagi perusahaan listrik, meteran pintar berarti
perusahaan tak lagi harus memperkerjakan pembaca meteran, mengurangi biaya, dan
beragam tarif bisa membingungkan pelanggan, sehingga perusahaan listrik bisa
menambah biaya ekstra pada masa puncak, bukan hanya memungkinkan konsumen untuk
menghemat
Bukannya
teknologi pintar tak dapat memberi manfaat kepada pemilik rumah, dengan alat
ini kepintaran berfokus pada konsumen, mengendalikan termostat dan mengakses
data langsung dari telepon termostrat bisa mendeteksi kapan rumah kosong,
mengurangi pemnasan secara otomatis, termostrat memang pintar dari sudut
pandang konsumen tapi meteran listrik menyimpan dan mengendalikan data sendiri
karena biaya ditampilkan kemungkinan kecil untuk mengubah konsumsi listrik
secara signifikan, manfaat bagi konsumen hanya didasari penelitian terbatas
Amazon,
Appe dan Gogole sistem mereka tak mencatat semua perkataan, dan menawarkan
mekanisme untuk memastikan pemantauan sementara. Setiap kali mengucapkan
permintaan ke Alexa, perkataan disimpan di server Amazon, tanpa batas waktu.
Amazon mengubah harga berdasarkan informasi yang dikumpulkan sistem dari
percakapan pribadi. Bahkan percakapan bisa jadikan bukti seperti peristiwa
Desember 2015, polisi AS mengirim surat perintah ke Amazon, terkait satu aalt
echo yang berada dekat bak mandi di Bentonville, Arkansas di mana Victor
Collins ditemukan mati dicekik, pemilik Echo, James Bates dipidana melakukan
pembunuhan, poliai ingin memeriksa rekaman apapun yang mungkin dimiliki Amazon
dari waktu kejadian, Amazon menolak, tapi pada Januari 2017 dipaksa memberikan
informasi. Amazon, Apple dan Google tidak sukarela berbagi informasi dengan
pemerintah seperti kasus 2016 ketika Apple menolak permintaan pemerintah AS
membongkar telepon seseorang yang dituduh teroris, namun teknologi pengawasan
bisa terjadi, ada riisko yang harus ditanggung demi segala keuntungan yang
didatangkan hubungan langsung dengan mahadata
Uber
bersama beberapa perusahaan lain muncul menyambut ekonomi pekerja lepas (gig
economy). Uber adalah organisasi yang tak hanya menggunakan mahadata untuk
menetapkan harga atau berinteraksi dengan konsumen. Mahadata mengendalikan cara
kerja individu yang bekerja bagi perusahaan, di AS, sudah diperkirakan sekitar
800.000 orang mendapat uang melalui perusahaan ekonomi pekerja lepas dan jumlahnya akan naik, uber
diperkirakan punya di atas 1 juta
pengemudi di seluruh dunia. Secara tradisional, waktu ramai dan sepi di tangani
dengan jadwal berdasarkan data historis, jadi jumlah karyawan yang bekerja di
sebagian besar restoran lebih sedikit pukul 4 sore dibanding 8 malam, waktu
ramain untuk makan malam. Sebagian besar toko akan menghadirkan lebih banyak
pramuniaga pada hari Sabtu di banding Senin, mahadata berarti proses
penjadwalan bisa menjadi jauh lebih efisien, bereaksi terhadap kebutuhan aktual
per menit, bisa terjadi jam kerja kelewat panjang, ketiadaan rutinitas dan
pengurangan pendapat
Jadwal
yang didorong mahadata bisa berubah seketika, uang yang dihemat perusahaan
dalam efisiensi staf berasal dari bayaran staff
Beberapa
pabrik Jepang adalah spesialis pendekatan yang dikenal Just In Time atau JIT.
Perusahaan menanggung biaya misalnya menyimpan banyak barang siapa tau
diperlukan, pendekatan JIT mengandalkan ketersediaan dalam waktu singkat dan
hanya mendatangkan barang dari pemasok ketika akan digunakan, akibatnya adalah
pemindahan biaya menyimpan stok dari konsumen ke pemasok, pada prinsipnya,
ekonomi pekerja lepas adalah cara memasok orang dengan pendekatan JIT,
mengarahkan orang sesudah pemberitahuan singkat untuk menanggapi data, namun
harga kepraktisan bagi perusahaan adalah kehidupan pegawai terganggu. Atau
lebih tepatnya yang bukan pegawai karena salah satu cara perusahaan ekonomi
pekerja lepas menjaga biaya tetap rendah adalah menggunakan pekerja lepas,
artinya tidak ada biaya kesehatan dan cuti digaji, jenis hubungan antara
pegawai maksudnya pekerja lepas dan perusahaan hanya dimungkinkan dengan sistem
mahadata yang memudahkan pembagian tugas dengan cepat, menggunakan jenis harga
berubah dengan sistemnya
Pada
Agustus 2016, terjadi protes para kurir yang bekerja untuk UberEats, bagian
Uber yang bersaing dengan perusahaan pengantar makanan pesanan dari restoran
seperti Deliveroo. Cara UberEats memperlakukan kurir menjadi iklan buruk untuk
mahadata. Kurir awalnya ditawari 20 Euro per jam, bayaran tinggi. Namun
algoritma berapa bayaran menjadi jauh lebih kompleks dengan angka lebih rendah
untuk tiap pengantaran ditambah lebih kecil per jarak di potong jatah Uber,
ditambah bonus waktu ramai, semua dilakukan pekerja dipandang aliran data
seperti barang JIT mengalami depersonalisasi dan siap dikenai perbaikan
efisiensi
Sudah
ada sejumlah tantangan legal yang berupaya membuat Uber memperlakukan pengemudi
sebagai pegawai tetap yang mendapat tunjangan dan gaji tetap jam – jaman, baik mereka
mendapat order maupun tidak. Tergantung Yuridiksi, serta tradisi keterlibatan
pemerintahan dalam hak pekerja, beberapa perselisihan bisa menguntungkan
perusahaan ekonomi pekerja lepas, sementara yang lainnya menguntungkan pekerja,
bukan berarti ekonomi pekerja lepas pasti buruk, data menjadi saringan akses
bagi organisasi yang dinilai dan skema penilaian dibawa lebih jauh oleh
perusahaan taksi Uber, karena penumpang menilai pengemudi, dan pengemudi juga
menilai menumpang
Nilai
memiliki konsekuensi tak terduga karena orang yang menilai tak mengerti arti
nilai tertentu atau lebih realistis yang merancang penilaian tidak begitu
mengerti manusia. Ada bukti kuat bahwa mereka yang memberi nilai kepuasaan di
Kerajaan Inggris lebih kecil kemungkinannya menggunakan nilai paling ekstrem,
menghindari nilia paling buruk atau baik jadi dalam keadaan normal, 4 bintang
mewakili tingkat kepuasan konsumen baik atau bahkan sangat baik, namun Uber
menetapkan nilai rata terendah yang bisa diterima adalah 4,6. Kalau lebih
rendah, pengemudi bisa kehilangan akunnya, tiap nilai 4 bintang dianggap bagus
menurunkan nilai rata total juga mungkin bahwa prasangka pribadi berperan, data
Uber belum tersedia untuk diteliti, tapi
ketika perusahaan dengan sistem penilai serupa, tapi ketika perusahaan dengan
sistem penilaian serupa, seperti perusahaan akomodasi Airbnb, di satu
penelitian di AS, orang dengan nama khas Afrika – Amerika 16% lebih rendah
kemungkinannya diterima sebagai konsumen dibanding dengan nama khas Eropa –
Amerika. Dalam ekonomi pekerja lepas seringkali konsumen menilai pekerja, dan
itu menjadi evaluasi kerja, itu hanya bagian cara mahadata bisa melencengkan
kemampuan bisnis mengelola orang dengan efektif
Algoritma
yang bagus, memanfaatkan mahadata, bisa mengoreksi diri seiring waktu. Seleksi
data prediktif tergantung perancang sistem. Ada situs web yang dibuat untuk
menemukan korelasi yang tak penting di data
Dengan
perangkat lunak pengenal yang bagus, bisa melacak individu atau mobil yang
bergerak dari kamera ke kamera, membangun gambar rinci pergerakan, kamera
banyak di gunakan di UK, untuk menemukan kendaraan tanpa plat nomor dan
mengejarnya, sistem dapat digunaakn untuk melacak pergerakan terakhir orang
hilang
Pada
abad ke 19. Dokter John Snow di London menemukan sumber wadah kolera di Soho
dengan memetakan penggunaan sumber air di tiap rumah, berdasarkan pola wabah
bisa menunjukkan bahwa penyakit itu disebarkan satu pompa air tertentu, Snow
mencopot gagang pompa agar tak bisa digunakan, dan penyebaran penyakit
berhenti, ditemukan bahwa limbah dari bangunan berdrainase buruk mencemari
sumber air pompa. Snow mengubah pendapat medis yang waktu itu menganggap
penyebar penyakit adalah hawa udara buruk dengan menggunakan data secara cermat
dan imajinatif. Yang bisa dilakukan PredPol dengan mahata, melebihi analisis
Snow, adalah mengelola aliran besar data yang digunakan sistem untuk
memprediksi dimana kira kejahatan paling besar kemungkiannya terjadi. Selagi
prediksi muncul, polisi bisa dikirim berpatroli di daerah yang diprediksi,
sehingga sumberdaya terbatas bisa dikerahkan agar berpengaruh terbesar bagi
kota atau daerah, sementara snow mendasari penelitiannya berdasarkan deugaan
bahwa penyebabnya adalah sumber air. PredPol dan para pesaingnya tak punya dugaan
awal, para operator sekadar menumpuk banyak data kemungkinan lokasi ATM dan
sasaran pencurian, faktor, jam, hari, apakah hari libur atau hari kerja, dll.
semuanya diolah untuk menghasilkan usul penempatan petugas, sesuadah berada di
lapangan polisi memasok lagi statistik pencegahan kejahatan, dan hasilnya
positif, sistem memperkuat data yang memberi hasil terletak. Polisi terlalu
berlebihan mengawSI minoritas dan kelompok tertentu.sistem tak kenal individu
jadi tidak punya faktor diskriminasi berdasarkan misalnya, umur, etnis atau
agama warga setempat, sistem memanfaatkan sumberdaya yang ada
Salah
satu kesukaran yang dihadapi dalam menangani mahadata adalah seringkali ada
manfaatnya bagi beberapa pihak dan mudarat bagi beberapa pihak lain
Dalam film spiderman ada bersama kekuatan besar, ada tanggung jawab
besar
Data
netral, tak bisa berbuat apapun sendiri, yang mempengaruhi kualitas algoritma
program komputer yang mempersatukan data dan membuat keputusan serta penemuan
sebagai hasil kemampuannya memilah banyak masukan, algoritma bisa menghadapi
lebih banyak informasi daripada manusia, tapi tak punya pertimbangan dan
perasaan manusia. Yang paling penting punya transparansi dan pemahaman jernih
mengenai apa yang terjadi jika ada kekeliruan. Tanggung jawab dalam peringat
Spiderman mencerminkan perlunya pemilik sistem mahadata menjamin mereka yang
menjadi subjek sistem mahadata berkesempatan mencari tau apa yang dilakukan
sistem dan bisa menunjukkan kekeliruan yang akan diberitahukan ke sistem serta
memungkinkan koreksi. Banyak pemilik mahadata enggan menerima tingkat tanggung
jawab, mereka beralasan algoritma mereka eksklusif dan tak bisa diungkap ke
pengguna akhir, mereka bilang transparansi akan meruska bisnis. Bila suatu
sistem berdampak ke kehidupan orang, jenis pengamanan itu diperkukan,
membiarkan pemilik mahadata berkelit dengan argumen algoritma eksklusif.
Pemilik sistem masih sangat bebas membiarkan algoritma memutuskan apa yang
dijual ke kita atau bagaimana nilai kredit. Satunya alasan menolak menambahkan
pengoreksi kekeliruan ke algoritma adalah kemalasan dan biaya membuat
perubahan, para pemilik sistem seharusnya jangan diberi keleluasaan kalau
hasilnya bisa mempengaruhi kualitas kehidupan orang
Mempertimbangkan
mengubah sistem pendidikan agar sesuai dengan mahadata, sistem pendidikan dan
ujian terlalu mengutamakan pengajaran dasar karir tertentu dan informasi.
Sistem pendidikan dirancang untuk dunia sbeelum mahadata, ada keperluan memberi
alat yang diperlukan generasi muda untuk memanipulasi dan mengerti data, tapi
menghindari terobsesi dengan data. Semua tau bagaimana mereka yang tumbuh di
dunia mahadata mahir berinteraksi dengan telepon, komputer, TV seerta mendapat
pelajaran sains komputer, mereka juga tidak diajari betapa merugikannya
bergonta – ganti tugas dan pencarian informasi acak, mereka perlu bantuan agar
bisa fokus dan menangani data dengan baik, juga masih mengajar berdasarkan mata
pelajaran, mengingat lebih banyak hal daripada yang diperlukan, supaya bisa
mengeluarkannya kembali dalam ujian, bukan memberi keahlian untuk
menginterograsi dan memanipulasi mahadata, untuk melihat bagaimana mahadata
bisa disalahgunakan dan mendapat manfaat sebanyaknya dan mahadata. Ujian
mahadata bakal menggunakan akses internet terbuka hanya membaca agar tidak
dipakai berkomunikasi karena yang ditest adalah keahlian, bukan ingatan
Di
UK, cenderung berasumsi negara memihak rakyat, meski punya kebiasaan mengeluh
dan tidak percaya politikus. Warga UK sukar mengerti sikap AS terhadap
pengendalian kepemilikan senjata api yang tampak sebagian didorong kepercayaan
bahwa negara tak bisa dipercaya dan orang ingin punya kemampuan membela diri
terhadapnya, dalam banyak rezim totaliter sepanjang sejarah, negara mengadu
domba rakyat, menggunakan sebagian rakyat sebagai informasi untuk mengawasi
yang lain, sarana kendali yang boros dan tak efisien, banyak waktu harus
diberikan untuk kegiatan pengawasan dan populasi yang selalu takut serta tak
saling percaya akan selalu beroperasi di tingkat di bawah standar, mahadata
memberi Bung Besar segala keuntungan pengawasan gaya lama dengan lebih sedikit
kerugian
Dapat menjadi kenyataan di Tiongkok, dimana ada
penerimaan jauh lebih kuat atas pembatasan kemerdekaan individu. Pemerintah
Tiongkok mengembangkan sistem mahadata bertujuan membuat dokumentasi otomatis
atas rakyat, memberi nilai berdasarkan tanda sosial dan finansial yang
mencerminkan perilaku dengan imbalan berupa ketersediaan berbagai layanan yang
dikuasai negara artinya hampir segala hal. Selain pengecekan belanja dan nilai
kredit yang sudah familiar, sistem itu bakal memantau pelanggaran kecil seperti
menyeberang sembarangan dan tidak bayar angkutan umum atau pelanggaran
pembatasan aturan ukuran keluarga Tiongkok, hasilnya adalah nilai bisa
dipercaya yang berpengaruh ke cara negara memperlakukan kita, bahkan
ketika mencoba makanan di restoran atau
mendapat pasangan kencan lewat internet
Sejauh
menyangkut negara Tiongkok, sistem seperti itu bukan beban, melainkan jalan menuju
kebebasan jika berkelakuan baik, negara akan memberi imbalan. Namun jika
berkelakuan tidak mendukung masyarakat sosialis harmonis, akan menderita. Kalau
kepercayaan di satu bidang dilanggar, akan dibatasi di bidang lain, negara
percaya sistem itu diperlukan untuk mencegah kekacauan ekonomi akibat penipuan
dan penyuapan, juga perusahaan yang menjual makanan tak layak atau obat palsu
berbahaya. Mahadata Bung Besar berskala masif terlalu masif untuk bisa
dilakukan bahkan dengan teknologi hari ini. Penduduk Tiongkok diatas 1,3 miliar
orang, sistemnya dicoba pada skala kecil, dan sistemnya benar diterapkan
disana, sukar membayangkan potensi
masalah dengan data buruk dan asumsi buruk harus diprediksi dan dicegah, GIGO
bisa menghancurkan kehidupan orang. Transparansi penting bagi sistem mahadata
yang digunakan dalam demokrasi, dan mengawasi ketat seberapa jauh pemerintah
diperbolehkan menggunakan data itu bahkan bila ada alasan yang benar sah,
seperti pencegahan terorisme. Ada keadaan khusus dimana pemerintah perlu akses
data melebihi batas normal tapi harus selalu jadi kasus khusus bukan keadaan umum sebagaimana besar
dimungkinkan oleh mahadata. Sisi positif keterlibatan pemerintah dalam data,
memberi akses dan kesempatan mencari tau apa yang diperlukan mengenai negara
dengan mudah dan bebas, kebebasan informasi masih sangat terbatas dan mahal,
dengan mahadata seharusnya siapapun mudah mendapat akses ke informasi relevan
mengenai pemerintah, menggunakan pengetahuan yang tepat, mengubah demokrasi
serta memastikan pemerintah dan korporasi tidak menyalahgunakan kesempatan
mahadata, peretas
Dua
A besar adalah algoritma dan asumsi, suatu sistem mahadata hanya sebagus
algoritma yang digunakan untuk mengakses dan mengelola data, dan algoritma
bergantung ke perancang yang bisa membuat asumsi akurat mengenai pengguna
sistem dan asumsi akurat mengenai deduksi yang bisa dibuat dari data. Asumsi
ada di inti sebagian besar kegagalan dalam pembuatan keputusan. Asumsi
menghalangi kreativitas dan gagasan baru, membuat asumsi mengenai batas data
dan bagaimana data akan digunakan kecuali kalau ada kesempatan mengoreksi,
asumsi akan menghalangi penggunaan mahadata dengan pantas
Ketika
komputer mulai banyak pada 1960, tahun 2000 tampak masih jauh, agar tidak makan
banyak tempat penyimpanan, data tanggal disingkat banyak sistem berasumsi bahwa
tahun dimulai dengan 19, bisa sesudah tahun 2000, suatu tanggal pada tahun
2017, misalnya bakal diasumsikan sebagai 1917, itu menyebabkan data keliru,
atau program macet, kalau misalnya mencoba mengetahui umur seseorang yang lahir
pada 1973 dengan menghitung 1917 dikurangi 1973, pengecekan dan pengetesan
jelas penting untuk sistem yang menjaga pesawat tetap terbang, misalnya tapi
tidak mesti untuk semua perangkat lunak kantoran biasa, namun tetap saja ada
fakta bahwa para pemrogram telah membuat asumsi bahwa tahun 2000 masih terlalu
jauh dikhawatirkan yang terbukti keliru, maka sebagian hikmahnya adalah bahwa
perancang algoritma mahadata harus sebanyak mungkin membuat asumsinya jelas dan
menguji asumsi sebanyak mungkin, akan selalu ada beberapa masalah yang lolos,
makanya diperlukan umpan balik dan koreksi, tapi seharusnya juga ada pemikiran
lebih matang mengenai konsekuensi sebelum suatu sistem mulai dijalankan
Pendekatan
mahadata bagus untuk memberi informasi, tapi terbatas dalam hal pengetahuan.
Sistem IBM Watson, terkenal karena menang satu versi khusus acara kuis Jeopardy
pada 2011, namun bila Watson keliru menjawab, kelirunya tidak masuk akal,
jawaban Watson untuk pertanyaan mengenai kota AS dengan bandara tertentu adalah
Apa itu Toronto, pendekatan mahadata tidak punya apa yang dapat disebut akal
sehat
Profesor
sains komputer Hector Levesque memberi
kesan bahwa kecerdasan butan didorong mahadata akan selalu bermasalah dengan
kejadian langka yang disebut ekor panjang,
dalam distribusi probabilitas, itu adalah kejadian kecil kemungkinannya,
namun sementara sembarang situasi tertentu barangkali terjadi, ada kemungkinan
kejadian tak terduga di mana sistem tidak punya cukup banyak data untuk
menanganinya. Menggunakan pengetahuan, akal sehat, adalah pendekatan terbaik
dalam keadaan seperti itu. Mobil swakemudi yang hanya punya data masa lalu
untuk membantunya membuat keputusan bisa kesulitan jika misalnya ada hewan
ternak masuk ke jalan atau mobilnya memasuki bundaran ajain terkenal di
Swindon, dimana 5 bundaran kecil bergabung menjadi satu bundaran besar
Mahadata
bisa membawa manfaat selama mendidik
diri untuk mengerti dan menghadapina, serta memastikan algoritma transparan dan
tidak dirancang sedemikian sehingga menjebak orang dalam spiral menurun tanpa
jalan keluar