Tampilkan postingan dengan label technology. Tampilkan semua postingan
Tampilkan postingan dengan label technology. Tampilkan semua postingan

Kamis, 21 Oktober 2021

Mahadata Bagaimana Revolusi Informasi Mengubah Hidup Kita

 



Mahata  adalah penggunaan seluruh kisaran data yang tersedia untuk mentransformasi suatu layanan atau organisasi. Netflix menunjukkan bagaimana suatu perusahaan video tayang sesuai permintaan (video on demand) bisa menempatkan mahadata di intinya. Layanan seperti Netflix melibatkan lebih banyak kominikasi dua arah dibanding siaran konvensional. Perusahaan itu tau siapa yang menonton apa, kapan, dan dimana. Sistemnya dapat melakukan pengukuran lintas indeks atas minat seorang penonton, dan memberi umpan balik. Kesukaan orang bisa mengubah proses pembuatan seri itu

 

Mahadata juga berpotensi mengubah pekerjaan polisi dengan memprediksi kemungkinan lokasi kejahatan, menggerakkan foto yang diam, memberi wahana demokrasi sejati untuk pertama kali, memprediksi buku laris berikutnya, memberi pemahaman mengenai struktur dasar alam dan merevolusi dunia kedokteran

 

Kedigdayaaan mahadata berasal dari pengumpulan banyak sekali informasi dan menganalisisnya dalam cara yang tak dapat dilakukan manusia tanpa komputer, suatu upaya melakukan hal yang tampak mustahil. Data sudah ada sejak 6000 tahun ke awal masyarakat petani untuk melihat konsep data menjadi tulang punggung peradaban. Data berevolusi pada abad ke 17 dan ke 18 untuk menjadi alat pembuka jendela masa depan. Namun upaya itu selalu dibatasi sempitnya data yang tersedia dan keterbatasan kemampuan menganalisisnya, mahadata membuka dunia baru, kadang caranya mencolok seperti komputer Amazon Echo yang berinteraksi dengan suara. Kadang ada di balik layar, seperti kartu pelanggan pasar swalayan. Yang jelas penerapan mahadata makin banyak dan berpotensi besar berdampak baik maupun buruk bagi kita.

 

Menurut kamus, data berasal dari bentuk jamak kata Latin datum artinya benda yang diberi,. Sebagian besar saintisi menganggap paham bahasa Latin dan memberitahu data adalah kata jamak jadi dalam bahasa Inggris, kata mereka yang benar itu “the data are convincing” bukan “the data is convincing. Namun Oxford English Dictionary yang biasanya konservatif mengakui bahwa penggunaan data sebagai kata benda tunggal massal merujuk ke satu kumpulan sekarang biasanya dianggap baku. Jelas kedengarannya lebih wajar, jadi dianggap data sebagai kata benda tunggal massal. Benda yang diberi itu sendiri tampak tak jelas. Paling sering dimaksud adalah angka dan ukuran, walau bisa berupa apapun yang bisa dicatat dan digunakan belakangan

 

Data bisa dianggap sebagai dasar piramida pemahaman : pengetahuan, informasi, data

 

Dari data membangun informasi. Informasi mengumpulkan koleksi data terkait agar memberitahu sesuatu yang berarti mengenai dunia. Dari informasi membangun pengetahuan, pengetahuan adalah tafisr atas informasi agar bisa emnggunakannya dengan membaca buku, lalu mengubah informasi untuk membnetuk gagasan, pendapat, dan tindakan masa depan, mengembangkan pengetahuan

 

Data bisa jadi berupa kumpulan angka, penataannya dalam tabel yang menunjukkan, misalnya jumlah ikan di daerah tertentu di laut, pada tiap jam, bakal memberi informasi. Seseorang yang menggunakan informasi untuk memutuskan kapan waktu terbaik untuk pergi menangkap ikan disebut memiliki pengetahuan

 

Sejak peradaban manusia bermula, manusia sudah memajukan teknologi untuk mengelola data dan mendaki piramida. Awalnya adalah tablet lempung, yang digunakan di Mesopotamia setidaknya 4000 tahun lalu. Tablet memungkinkan data disimpan secara praktis dan bisa di gunakan kembali, bukan disimpan dalam kepala atau dicoretkan ke dinding gua. Tablet adalah penyimpanan data yang bisa dibawa. Pada waktu yang sama, pengolah data pertama dikembangkan, berupa sempoa yang sederhana tapi sangat berdaya, sempoa, yang awalnya menggunakan batu bertumpuk, kemudian manik di kawat, memungkinkan pengolaan data angka sederhana. Namun meski kemampuan pengelolaan data meningkat dari abad ke abad, arti mahadata baru tampak pada akhir abad ke 19 akibat ada masalah dalam penanganan sensus

 

Pada hari awal pelaksanaan sensus di USA, makin besarnya jumlah data yang harus disimpan dan diolah tampak bisa menghabiskan sumber daya yang tersedia untuk menanganinya. Keseluruhan prosesnya tampak akan kacau. Ada periode 10 tahun antarsensus tapi waktu makin panjang untuk tabulasi data sensus. Tak lama kemudian ketika 1 sensus berikutnya sudah tiba, masalah itu dipecahkan dengan mekanisasi, alat elektromekanis memungkinkan pengunaan kartu berlubang, masing mewakili sepotong data untuk dimanipulasi otomatis jauh lebih cepat daripada yang dapat dilakukan manusia. Menginjak akhir 1940, kebangkitan komputer elektronik, peralatan mencapai tingkat kedua piramia. Pengolahan data berganti menjadi teknologi informasi. Sudah ada penyimpanan data sejak penciptaan tulisan. Buku adalah penyimpanan informasi

 

Untuk beberapa lama tampakmya seolah tahap terakhir otomatisasi piramida mengubah informasi menjadi pengetahuan berharga, bakal memerlukan sistem berbasis pengetahuan. Program komputer itu mencoba menangkap aturan yang manusia gunakan untuk menerapkan pengetahuan dan menafsirkan data. Namun sistem berbasis pengetahuan yang bagus terbukti sukar dicapai karena 3 alasan, pertama, para pakar manusia tak buru membuat diri sendiri jadi tak diperlukan dan jarang mau bekerjasama. Kedua pakar manusia sering tak tau bagaimana mereka mengubah informasi menjadi pengetahuan dan tak dapat menyatakan aturannya untuk orang TI, kalaupun mereka mau dan terakhir, aspek realitas yang dibuat modelnya dengan cara itu terbukti terlalu kompleks untuk memberi hasil berguna

 

Dunia nyata sering kacau (khaotik) dalam arti matematis. Bukan berarti yang terjadi itu acak justru sebalikmnya,artinya ada banyak sekali interaksi antarbagian dunia yang dipelajari sehingga perubahan kecil sekali sekarang  bisa menghasilkan perubahan besar pada hasil masa depan. Prediksi masa depan secara signifikan jadi praktis mustahil

 

Namun sekarang tersedianya internet dan komputer yang puter terbaru, karena tersedianya internet dan komputer yang mudah dibawa, mahadata memberi alternatif, pendekatan lebih pragmatis untuk menuju puncak piramida data, informasi pengetahuan. Sistem mahadata mengambil volume besar data, data biasanya mengalir cepat dan tak berstruktur, lalu menggunakan teknologi informasi terbaru untuk menangani dan menganalisis data dengan cara yang kurang kaku dan lebih tanggap, sampai baru ini, itu mustahil. Penanganan data di skala itu tak praktis, jadi orang yang mempelajari suatu bidang bakal mengandalkan sampel

 

Contoh pengambilan sampel adalah jajak pendapat, dimana para pelakunya mencoba menyimpulkan pendapat suatu populasi berdasarkan sampel kecil. Kelompok kecil dipilih dengan cermat (kalau jajak pendapatnya bagus) agar mewakili keseluruhan populasi, tapi selalu ada asumsi dan tebak – tebakan yang tak terlibat. Beberapa pemiluhan umum baru ini sudah menunjukkan bahwa jajak pendapat tak bisa memberi lebih daripada tebakan bagus mengenai hasilnya, pemilihan umum Kerajaan Inggris 2010 jajak pendapat keliru. Referendum Brexit 2016 dan pemilihan presiden USA 2016, teknologi yang sekarang dipunyai bisa mengakses data terus – menerus, bukan melalui mekanisme mahadata gaya lemas yang kikuk dan lembut seperti sensus atau pemilihan umum

 

Bagi para pecinta data, masa lalu, masa kini, dan masa depan punya nuansa tertentu. Secara tradisional, data dari masa lalu menjadi satunya kepastian, data paling awal utamanya merupakan catatan masa lalu mengenai pertanian dan perdagangan. Para tukang hitunglah yang mengerti nilai data. Yang mereka garap kala itu tidak selalu dipegang, karena konsep angka itu sendiri masih belum tetap

 

Kota Uruk yang berdiri sekitar 6000 tahun lalu ditempat yang sekarang Irak. Orang Uruk segera mendapat data dari perdagangan mereka, tetapi mereka belum menyadari bahwa angka bisa diterapkan untuk segala benda. Data bergandengan dengan perdagangan, juga dengan pendirian negara. Kata statisik punya asal yang sama dengan state (negara) aslinya statistik adalah data mengenai negara, entah data dikumpulkan untuk perdagangan atau pajak atau penyediaan barang, masa lalu dianggap penting untuk diketahui, dalam pengertian itu, ketergantungan kepada data masa lalu bukan solusi sempurna, melainkan cerminan pragmatis atas kemungkinan, idealnya adalah mengetahui negara aslinya statistik adalah data mengenai negara. Data dikumpulkan untuk perdagangan atau pajak atau penyediaan barang masa lalu dianggap penting untuk diketahui

 

Ketergantungan kepada data masa lalu, cerminan pragmatis atas kemungkinan. Idealnya adalah mengetahui masa kini juga, namun hanya mudah untuk transaksi lokal, sampai mekanisme mahadata tersedia menjelang akhir abad ke 20, banyak organisasi masih menganggap masa kini tidak ada. Masa kini menjadi bagian mahadata pokok untuk masa depan

 

Penulis menerima laporan penjualan untuk misalnya 6 bulan dari Januari ke Juni pada akhir September dan akan mendapat royalti pada Oktober, sistem pencatatan penjualan tidak ada, tapi tidak diintegrasikan. Penerbitan menggunakan penjualan atau retur, buku tercatat, terjual, bila dikirim ke toko buku tapi bisa diretur/dikembalikan dan data penjualannya dihapus kapan saja pada masa depan, perjanjian komersial berakar pada masa lalu, dan berubah ke pendekatan mahadata adalah tantangan besar. Pada abad ke 17, ada kesadaran bahwa data yang dikumpulkan dari masa lalu dapat diterapkan untuk masa depan, menggunakan data dari pengalaman untuk membantu bersiap untuk menghadapi berbagai kemungkinan pada masa depan, namun yang baru adalah penggunaan data sedemikian dengan sadar dan tersurat

 

London abad ke 17 dengan seorang pembuat kancing John Graunt, karena rasa ingin tau saintifik. Graunt mendapatkan catatan mortalitas, dokumen yang berisi rincian kematian di London antara 1604 – 1661. Graunt hanya tertarik mempelajari angka melainkan juga memadukan apa yang dia dapat darinya dengan sebanyak mungkin sumber data lain. conton rincian kelahiran. Dia melihat bagaimana perubahan populasi London (tak ada sensus) dan pengaruh berbagia faktor terhadap harapan hidup. Kombinasi data masa lalu dan spekulasi masa depan itulah yang membantu bermulanya satu industri yang mendunia di warung kopi London, berdasarkan perhitungan Graunt buat, data dipelajari secara sadar dan digunakan untuk membuat rencana,  data akan membentuk rantai bercahaya, menautkan apa yang sudah terjadi dan apa yang akan terjadi. Yang dikuantifikasi kemudian bukan hanya harapan hidup, meski berguna buat bisnis asuransi. Sains prakiraan (forecasting), prediksi data masa depan, penting bagi segalanya dari meteorologi sampai perkiraan volume penjualan, prakiraan berarti memperkirakan masa depan, dengan mengumpulkan data dari masa lalu dan sebanyak mungkin dari masa kini, gagasan prakiraan adalah melempar angka ke masa depan. Kualitas upaya semacam itu sangat beragam, mengeluhkan ketepatan prakiraan cuaca sudah menjadi hobi nasional Kerajaan Inggris sejak prakiraan cuaca mulai dimuat di The Times pada 1860,  walau sekarang sudah jauh lebih baik dibanding 40 tahun lalu, dalam tiap bisnis angka tak akurat, dan perusahaan biasanya mengadakan pemeriksaan apa yang salah dengan bisnisnya, pemeriksaan mengabaikan kenyataaan bahwa prakiraan pasti salah, yang terjadi adalah prakiraan tak sama dengan penjualan, tapi pemeriksaan berusaha mencari tau mengapa penjualan tak sama dengan prakiraan

 

Pola adalah mekanisme utama yang digunakan untuk mengerti dunia, tanpa membuat kesimpulan berdasarkan pola untuk mengindentifikasi pemangsa dan kawan, makanan atau ancaman, tak bakal bertahan lama. Sains sendiri sola penggunaan pola  tanpa pola perlu teori baru untuk tiap atom, tiap benda, tiap hewan, guna menjelaskan perilakunya

 

Ketika wahana antariksa Viking 1 pada 1976 memotret rincian permukaan planet Mars, ada satu fotonya yang langsung ditafsirkan otak pengenal pola sebagai wajah, ukiran wajah berukuran besar. Foto lebih baru menunjukkan bahwa itu ilusi, disebabkan  bayangan ketika Matahari ada di sudut ruangan, bebatuan yang menimbulkan bayangan tak mirip wajah tapi hampir mustahil untuk tidak melihat wajah di foto asli. Bahkan ada kata melihat gambaran sesuatu yang tidak benar ada disana: pareidolia. Dengan cara yang sama, keseluruhan usaha prakiraan didasari pola  yang menjadi kekuatan dan kelemahan terbesarnya

 

Peristiwa acak tak terjadi merata, ada pengumpulan dan kekosongan. Ketika penyakit pola muncul, sukar menolak gejala kuatnya, alasan perusahaan lotre menyediakan statistik adalah karena banyak orang percaya bahwa satu bola yang belum keluar akhir ini sudah waktunya keluar, tidak ada hubungan yang mengaitkan satu undian dengan undian lain. lotre tak punya ingatan. Di sebagian besar, entah cuaca, perilaku bursa saham, atau penjualan sepatu bot karet, masa depan tak sepenuhnya tak berhubungan dengan masa lalu, di situ ada hubungan yang diteliti, sampai batas tertentu bisa menggunakan data untuk membuat prakiraan bermakna, namun masih perlu berhati untuk mengerti batas proses prakiraan

 

Cara tergampang menggunakan data untuk memprediksi masa depan adalah berasumsi keadaan akan sama seperti kemarin. Metode paling sederhana bisa bekerja dengan sangat baik, memerlukan  sedikit saja daya komputasi

 

Pada 2016, Hukum Moore, yang memprediksi bahwa jumlah translator di komputer akan mengganda setiap satu atau dua tahun sudah berlaku selama 50 tahun lebih, Hukum Moore akan berlaku lagi pada satu titik, dan berharap kegagalannya terjadi segera selama setidaknya 20 tahun, lebih banyak lagi hal yang sama sudah lumayan ampuh sejauh ini

 

Sepanjang sebagian besar masa sejarah telah terjadi inflasi. Nilai uang turun terus, pernah ada periode deflasi, dan masa ketika redefinisi satuan mata uang menggeser standar, tapi secara keseluruhan nilai uang turun terus bekerja baik sebagai alat prediksi. Bagi pemrakira, sedikit sistem yang seserdahana itu. Efek musim hanya satu pengaruh yang tercermin dalam data masa lalu yang bisa memengaruhi masa depan. Bila ada variabel seperti itu, prakiraan bisa kacau, apalagi jika sekumpulan masukan saling berinteraksi hasilnya bisa berupa sistem khaotik matematik yang tidak bisa diprediksi melebihi beberapa hari ke depan, sistem cuaca secara keseluruhan punya  banyak sekali faktor kompleks, semuanya saling berinteraksi, sehingga perbedaan kecil di konsisi awal bisa menghasilkan perbedaan besar kemudian

 

Istilah angsa hitam dikenal karena Nassim Nicholas, The Black Swan, walau konsepnya lebih tua. Sejak 1570, angsa hitam digunakan sebagai metafora untuk kelangkaan ketika seseorang bernama T Draunt menulis Captaine Cornelius is a blacke swan in this generation, angsa hitam dalam statistik adalah bahwa pembuatan prediksi berdaar data statisik adalah pembuatan prediksi berdasar data tak lengkap dan itu hampir selalu terjadi dalam kenyataan mengandung risiko terjadi sesuatu mendadak dan belum pernah ada pada masa lalu, penggunaannya dalam statisik merujuk ke fakta bahwa Eropa, sampai mulai meneliti fauna Australia, dapat membuat prediksi, semua angsa itu putih, yang selalu berlaku, namun sesudah melihat satu angsa hitam Australia, keseluruhan premis buyar. Angsa hitam mencerminkan perbedaan antara dua teknik logika, deduksi dan induks, berkat Holmes prakiraan sebagai deduksi, mengenai apa yang sudah terjadi, namun proses deduksi berdasarkan set data lengkap, tanpa ketersediaan deduksi kembali ke induksi

 

Tujuan mahadata adalah meminimalkan risiko kegagalan prakiraan dengan mengumpulkan sebanyak mungkin data, memungkinkan para pengendali mahadata melakukan hal yang dulu belum mungkin. Prakiraan meteorologi adalah yang pertama menyambut mahadata. Met Office adalah pengguna super komputer terbesar di Kerajaan Inggris, melahap banyak data seban hari untuk memproduksi sejumlah prakiraan yang dikenal sebagai ensembel, prakiraan dipadukan untuk memberi probabilitas terbaik hasil tertentu di lokasi tertentu dan prakiraannya jauh lebih baik daripada dulu, namun tak bisa mengandalkan sepanjang waktu atau mendapat prakiraan yang berguna untuk lebih daripada 10 hari ke depan. Mahadata bisa menghilangkan bahaya salah satu alat prakiraan berbahaya, upaya memberi kesan punya mahadata padahal hanya ada sebagian kecil data

 

Pernah ada masa ketika mahadata hanya dapat ditangani sekali karena butuh waktu dan upaya yang sangat banyak untuk mengolahnya, sensus atau pemilihan umum dapat menanyakan data semua orang tapi tidak dimungkinkan untuk hal lain dengan sistem penanganan data manual yang tersedia, mengembangkan konsep sampel. Mencakup memilih sebagian populasi, mengambil datanya lalu mengeksploitasi temuannya ke populasi secara keseluruhan

 

Pembayaran PLR di Kerajaan Inggris PLR (Public Lending Right) adalah mekanisme untuk membayar penulis bila buku karyanya dipinjam dari perpustakaan, karena tidak ada sistem yang mengumpulkan data pinjaman di seluruh negara, diambil sampel 36 perpustakaan, seperempat dari seluruh perpustakaan senegara, kemudian sampel dikalikan 4 untuk menggambarkan peminjaman buku senegara, beberapa angka akan tak akurat, jika menulis buku mengenai Swindon, buku itu akan dipinjam lebih dari sering di Swindon daripada Hampshire, yang perpustakaannya dijadikan sampel, akan ada banyak alasan lain mengapa sekumpulan perpustakaan tertentu mungkin tak mewakili secara akurat peminjaman buku tertentu, sampel lebih baik daripada tidak ada sama sekali, tapi tak bisa dibandingkan juga dengan pendekatan mahadata yang mengambil data dari semua perpustakaan. Sampel bukan hanya pendekatan yang digunakan untuk jajak pendapat dan memperoleh statistik

 

Hanya sedikit yang melibatkan populasi secara keseluruhan, sampai akhir ini, diambillah sampel yang mewakili untuk mengecek dampak suatu perlakuan atau diet terhadap orang yang ada disampel, ada 2 masalah dengan pendekatan, satu sangat sukar mengisolasi dampak perlakuan tertentu, dan dua sangat sukar memilih sampel yang mewakili, mengumpulkan cukup banyak orang dengan proporsi yang tepat untuk mencakup variasi akan mempengaruhi hasil penelitian atau jajak pendapat

 

Jika mengetahui apa saja faktor signifikannya, ada mekanisme untuk menentukan ukuran sampel yang tepat agar mewakili. Namun banyak penelitian medis, hanya mampu menyediakan sebagian kecilnya, makanya sering mendapat hasil penelitian yang bertentangan. Banyak survei dan jajak pendapat yang kurang memadai jumlah sampel maupun keterwakilannya untuk mengatasi itu, para pelaku jajak pendapat mencoba mengoreksi perbedaan antara sampel dan apa yang dianggap seharusnya. Angka jajak pendapat bukan nilai sebenarnya, melainkan hasil koreksi dengan menebak angka seharusnya

 

Penggunaan sampel akan berlanjut di banyak bidang karena alasan biaya dan kepraktisan, walau kepercayaan terhadapnya bakal lebih terbantu kalau konsumen hasil dipermudah untuk mengetahui asumsi dan pembobotannya. Mahadata menawarkan kesempatan untuk menghindari jebakan sampel dan mengambil masukan dari kelompok besar sehingga ada lebih sedikit ketidakpastian, secara tradisional, kiranya memerlukan pemilihan umum yang persiapan dan pengambilan hasilnya butuh berminggu kalau pemberi suara bersedia menjalani prosesnya, berkali dalam satu tahun, sistem modern membuat relatif mudah mengumpulkan beberapa jenis data, bahkan pada skala besar, dan organisasi makin melakukannya. Menggunakan proksi, gagasannya memulai dengan data yang bisa dikumpulkan dengan mudah, data yang bisa diambil tanpa harus membuat populasi melakukan sesuatu. Dulu data hasil pengamatan sangat sukar di dapat para ahli statisik, kemudian datanglah internet, biasanya pergi ke satu situs web berniat melaukan sesuatu, menemukan suatu informasi di mesin pencari, atau membeli sesuatu di toko daring, namun para pemilik situs bisa menangkap jauh lebih banyak data daripada yang disadari bagi apa yang dicari, memperkenalkan data digunakan memberikan kepraktisan tapi memberi sumber data hebat bagi perusahaan

 

Para pemilik mesin pencari dominan dapat mengumpulkan segala macam informasi untuk memprediksi niat kita dalam pemilihan umum, penetapan mahadata tidak seperti sistem berbasis pengetahuan, tak ada yang harus memberitahu sistem mengenai apa saja aturannya, dengan mencocokan kuantitas besar data dan hasil, sistem dapat belajar seiring waktu untuk menghasilkan gambaran populasi yang makin akurat

 

Gigo adalah singkat populer, kepanjangannya, garbage in, garbage out, masuk sampah, keluar sampah. Premisnya sederhana sebagus apapun sistem, jika data yang diberikan itu sampah, keluarannya juga sampah, satu potensi masalah mahadata adalah apabila data masukan kurang besar, memang bisa menggunakan data pencarian untuk mencari tau hal mengenai sebagian populasi, tapi hanya bagian populasi yang menggunakan mesin pencari. Tanpa mekanisme untuk mendeteksi sampah dan memodifikasi sistem agar menghindarinya, GIGO membuat sistem memelihara kekeliruan. Sistem mulai berfungsi dalam dunianya sendiri, bukan mencerminkan populasi yang hendak dimodelkan

 

Para pembangun sistem mahadata prediktif gampang mendapat kompleks Hari Seldon, Hari Seldon ialah tokoh utama novel fiksi sains klasik Isaac Asimov, Foundation, dalam seri itu, Hari Seldon membentuk kelompok ahli matematika yang menggunakan sains psikosejarah untuk membangun model masa depan imperium galaktik, tujuan mereka mengurangi periode barbarisme yang tak terhindarkan apabila imperium runtuh, sebagaimana terjadi sepanjang sejarah, dramanya tapi di dunia nyata tak ada yang namanya psikosejarah. Tidak peduli sebanyak apapun data yang dimiliki, bisa memprediksi masa depan negara dan bangsa seperti cuaca, negara dan bangsa adalah sistem khaotik sistematis. Ada terlalu banyak interaksi antar komponen sistem sehingga mustahil membuat prediksi bagus melebihi cakrawala waktu singkat dan tiap individu manusia bisa menjadi angsa hitam, menghasilkan sistem yang benar kompleks, para pembuat sistem mahadata perlu berhati agar tak merasa seperti Hari Seldon yang menganggap teknologi memungkinkannya memprekdiksi masa depan manusia dengan akurat karena mereka akan gagal

 

Data tak mesti hanya kumpulan data. Data bisa bermacam. Dalam sains, data biasanya disajukan bukan sebagai nilai spesifik, melainkan kisara yang disajikan dengan batas kesalahan, bukannya mengatakan bahwa nilainya  adalah 1 bisa dikataan 1 = 0,05 pada tingkat kepercayaan 99% artinya berharap menemukan nilainya pada kisaran antara 0,95 dan 1,05 dalam 99 dari 100 kesempatan. Ketiadaan presisi hadir dalam data, tapi jarang ditunjukkan dan berarti bisa membaca hal yang sebenarnya tak ada pada data

 

Jika mengerjakan mahadata dengan benar, diatasi bukan hanya ketidakakuratan yang selalu ada akibat pengambilan sampel, melainkan juga perluasan pandangan diatas data yang berguna dari masa lalu agar mencakup masa kini, memberi gambaran terbaik atas masa depan yang dekat, itu karena analisis statistik konvensional mahadata bisa terus diperbaharui mengikuti tren. Mahadata memperkenankan menangani irama dan variasi yang lebih rinci, bisa menghadirkan banyak tambahan dan melihat apakah ada gunanya dalam membuat prakiraan jangka pendek

 

Pengamat kereta dan penulis buku harian menggunakan pendekatan mahadata sebelum ada teknologi maju. Penulis buku harian sebagai pengumpul mahadata purba karena mereka mampu mengumpulkan hal kecil yang tak bakal dicatat orang lain, untuk mengisi buku harian menjadi mahadata hanya diperlukan penataan. Dari 1937 sampai 1949 di Kerajaan Inggris, satu program yang dikneal sebagai Mass Observation melakukan itu, satu panel penulis nasional menulis buku harian, menjawab pertanyaan, dan mengisi survei. Pada waktu yang sama, satu tim peneliti dibayar untuk ikut serta mencatat kegiatan dan percakapan publik, pertama di Bolton lalu di seluruh negeri. Hasil kegiatan dikumpulkan dalam 3000 lebih laporan yang menyajikan rangkuman data luas tingkat tinggi, semua data tersedia untuk publi, menjadi sumberdaya yang luar biasa, proyek kedua semacam itu dimulai pada 1981 dengan panel lebih kecil sekitar 450 sukarelawan yang memasukkan informasi ke kumpulan data

 

Charles Babbage berhubungan erat dengan komputer, dan meski Babbage tidak pernah berhasil membuat teknologinya bekerja dan mesin komputasinya hanya berhubungan secara konseptual dengan komputer sungguh sesudahnya, ia tak diragukan lagi bahwa Babbage berperan membuat mahadata menjadi praktis

 

Babbage sedang menolong kaean lama, John Herschhel, putra ahli astronomi, dan pemusik kelahiran Jerman William Herschel, waktu itu musim panas 1821 dan Herschel meminta Babbage ikut bersamanya mengecek buku tabel astronomi sebelum dicetak, baris demi baris angka yang harus diperiksa ketepatannya amat sangat membosankan. Selagi Babbage menggarap tabel dengan cermat memeriksa tiap nilai. Babbage tidak dapat melakukannya secara praktis dengan mesin komputasi mekanis tapi dia punya gagasan dengan Herman Hollerith, orang Amerika yang menyelamatkan sensus AS dengan mekanisasi data, keduanya dilhami alat tenun Jacquard, alat tenun Jacquard adalah ciptaan zaman Ratu Victoria yang memungkinan pola tenun sustra diprogram di sekumpulan kartu, masing dengan pola lubang tertentu untuk menandakan warna apa yang digunakan. Babbage ingin menggunakan kartu seperti itu pada komputer untuk umum, tapi tak bisa menyelesaikan rancangannya yang jelimet. Hollerith mundur selangkah dari pengolah informasi Babbage menyebutnya mill, bagian tercerdas rancangan namun Hollerith menyadari bahwa misalnya tiap baris informasi dari sensus diterakan sebagai lubang di kartu, alat elektromekanis dapat menata dan mengumpulkan kartu untuk menjawab berbagai pertanyaan dan mulai mendapatkan manfaat yang bisa diberikan mahata

 

Alat yang terlibat disebut tabulator. Penggunaan tipikal mungkin untuk menghitung berapa orang yang ada dalam berbagai kelompok umur, jenis kelamin, ras, dan sebagainya. Kartu di lewatkan di tabulator (awalna secara manual belakangan secara otomatis), dimana paku logam menyambungkan rangkaian listrik dengan mencelup ke air raksa ketika melewati lubang di kartu. Tiap denyut listrik memajukan satu jarum petunjuk. Operator kemudian menaruh kartu ke laci tertentu di meja penataan, sebagaimana di arahkan tabulator (bagian dalam proses juga kemudian diotomatisasi. Tabulator Hollerith diproduksi perusahaan Tabulating Hollierith diproduksi perusahaan Tabulating Machine Company miliknya, yang berubah menjadi International Business Machines, IBM menjadi raksasa teknologi informasi. Pendekatan mekanis adalah laju pengolahan datanya selalu terbatas, pendekatan itu memungkinkan sensus dikelola dalam 10 tahun masa antarsensus tapi tak dapat menyediaka analisis dan manipulasi luwes. Satu alasan mahadata bisa dimudahkan adalah karena kecepatan beralih dalam 2 dasawarsa berakhir ke teknologi berjejaring berkecepatan ultratinggi yang memungkinkan operasi mahadata sejati. Hollerith string untuk sebaris informasi di kartu masih bisa dipakai. Pada 1995, komputer personal, salah satu alat wajib mahadata, sudah lazim, meski belum gampang dibawa seperti hp, alat wajib kedua, konektivitas lewat internet,bagian teka teki mahadata, algoritma

 

Walau Oxford English Dictionary bersikeras bahwa algoritma berasal dari Yunani kuno untuk angka (agak mirip Aritmetika), sebagian besar sumber lain memberitahu bahwa algoritma kebanyakan data berawalan Al berasal dari bahasa Arab, kata itu berasal dari nama penulis buku matematika berpengaruh pada zaman pertengahan, al – Khwarizmi, algoritma merujuk ke satu set prosedur dan aturan yang memungkinkan menangani data dan melakukan sesuatu dengannya. Aturna yang sama bisa diterapkan ke berbagai set data. Mirip sekali definisi program komputer dan banyak program menggunakan algoritma tapi tak perlu komputer untuk algoritma dan program komputer tidak harus mencakup algoritma, algoritma Fibonacci, 1,1,2,3,5,8,21,34,55,89,144

 

Deretnya panjang tak berhingga, tapi algoritma untuk membuatnya pendek seperti awali dengan dua angka satu, tambahkan angka terakhir di deret dengan angka sebelumnya untuk menghasilkan nilai berikutnya. Algoritma untuk mahadata bisa jauh lebih canggih. Namun algoritma deret Fibonacci, intinya aturan dan prosedur yang memperkenankan sistem menganalisis atau membangkitkan data. Dari satu deret, ambil hanya angka ganjil, jika diterapkan algoritma ke deret Fibonacci mendapat; 1,1,3,5, 13, 21, 55, 89

 

Data itu tak memiliki nilai. Namun jika data aslinya adalah mengenai pembayar pajak dan menggunakan algoritma untuk angka ganjil

 

Tantangan bagi layanan konsumen efektif berbasis data berasal dari cara data menghadap kedua arah: ketoko atau bank ke konsumen, toko ingin mengetahui sebanyak mungkin mengenai konsumen, supaya bisa mempertahankan dan mendapat sebanyaknya uang dari kita. Data memungkinkan toko memberi layanan lebih baik dan hadiah pribadi, kalau dilakukan dengan benar, mahadata bisa memberi keuntungan ke semua pihak, dan satu kesempatan pertama melakukannya berupa kartu kesetiaan

 

Situs perbandingan harga tidak menjual sendiri, jadi agar dapat uang, situs harus mendapat bayaran dan peritel yang dituju dari sana, tidak ada situs perbandingan di beberapa bagian pasar, komisi membuka kemungkinan disesatkan, atau diberi informasi tak lengkap. Situs perbandingan mengarahkan konsumen ke peritel yang memberi komisi besar, baik itu paling cocok atau bukan dan tidak ada gunanya mengarahkan ke peritel yang tak memberi komisi. Situs perbandingan harga adalah senjata mahadata yang lebih banyak bermanfaat bagi konsumen yang tak punya wakty mencari diantara berbagai kemungkinan. Langkah berikutnya dari aplikasi yang menggunakan data untuk membantu konsumen adalah mekanisme yang memungkinkan mahadata menjadi konsumen, membentuk pasar otomatis

 

Di Amazon bisa membeli banyak produk dari penjual lain. Amazon bertindak sebagai pasar, mengambil sedikit hasil penjualan sebagai imbalan mewujudkan transaksi tapi harga ditetapkan penjual, penjual tergoda untuk melakukan 2 hal : menaikkan harga jika tidak ada pesaing, dan menurunkan harga jika bukan penjual berharga termurah

 

Robot toko, algoritma secara teratur menyesuaikan harga. Pada prinsipnya berarti penjual dijaga agar selalu berada pada posisi terbaik, namun jika aturannya tak dibatasi dengan baik atau frekuensi pengecekan harga oleh robot terlalu sering pendekatan mahadata bisa lepas kendali, penurunan harga berlebihan menyebabkan terlalu banyak produk berharga sangat rendah bahkan ketika sudah merugikan

 

Sistem mahadata bisa bereaksi jauh lebih cepat daripada manusia, dalam 36 menit terjadi kekacauan sebelum manusia sadar apa yang terjadi dan menghentikan algoritma. Mahadata hanya sebagus algoritma yang menangani, kalau ada kesalahan, kecepatan, dan pengulangan algoritma bisa menyebabkan kerusakan besar sebelum efeknya disadari

 

Cookie, file kecil yang digunakan untuk situs web untuk menyimpan data kunjungan

 

American Airlines dulu fokus ke sistem pemesanan Sabre sehingga mengaku sebagai perusahaan sistem pemesanan juga menerbangkan pesawat

 

Bidang riset operasi (operational research, OR) berawal pada Perang Dunia II, parah ahli fisika dan matematika didatangkan untuk membantu memecahkan masalah militer, mereka menghasilkan mekanisme matematis untuk mencari pola bom laut yang melumpuhkan kapal selam, namun sesudah perang, keahlian diserap industri, dan para analisis OR adalah ahli algoritma. Tim OR mengumpulkan data distibusi statistik orang batal terbang, selagi gambaran mahadata terbentuk, mereka memprediksi dengan akurat bahwa 10% pemesanan di penerbangan tak bakal digunakan, sistem menjual 110% tiket di penerbangan

 

Bank menggunakan mahadata dalam sejumlah cara berdampak ke konsumen. Sistem mahadata memantau kegiatan kartu kredit dan debit untuk mencari tindakan mencurigakan

Mahadata dalam kehidupan langsung melalui internet, khususnya World Wide Web keduanya dicampuradukkan media, sering menyatakan bahwa Tim Berners Lee, saintis komputer Britania yang bekerja di CERN Jenewa, menciptakan internet, sebenarnya tidak sumbangan Berners Lee adalah web. Internet infrastruktur untuk menghubungkan komputer, secara harfiah artinya jejaring antarkomputer, internet berkembang secara organik pada 1970, tumbuh dari jejaring militer AS bernama ARPAnet, yang sejak 1960 sudah hadir di Universitas AS, jejaring itu awalnya digunakan untuk menyambungkan komputer terminal ke mainframe yang terletak jauh jadi peneliti di LA, dapat berinteraksi dengan komputer di Boston tanpa perlu pergi ke Boston. Langkah besar pertama maju dari interkonektivitas dasar terjadi pada September 1973 ketika seorang lupa membawa pisau cukur. Dia saintis komputer AS Len Kleinrock, yang menghadiri satu konferensi di Sussex University di Inggris lalu pulang ke LA dan menyadari pisau cukurnya ketinggalan di Brighton,  karena konferensi Brighton dihubungkan ke jejaring seperti ARPANet, jejaring itu diperpanjang untuk sementara, mengantarkan sinyal melalui stasiun komunikasi satelit Goonhilly Downs di Cornwall yang biasanya menangani panggilan telepon lintas Samudra Atlantik dan TV

 

Sejak 1970 surat elektronik menyebar, kemudian ada papan pesan dan mekanisme komunikasi lain yang menggunakan internet atau jejaring komersial seperti Compuserve dan AOL. Namun mahadata masih belum masuk ke kehidupan sehari, selain bagi penggemar, sampai Berners Lee membuat keajaiban. Meski nama World Wide Web kedengaran besar, Berners Lee hanya mencoba mempermudah akses atas perpustakaan dokumen elektronik melalui internet, dia membuat mekanisme standar untuk melakukan itu sebagaimana para pendiri internet membuat protokol komunikasi yang memungkinkan komunikasi antarkomputer terjadi. Berners Lee menggunakan konsep hyperlink (pranala)  yang bisa diklik untuk melompat dari dokumen ke dokumen yang diajukan konsepnya oleh Ted Nelson pada 1960 dan sudah digunakan secara luas di sistem bantuan Microsoft dan program Mac Hypercard, Berners Lee mewujudkan fungsionalitas web lokal pertama di CERN pada akhir 1990 dan membukanya kepada dunia pada 1991. Situs CERN, situs itu utamanya dokumen, teks, hanya sedikit gambar tak mengherankan, mengingat bahwa di luar organisasi besar, akses terhadapnya adalah melalui modem yang memutar nomor telepon, sekitar 1000 kali lebih lambat daripada koneksi internet modern biasa, belum ada Google atau mesin pencari lain (mesin pencari besar pertama, Altavista, baru ada pada 1995). Sebagian besar isinya teks, dan ada beberapa gambar beresolusi rendah

 

Internet sebagai pusat mahadata universal, sumber segala informasi yang diperlukan yang bisa diakses dimana saja kalau memerlukannya. Harus ada pertimbangan mengenai apa yang faktual dan apa yang bohongan. Belum pernah ada ensiklopedia serinci wikipedia, dan banyak informasi di dalamnya akurat, terutama untuk topik sains dan teknologi, analisis pada masa lalu telah menunjukkan bahwa tidak lebih banyak kesalahan artikel sains wikipedia dibanding Encylopaedia Britannica tapi wikipedia berisi jauh lebih banyak informasi. Namun artikel tentang topik yang diperdebatkan

 

Bocketts Farm salah satu kompleks pertama di dunia yang merekayasa genetika dinosaurus yang pertama adalah bronchosaurus (sic) 19 ton bernama Stuart, yang tinggal di padang 16 acre di ujung utara Farm Park, makanannnya jerami, voda Martini, dan piring terbang, Stuart bilang dia kelak mau berkarir di bidang akuntansi

 

Internet telah menyadikan revolusi data dalam pemberian informasi dan masyarakat belum sepenuhnya menyesuaikan diri dengan lingkungan. Kunci akses informasi adalah mesin pencari yang bagus, suatu pasar yang selain Microsoft Bing di dominai satu nama: Google

 

Dalam sepersekian detik Google menyatakan sudah menemukan sekitar 564000 hasil. Google meliputi antara 47 – 49 miliar halaman (perbandingan Bing,meliputi 16 sampai 17 miliar, walau secara realistis sebagian besar perbedaan jumlahnya di sebabkan halaman yang akan jarang digunakan. Hanya ada 50 miliar halaman di web, ada banyak lagi dokumen yang tak bisa dilihat Google karena merupakan bagian situs komersial atau berpengaman. Kisaran halaman Google cakup masih cukup besar sehingga sukar percaya Google benar benar mencari melalui segala bahan.  Google tak mencari di seluruh web tiap kali mengajukan permintaan pencarian. Agen perangkat lunak, disebut crawler, terus – menerus berkeliaran web, mencari bahan baru untuk ditambahkan ke indeks, dan itulah yang dicocokan ke permintaan pencarian, bukan data mentah. Meski indeks Google mencapai 100 petabyte data. Satu petabyte setara sejuta gigabyte

 

Menemukan tanggapan dari indeks sebagiannya adalah saol mencocokan kata di permintaan pencarian dengan kata di halaman web, sesuatu yang dipercepat dengan mengawali prosesnya begitu mulai mengetik tapi Google menggunakan beraneka data untuk mengurutkan hasilnya. Pemilik situs membayar untuk ditaruh di atas. Muncul karena baru, karena situs bertauran dengan situs penting lain karena Google menganggap situsnya bermutu tinggi, dll. hasil pencarian bahkan berstruktur beda, tergantung apapun yang bisa disimpulkan sistem Google mengenai orang yang telah mengajukan permintaan pencarian berdasarkan riwayat pencarian atau karena terhubung ke fasilitas lain Goog,e telah tumbuh satu industri yang mencoba merekayasa bahan algoritma Google dan mendorong posisi situs ke atas dalam pencarian, untuk menghadapi search engine optimisation, optimasi mesin pencari, para insinyur Google terus – menerus mengotak – atik algoritma penyusunan peringkat. Google bisa digunakan untuk lebih daripada hiburan. Banyak pencarian dilakukan untuk membeli sesuatu, atau tujuan bisnis dan pendidikan, namun tak ada keraguan bahwa sisi mahadata bermain di internet terutama di streaming video, Netflix, Amazon Prime

 

Satu DVD berisi beberapa gigabyte data, besarnya jumlah data yang terlibat situs streaming melayani jutaan konsumen, mahadata tingkat industrial. Satu penerapan mahadata yang cukup berbeda di TV dan film adalah dalam membuat gambar, sudah ada sistem kecerdasan buatan yang dilatih untuk memproduksi gambar bergerak sebagai semacam teka – teki apa yang terjadi berikutnya dari gambar diam. Sistem MIT menggunakan dua algoritma terpisah, satu sebagai pengkritik mutu hasil yang lain, mencari variasi dari harapan berdasarkan semua film yang diserap. Membuat deduksi atau induksi berdasarkan pengetahauan lebih luas. Sistemnya masih terbatas dalam hal resolusi dan kemampuan maju. Pada prinsipnya sistem itu dapat digunakan untuk mengisi beberapa gambar yang hilang di film, alasan para peneliti mencoba melakukan adalah sebenarnya para peneliti mencoba melakukan itu adalah memberi pemahaman lebih baik kepada sistem kecerdasan buatan mengenai apa yang berikutnya terjadi sesuatu yang esensial bila ingin teknologi bekerja mandiri. Musik dan penerbitan buku masih seperti studio tua dalam menanggapi mahadata : kerepotan dengan cara kerja baru

 

Mobil swakemudi sutdah di tes dijalanan, dalam memutuskan tindakan, sistem kecerdasan buatan yang mengendalikan mobil harus memantau lingkungan sekitar dan memprediksi hasil untuk mengurangi risiko kecelakaan. Sistem MIT dapat menjadi satu langkah ke arah penyempurnaan kemampuan

 

Hakikat data digital adalah lebih mudah disalin daripada data analog yang disimpan secara fisik.  Dokumen digital dapat disediakan untuk dunia dalam hitungan detik, dan layanan berbagi gratis eeprti Napseter menghancurkan laba secara drmatis

 

Penerbitan buku sudah punya model mapan untuk mendapat laba sebanyak mungkin dari penjualan buku, pertama penerbit mengeluarkan edisi sampul keras, yang tak terjual banyak tapi margin keuntungannya lebih tinggi daripada buku sampul lunak jadi ingin mendapatkan buku secepat mungkin bisa membeli harga lebih tinggi, bisa sampai setahun, edisi sampul lunak diterbitkan lagi bagi para pembaca lain yang tidak mau membayar. Pada permulaan banyak penerbit memperlakukan buku elektronik sebagai buku sampul lunk, terbit ditahan beberapa bulan, daripada menggunakan pendekatan mahadata untuk memudahkan mendapat versi legal, mereka mempersulit, pembajakan merajarela di bidang yang belum pernah mengalami. Riset menunjukkan tidak ada logika menunda keputusan menahan penerbitan buku elektronik karena pasar untuk buku cetak sampul keras dan buku elektronik tidak tumpang tindih. Walau penjualan buku sampul keras tak terpengaruh penerbitan buku elektronik pada waktu bersamaan, penjualan buku elektronik turun signifikan jika riilisnya ditunda, penerbit buku elektronik suka mendapat produk secepat mungkin jadi pendekatan tradisional pra mahadata bukan melindungi angka penjualan, malah menguranginya. Sebagian besar merilis buku elektronik berbarengan dengan edisi sampul keras, beberapa menjual buku elektronil dengan harga sedikit dibawah buku sampul keras, menurunkan harganya ketika buku sampul lunak, sudah tersedia. Strategi berbahaya, kembali mengundang pembajakan. Menunjukkan bahwa mereka masih tak mengerti konsumen digital

 

Pemain dominan di pasar buku elektronik ialah Amazon dengan platform Kindle menguasai 75% pasar AS dan 95% pasar Kerajaan Inggris. Amazon seperti Netflix menggunakan data konsumen untuk mengendalikan produk yang ditampilkan di situs web dan memudahkan akses konsumen ke buku elektronik. Amazon punya keunggulan besar dibanding penerbit, karena penerbit buku tak punya banyak kontak langsung dengan basis konsumen. Di dunia mahadata, ketiadaan kontak langsung membuat berada di posisi berbahaya. Mencoba menggunakan mahadata untuk mencoba mencari tau apa yang menjual buku menjadi baru

 

Penerbit buku tak punya akses mahadat ke konsumen seperti dipunyai media hiburan namun mereka memang punya akses ke konten, buku yang dicetak serta naskah diterima, dan telah di usulkan bahwa bisa digunakan untuk memprediksi atau bahkan merumuskan buku laris berikutnya . buku laris karena faktor sosial dan tren sehingga sukar di prakirakan dengan baik. Banyak buku yang menurut sistem adalah buku laris, tapi kenyataannya tidak laris, jenis informasi juga diperlukan untuk menilai keefektifan algoritma

 

Jika memiliki telepon pintar atau komputer modern, bisa berbicara dengan algoritma, perangkat lunak seperti Siri dan Contana mensimulasikan suara dan kecerdasan manusia, mencoba memberi jawaban cerdas bagi pertanyaan yang diajukan dengan pembicaraan, mahadata jelas berada pada inti kerja teknologi, akan dilakukan menggunakan kombinasi kosakata dan aturan tata bahasa seperti belajar bahasa asing di sekolah. Jenis pembelajaran ini ada batasnya, siapapun sudah beralih dari belajar di kelas ke menggunakan langsung suatu bahasa asing menyadari betapa banyak yang bisa didapat dari paparan langsung terhadap percakapan betulan dan bahan tertulis dibanding daftar kata dan aturan dan bagi komputer sama saja

 

Pendekatan mahadata untuk menangani bahasa asing bagi komputer, semua bahasa manusia adalah bahasa asing adalah imersi, pembiasaan. Komputer punya akss ke banyak teks sungguhan yang dituls manusia, dari sana komputer bisa berusaha menyimpulkan apa terjemahannya, sistem menaruh kata dalam konteks, memberinya kemungkinan lebih baik untuk mengerti dan berbicara seperti alami di banding kalau mencoba menggunakan aturan saja. Perancang sistem pengenal pembicaraan seperti Siri membuatnya lebih mengesankan dengan membuat kode keras untuk beberapa tanggapan terhadap pertanyaan yang mungkin sering di dapatkan dan mengembangkannya seiring waktu. Makin banyak mahadata yang terlibat, makin baik kemungkinan mendikte dengan tepat begitu juga, perangkat lunak penerjemah seperti yang ada di Google bukan menggunakan terjemahan kata per kata dari kamus. Melainkan kumpulan data terjemahan mengambil frase dan kalimat agar mendapat konteks.  Alexa mengintegrasikan mahadata dengan rumah. Echo masih tahap awal, kalau bertanya sesuatu ke Alexa, permintaannya diteruskan ke sistem mahadata amazon yang menafsirkannya lalu berusaha memberi tanggapan layak. Echo bekerja sama dengan sejumlah sistem otomasi rumah , memberikan fungsionalitas yang jumlahnya mengejutkan. Echo memantau mikrofon. Seperempat juga orang telah mencoba melamar Alexa, sementara 100.000 orang per hari mengucap selamat pagi kepadanya. Kadang sukar untuk mengatakan Terima kasih kepada Alexa bila sudah membantu. Namun perlu memandang statistik dengan hati – hati, kecil kemungkinan banyak orang serius mengajak nikah Alexa, sementara Amazon mendorong orang mengucap selamat pagi dengan memberi tanggapan berupa fakta seru tentang hari itu, namun seberapapun seriusnya menganggap Aleza, mahadata sudah berdampak besar kepada sesuatu yang selalu punya, lama sebelum masuk ke internet jejaring sosial

 

Dampak jenis jejaring mahadata ke kemampuan berkonsentrasi berinteraksi secara normal dengan orang lain, terutama bagi pengguna muda yang hidupnya dihabiskan di media sosial, memandang telepon, mengecek sosmed rata 100 kali sehari. Mengapresiasi penemuan informasi sebagaimana mendapat kesenangan dari berburu sesuatu secara fisik memberi kenimatan kecil, melepas domain untuk memicu bagian otak yang pas, mencerminkan asal usul sebagai hewan dengan gaya hidup pemburu – pengumpuk, namun kombinasi media sosial, terus memompa informasi ke kota dan telepon seluler, yang membuat informasi bisa terus – menerus diakses, menyebabkan perilaku kecandua, bila mendapat pelepasan neurotransmitter jenis itu terlalu sering, otak kehilangan kepekaan, jadi butuh makin banyak demi memuaskan diri dalam hitungan menit, mengecek media sosial

 

Sejak zaman dulu ada kecenderungan mengkritik kemampuan orang muda berkonsentrasi, namun dmapak media sosial bisa diukur. Sistem mahadata telah ditunjukkan menghasilkan penurunan kapabilitas jelas, terlalu banyak media sosial membuat kurang mampu melaksanakan tugas yang memerlukan masukan mental. Mahadata menghadirkan pro dan kontra

 

Membuat media sosial bekerja bagi kita pertama memerlukan kesadaran bahwa ada masalah, dan pemecahan masalah adalah tempatnya mahadata berkesempatan bekerja mandiri, asalkan mengetahui kenetralannya, tergantung apa yang dilakukan dengannya, mahadata bisa membantu menata masalah atau memperbesar dampak masalah

 

Mencapai keseimbangan dengan mahadata yang berpotensi menganggu memerlukan kesadaran akan potensi masalah dan upaya sadar untuk melakukan sesuatu terhadapnya, bisa mendapat manfaat dari media sosial sadar dengan kemungkinan masalahnya dan memegang kendali, jangan biarkan media sosial mengusai kita atau gawai kita

 

World Wide Web dikembangkan di laboratorium CERN (Conseil Europeen Pour la Recherche Nucleaire, Organisasi Riset Nuklir Eropa) pusat riset nuklir multinasional yang berlokasi dekat Jenewa, Swiss itu adalah tempatnya Large Hadron Collider (LHC), percobaan besar menabrakan proton berkecepatan tinggi satu sama lain, salah satu temuannya adalah boson Higgs : boleh jadi tampak anah kalau alat data sehebat Web tidak berasal dari pakar perangkat lunak seperti IBM atau Microsoft. Namun percobaan besar di CERN, teruama yang menggunakan LHC, menghasilkan data luar biasa banyak, dan lab seperti CERN harus bisa menangani serta menganalisis mahadata setara dengan ilmu fisika zarah. LHC memproduksi kira 30 petabyte data yang bisa digunakan per tahun, walau hanya sekitar sepertiga ukuran indeks Google, itu jumlah sangat besar, dan baru sebagian dari seluruh data LHC hasilkan, sebagian besar  datanya dibuang, bila tabrakan terjadi dalam detektor LHC, bisa terjadi semburan besar zarah, masing berpotensi meluruh, menghasilkan sekitar 600 juta peristiwa atau 25 gigabyte per detik untuk disimpan

 

Sistem CERN tak bisa menyimpan 25 gigabytes per detik, jadi satu set algoritma digunakan untuk menyeleksi data yang berpotensi tampak menarik, pertama mengurangi dari 600 juta peristiwa per detik ke 100.000 kemudian mengurangi lagi ke antara 100 dan 200 peristiwa perdetik. Data didistribusikan ke seluruh dunia untuk digarap banyak komputer dalam proses lambat menapis dan menganalisis, sebagai gambaran kecepatannya, data yang bakal menyebabkan pengumuman penemuan Boson Higgs mulai dikumpulkan pada 2010, tapi penguman itu baru terjadi pada 2012. Penemuan Boson Higgs merupakan peristiwa mahadata murni. Tak ada yang melihat Boson Higgs. Bahkan tak ada yang mendeteksi, peristiwa yang digunakan untuk memastikan keberadannya hanya sekumpulan data mengenai zarah yang dianggap hasil peluruhan Boson Higgs, dianalisis dari aliran besar informasi keluaran LHC, penemuan itu jadi berita di seantero dunia, meski fisika di balik penemuannya kompleks dan tak mudah dimengerti

 

Ukuran byte adalah penyimpanan di komputer biasanya diukur dengan byte, satu byte terdiri atas 8 bit, tiap bit bisa menyimpan informasi 0 dan 1. Suatu telepon pintar biasanya punya penyimpanan antara 8 dan 129 gigabyte; satu gigabyte sekitar 1 miliar byte. (sekitar karena satu kilobyte adalah 1.024 byte bukan 1000, satu megabyte adalah 1024 x 1024 dst) satu Pc bisa menampung satu terabyte, sekitar 1000 miliar byte awalannya menunjukkan ukuran yang makin besar

 

Kilo = 1000

Mega = 1.000.000

Giga = 1,000.000.000

Tera = 1.000.000.000.000

Peta = 1.000.000.000.000.000

Eksa = 1.000.000.000.000.000.000

 

Fisika zarah adalah tambahan baru dalam pemahaman manusia tapi mahadata juga menjangkau cabang sains yang barangkali paling tua, astronomi. Organisasi seperti CERN mengetahui sejak awal mengenai betapa pentingnya mahadata bagi sains tapi kesadaran itu belum ada di semua tempat, bukannya komputer tidak digunakan

 

James H Simons, mantan ahli matematika yang menjadi miliarder sesudah bekerja sebagai manajer dana lindung nilai, telah mendirikan Flatiron Institute di New York untuk fokus ke pembangunan infrastruktur dan metode komputasi guna menopang mahadata di sains, di awali dengan astronomi dan biologi, seperti ditunjukkan Simons, bila komputer digunakan dalam sains, dengan kekecualiaan seperti Tim Berners Lee di Cern, sebagian besar pemrogramman diserahkan ke mahasiswa pascasarjana nonspesialis yang biasanya bukan ahli pemrograman, perangkat lunak mereka sering hanya digunakan untuk satu proyek lalu ditinggalkan

 

Jika ingin menggunakan mahadata  dengan efektif, maka para pemrogram  perlu keahlian yang jarang ditemukan di departemen biologi atau fisika universitas Simons berharap yayasannya akan memberi dorongan untuk mengubah keadaan, proyek mahadata yang telah muncul dalam biologi adalah analisis sinyal listrik yang dikumpulkan dari alat pemantau di otak hewan, banyak universitas melakukan riset semacam itu tapi masing menggunakan perangkat lunak sendiri yang biasanya dibuat amatir untuk menangani data, perangkat lunak Flatiron telah dikembangkan untuk mengumpulkan data dari banyak kelompok peneliti, memberi potensi pemahaman yang jauh lebih baik. Edward Merricks yang bekerja di Columbia University menggarap satu proyek otak, Merricks mengusulkan bahwa pemrogram berdedikasi hanya akan efektif jika bekerja sama dalam jarak dekat, masalah potensial mengajak pemrogram murni menganggarap alat adalah data rill sering mencakup situasi aneh yang belum pernah terpikir siapapun dan untuk mengurai masalah bakal banyak diperlukan pemahaman relatif bagus atas biologi yang mendasari, bukan masalah pemrograman murni namun jika ada kerja sama betulan sepanjang proses, tak bakal jadi masalah besar, dan standarisasi prosedur analitis di seluruh bidang kiranya bakal fantastis,  di bidang lain ahli astrofisika yang tak bisa melakukan percobaan langsung di bintang harus mengandalkan simulasi komputer terjadinya supernova, interaksi antara lubang hitam, cara galaksi terbentuk, dan masalah komputasi kompleks lain. pendekatan mahadata Flatiron di rancang untuk penggunaan juga dalam cara yang tak bakal bersedia bagi ahli astrofisika biasa yang membuat program. Dalam kedua penerapan di Flatiron Institute juga di CERN, mahadata digunakan pada proyek individual berskala besar namun manfaat analisi mahadata juga bida diambil secara lebih luas, contohnya memperbaiki kemampuan mobil


komputer di mobi modern bisa berguna selain mengendalikan kunci, lampu, menyalakan mesin, dll. sistem bisa memantau penggunaan bahan bakar dan emisi, memberi informasi dari pemantau terpasang, jumlah oli atau cairan pembersih kaca dan secara umum menjaga kondisi produk teknik mesin paling kompleks yang dimiliki sebagian besar, padukan dengan data GPS dan segala jenis informasi mengenai gaya menyetir, penggunaan bahan bakar, keandalan, serta banyak lainnya bisa didapat

 

sebagian informasi bisa disediakan. Kotak hitam digunakan peruasahaan asuransi untuk menurunkan premi bagi pengemudi yang berhati – hati, namun sedikit menggunakan data, perusahaan membatasi akses dengan perangkat lunak sendiri, seperti pemutar musik elektronik sering mengandalkan perangkat lunka khusus Itunes. Sebagian lagi bisa karena perusahaan lebih suka konsumen tak mudah mengakses data performa dan keandalan. Namun tak ada keraguan mengenai arah yang dituju. Datanya bukan hanya akan bisa memberitahu bagaimana memperbaiki cara mengemudi, dengan algoritma yang membandingkan antisipasi rem dengan orang lain tapi menggunakan mahadata dari semua mobil serupa. Kiranya dimungkinkan memberi prediksi kapan onderdil tertentu rusak, serta bantuan teknik lain, mobil akan mengejar orang, selagi teknologi sandang (wearable technology) yang mengukur data kebugaran sudah menjadi bagian revolusi mahadata

 

pembagian data bersifat sukarela, tapi manfaatnya besar karena bisa memantau performa dalam konteks dan menunjukkan tanda risiko kesehatan atau memberi saran untuk cara berolahraga yang lebih tepat sehingga banyak yang akan mau dibagi. Walau biasanya dipasarkan untuk penyuka olahraga gawai seperti itu sebenarnya bagian kecil kehadiran mahadata yang makin besar di bidang medis

 

secara tradisional tidak banyak tumpah tindih antara mengenai kedokteran termasuk sains, keduanya: banyak perawatan medis mengandalkan desas – desus dan harapan dibanding data saintifik kuat, sekarang kedokteran berbasis bukti cukup langka sehingga bisa diberi label bukan hanya kedokteran. Namun keadaan berubah, dengan bantuan mahadata. Satu masalah peneliti medis tak bisa menaruh manusia dalam kotak dan mengisolasinya dari segala pengaruh luar, itu membuat sulit memastikan apa yang menjadi penyebab sesuatu, menyebabkan banyaknya klaim bahwa berbagai makanan dan gaya hidup menyebabkan perbaikan atau pemburukan kesehatan, orang yang menjalani gaya hidup Laut Tengah dna makan diet Laut Tengah lebih kecil kemungkinan menderita masalah jantung dibanding Skotlandia, orang yang mengonsumsi lebih banyak minyak zaitun lebih kecil kemungkinannya mengalami masalah jantung,itu mencerminkan satu masalah lama sains yang dirangkum sebagai korelasi bukan sebab akibat, hanya karena dua hal naik atau turun berbarengan bukan berarti A menyebabkan B

 

satu pendekatan mahadata tingkat pertama yang sekarang makin lazim di riset medis adalah metariset (metastudies) satu penelitian mengenai  makanan dan kesehatan kesulitan mendapat data bermutu dari peserta berjumlah memadai dan menemukan hubungan sebab akibat. Makin banyak data makin andal deduksi, makin besar peluang mengontrol beberapa penyebab potensial lain sehingga bisa disisihkan, metariset memadukan hasil sejumlah penelitian, biasanya memberi pembobotan berdasarkan mutu data. Pendekatan mahadata sudah mempermudah memastikan banyak pengobatan alternatif tak lebih manjur daripada plasebo, misalnya atau untuk mengetahui sumbangan diet tertentu bagi kesehatan. Tiap orang punya catatan medis tradisional bersifat lokal dan tidak dibagi. Lembaga rumah sakit punya sebagian data tapi biasanya disimpan di satu tmepat, jika data medis bisa dibagi ada peluang lebih besar dapat menggunakannya untuk memastikan keampuhan penanganan dan mengembangkan cara baru. Data medis sensitif dan diperlukan penangan cermat untuk memastikan anonimitas sebisa mungkin, pasien bisa dimengertie nggan menyerahkan data, bahkan bila dijanjikan mendapat manfaat nyata. Beberapa orang yang tidak eprcaya orang terlibat atau tidak mengerti konsep anonim, tetap menolak dalam survei atas 2000 pasien sekitar 17% tak bakal setuju kalau data anonim mereka dibagi ke pihak ketiga dengan aalsan apapun

 

Februari 2016 grup DeepMind mulai bekerja sama dengan Royal Free Hospital London untuk menggunakan mahata guna membantu menemukan pasien dengan risiko penyakit jantung, itu melibatkan pengumpulan data dari 1,6 juta rekam audiens pasien, namun para pasien tak diberitahu bahwa itu terjadi dan hasilnya reaksi negatif kuat dari pers.  Pasien diyakinkan mengenai manfaat data anonim yang kemudian bisa menjadi patokan agar algoritma bisa bekerja mengecek data seorang pasien yang bersedia untuk mengetahui risiko penyakit ginjal, misalnya masalah pendekatan DeepMind adalah bahwa para peneliti Google menganggap mereka bakal mendapat akses catatan medis penuh tak anonims, ketika mencoba mempromosikan pendekatannya. Google menjabaran job pasien dimana pasien dna dokter mengakses catatan medis dan menambahnya tanpa menyadari bahwa pasein jadi tidak membukanya ke Google

 

Pada waktu sama, rumah sakit mungkin enggan berbagi data jika statistik kelihatan buruk, selain itu ada potensi mahadata disalahgunakan secara medis, obat dipasarkan lebih cepat, penangana dikembangkan lebih efektif dan pada dasarnya lebih banyak nyawa terselamatkan, meski memang wajib berhati – hati jangan sampai menghalangi kemajuan luar biasa berharga yang dibuat

 

Satu masalah mahadata dan kedokteran adalah menanggung reaksi keras terhadap Genome Project (HGP). HGP adalah proyek besar dulu yang diawali pada 1990 dan selesai 2003, karena genom, keseluruhan DNA satu individu atau dalam hal HGP bagian DNA sejumlah individu belum 100% lengkap keti ka diumumkan, sebagian penyebab adalah karena proyek komersial pesaing yang mengajak balapan penelitian yang didanai negara (walau akhirnya kedua pesaing membuat pengumuman bersama). Proyek disebut terobosan besar dalam kedokteran, mengubah praktik melalui penanganan bersasaran personal, dan teknologinya sudah makin maju biaya memetakan satu genom manusia sudah turun dari ongkos proyek asli yang $3 miliar sampai dibawah $1000 orang, namun sedikit kemajuan media yang muncul dan sebagian besar praktisi meski masih sangat antusias dengan manfaat jangka panjang, menerima bahwa dapat dibutuhkan puluhan tahun sebelum sebagian besar kedokteran praktis akhirnya dipengaruhi proyek, ketiadaan hasil langsung mungkin telah menyebabkan keraguan publik yang cukup besar mengenai proyek mahadata di kedokteran, namun dalam jangka panjang, tak banyak keraguan bahwa mahadata bisa memungkinkan sains kedokteran membantu kehidupan pasien, manfaat memecahkan masalah jenis itu jelas, namun solusi masalah lain bisa sangat beragam hasilnya misal di bisnis asuransi

 

Pada 2012, Uni Eropa menyebabkan kehebohan dengan membuat putusan bahwa menetapkan premi asuransi kendaraan yang beda antara laki dan perempuan itu diskriminatif, ada data tegas yang menunjukkan pengemudi wanita muda menghadapi risiko lebih kecil dari pengemudi laki muda, yang akibatnya dikenal premi sampai 3 kali lebih tinggi, dan menunjukkan sekali lagi betapa pentingnya dimensi moral dalam keputusan mahadata. Algoritma tak bisa membuat penilaian moral namun hingga kini masih membuat penilain moral namun hingga kini masih kesulitan mendapat pendekatan yang bisa diterima untuk menghadapi implikasi moral

 

Jika premi tidak dinaikkan di daerah berisiko tinggi, orang yang tinggal di daerah berisiko rendah jadi dikenai premi terlalu tinggi. Jika seseorang didiagnosis penyakit jantung misal orangtuanya meninggal karena sakit jantung, perusahaan asuransi akan menaikkan premi asuransi jiwa. Perusahaan asuransi belum mempertimbangkan rincian data genetis

 

Di AS, daftar U.S.News tabel klasemen universitas yang pertama menggunakan nilai SAT (Scholastic Aptitude/Assesment Test) SAT adalah test yang diberikan ke murid SMA dan digunakan untuk penerimaan di universitas, beberapa universitas membayar mahasiswa agar mengulang test  dengan harapan mendapat hasil lebih baik yang lain mainnya lebih kasar dan mengirim hasil palsu ke survei. Satu ukuran yang digunakan daftar U.S.News adalah penggalangan dana. Sistem U.S.News tidak menyertakan biaya kuliah mendukung kredibilitas tabel klasemen. Sistem perangkat U.S. News berkaitan dengan kesadaran mereka, di Inggris ada Oxford dan Cambridge, sementara di As mencakup perguruan tinggi Ivy League seperti Harvard, Yale, dan Princeton. Di Inggris biaya kuliah tidak jadi masalah dalam proses seleksi, karena tidak banyak bedanya antar universitas, namun di AS, universitas paling terkenal sangat tinggi biaya kuliahnya, jadi jika biaya tinggi dipertimbangkan selain prestasi universitas di tabel, bakal menyebabkan perguruan tinggi. Ivy League terdorong turun peringkatnya sehingga kredibilitas tabel secara keseluruhan turun. Solusi sederhana: abaikan biaya kuliah. Salah satu alasan kenaikan biaya kuliah di Universitas AS sangat tinggi dalam beberapa dasawarsa belakangan adalah tak dipertimbangkannya biaya dalam tabel klasemen, jadi dengan menarik uang kuliah lebih besar lalu menyalurkannya ke dalam bentuk pemberian fasilitas, universitas bisa menaikkan peringkat. Pada waktu yang sama, lembaga lain mendapat untung dari membimbing siswa agar lolos dari sistem penerimaan mahasiswa, sistem juga memanfaatkan algoritma yang berusaha membedah algoritma pendaftaran yang ada, dan memilih calon siswa yang paling berpotensi membuat  universitas meraih peringkat tertinggi, bukan calon yang paling berpotensi menerima manfaat jika kuliah disana

 

Rapuhnya keseimbangan yang hendak dicapai dalam pemanfaatan mahadata untuk memecahkan masalah adalah perkara demokrasi

 

John Bunner tahun  1975 : The Shockwave Ridel juk buku merujuk pada non fiksi Alvin Tofferm Future Shock (1970) yang mencoba memprediksi kehidupan tahun 2000 tapi meleset, namun Brunner melangkah lebih jauh dia mengembangkan gagasan jejaring komputer universal dan mahadata untuk menjabarkan sistem dimana penduduk bisa memberi masukan bagi cara pemerintah menjalankan negara. Bunner menggunakan prinsio Delphi, gagasan yang dibuat lembaga think tank AS Rand Corporation di Delphi, satu kelompok membuat pilihan. Statistik keputusan mereka ditunjukkan ke kelomok, dan para anggota bisa berubah pikiran, proses bisa diulang beberapa kali, ada bukti bahwa untuk beberapa keadaan, jenis pendekatan kebijaksanaan khalayak berulang itu menghasilkan keputusan lebih bagus daripada memberi suara satu kali. Dalam novel Bunner, pendekatan pemungutan suara punya komponen taruhan agar membuatnya lebih melibatkan pemilih,walau dalam praktiknya Delphi digunakan untuk mengendalikan penduduk bukan sebagai mekanisme pemerintahan sejati, yang ditangani secara tradisional

 

Mahadata berpotensi membuat demokrasi sejati, lebih praktis pada skala negara untuk pertama kalinya, namun tampaknya tak ada yang buru ingin mewujudkannya, mereka sinis bisa berkata karena orang berkuasa, politikus terpilih, bakal kehilangan kekuasaan. Memberi kendali kepada massa karena mengarah hasil tak mesti sejalan dengan nasihat pakar

 

Inggris menghapus hukuman mati pada 1965, walau pendapat masyarakat sudah beralih menentang hukuman mati sekarang selama puluhan tahun keputusan untuk menghapuskannya tak didukung masyarakat pada umumnya, jika punya sistem demokrasi murni masyarakat bisa menghadirkan lagi hukuman mati. Mereka berargumen bahwa lebih baik punya sistem perwakilan secara efektif mendukung semacam oligarki, di mana kekuasaan berada pada segelintir orang yang diharap bisa lebih baik mempertimbangkan keputusan daripada massa

 

Demokrasi sejati bisa dianggap harus menggunakan kemampuan mahadata untuk melibatkan semua orang secara langsung dalam membuat keputusan tapi hanya bisa memuaskan jika bisa memberi mekanisme yang membuat masyarakat pemberi suara cukup berpengetahuan untuk mengambil keputusan bagus sesuatu yang dapat didukung atau disangkal juga oleh mahadata, tapi belum terjadi. Mahadata untuk keperluan politik perlu dipikirkan baik, bila data dan politik bercampur, selalu ada kemungkinan Bung besar datang, penggunaan mahadata bisa menghasilkan pemerintahan lebih baik atau kendali totaliter

 

Bung besar (Big Brother) gambaran sisi gelap mahadata merujuk ke pemerintah tiran yang maha melihat dalam novel distopia 1984  karya Google Orwell, kecurigaan dampak mahadata sudah ada sejak sebelumnya, barangkali upaya mahadata pertama adalah sensus. Ketika Kerajaan Inggris berencana mengadakan sensus pada 1753 gagasan itu ditolak parlemen, sebagian karena kata sensus berkonotasi negatif di Alkitab, sensus Raja Daud disusul wabah dan sensus Romawi yang menemukan tempat lahir Yesus mengarah ke pembantaian anak tak berdosa oleh Herodes, namun ada kekhawatiran realistis dari rakyat dan pemerintah mengenai bagaimana data akan digunakan. Dari sudut pandang pemerintah walau berguna dirasakan bahwa data sensus bakal mengungkap statistik penting ke negara musuh, diketahui bahwa ketika Swedia pertama kali mempublikasikan statistik kelahiran 1744 nama kota tempat penelitiannya, Uppsala disembunyikan rakyat Britania juga khawatir negara tau lebih banyak tentang mereka, kiranya hampir pasti hasilnya adalah lebih banyak pajak, dan tentara lebih mudah melakukan wajib militer, menarik laki muda dari pertanian dan usaha keluarga, baru ketika ada kekurangan pangan senegara pada 1800 ada dorongan kuat untuk melakukan sensus pertama di Kerajan Inggris pada 1801 terkadang akuisisi data oleh Bung Besar lebih tak kentara seperti dalam hal meteran energi pintar

 

Cara manfaat mahadata ditawarkan kepada pengguna akhir tapi yang mendapat manfaat lebih besar adalah suatu perusahaan adalah meteran listrik pintar yang sekilas tampak tidak berbahaya. Meteran listrik tradisional adalah alat sederhana yang melakukan hanya satu hal, mengukur jumlah listrik yang digunakan, meteran listrik berada di rumah, jadi perusahaan listrik harus mengirim orang untuk membacanya guna menghitugn tagihan, namun banyak rumah sekarang sudah dipasangi meteran generasi baru, meteran listrik pintar. Satu program besar dan mahal sedang berlangsung di Kerajaan Inggris dengan tujuan memasang meteran pintar di 26 juta lebih rumah sampai 2020, meteran pintar akan memungkinkan pengurangan tagihan listrik karena menampilkan berapa persisnya energi yang digunakan dan biaya sehingga mempermudah penghematan, karena pintar, meteran bisa menggunakan tarif spesial yang memasok energi lebih murah pada berbagai waktu dalam sehari, jadi pelanggan mengurangi tagihan, namun alasan meteran pintar jadi populer diantara pemasok energi

 

Manfaat teknologi mahadata lebih banyak bagi perusahaan listrik, meteran pintar berarti perusahaan tak lagi harus memperkerjakan pembaca meteran, mengurangi biaya, dan beragam tarif bisa membingungkan pelanggan, sehingga perusahaan listrik bisa menambah biaya ekstra pada masa puncak, bukan hanya memungkinkan konsumen untuk menghemat

 

Bukannya teknologi pintar tak dapat memberi manfaat kepada pemilik rumah, dengan alat ini kepintaran berfokus pada konsumen, mengendalikan termostat dan mengakses data langsung dari telepon termostrat bisa mendeteksi kapan rumah kosong, mengurangi pemnasan secara otomatis, termostrat memang pintar dari sudut pandang konsumen tapi meteran listrik menyimpan dan mengendalikan data sendiri karena biaya ditampilkan kemungkinan kecil untuk mengubah konsumsi listrik secara signifikan, manfaat bagi konsumen hanya didasari penelitian terbatas

 

Amazon, Appe dan Gogole sistem mereka tak mencatat semua perkataan, dan menawarkan mekanisme untuk memastikan pemantauan sementara. Setiap kali mengucapkan permintaan ke Alexa, perkataan disimpan di server Amazon, tanpa batas waktu. Amazon mengubah harga berdasarkan informasi yang dikumpulkan sistem dari percakapan pribadi. Bahkan percakapan bisa jadikan bukti seperti peristiwa Desember 2015, polisi AS mengirim surat perintah ke Amazon, terkait satu aalt echo yang berada dekat bak mandi di Bentonville, Arkansas di mana Victor Collins ditemukan mati dicekik, pemilik Echo, James Bates dipidana melakukan pembunuhan, poliai ingin memeriksa rekaman apapun yang mungkin dimiliki Amazon dari waktu kejadian, Amazon menolak, tapi pada Januari 2017 dipaksa memberikan informasi. Amazon, Apple dan Google tidak sukarela berbagi informasi dengan pemerintah seperti kasus 2016 ketika Apple menolak permintaan pemerintah AS membongkar telepon seseorang yang dituduh teroris, namun teknologi pengawasan bisa terjadi, ada riisko yang harus ditanggung demi segala keuntungan yang didatangkan hubungan langsung dengan mahadata

 

Uber bersama beberapa perusahaan lain muncul menyambut ekonomi pekerja lepas (gig economy). Uber adalah organisasi yang tak hanya menggunakan mahadata untuk menetapkan harga atau berinteraksi dengan konsumen. Mahadata mengendalikan cara kerja individu yang bekerja bagi perusahaan, di AS, sudah diperkirakan sekitar 800.000 orang mendapat uang melalui perusahaan ekonomi pekerja  lepas dan jumlahnya akan naik, uber diperkirakan  punya di atas 1 juta pengemudi di seluruh dunia. Secara tradisional, waktu ramai dan sepi di tangani dengan jadwal berdasarkan data historis, jadi jumlah karyawan yang bekerja di sebagian besar restoran lebih sedikit pukul 4 sore dibanding 8 malam, waktu ramain untuk makan malam. Sebagian besar toko akan menghadirkan lebih banyak pramuniaga pada hari Sabtu di banding Senin, mahadata berarti proses penjadwalan bisa menjadi jauh lebih efisien, bereaksi terhadap kebutuhan aktual per menit, bisa terjadi jam kerja kelewat panjang, ketiadaan rutinitas dan pengurangan pendapat

 

Jadwal yang didorong mahadata bisa berubah seketika, uang yang dihemat perusahaan dalam efisiensi staf berasal dari bayaran staff

 

Beberapa pabrik Jepang adalah spesialis pendekatan yang dikenal Just In Time atau JIT. Perusahaan menanggung biaya misalnya menyimpan banyak barang siapa tau diperlukan, pendekatan JIT mengandalkan ketersediaan dalam waktu singkat dan hanya mendatangkan barang dari pemasok ketika akan digunakan, akibatnya adalah pemindahan biaya menyimpan stok dari konsumen ke pemasok, pada prinsipnya, ekonomi pekerja lepas adalah cara memasok orang dengan pendekatan JIT, mengarahkan orang sesudah pemberitahuan singkat untuk menanggapi data, namun harga kepraktisan bagi perusahaan adalah kehidupan pegawai terganggu. Atau lebih tepatnya yang bukan pegawai karena salah satu cara perusahaan ekonomi pekerja lepas menjaga biaya tetap rendah adalah menggunakan pekerja lepas, artinya tidak ada biaya kesehatan dan cuti digaji, jenis hubungan antara pegawai maksudnya pekerja lepas dan perusahaan hanya dimungkinkan dengan sistem mahadata yang memudahkan pembagian tugas dengan cepat, menggunakan jenis harga berubah dengan sistemnya

 

Pada Agustus 2016, terjadi protes para kurir yang bekerja untuk UberEats, bagian Uber yang bersaing dengan perusahaan pengantar makanan pesanan dari restoran seperti Deliveroo. Cara UberEats memperlakukan kurir menjadi iklan buruk untuk mahadata. Kurir awalnya ditawari 20 Euro per jam, bayaran tinggi. Namun algoritma berapa bayaran menjadi jauh lebih kompleks dengan angka lebih rendah untuk tiap pengantaran ditambah lebih kecil per jarak di potong jatah Uber, ditambah bonus waktu ramai, semua dilakukan pekerja dipandang aliran data seperti barang JIT mengalami depersonalisasi dan siap dikenai perbaikan efisiensi

 

Sudah ada sejumlah tantangan legal yang berupaya membuat Uber memperlakukan pengemudi sebagai pegawai tetap yang mendapat tunjangan dan gaji tetap jam – jaman, baik mereka mendapat order maupun tidak. Tergantung Yuridiksi, serta tradisi keterlibatan pemerintahan dalam hak pekerja, beberapa perselisihan bisa menguntungkan perusahaan ekonomi pekerja lepas, sementara yang lainnya menguntungkan pekerja, bukan berarti ekonomi pekerja lepas pasti buruk, data menjadi saringan akses bagi organisasi yang dinilai dan skema penilaian dibawa lebih jauh oleh perusahaan taksi Uber, karena penumpang menilai pengemudi, dan pengemudi juga menilai menumpang

 

Nilai memiliki konsekuensi tak terduga karena orang yang menilai tak mengerti arti nilai tertentu atau lebih realistis yang merancang penilaian tidak begitu mengerti manusia. Ada bukti kuat bahwa mereka yang memberi nilai kepuasaan di Kerajaan Inggris lebih kecil kemungkinannya menggunakan nilai paling ekstrem, menghindari nilia paling buruk atau baik jadi dalam keadaan normal, 4 bintang mewakili tingkat kepuasan konsumen baik atau bahkan sangat baik, namun Uber menetapkan nilai rata terendah yang bisa diterima adalah 4,6. Kalau lebih rendah, pengemudi bisa kehilangan akunnya, tiap nilai 4 bintang dianggap bagus menurunkan nilai rata total juga mungkin bahwa prasangka pribadi berperan, data Uber  belum tersedia untuk diteliti, tapi ketika perusahaan dengan sistem penilai serupa, tapi ketika perusahaan dengan sistem penilaian serupa, seperti perusahaan akomodasi Airbnb, di satu penelitian di AS, orang dengan nama khas Afrika – Amerika 16% lebih rendah kemungkinannya diterima sebagai konsumen dibanding dengan nama khas Eropa – Amerika. Dalam ekonomi pekerja lepas seringkali konsumen menilai pekerja, dan itu menjadi evaluasi kerja, itu hanya bagian cara mahadata bisa melencengkan kemampuan bisnis mengelola orang dengan efektif

 

Algoritma yang bagus, memanfaatkan mahadata, bisa mengoreksi diri seiring waktu. Seleksi data prediktif tergantung perancang sistem. Ada situs web yang dibuat untuk menemukan korelasi yang tak penting di data

 

Dengan perangkat lunak pengenal yang bagus, bisa melacak individu atau mobil yang bergerak dari kamera ke kamera, membangun gambar rinci pergerakan, kamera banyak di gunakan di UK, untuk menemukan kendaraan tanpa plat nomor dan mengejarnya, sistem dapat digunaakn untuk melacak pergerakan terakhir orang hilang

 

Pada abad ke 19. Dokter John Snow di London menemukan sumber wadah kolera di Soho dengan memetakan penggunaan sumber air di tiap rumah, berdasarkan pola wabah bisa menunjukkan bahwa penyakit itu disebarkan satu pompa air tertentu, Snow mencopot gagang pompa agar tak bisa digunakan, dan penyebaran penyakit berhenti, ditemukan bahwa limbah dari bangunan berdrainase buruk mencemari sumber air pompa. Snow mengubah pendapat medis yang waktu itu menganggap penyebar penyakit adalah hawa udara buruk dengan menggunakan data secara cermat dan imajinatif. Yang bisa dilakukan PredPol dengan mahata, melebihi analisis Snow, adalah mengelola aliran besar data yang digunakan sistem untuk memprediksi dimana kira kejahatan paling besar kemungkiannya terjadi. Selagi prediksi muncul, polisi bisa dikirim berpatroli di daerah yang diprediksi, sehingga sumberdaya terbatas bisa dikerahkan agar berpengaruh terbesar bagi kota atau daerah, sementara snow mendasari penelitiannya berdasarkan deugaan bahwa penyebabnya adalah sumber air. PredPol dan para pesaingnya tak punya dugaan awal, para operator sekadar menumpuk banyak data kemungkinan lokasi ATM dan sasaran pencurian, faktor, jam, hari, apakah hari libur atau hari kerja, dll. semuanya diolah untuk menghasilkan usul penempatan petugas, sesuadah berada di lapangan polisi memasok lagi statistik pencegahan kejahatan, dan hasilnya positif, sistem memperkuat data yang memberi hasil terletak. Polisi terlalu berlebihan mengawSI minoritas dan kelompok tertentu.sistem tak kenal individu jadi tidak punya faktor diskriminasi berdasarkan misalnya, umur, etnis atau agama warga setempat, sistem memanfaatkan sumberdaya yang ada

 

Salah satu kesukaran yang dihadapi dalam menangani mahadata adalah seringkali ada manfaatnya bagi beberapa pihak dan mudarat bagi beberapa pihak lain

 

 Dalam film spiderman ada  bersama kekuatan besar, ada tanggung jawab besar

 

Data netral, tak bisa berbuat apapun sendiri, yang mempengaruhi kualitas algoritma program komputer yang mempersatukan data dan membuat keputusan serta penemuan sebagai hasil kemampuannya memilah banyak masukan, algoritma bisa menghadapi lebih banyak informasi daripada manusia, tapi tak punya pertimbangan dan perasaan manusia. Yang paling penting punya transparansi dan pemahaman jernih mengenai apa yang terjadi jika ada kekeliruan. Tanggung jawab dalam peringat Spiderman mencerminkan perlunya pemilik sistem mahadata menjamin mereka yang menjadi subjek sistem mahadata berkesempatan mencari tau apa yang dilakukan sistem dan bisa menunjukkan kekeliruan yang akan diberitahukan ke sistem serta memungkinkan koreksi. Banyak pemilik mahadata enggan menerima tingkat tanggung jawab, mereka beralasan algoritma mereka eksklusif dan tak bisa diungkap ke pengguna akhir, mereka bilang transparansi akan meruska bisnis. Bila suatu sistem berdampak ke kehidupan orang, jenis pengamanan itu diperkukan, membiarkan pemilik mahadata berkelit dengan argumen algoritma eksklusif. Pemilik sistem masih sangat bebas membiarkan algoritma memutuskan apa yang dijual ke kita atau bagaimana nilai kredit. Satunya alasan menolak menambahkan pengoreksi kekeliruan ke algoritma adalah kemalasan dan biaya membuat perubahan, para pemilik sistem seharusnya jangan diberi keleluasaan kalau hasilnya bisa mempengaruhi kualitas kehidupan orang

 

Mempertimbangkan mengubah sistem pendidikan agar sesuai dengan mahadata, sistem pendidikan dan ujian terlalu mengutamakan pengajaran dasar karir tertentu dan informasi. Sistem pendidikan dirancang untuk dunia sbeelum mahadata, ada keperluan memberi alat yang diperlukan generasi muda untuk memanipulasi dan mengerti data, tapi menghindari terobsesi dengan data. Semua tau bagaimana mereka yang tumbuh di dunia mahadata mahir berinteraksi dengan telepon, komputer, TV seerta mendapat pelajaran sains komputer, mereka juga tidak diajari betapa merugikannya bergonta – ganti tugas dan pencarian informasi acak, mereka perlu bantuan agar bisa fokus dan menangani data dengan baik, juga masih mengajar berdasarkan mata pelajaran, mengingat lebih banyak hal daripada yang diperlukan, supaya bisa mengeluarkannya kembali dalam ujian, bukan memberi keahlian untuk menginterograsi dan memanipulasi mahadata, untuk melihat bagaimana mahadata bisa disalahgunakan dan mendapat manfaat sebanyaknya dan mahadata. Ujian mahadata bakal menggunakan akses internet terbuka hanya membaca agar tidak dipakai berkomunikasi karena yang ditest adalah keahlian, bukan ingatan

 

Di UK, cenderung berasumsi negara memihak rakyat, meski punya kebiasaan mengeluh dan tidak percaya politikus. Warga UK sukar mengerti sikap AS terhadap pengendalian kepemilikan senjata api yang tampak sebagian didorong kepercayaan bahwa negara tak bisa dipercaya dan orang ingin punya kemampuan membela diri terhadapnya, dalam banyak rezim totaliter sepanjang sejarah, negara mengadu domba rakyat, menggunakan sebagian rakyat sebagai informasi untuk mengawasi yang lain, sarana kendali yang boros dan tak efisien, banyak waktu harus diberikan untuk kegiatan pengawasan dan populasi yang selalu takut serta tak saling percaya akan selalu beroperasi di tingkat di bawah standar, mahadata memberi Bung Besar segala keuntungan pengawasan gaya lama dengan lebih sedikit kerugian

 

Dapat  menjadi kenyataan di Tiongkok, dimana ada penerimaan jauh lebih kuat atas pembatasan kemerdekaan individu. Pemerintah Tiongkok mengembangkan sistem mahadata bertujuan membuat dokumentasi otomatis atas rakyat, memberi nilai berdasarkan tanda sosial dan finansial yang mencerminkan perilaku dengan imbalan berupa ketersediaan berbagai layanan yang dikuasai negara artinya hampir segala hal. Selain pengecekan belanja dan nilai kredit yang sudah familiar, sistem itu bakal memantau pelanggaran kecil seperti menyeberang sembarangan dan tidak bayar angkutan umum atau pelanggaran pembatasan aturan ukuran keluarga Tiongkok, hasilnya adalah nilai bisa dipercaya yang berpengaruh ke cara negara memperlakukan kita, bahkan ketika  mencoba makanan di restoran atau mendapat pasangan kencan lewat internet

 

Sejauh menyangkut negara Tiongkok, sistem seperti itu bukan beban, melainkan jalan menuju kebebasan jika berkelakuan baik, negara akan memberi imbalan. Namun jika berkelakuan tidak mendukung masyarakat sosialis harmonis, akan menderita. Kalau kepercayaan di satu bidang dilanggar, akan dibatasi di bidang lain, negara percaya sistem itu diperlukan untuk mencegah kekacauan ekonomi akibat penipuan dan penyuapan, juga perusahaan yang menjual makanan tak layak atau obat palsu berbahaya. Mahadata Bung Besar berskala masif terlalu masif untuk bisa dilakukan bahkan dengan teknologi hari ini. Penduduk Tiongkok diatas 1,3 miliar orang, sistemnya dicoba pada skala kecil, dan sistemnya benar diterapkan disana, sukar membayangkan  potensi masalah dengan data buruk dan asumsi buruk harus diprediksi dan dicegah, GIGO bisa menghancurkan kehidupan orang. Transparansi penting bagi sistem mahadata yang digunakan dalam demokrasi, dan mengawasi ketat seberapa jauh pemerintah diperbolehkan menggunakan data itu bahkan bila ada alasan yang benar sah, seperti pencegahan terorisme. Ada keadaan khusus dimana pemerintah perlu akses data melebihi batas normal tapi harus selalu jadi kasus  khusus bukan keadaan umum sebagaimana besar dimungkinkan oleh mahadata. Sisi positif keterlibatan pemerintah dalam data, memberi akses dan kesempatan mencari tau apa yang diperlukan mengenai negara dengan mudah dan bebas, kebebasan informasi masih sangat terbatas dan mahal, dengan mahadata seharusnya siapapun mudah mendapat akses ke informasi relevan mengenai pemerintah, menggunakan pengetahuan yang tepat, mengubah demokrasi serta memastikan pemerintah dan korporasi tidak menyalahgunakan kesempatan mahadata, peretas

 

 

Dua A besar adalah algoritma dan asumsi, suatu sistem mahadata hanya sebagus algoritma yang digunakan untuk mengakses dan mengelola data, dan algoritma bergantung ke perancang yang bisa membuat asumsi akurat mengenai pengguna sistem dan asumsi akurat mengenai deduksi yang bisa dibuat dari data. Asumsi ada di inti sebagian besar kegagalan dalam pembuatan keputusan. Asumsi menghalangi kreativitas dan gagasan baru, membuat asumsi mengenai batas data dan bagaimana data akan digunakan kecuali kalau ada kesempatan mengoreksi, asumsi akan menghalangi penggunaan mahadata dengan pantas

 

Ketika komputer mulai banyak pada 1960, tahun 2000 tampak masih jauh, agar tidak makan banyak tempat penyimpanan, data tanggal disingkat banyak sistem berasumsi bahwa tahun dimulai dengan 19, bisa sesudah tahun 2000, suatu tanggal pada tahun 2017, misalnya bakal diasumsikan sebagai 1917, itu menyebabkan data keliru, atau program macet, kalau misalnya mencoba mengetahui umur seseorang yang lahir pada 1973 dengan menghitung 1917 dikurangi 1973, pengecekan dan pengetesan jelas penting untuk sistem yang menjaga pesawat tetap terbang, misalnya tapi tidak mesti untuk semua perangkat lunak kantoran biasa, namun tetap saja ada fakta bahwa para pemrogram telah membuat asumsi bahwa tahun 2000 masih terlalu jauh dikhawatirkan yang terbukti keliru, maka sebagian hikmahnya adalah bahwa perancang algoritma mahadata harus sebanyak mungkin membuat asumsinya jelas dan menguji asumsi sebanyak mungkin, akan selalu ada beberapa masalah yang lolos, makanya diperlukan umpan balik dan koreksi, tapi seharusnya juga ada pemikiran lebih matang mengenai konsekuensi sebelum suatu sistem mulai dijalankan

 

Pendekatan mahadata bagus untuk memberi informasi, tapi terbatas dalam hal pengetahuan. Sistem IBM Watson, terkenal karena menang satu versi khusus acara kuis Jeopardy pada 2011, namun bila Watson keliru menjawab, kelirunya tidak masuk akal, jawaban Watson untuk pertanyaan mengenai kota AS dengan bandara tertentu adalah Apa itu Toronto, pendekatan mahadata tidak punya apa yang dapat disebut akal sehat

 

Profesor sains komputer Hector  Levesque memberi kesan bahwa kecerdasan butan didorong mahadata akan selalu bermasalah dengan kejadian langka yang disebut ekor panjang,  dalam distribusi probabilitas, itu adalah kejadian kecil kemungkinannya, namun sementara sembarang situasi tertentu barangkali terjadi, ada kemungkinan kejadian tak terduga di mana sistem tidak punya cukup banyak data untuk menanganinya. Menggunakan pengetahuan, akal sehat, adalah pendekatan terbaik dalam keadaan seperti itu. Mobil swakemudi yang hanya punya data masa lalu untuk membantunya membuat keputusan bisa kesulitan jika misalnya ada hewan ternak masuk ke jalan atau mobilnya memasuki bundaran ajain terkenal di Swindon, dimana 5 bundaran kecil bergabung menjadi satu bundaran besar

 

Mahadata bisa membawa  manfaat selama mendidik diri untuk mengerti dan menghadapina, serta memastikan algoritma transparan dan tidak dirancang sedemikian sehingga menjebak orang dalam spiral menurun tanpa jalan keluar