Soalan kepada pakar: Adakah benar bahawa rangkaian sosial menonton kami

Dmitry Kurkin

TANGGUNGJAWAB KEPADA MAJORITI PERTANYAAN AS kami biasa mencari dalam talian. Dalam siri baru bahan-bahan kami bertanya soalan-soalan seperti: pembakaran, yang tidak dijangkakan atau meluas - kepada para profesional dalam pelbagai bidang.

Gerombolan kilat Tahun 10, yang dilancarkan di rangkaian sosial pada awal tahun ini, bukan sahaja menimbulkan teori konspirasi bahawa matlamat kempen adalah untuk mengumpulkan foto pengguna dan melatih mereka untuk mengenali sistem pengenalan wajah, tetapi juga sekali lagi membuat mereka berfikir tentang berapa banyak yang mereka tahu tentang kami. rangkaian sosial dan pihak ketiga yang bekerja dengan mereka (dari syarikat komersial ke agensi kerajaan).

Hakikat bahawa gergasi teknologi mengumpul dan menganalisis apa yang disebut jejak kaki digital yang dibiarkan oleh berbilion-bilion pengguna setiap hari tidak ada rahsia kepada sesiapa pun. Dan kesedaran ini menimbulkan ketakutan baru terhadap "abang": rangkaian sosial banyak mengenali kami, tetapi bagaimana jika mereka tahu terlalu banyak tentang kami? Bolehkah data besar digunakan untuk mengetahui semua sambungan, rasa, tabiat seseorang, masa lalu dan sekarang? Dan jika ya, apa bahaya yang boleh keinginan kita untuk bersosial dalam talian, demi yang kita secara sukarela berkongsi maklumat tentang diri kita, menyebabkan kita?

Kami bertanya kepada pakar tentang bagaimana data pengguna diproses oleh syarikat-syarikat besar dan betapa besarnya bahaya untuk mewarisi di rangkaian sosial.

Liliya Zemnukhova

Penyelidik di Pusat Penyelidikan Sains dan Teknologi di Universiti Eropah di St Petersburg

Jejak digital mengandungi semua jenis data yang mungkin - teks, imej, rakaman audio dan video, geolokasi, dan banyak metadata (contohnya, model alat, pengendali mudah alih, sistem operasi, dinamik dan tempoh lawatan, dll.). Dan bukan hanya kita yang menambah jejak digital kita. Rangkaian sosial membentuk kita sebagai pengguna dengan bantuan tiga sumber data: hakikat bahawa kita sendiri melaporkan diri kita; yang lain melaporkan tentang kami; dan apa yang paling sering terjadi tanpa pengetahuan kita. Terutamanya legap yang terakhir. Kami, sebagai peraturan, tidak membaca perjanjian pengguna dan dasar untuk pengumpulan dan penggunaan data peribadi. Kami hanya perhatikan bahawa "kotak hitam" ini entah bagaimana mempengaruhi pengalaman pengguna kami: pengiklanan yang disasarkan, cadangan daripada rakan, cadangan untuk muzik, prosedur untuk melancarkan berita ... Kami membina sebahagian kecil daripada pengalaman ini diri kita, apabila kita secara manual membina suapan berita, tetapi terutamanya algoritma menjalankan fungsi yang tertanam dalam profil lalai. Itulah sebabnya kami tidak akan menyingkirkan pengiklanan kontekstual atau cadangan mengganggu kumpulan atau (tidak) rakan-rakan. Rangkaian sosial sebagai syarikat menggunakan data mengenai pengguna mereka untuk tujuan komersil, menawarkan platform mereka untuk menjual kandungan yang disasarkan. Dan di sepanjang jalan, mereka terus mengumpul data tentang kami: sebagai contoh, jika anda telah membayar untuk pengiklanan sekurang-kurangnya sekali, maka kad bank dan data urus niaga juga tetap dengan syarikat. Data juga boleh diberikan kepada agensi kerajaan apabila terdapat keperluan yang besar: misalnya, Facebook kerap bekerjasama dengan agensi kerajaan AS, selaras dengan dasar ketelusannya.

Sebagai tambahan kepada dasar dalaman rangkaian sosial, terdapat satu perincian yang lebih penting: akaun dapat dikaitkan dengan ratusan ribu aplikasi dan fungsi lain. Contohnya, ini adalah sebab untuk perbincangan besar tahun lepas mengenai akses pihak ketiga ke data pengguna. Percubaan penting untuk mengawal kebebasan pemaju dibuat di Kesatuan Eropah - Peraturan Perlindungan Data Am (GDPR) berkuat kuasa tahun lepas. Dia memutuskan untuk tidak memindahkan masalah data, tetapi menarik perhatian pengguna kepada soalan ini. Ini tidak mewajibkan kita membaca semua perjanjian pengguna, tetapi ia membuatkan kita berfikir dan sekurang-kurangnya menjadi lebih bertanggungjawab untuk jejak kaki digital kita dan mengikut peraturan asas kebersihan digital.

Valeria Karavaeva

saintis data di Spiking

Kami kadang-kadang tidak memikirkan berapa banyak jejak yang kami tinggalkan di Web dan berapa lama ia membantu syarikat, bukan sahaja rangkaian sosial - walaupun rangkaian sosial juga. Rangkaian sosial mengumpul data bukan sahaja untuk diri mereka, mereka boleh menjualnya - Saya tahu mengenainya, kerana saya bekerja di agensi pengiklanan, dan kami membeli data dari Facebook. Dan selalunya kita, para pengguna, memberi persetujuan ini tanpa menyadarinya. Orang menghabiskan separuh nyawa mereka di rangkaian sosial dan memberikan banyak maklumat tentang diri mereka sendiri.

Tetapi ada kemungkinan untuk mengumpul data sebelum ini - jadi mengapa anda mula bercakap mengenai data besar baru-baru ini? Pertama sekali, kerana kuasa pengkomputeran tumbuh dan, dengan itu, menjadi lebih murah. Isu utama data besar bukan cara mengumpul data - secara prinsip, setiap kita hari ini boleh mengumpul dan menyimpan terabyte maklumat - tetapi bagaimana untuk bekerja dengan mereka. Kebanyakan data yang diperoleh daripada rangkaian sosial (teks, suara, gambar, video) tidak tersusun dengan cara apa-apa, oleh itu tanpa mesin pembelajaran data besar tidak berguna. Kini, disebabkan kuasa dan memori telah menjadi lebih murah, permintaan untuk rangkaian saraf dan pembelajaran mendalam telah meningkat - akhirnya kita belajar untuk memproses array data besar.

Ambil, sebagai contoh, gambar - dan ini adalah data yang sangat besar, mereka boleh memberikan banyak maklumat. Terdapat berjuta-juta gambar, tetapi apa yang perlu dilakukan dengan mereka? Bagaimana anda boleh mendapat manfaat daripada mereka? Apakah pola yang mereka berikan kepada anda? Pembelajaran mesin, sebenarnya, tidak begitu jauh. Ini bukan satu proses yang mudah seperti yang berlaku: tidak ada perkara yang anda tekan butang dan dalam seminggu mendapat pengiraan penuh.

Pembelajaran mesin secara langsung didahului dengan tugas yang lebih kompleks. Gambar yang sama mesti terlebih dahulu diproses dengan betul (contohnya, potongan, foto berpusat, ini penting untuk belajar) - ini adalah peringkat pertama, yang biasanya mengambil masa yang lama. Tahap kedua adalah untuk memilih seni bina rangkaian yang sesuai untuk menyelesaikan masalah. Secara kasar, anda membina sepuluh rangkaian neural yang berbeza, dan mereka memberikan sepuluh keputusan yang berbeza. Kemudian anda perlu entah bagaimana menilai hasilnya. Dan selepas itu anda, dengan kebarangkalian yang tinggi, kembali ke peringkat pertama. Tidak mustahil untuk membina satu rangkaian sejagat untuk sebarang tugas: anda sama ada membinanya dari awal atau mengubah suai yang sedia ada. Pengiktirafan muka adalah satu tugas, pengiktirafan kucing adalah satu lagi.

Dalam proses pembelajaran mesin, kami turut mengambil bahagian, tanpa mengetahui. Sebagai contoh, memperkenalkan captcha di laman web: menggunakan captcha, Google melatih rangkaian saraf untuk mendigitalkan buku.

Kita mesti faham bahawa syarikat yang mengumpul data besar tidak berminat dengan profil peribadi kami. Mereka memerlukan data tentang banyak orang yang berminat dengan sesuatu yang khusus. Bagi perkhidmatan khas, saya fikir mereka boleh mengumpul data tanpa menggunakan rangkaian sosial. Saya rasa ketakutan kita bahawa kita sedang ditonton akan segera berlalu. Inilah dunia baru: mungkin tidak dapat mengesan web, tetapi sukar. Lebih mudah untuk tidak muncul di Web sama sekali.

PHOTOS: antonsov85 - stock.adobe.com