Big Data înseamna procesare, analiza si predictie având la dispozitie capacitati imense de stocare a datelor din mediul digital. Aceste date sunt frecvent descrise de o componenta a informaticii numita Artificial Intelligence - AI (inteligenta artificiala), mai exact de un domeniu al AI numit „învatare automatizata” care, mai pe întelesul tuturor, înseamna matematica aplicata în procesarea unui volum mare de date pentru a obtine probabilitati. În anul 2019, a fost descoperit un nou virus gripal, o combinatie de elemente de la virusii care provoaca gripa aviara si cea porcina. Sa ne reamintim de A(H1N1), dupa cum a fost denumit noul virus gripal, si de teama autoritatilor medicale de atunci în fata declansarii unei pandemii. La data de 1 iunie 2009, un numar de 62 tari raportasera oficial 17.410 cazuri de gripa A(H1N1) varianta 2009 soldate cu 115 decese. În România, primul caz de gripa A(H1N1) s-a înregistrat pe data de 27 mai 2009. Câteva zile mai târziu, au mai aparut câteva cazuri de persoane infectate cu acest virus gripal, venite din SUA unde au contactat acest virus gripal1. Dar nu despre virusi mi-am propus sa vorbesc în articolul din aceasta saptamâna, ci despre Big Data, o tehnologie prin care gigantul american Google a prezis mult mai rapid decât statistica sistemului medical din SUA aria de raspândire a virusului gripal A(H1N1). Inginerii de la Google au analizat ce anume cauta oamenii pe Internet (cca. 3 miliarde de cautari zilnice), luând în calcul 50 de milioane de termeni cel mai des întâlniti în aceste cautari, pe care le-au comparat cu datele furnizate de Centrul pentru raspândirea gripei sezoniere între 2003 si 2008. Ideea (ipoteza de lucru) era ca oamenii infectati cu virusul gripal puteau fi identificati dupa cautarile pe Internet (medicamente, consiliere medicala, cabinete medicale, programare la medici s.a.). Rezultatele cercetarii au fost publicate sub forma unui articol în cunoscuta revista Nature2. Algoritmul Google a cautat corelatii între frecventa anumitor cautari si raspândirea gripei în timp si spatiu, procesând un numar de 450 de milioane de modele matematice diferite pentru a testa termenii de cautare si comparând predictiile acestora cu cazurile reale de la Centrul pentru Controlul si Prevenirea Bolilor. În acest fel, softul a gasit o combinatie de 45 de termeni care, utilizati într-un model matematic, creau o corelatie de 97- între predictia lor si datele oficiale. Atunci când s-a declansat criza A(H1N1) din 2009, algoritmul Google a redus decalajul de raportare fata de statistica medicala care se bazeaza pe datele privind vizitele pacientilor la medici. Acest lucru a fost posibil prin procesarea si analizarea unui volum enorm de date (Big Data). De atunci am intrat într-o era noua a tehnologiei digitale despre care nu stim exact ce consecinte va avea asupra vietii noastre. În esenta, Big Data se refera la stiinta/ metoda/ abilitatea de a prelucra un volum mare (urias) de date, de a le analiza instantaneu si uneori de a trage concluzii surprinzatoare. Potrivit lui V. Mayer-Schönberger si K. Cukier, Big Data reprezinta „o revolutie comparabila cu Internetul”3, care va schimba fundamental modul în care traim si gândim: educatia, cercetarea, afacerile, sanatatea si, nu în ultimul rând, politica. Ceea ce a reprezentat tiparul, microscopul, telescopul în istoria umanitatii, tot asa si Big Data va marca definitiv viata oamenilor. De exemplu, pe baza procesarii si analizei profilurilor afisate pe retelele de socializare si a cautarilor pe platformele online, algoritmii vor putea identifica persoanele care prezinta un potential infractional/ criminogen si, eventual, cineva va putea decide sa le sanctioneze preventiv. Orice urma digitala rezultata din accesarea unui dispozitiv informatic conectat la Internet este stocata si analizata pentru a servi unor scopuri diverse: comerciale, politice, militare si de alt gen. Tehnologia Big Data permite analistilor, cercetatorilor si utilizatorilor sa ia decizii mai bune si mai rapide, utilizând date care anterior erau inaccesibile sau inutilizabile: date de pe dispozitive inteligente sau senzori (de la o masina la alta, senzori digitali, etichete de identificare a frecventei radio etc.); date de geolocalizare rezultate din utilizarea dispozitivelor portabile conectate prin telefoane mobile, conexiuni wireless sau GPS; date furnizate de accesarea retelelor de socializare (retele sociale, bloguri, site-uri web de partajare a continutului multimedia); date generate de tranzactiile bancare, comerciale, alte date web deschise. Big Data înseamna procesare, analiza si predictie având la dispozitie capacitati imense de stocare a datelor din mediul digital. Aceste date sunt frecvent descrise de o componenta a informaticii numita Artificial Intelligence - AI (inteligenta artificiala), mai exact de un domeniu al AI numit „învatare automatizata” care, mai pe întelesul tuturor, înseamna matematica aplicata în procesarea unui volum mare de date pentru a obtine probabilitati. Compania Amazon utilizeaza AI pentru a ne recomanda cele mai bune carti, Google determina cele mai relevante site-uri web în functie de profilul si cautarile noastre anterioare, Facebook stie ce ne place pentru ca atunci când ne conectam pe aceasta retea de socializare vizualizam anumite postari si dam like-uri, iar LinkedIn ghiceste pe cine cunoastem tinând cont de profilul si interesele profesionale afisate. Cu siguranta, statistica oficiala, domeniul în care activez în prezent, va fi profund marcat de aplicatiile Big Data. În momentul în care bazele de date provenite din surse administrative vor fi interconectate si în România, vor începe sa ruleze si aplicatiile de tip Big Data. În unele domenii se întâmpla deja acest lucru. Introducerea acestor aplicatii va însemna sfârsitul utilizarii esantioanelor în cercetarile statistice. Sa luam ca exemplu ancheta statistica „indicii preturilor de consum”. Conform metodologiei INS, observarea si înregistrarea preturilor se realizeaza de catre operatori statistici în cele 42 de orase resedinta de judet din care sunt selectate 68 de centre de cercetare, în esantion fiind cuprinse cca. 7200 de unitati economice. Tehnologia Big Data nu are nevoie de esantion, nici de operatori statistici, întrucât permite culegerea si analiza datelor despre toate preturile la bunurile alimentare, marfurile nealimentare si servicii afisate în mediul online. Big Data înseamna nu numai estimari de calitate, reducerea timpului de lucru pentru procesare, analiza si diseminare de date, ci si reducerea personalului. În era Big Data, a Inteligentei Artificiale, a algoritmilor si Machine Learning-urilor, multe meserii vor dispare si odata cu acestea locurile de munca. Nu degeaba Elon Musk, CEO-ul Tesla, propune instituirea unui venit universal de baza în contextul în care robotii si masinile inteligente vor lasa oamenii fara ocupatii. 1 Institutul de Virusologie „Stefan S. Nicolau” al Academiei Romane, Date privind epidemia de gripa A(H1N1) varianta 2009. 2 Jeremy Ginsburg et al., „Detecting influenza epidemics using search engine query data”, Nature, vol. 457/ 2009. 3 Victor Mayer-Schönberger & Kenneth Cukier, Big Data. O revolutie care va transforma felul în care traim, muncim si gândim, Editura Pact si Politon, Bucuresti, 2018. Ciprian Iftimoaei este director adjunct la Directia Judeteana de Statistica Iasi si lector asociat doctor la Facultatea de Filosofie si Stiinte Social-Politice a Universitatii „Al. I. Cuza” din Iasi
Ce înseamnă Big Data şi cum ne va afecta viaţa această tehnologie?
- de Ziarul de Iasi
- 2021/09/27 23:51
Alte știri din Ziarul de Iasi
- de Ziarul de Iasi
- 2021/09/27 23:50
- de Ziarul de Iasi
- 2021/09/27 23:50
- de Ziarul de Iasi
- 2021/09/27 23:50
- de Ziarul de Iasi
- 2021/09/27 23:50
- de Ziarul de Iasi
- 2021/09/27 23:50
- de Ziarul de Iasi
- 2021/09/27 23:50
