TECNOLOGIA
30-04-2025 14:01
Subscriu-te gratuïtament i rebràs cada dissabte el nostre butlletí amb els articles d’opinió i notícies més destacades del nostre diari. Apunta’t ara!
Segons l’Enciclopèdia.cat el Big Data és un “conjunt de dades que, pel seu enorme volum, han de ser processades per mitjà de les modernes tecnologies de la informació i la comunicació, ja que ultrapassen la capacitat dels sistemes informàtics habituals.
El processament de les dades massives inclou, entre d’altres, operacions com l’emmagatzematge, la classificació, l’anàlisi, el filtratge, la transferència, la visualització, etc., i, a través de la mineria de dades (basada en tècniques estadístiques i algoritmes) hom les converteix en informació significativa. L’enorme volum de dades generat és el resultat de les mateixes noves tecnologies de la informació i la comunicació (internet, ordinadors, mòbils, etc., amb el seu programari associat). L’obtenció i el processament de les dades massives prové sobretot de grans organitzacions, tant públiques com privades (empreses, governs, administracions, organismes internacionals, institucions financeres, serveis públics, universitats, recerca científica, indústria, etc.).
Tant el volum creixent de dades a disposició d’aquestes organitzacions com les tècniques cada vegada més refinades de processament han donat lloc a polèmiques sobre possibles vulneracions del dret a la privacitat i a la intimitat”.
També anomenat dades massives, el Big Data és una combinació de dades estructurades, semiestructurades i no estructurades recollides per les organitzacions amb les quals poder extreure informació. Les diverses “V” que defineixen aquests sistemes són, Volum de dades; Varietat dels tipus de dades que s'emmagatzemen; Velocitat amb què es generen aquestes dades; Veracitat de les dades recollides i utilitzades; Validesa a l'hora de fer-les servir; Valor que tenen i que aporten aquestes dades; Variabilitat, tant en la seva composició com en la seva freqüència i disponibilitat; Volatilitat, atès que no són eternes ni perennes; Viabilitat de les dades; Visualització d'aquestes mateixes dades.
N’hi ha 4, però que hem de destacar entre les altres que són: Volum, quan un gran volum de dades no es pot tractar sense l'ajuda d'eines d'anàlisis complexes.
Varietat, quan hi ha dades que han passat de ser bases de dades relacionals, fulls de càlcul, fitxers, és a dir estructurades, a estar semiestructurades com XML, JSON o dades de text, les imatges i els vídeos totalment desestructurades. Cal considerar que només un 20%, de les dades, estan emmagatzemades en sistemes tradicionals que permeten analitzar la informació de forma estructurada.
Velocitat, existeix una alta velocitat de generació de dades i necessitem una alta velocitat de resposta per poder-les processar.
I finalment, Valor, cal transformar totes les dades o la majoria d’elles, primer, en informació, i finalment en coneixement.
Els dos noms es consideren correctes i adequats i tenen el mateix sentit, tant “Big Data” corresponent al nom en masculí i “Dades Massives”, nom en femení que sempre s’usa en plural.
Però per a què serveix el Big Data?
La realitat és que tot aquest volum d'informació ha de ser tractada i analitzada per poder extreure el seu valor.
El Big Data permet, aconseguir uns objectius marcats d'una forma més ràpida, efectiva i eficient. I, per què? Malauradament, l'ús d’aquesta informació depèn molt de la persona, l’empresa i de l'organització que en faci ús, algunes poden ser per campanyes de màrqueting, per a la investigació de malalties...
El Big Data té la capacitat de treballar amb dades en temps real i s’apliquen processos per tractar-les, analitzar-les i emmagatzemar-les. A banda, correlaciona les dades procedents de diverses fonts i en diferents formats.
És també un conjunt de dades que pel seu volum, la velocitat i la seva naturalesa del seu processament és molt superior als sistemes informàtics habituals. Són metadades que naveguen per la xarxa, que no serveixen per a res de res si no s’emmagatzemen, classifiquen i analitzen.
Per a la majoria d’analistes i professionals els conjunts de dades van des de 30 fins a 50 Terabytes, el que serien 30.000 o 50.000 GB, i que arriben a Petabytes, que són un milió de GB. Per tant, no cal ser un endeví per saber que cap dels dispositius electrònics convencionals no pot suportar, emmagatzemar ni processar totes aquestes dades.
Existeixen doncs una gran quantitat d'informació a les nostres mans, aquestes dades han de ser gestionades per organitzacions professionals amb capacitat per identificar d’una manera ràpida i eficient els problemes que se’n derivin.
Cal tenir molt present que el Big Data suposa un volum de dades tan gran i complex que s’han de processar i que requereixen l’ús de tecnologies no tradicionals. Una informació enorme, molt diversa i vinculada a l’ús d’internet, s’ha de processar molt ràpidament, a voltes, en temps real.
Això provoca que aniran sorgint noves eines tecnològiques per fer front a aquestes necessitats. Per tant, el Big Data s’ha de relacionar amb noves tecnologies com la intel·ligència artificial, el machine learning, el deep learning o l’ús del núvol, entre d’altres.
Un híbrid entre totes aquestes ha d’ajudar al desenvolupament de solucions innovadores i disruptives i ajudar a avançar en diferents camps de coneixement.
La gran majoria dels enquestats estava d’acord que l’anàlisi de dades afegia valor significatiu a la seva empresa. Les solucions de Big Data es poden utilitzar de tantes maneres diferents que, ja sigui mitjançant la seguretat, la interconnexió amb els clients, o prenent les decisions comercials correctes, qualsevol empresa els trobarà un ús pràctic.
Segons la definició de Gartner “El Big Data són actius informacionals de gran volum, velocitat i varietat, que demanden formes innovadores i efectives de processar la informació per a la presa de decisions".
Els sectors que més inverteixen en Big Data són el financer en el control del risc de frau o impagaments, en la reacció als successos del mercat en temps real, en la gestió de l'efectiu o en la segmentació avançada de clients.
El comerç, personalitzant l'oferta, recuperant a clients inactius, en respondre a les demandes de manera ràpida i eficaç, i optimitzant l'estoc. La salut, en l’anàlisi predictiva dels diagnòstics, en la monitorització de pacients, en els estudis epidemiològics i en la interacció farmacològica.
En les telecomunicacions, en l’oferiment a consumidors millors contractes, en afinar les campanyes de màrqueting, en computar moltes més variables (xarxes socials) a l'hora de valorar la satisfacció d’un client i dissenyar nous productes i serveis. En el desenvolupament i els avenços en tecnologies de la informació, en els sistemes d’emmagatzematge i el núvol, en la seguretat i integritat de les dades.
En l’energia, anticipant errors en la xarxa, millorant el manteniment, ajustant la demanda (models predictius), identificant avaries, descobrint noves tendències en el consum o aprofitant al màxim la llum del sol o el vent. En la indústria, per l’optimització de la logística, en l’inventari o producció, en diagnòstics predictius, en la variabilitat en els processos de fabricació o la traçabilitat.
En serveis immobiliaris, per optimitzar, agilitzar i millorar els serveis, així com en identificar les oportunitats i els patrons de comportament. I en el sector públic per a les smart cities, per a la gestió de coneixement, en la ciberseguretat, en el rendiment d'infraestructures, per l’optimització de peticions dels ciutadans. En els materials, en el seu disseny, en la selecció de materials i la reducció de residus.
Som conscients que hi ha aspectes positius i negatius, en la recollida de dades i en la seva explotació. El seu manteniment, processament i anàlisi pot provocar molt d’enrenou.
També ens preocupen qüestions relacionades amb la discriminació predictiva, una pèrdua de l’anonimat, l’ús que en puguin fer els governs, els negocis de les dades i, de retruc, els ciberatacs.
Existeix molta preocupació, hi ha un debat social sobre aquest tema, i si cal determinar el límit entre el bon o el mal ús de les dades.
El rastre digital en l’ús les xarxes socials, d’internet, dels que paguem amb mitjans electrònics, fins i tot del que consumim, en realitat vivim en una constant geolocalització.
Com a conseqüència, d’una manera contínua i sistemàtica existeixen moltes dades que són constantment emmagatzemades. Són aquestes dades la base del Big Data, un tractament massiu d’aquestes provoca que existeixi una gran força i poder. Així doncs, igualment, ha de créixer un gran debat sobre l'ètica en el seu ús. Pensem que el Big Data esdevé la base de la intel·ligència artificial.
Cèsar Alierta (1945- 2024), un advocat que va ser president de Telefònica S.A. va dir, “les dades són el petroli del segle XXI. El desplegament de sensors i l'increment de la capacitat del processament són claus en la transformació de molts sectors i en la creació d'un món més mesurable i programable”.
I també la Dra. Rosa Colmenarejo, per la facultat d’econòmiques i empresarials, enginyera tècnica agrícola i llicenciada en humanitats va afirmar “els Big Data han de ser considerats un fenomen sociotecnològic en tant que no només estan transformant la cultura de comunicació entre éssers humans sinó que intervenen simultàniament als espais públics i privats dels agents fent que la frontera entre tots dos es mostri més difusa que mai”.
Joan Rodríguez i Serra és educador social (joanr.educadorsocial@gmail.com)
PUBLICITAT
PUBLICITAT