{"id":924,"date":"2024-10-10T18:23:21","date_gmt":"2024-10-10T16:23:21","guid":{"rendered":"https:\/\/sites.unica.it\/holmes\/?p=924"},"modified":"2024-10-10T18:24:14","modified_gmt":"2024-10-10T16:24:14","slug":"i-dati-sintetici-generati-dallintelligenza-artificiale-potrebbero-ridurre-i-rischi-per-la-privacy","status":"publish","type":"post","link":"https:\/\/sites.unica.it\/holmes\/i-dati-sintetici-generati-dallintelligenza-artificiale-potrebbero-ridurre-i-rischi-per-la-privacy\/","title":{"rendered":"I dati sintetici generati dall&#8217;intelligenza artificiale potrebbero ridurre i rischi per la privacy"},"content":{"rendered":"\n<p><em>Un interessante <\/em>policy brief<em> pubblicato dalla Commissione Europea analizza i diversi tipi di dati che possono essere utilizzati nel processo di <\/em>policy-making<em>. In particolare, l\u2019attenzione viene focalizzata sui dati sintetici prodotti tramite sistemi di Intelligenza Artificiale Generativa: questi possono rappresentare, se utilizzati in modo corretto e controllato, un aiuto fondamentale nella formazione di normative etiche ed efficaci, salvaguardando la privacy dei dati sensibili<\/em><\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity is-style-default\" style=\"margin-top:var(--wp--preset--spacing--30);margin-bottom:var(--wp--preset--spacing--30)\" \/>\n\n\n\n<p>Recentemente, la Commissione Europea ha pubblicato un <em>policy brief<\/em> <a href=\"#_ftn1\" id=\"_ftnref1\">[1]<\/a> sul tema dell\u2019utilizzo dei dati sintetici all\u2019interno dei processi di <em>policy-making<\/em>. Nel documento, si analizzano diversi aspetti, tra cui la privacy dei cosiddetti dati sensibili.<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter size-large is-resized has-custom-border is-style-default has-lightbox\"><a href=\"https:\/\/publications.jrc.ec.europa.eu\/repository\/handle\/JRC138521\"><img loading=\"lazy\" decoding=\"async\" width=\"724\" height=\"1024\" src=\"http:\/\/sites.unica.it\/holmes\/files\/2024\/10\/Immagine_JRC_EU-724x1024.jpg\" alt=\"\" class=\"wp-image-928\" style=\"border-width:1px;border-radius:0px;box-shadow:var(--wp--preset--shadow--natural);width:404px;height:auto\" srcset=\"https:\/\/sites.unica.it\/holmes\/files\/2024\/10\/Immagine_JRC_EU-724x1024.jpg 724w, https:\/\/sites.unica.it\/holmes\/files\/2024\/10\/Immagine_JRC_EU-212x300.jpg 212w, https:\/\/sites.unica.it\/holmes\/files\/2024\/10\/Immagine_JRC_EU-768x1086.jpg 768w, https:\/\/sites.unica.it\/holmes\/files\/2024\/10\/Immagine_JRC_EU-1087x1536.jpg 1087w, https:\/\/sites.unica.it\/holmes\/files\/2024\/10\/Immagine_JRC_EU.jpg 1240w\" sizes=\"auto, (max-width: 724px) 100vw, 724px\" \/><\/a><\/figure>\n\n\n\n<p>Il problema della privacy dei dati \u2013 e del loro utilizzo corretto in tal senso \u2013 si \u00e8 acuito ulteriormente sin dalla prima diffusione dei sistemi di Intelligenza Artificiale Generativa: questi sistemi, allenati tramite grandi moli di dati la cui provenienza risulta molto variegata, necessitano di un maggiore controllo e di un utilizzo che sia consapevole ed eticamente corretto. La domanda sorge spontanea: come far s\u00ec che ci\u00f2 possa avvenire in maniera rigorosa in una societ\u00e0 ampiamente globalizzata ed in costante evoluzione, sia sociale che tecnologica?<\/p>\n\n\n\n<p>Prima di procedere in un tentativo di risposta, \u00e8 necessario soffermarci sull\u2019analisi delle tipologie di dati utilizzabili per raggiungere lo scopo individuato, cos\u00ec come vengono affrontate nel documento (differenti dalle specifiche inserite nella GDPR, che si riferisce a differenti categorizzazioni dei dati personali <a href=\"#_ftn2\" id=\"_ftnref2\">[2]<\/a>).<\/p>\n\n\n\n<p>Secondo la Commissione europea, i cosiddetti \u201cdati tradizionali\u201d costituiscono dei fedeli spaccati della realt\u00e0, ma a volte non offrono un quadro completo dei fenomeni da analizzare; inoltre, quando vengono processati per migliorare la protezione della privacy (ad esempio tramite una pseudo-anonimizzazione), perdono la loro autenticit\u00e0.<\/p>\n\n\n\n<p>I dati sintetici, invece, contengono s\u00ec delle deviazioni rispetto ai dati reali, ma mantengono intatti i <em>pattern<\/em> statistici dei <em>dataset<\/em> reali garantendo allo stesso tempo il giusto livello di privacy (in particolare riguardo ai dati sensibili).<\/p>\n\n\n\n<p>C\u2019\u00e8 poi una terza tipologia di dati che sta assumendo sempre pi\u00f9 rilievo: i dati generati totalmente da sistemi di Intelligenza Artificiale Generativa. Questi dati sono sicuramente pi\u00f9 complessi rispetto a quelli sintetici, ma risultano essere maggiormente esposti al rischio di inesattezze, fra le quali si annoverano le cosiddette \u201callucinazioni\u201d<a href=\"#_ftn3\" id=\"_ftnref3\">[3]<\/a> dell\u2019IA. L\u2019altro aspetto riguardante questi dati \u00e8 quello della quasi totale assenza di normative e linee guida (specie dal punto di vista etico) sull\u2019utilizzo corretto nel campo della <em>policy making<\/em>; va per\u00f2 sottolineato il grande sforzo dell\u2019Unione Europea, in modo particolare della Commissione Europea, nella stesura del Regolamento sull\u2019Intelligenza Artificiale (<a href=\"https:\/\/digital-strategy.ec.europa.eu\/en\/policies\/regulatory-framework-ai\">AI Act<\/a>), entrato definitivamente in vigore il 1\u00b0 agosto del 2024.<\/p>\n\n\n\n<p>Il documento entra nel vivo della questione, andando a introdurre i cosiddetti <em>AI agents<\/em>, dei sistemi basati sui <em>Large Language Models<\/em> (LLMs) che, a differenza dei modelli tradizionali, hanno una forte adattabilit\u00e0: questo crea un vantaggio importante, ossia integrare sorgenti di dati differenti con facilit\u00e0 e permettendo di estrarre da questo processo dei dati effettivamente utili e validi.<\/p>\n\n\n\n<p>Quanto appena esposto fa emergere una sfida importante per il futuro: la creazione di un approccio all\u2019utilizzo dei dati (sintetici e non) in modo dinamico, integrato ed onnicomprensivo. Affinch\u00e9 ci\u00f2 abbia successo, \u00e8 necessario affrontare i seguenti punti: investire maggiormente sullo sviluppo tecnologico e della conoscenza; creare dei <em>framework<\/em> sufficientemente robusti per valutare la qualit\u00e0 e l\u2019affidabilit\u00e0 dei dati; considerare, con un\u2019attenzione non secondaria ma preponderante, gli aspetti etici legati al possibile uso improprio dei dati sintetici e\/o generati da IA.<\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity is-style-default\" style=\"margin-top:var(--wp--preset--spacing--30);margin-bottom:var(--wp--preset--spacing--30)\" \/>\n\n\n\n<p class=\"is-style-info\" style=\"margin-top:var(--wp--preset--spacing--20);margin-bottom:var(--wp--preset--spacing--20);line-height:1.4\">Di <strong>Francesco Aracu<\/strong><br><em>Studente del Corso di Laurea Magistrale in Computer Engineering, Cybersecurity and Artificial Intelligence dell\u2019Universit\u00e0 degli Studi di Cagliari<\/em><\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity is-style-default\" style=\"margin-top:var(--wp--preset--spacing--30);margin-bottom:0\" \/>\n\n\n\n<p><a href=\"#_ftnref1\" id=\"_ftn1\">[1]<\/a> HRADEC, J., DI LEO, M. and KOTSEV, A., AI Generated Synthetic Data in Policy Applications, European Commission, Ispra, 2024, JRC138521 (clicca <a href=\"https:\/\/publications.jrc.ec.europa.eu\/repository\/handle\/JRC138521\">qui<\/a> per scaricare)<\/p>\n\n\n\n<p><a href=\"#_ftnref2\" id=\"_ftn2\">[2]<\/a> <a href=\"https:\/\/gdpr.eu\/eu-gdpr-personal-data\/\">What is considered personal data under the EU GDPR? &#8211; GDPR.eu<\/a><\/p>\n\n\n\n<p><a href=\"#_ftnref3\" id=\"_ftn3\">[3]<\/a> Stringhi, E. (2023) \u00abLLM allucinanti (o mal addestrati)? Il problema dell\u2019accuratezza dei dati\u00bb, i-lex. Bologna, Italy, 16(2), pagg. 54\u201363. doi: 10.6092\/issn.1825-1927\/18877.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Un interessante policy brief pubblicato dalla Commissione Europea analizza i diversi tipi di dati che possono essere utilizzati nel processo di policy-making. In particolare, l\u2019attenzione viene focalizzata sui dati sintetici prodotti tramite sistemi di Intelligenza Artificiale [&hellip;]<\/p>\n","protected":false},"author":10006,"featured_media":798,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_coblocks_attr":"","_coblocks_dimensions":"","_coblocks_responsive_height":"","_coblocks_accordion_ie_support":"","footnotes":""},"categories":[4],"tags":[],"class_list":["post-924","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-news"],"_links":{"self":[{"href":"https:\/\/sites.unica.it\/holmes\/wp-json\/wp\/v2\/posts\/924","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/sites.unica.it\/holmes\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/sites.unica.it\/holmes\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/sites.unica.it\/holmes\/wp-json\/wp\/v2\/users\/10006"}],"replies":[{"embeddable":true,"href":"https:\/\/sites.unica.it\/holmes\/wp-json\/wp\/v2\/comments?post=924"}],"version-history":[{"count":4,"href":"https:\/\/sites.unica.it\/holmes\/wp-json\/wp\/v2\/posts\/924\/revisions"}],"predecessor-version":[{"id":931,"href":"https:\/\/sites.unica.it\/holmes\/wp-json\/wp\/v2\/posts\/924\/revisions\/931"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/sites.unica.it\/holmes\/wp-json\/wp\/v2\/media\/798"}],"wp:attachment":[{"href":"https:\/\/sites.unica.it\/holmes\/wp-json\/wp\/v2\/media?parent=924"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/sites.unica.it\/holmes\/wp-json\/wp\/v2\/categories?post=924"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/sites.unica.it\/holmes\/wp-json\/wp\/v2\/tags?post=924"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}