Uno studio condotto dao ricercatori della Rice e della StanfordUniversity ha scoperto che l’allenamento di modelli IA attraverso dati sintetici sembra portare a distorsioni sul lungo periodo.
Per dati sintetici si intende l’utilizzo di informazioni generate da IA per allenare altre intelligenze artificiali. Il termine usato per indicare la sindrome sviluppata è MAD, ovvero Model Autophagy Disorder.
I dati sintetici sono creati per simulare il mondo reale e sono adibiti all’allenamento di altri modelli di machine learning. Queste informazioni comprendono volti di persone che non esistono, dati finanziari inventati e tanti altri fattori che caratterizzano la nostra società. Secondo l’azienda Gartner entro il 2030, sostituiranno in gran parte i dati reali nell’addestramento di queste tipologie di software.
Tuttavia, i ricercatori della Rice e della Stanford hanno dimostrato come, dopo appena cinque cicli di addestramento con dati sintetici, i vari modelli “esplodessero”. Secondo lo studio, utilizzando i dati sintetici per apprendere nuove informazioni, la macchina inizia ad attingere da contenuti sempre più convergenti e meno variegati rispetto all’utilizzo di dati “classici”.
Jonathan Sadowski, dell’Università di Melbourne, ha coniato il termine “IA Asburgica”, come l’antica famiglia che praticava matrimoni tra consanguinei. Allo stesso modo l’IA alimentata da dati sintetici genera “un mutante consanguineo con caratteristiche esagerate e grottesche”.










