OpenAI, una rinomata azienda di intelligenza artificiale, ha recentemente introdotto il suo ultimo strumento, il "GPTBot", progettato per scopi di scansione del web, aprendo potenzialmente la strada a miglioramenti nelle future iterazioni dei suoi modelli ChatGPT.
In un recente post sul blog, OpenAI ha annunciato il lancio del GPTBot, evidenziando il suo potenziale per migliorare le prossime versioni di ChatGPT. La funzione principale dello strumento ruota attorno al web crawling, un processo in cui un bot, spesso indicato come web spider, indicizza il contenuto del sito web attraverso la vasta distesa di Internet. Ciò consente ai motori di ricerca come Google e Bing di visualizzare siti Web pertinenti nei risultati di ricerca.
OpenAI ha spiegato che GPTBot è progettato per raccogliere informazioni pubblicamente accessibili da varie fonti web. Tuttavia, è programmato per escludere contenuti dietro paywall, fonti che coinvolgono informazioni di identificazione personale e testo che viola le politiche stabilite di OpenAI. È interessante notare che i proprietari di siti Web mantengono la possibilità di impedire le attività di scansione di GPTBot inserendo un comando "disallow" in un file standard sui loro server.
Questa nuova attività di web crawling segue il recente deposito di OpenAI per una domanda di marchio per "GPT-5", il previsto successore del modello GPT-4 esistente. Questa domanda, depositata presso l'Ufficio brevetti e marchi degli Stati Uniti il 18 luglio, copre l'utilizzo del termine "GPT-5" per varie applicazioni basate sull'intelligenza artificiale , tra cui la conversione di testo e voce, la traduzione da audio a testo e il riconoscimento vocale .
OpenAI progetta il prossimo modello
Tuttavia, nonostante l'anticipazione che circonda GPT-5, il fondatore e CEO di OpenAI, Sam Altman, ha avvertito che l'azienda è ancora molto lontana dall'inizio della formazione GPT-5. Ha sottolineato la necessità di ampi controlli di sicurezza prima di intraprendere il processo di formazione.
Nel frattempo, OpenAI ha incontrato crescenti preoccupazioni riguardo alle sue pratiche di raccolta dei dati, in particolare in relazione ai problemi di copyright e consenso. A giugno, il garante della privacy giapponese ha emesso un avviso a OpenAI in merito alla raccolta di dati sensibili senza un'adeguata autorizzazione. Allo stesso modo, l'Italia ha imposto un divieto temporaneo all'uso di ChatGPT, adducendo violazioni delle leggi sulla privacy dell'Unione Europea. Questi casi mettono in luce il crescente controllo sulla privacy dei dati e sulla tecnologia AI.
In particolare, OpenAI ha recentemente affrontato un'azione legale collettiva intentata da 16 querelanti che hanno affermato che la società ha avuto accesso a informazioni private dalle interazioni degli utenti con ChatGPT. Questa causa, che coinvolge anche Microsoft come imputato, sostiene che se le accuse saranno comprovate, entrambe le società potrebbero essere trovate in violazione del Computer Fraud and Abuse Act, un quadro legale che è stato storicamente applicato ai casi di web scraping.
Mentre OpenAI fa incursioni nel regno del web crawling con GPTBot, introduce nuove possibilità per perfezionare i suoi modelli di intelligenza artificiale. Tuttavia, questi sviluppi sono accompagnati da un contesto di considerazioni legali ed etiche, poiché l'industria dell'IA naviga nel delicato equilibrio tra innovazione, privacy e utilizzo responsabile dei dati.