中國青年報客戶端北京3月20日電(中青報·中青網(wǎng)記者 賈驥業(yè))我國7個數(shù)據(jù)標注基地已形成醫(yī)療、工業(yè)、教育等行業(yè)的高質(zhì)量數(shù)據(jù)集335個;賦能121個國產(chǎn)人工智能大模型研發(fā);引進和培育標注企業(yè)223家;標注從業(yè)人員達5.8萬人;帶動數(shù)據(jù)標注行業(yè)相關(guān)產(chǎn)值超過83億元;數(shù)據(jù)標注總規(guī)模達17282TB,相當(dāng)于中國國家圖書館數(shù)字資源總量的6倍左右。
所謂數(shù)據(jù)標注,就是對數(shù)據(jù)進行添加標記、說明、解釋、分類和編碼的過程,是提升人工智能算法、模型核心能力的關(guān)鍵環(huán)節(jié)。我國有7個數(shù)據(jù)標注基地,分別位于四川成都、遼寧沈陽、安徽合肥、湖南長沙、海南海口、河北保定和山西大同。
據(jù)悉,國家數(shù)據(jù)局未來將進一步暢通數(shù)據(jù)采集、標注、人工智能應(yīng)用產(chǎn)業(yè)鏈,重點推動工業(yè)、金融、醫(yī)療、交通、教育等幾大領(lǐng)域的高質(zhì)量數(shù)據(jù)集建設(shè),促進數(shù)據(jù)標注產(chǎn)業(yè)高質(zhì)量發(fā)展。