Google近日發(fā)布了一個(gè)巨型數(shù)據(jù)集Open Images Dataset V4,為邊界框、視覺關(guān)系等注釋了20000個(gè)不同的概念。Open Images Dataset V4包含920萬張帶有大量注釋的圖像。注釋包括邊界框、視覺關(guān)系注釋以及近3000個(gè)不同概念的3000萬個(gè)圖像級(jí)標(biāo)簽,注釋規(guī)模前所未有。此外,他們還使用了自動(dòng)標(biāo)記的方法,訓(xùn)練人類標(biāo)注師用“快速點(diǎn)擊”的方法更有效地標(biāo)注圖像。
Open Images Dataset V4的20000個(gè)類名本身是Google的內(nèi)部數(shù)據(jù)集 JFT的所有名稱的子集,包含“超過3億張圖像”。有業(yè)內(nèi)人士認(rèn)為,近年來,新的大型數(shù)據(jù)集的發(fā)布與新的AI算法出現(xiàn)突破,效率和功能提高之間似乎存在著一定的聯(lián)系。Open Images Dataset V4的大規(guī)模和密集標(biāo)簽或可促進(jìn)AI的發(fā)展。
