4月16日,由北京曠視科技有限公司與北京智源星空人工智能研究院共同舉辦的“智源學(xué)者計(jì)劃啟動(dòng)暨聯(lián)合實(shí)驗(yàn)室發(fā)布會(huì)”在京舉行。在會(huì)上,曠視研究院聯(lián)合北京智源星空人工智能研究院發(fā)布了全球最大的物體檢測(cè)數(shù)據(jù)集——曠視Objects365,該數(shù)據(jù)集也是新一代通用物體檢測(cè)數(shù)據(jù)集,具有規(guī)模大、質(zhì)量高、泛化能力強(qiáng)的特點(diǎn)。

圖:“智源學(xué)者計(jì)劃啟動(dòng)暨聯(lián)合實(shí)驗(yàn)室發(fā)布會(huì)”在京召開
曠視Objects365首批開放60萬張圖像和1000萬標(biāo)注框,超越微軟COCO
據(jù)曠視首席科學(xué)家兼研究院院長(zhǎng)孫劍介紹,在規(guī)模方面,曠視Objects365定義了生活中常見的365個(gè)類別,第一批將開放63萬張圖像,1000萬的標(biāo)注框。開放圖片數(shù)是微軟COCO的5倍,標(biāo)注框超過微軟COCO的11倍。
算法優(yōu)化的上限嚴(yán)重依賴于基準(zhǔn)數(shù)據(jù)集術(shù)的質(zhì)量。因此,為保證標(biāo)注質(zhì)量,在打造曠視Objects365時(shí),曠視設(shè)計(jì)出一套科學(xué)而嚴(yán)格的標(biāo)注流程,每一張圖片的背后至少會(huì)經(jīng)過9名標(biāo)注工人之手。此外,作為一個(gè)優(yōu)秀的預(yù)訓(xùn)練數(shù)據(jù)集,曠視Objects365預(yù)訓(xùn)練模型在使用過程中,可以輕松超越現(xiàn)有算法的精度,顯著加速收斂過程,表現(xiàn)出極強(qiáng)的泛化能力。在執(zhí)行COCO、VOO Det、CityPersons等檢測(cè)任務(wù)時(shí),在VOC Seg和ADE等分割任務(wù)上均有顯著提升。
除此之外,孫劍還表示:“雖然曠視Objects365已是目前世界上最大的物體檢測(cè)數(shù)據(jù)集,但我們的目標(biāo)是在未來3年內(nèi)將這個(gè)數(shù)據(jù)集從現(xiàn)在的60萬,擴(kuò)大到200萬圖,超過2000多萬框,進(jìn)一步擴(kuò)大這個(gè)數(shù)據(jù)集。”

圖:曠視首席科學(xué)家兼研究院院長(zhǎng)孫劍在發(fā)布會(huì)上講話
重視數(shù)據(jù)共享,曠視為行業(yè)發(fā)展樹立新的里程碑
相較于算法,高質(zhì)量的數(shù)據(jù)能對(duì)深度學(xué)習(xí)帶來更大的提升,因而數(shù)據(jù)共享是集結(jié)全行業(yè)之力推動(dòng)計(jì)算機(jī)視覺發(fā)展的關(guān)鍵之舉。并且近幾年,相關(guān)技術(shù)的進(jìn)步使得圖像采集設(shè)備一代代革新,更高清晰度、更優(yōu)色彩表現(xiàn)的圖像將會(huì)對(duì)計(jì)算機(jī)視覺模型的訓(xùn)練產(chǎn)生更大影響。曠視Objects365 數(shù)據(jù)集的發(fā)布,無論從數(shù)據(jù)規(guī)模再到標(biāo)注質(zhì)量,皆為計(jì)算機(jī)視覺基礎(chǔ)技術(shù)通用物體檢測(cè)樹立了新的里程碑。
值得一提的是,曠視Objects365數(shù)據(jù)集將被用于Detection In the Wild 2019(DIW 2019)挑戰(zhàn)賽中。DIW 2019由曠視研究院聯(lián)合北京智源星空人工智能研究院舉辦,并已成功申請(qǐng)到2019 CVPR Workshop,其目的是為了推動(dòng)目標(biāo)檢測(cè)技術(shù)的發(fā)展,改善現(xiàn)有目標(biāo)檢測(cè)數(shù)據(jù)集的類別覆蓋不全、標(biāo)注精度不高、密集場(chǎng)景缺少等問題。
DIW2019挑戰(zhàn)賽的比賽賽道分為三個(gè)賽道,即Objects365賽道、Objects365小賽道和CrowdHuman賽道。其中,為探索目標(biāo)檢測(cè)系統(tǒng)的瓶頸,參加Objects365賽道的選手將利用公開的365種類別,60萬張圖片超過1000萬個(gè)框的完整訓(xùn)練集對(duì)檢測(cè)模型進(jìn)行訓(xùn)練;在3萬張圖片構(gòu)成的驗(yàn)證集上調(diào)試算法,并在10萬張圖片構(gòu)成的測(cè)試集上進(jìn)行最終的挑戰(zhàn)。
主辦方為每個(gè)賽道的冠軍隊(duì)伍準(zhǔn)備了10000美元的獎(jiǎng)勵(lì)。同時(shí),挑戰(zhàn)賽賽程共分為四個(gè)階段:即日起進(jìn)入第一階段,開放注冊(cè)并同步發(fā)布訓(xùn)練集和驗(yàn)證集;第二階段(5月初)發(fā)布測(cè)試集數(shù)據(jù);第三階段(6月初)終止提交結(jié)果;最后階段將于CVPR 2019 Workshop期間公布比賽結(jié)果,并邀請(qǐng)優(yōu)勝隊(duì)在研討會(huì)中介紹比賽經(jīng)驗(yàn),共同探討檢測(cè)問題的瓶頸及優(yōu)化方向。
DIW2019挑戰(zhàn)賽只是曠視Objects365數(shù)據(jù)集其中一個(gè)應(yīng)用案例。相信隨著該數(shù)據(jù)集的發(fā)布,研究社區(qū)得以在曠視 Objects365 這一全新的 Benchmark 上開展更多實(shí)驗(yàn),這勢(shì)必會(huì)推動(dòng)通用物體檢測(cè)技術(shù)發(fā)展新一波浪潮的到來,為計(jì)算機(jī)視覺技術(shù)發(fā)展注入新活力和新動(dòng)力。
星空人工智能技術(shù)網(wǎng) 倡導(dǎo)尊重與保護(hù)知識(shí)產(chǎn)權(quán)。如發(fā)現(xiàn)本站文章存在版權(quán)等問題,煩請(qǐng)30天內(nèi)提供版權(quán)疑問、身份證明、版權(quán)證明、聯(lián)系方式等發(fā)郵件至1851688011@qq.com我們將及時(shí)溝通與處理。?。?a href="/">首頁 > 星空人工智能產(chǎn)業(yè) > 智能物聯(lián) » 超越微軟COCO 全球最大物體檢測(cè)數(shù)據(jù)集“曠視Objects365”發(fā)布