數(shù)據(jù)標(biāo)注產(chǎn)業(yè)乘風(fēng)起航加速發(fā)展
大模型與AI標(biāo)注工具幫助電商平臺(tái)文字生成標(biāo)注、圖上文案摳圖、AI視頻打標(biāo),商品素材生成效率較人工提升千倍,內(nèi)容制作成本降低超30%,破解了電商行業(yè)商品識(shí)別效率低、倉儲(chǔ)分揀自動(dòng)化不足、個(gè)性化推薦精準(zhǔn)度差等痛點(diǎn)……
在人工智能產(chǎn)業(yè)風(fēng)起云涌之際,數(shù)據(jù)標(biāo)注產(chǎn)業(yè)也乘風(fēng)起航,不斷加速創(chuàng)新發(fā)展。
數(shù)據(jù)標(biāo)注產(chǎn)業(yè)進(jìn)入快速發(fā)展期
數(shù)據(jù)標(biāo)注產(chǎn)業(yè)是對(duì)數(shù)據(jù)進(jìn)行篩選、清洗、分類、注釋、標(biāo)記和質(zhì)量檢驗(yàn)等加工處理的新興產(chǎn)業(yè)。培育壯大數(shù)據(jù)標(biāo)注產(chǎn)業(yè)對(duì)于提升數(shù)據(jù)供給質(zhì)量,推動(dòng)人工智能創(chuàng)新發(fā)展具有重要支撐作用。
去年年末,國家發(fā)展改革委等部門發(fā)布《關(guān)于促進(jìn)數(shù)據(jù)標(biāo)注產(chǎn)業(yè)高質(zhì)量發(fā)展的實(shí)施意見》,提出到2027年,數(shù)據(jù)標(biāo)注產(chǎn)業(yè)專業(yè)化、智能化及科技創(chuàng)新能力顯著提升,產(chǎn)業(yè)規(guī)模大幅躍升,年均復(fù)合增長率超過20%。
目前,我國已建成四川成都、遼寧沈陽、安徽合肥、湖南長沙、海南海口、河北保定和山西大同7個(gè)數(shù)據(jù)標(biāo)注基地,7個(gè)數(shù)據(jù)標(biāo)注基地?cái)?shù)據(jù)標(biāo)注總規(guī)模達(dá)到17282TB,形成醫(yī)療、工業(yè)、教育等行業(yè)的高質(zhì)量數(shù)據(jù)集335個(gè),賦能121個(gè)國產(chǎn)人工智能大模型研發(fā),引進(jìn)和培育標(biāo)注企業(yè)223家,標(biāo)注從業(yè)人員達(dá)5.8萬人,帶動(dòng)數(shù)據(jù)標(biāo)注行業(yè)相關(guān)產(chǎn)值超過83億元。
日前在2025數(shù)據(jù)安全發(fā)展大會(huì)上發(fā)布的《2025高質(zhì)量數(shù)據(jù)集研究報(bào)告》顯示,隨著人工智能、大模型技術(shù)迭代,我國數(shù)據(jù)標(biāo)注產(chǎn)業(yè)產(chǎn)值已突破80億元,高質(zhì)量數(shù)據(jù)建設(shè)進(jìn)入規(guī)模化、規(guī)范化發(fā)展新階段。
數(shù)據(jù)標(biāo)注產(chǎn)業(yè)賦能效應(yīng)顯現(xiàn)
近日,國家數(shù)據(jù)局發(fā)布了一批數(shù)據(jù)標(biāo)注優(yōu)秀案例集,從助力人工智能、低空經(jīng)濟(jì)等新興產(chǎn)業(yè)加快發(fā)展,到推動(dòng)油氣勘探、礦山巡檢智能化轉(zhuǎn)型,再到賦能基層治理和信息無障礙建設(shè),數(shù)據(jù)標(biāo)注產(chǎn)業(yè)正加速賦能千行百業(yè)轉(zhuǎn)型發(fā)展。
為解決傳統(tǒng)標(biāo)注精度低、效率低、成本高、復(fù)雜目標(biāo)識(shí)別難等問題,無人機(jī)影像數(shù)據(jù)標(biāo)注采用深度學(xué)習(xí)算法、3D點(diǎn)云等標(biāo)注技術(shù),有效提升無人機(jī)數(shù)據(jù)標(biāo)注的準(zhǔn)確性、一致性與可用性,目前已用于近20個(gè)低空經(jīng)濟(jì)場(chǎng)景,年均標(biāo)注數(shù)據(jù)近1萬條,標(biāo)注效率提升90%,成本下降60%,有效推動(dòng)低空數(shù)據(jù)產(chǎn)業(yè)高質(zhì)量發(fā)展。
針對(duì)礦山行業(yè)數(shù)據(jù)標(biāo)注標(biāo)準(zhǔn)缺失、多模態(tài)數(shù)據(jù)標(biāo)注成本高、海量數(shù)據(jù)價(jià)值釋放困難等困境,通過構(gòu)建礦山行業(yè)知識(shí)標(biāo)簽體系、多模態(tài)數(shù)據(jù)生成算法與合規(guī)校驗(yàn)?zāi)P偷龋瑢?shí)現(xiàn)標(biāo)注效率提升30%,跨模態(tài)語義一致性提升20%,高質(zhì)量數(shù)據(jù)復(fù)用率提升50%,將行業(yè)人工智能應(yīng)用研發(fā)周期由3個(gè)月縮短至3周,賦能礦山行業(yè)實(shí)現(xiàn)高質(zhì)量發(fā)展。
通過對(duì)各級(jí)各類訴求渠道數(shù)據(jù)的歸口化管理,引入“數(shù)據(jù)清洗車間”“因果森林”等技術(shù),解決傳統(tǒng)數(shù)據(jù)標(biāo)注效率低、精準(zhǔn)性差等問題。打造人機(jī)協(xié)同的訓(xùn)練體系,日均處理數(shù)據(jù)6萬余條,標(biāo)注準(zhǔn)確率達(dá)90%以上,人力成本降低30%,提升了基層治理的效率。
智能數(shù)據(jù)標(biāo)注成為產(chǎn)業(yè)發(fā)展未來方向
人工智能作為新一輪科技革命和產(chǎn)業(yè)革命的核心驅(qū)動(dòng)力,具有強(qiáng)大的“頭雁”效應(yīng),而高質(zhì)量的數(shù)據(jù)集是人工智能發(fā)展的基石,數(shù)據(jù)標(biāo)注則是構(gòu)建高質(zhì)量數(shù)據(jù)集的關(guān)鍵環(huán)節(jié)。
近年來,隨著人工智能技術(shù)的飛速發(fā)展,數(shù)據(jù)標(biāo)注的需求也在不斷增長,從圖像到文本,從語音到視頻,數(shù)據(jù)標(biāo)注的類型和任務(wù)劃分日益多樣化,對(duì)數(shù)據(jù)標(biāo)注的質(zhì)量和規(guī)模的要求也不斷提升。與此同時(shí),數(shù)據(jù)存量小產(chǎn)量低、數(shù)據(jù)集質(zhì)量良莠不齊、缺乏主流高價(jià)值數(shù)據(jù)引領(lǐng)、數(shù)據(jù)利用效率低等問題仍然存在。
日前,由清華大學(xué)數(shù)字政府與治理研究院聯(lián)合江蘇省數(shù)字化協(xié)會(huì)發(fā)布的《智能數(shù)據(jù)標(biāo)注產(chǎn)業(yè)發(fā)展觀察報(bào)告》(以下簡稱“報(bào)告”)指出,數(shù)據(jù)標(biāo)注產(chǎn)業(yè)涵蓋了從數(shù)據(jù)采集、標(biāo)注到應(yīng)用的全過程,數(shù)據(jù)標(biāo)注是人工智能模型訓(xùn)練的基礎(chǔ),數(shù)據(jù)標(biāo)注產(chǎn)業(yè)不僅關(guān)乎人工智能技術(shù)的進(jìn)步,更對(duì)數(shù)字經(jīng)濟(jì)、產(chǎn)業(yè)升級(jí)乃至社會(huì)生活的智能化轉(zhuǎn)型具有深遠(yuǎn)意義。
數(shù)據(jù)標(biāo)注產(chǎn)業(yè)通過標(biāo)準(zhǔn)化的數(shù)據(jù)處理流程,將原始數(shù)據(jù)轉(zhuǎn)換為可供機(jī)器學(xué)習(xí)的高質(zhì)量訓(xùn)練數(shù)據(jù),其核心參與者包括數(shù)據(jù)標(biāo)注企業(yè)、專業(yè)技術(shù)團(tuán)隊(duì)以及經(jīng)過系統(tǒng)培訓(xùn)的標(biāo)注人員,而人工智能技術(shù)的快速發(fā)展,讓數(shù)據(jù)標(biāo)注產(chǎn)業(yè)逐步從勞動(dòng)密集型向技術(shù)密集型轉(zhuǎn)型,人工標(biāo)注與人工智能標(biāo)注正在深度融合。
報(bào)告指出,隨著人工智能技術(shù)的不斷發(fā)展,智能標(biāo)注將成為未來數(shù)據(jù)標(biāo)注產(chǎn)業(yè)的重要發(fā)展方向。它不僅能夠滿足大模型數(shù)據(jù)標(biāo)注的需求,還能為復(fù)雜的人工智能模型提供高質(zhì)量的數(shù)據(jù)支持,推動(dòng)人工智能技術(shù)在各個(gè)領(lǐng)域的廣泛應(yīng)用和深度發(fā)展。
關(guān)鍵詞:
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作媒體供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。
科技互聯(lián)網(wǎng)排行榜
-
2019-03-11 12:01
-
2019-03-05 11:48
-
2019-03-05 11:48
-
2019-03-05 11:42
-
2019-03-05 11:42
科技互聯(lián)網(wǎng)熱門推薦
-
2019-03-11 12:01
-
2019-03-05 11:48
-
2019-03-05 11:48
-
2019-03-05 11:42
-
2019-03-05 11:42