首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|芯片|物聯(lián)網(wǎng)|量子|低空經(jīng)濟|智能汽車|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|大數(shù)據(jù)|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 大數(shù)據(jù) >> 正文

高質(zhì)量數(shù)據(jù)集驅(qū)動AI模型突破與創(chuàng)新

2025年6月12日 14:36  通信信息報  作 者:葉菁

高質(zhì)量數(shù)據(jù)集,簡而言之,就是那些具有高價值、高密度且標(biāo)準(zhǔn)化的數(shù)據(jù)。在人工智能領(lǐng)域,它扮演著至關(guān)重要的角色。北京公開征集行業(yè)高質(zhì)量數(shù)據(jù)集需求和建設(shè)成果的通知;國務(wù)院國資委發(fā)布了首批包含10余個行業(yè)30項的央企人工智能高質(zhì)量數(shù)據(jù)集建設(shè)成果。隨著大模型技術(shù)的迅猛發(fā)展,數(shù)據(jù)集作為人工智能核心三要素之一,在算法趨同、算力普惠的競爭環(huán)境中正在構(gòu)建難以復(fù)制的差異化壁壘。

高質(zhì)量數(shù)據(jù)是AI應(yīng)用可靠性的保障

數(shù)據(jù)集的質(zhì)量直接影響著人工智能的“智商”。

政策層面的舉措充分體現(xiàn)了高質(zhì)量數(shù)據(jù)的重要性。國家數(shù)據(jù)局等17部門已聯(lián)合印發(fā)《數(shù)據(jù)要素×三年行動計劃(2024—2026年)》,鼓勵科研機構(gòu)和龍頭企業(yè)共同打造行業(yè)共性數(shù)據(jù)資源庫。

而在第八屆數(shù)字中國建設(shè)峰會上,國務(wù)院國資委更是發(fā)布了首批涵蓋多個行業(yè)的高質(zhì)量數(shù)據(jù)集,為人工智能產(chǎn)業(yè)注入了新的活力。這不僅展示了央企在人工智能領(lǐng)域的積極探索和實踐,更體現(xiàn)了高質(zhì)量數(shù)據(jù)集對于推動行業(yè)發(fā)展的關(guān)鍵作用。這些高質(zhì)量數(shù)據(jù)集為AI模型在相關(guān)行業(yè)的應(yīng)用提供了堅實的基礎(chǔ),使得AI模型能夠更準(zhǔn)確地理解和處理復(fù)雜的業(yè)務(wù)場景,從而保障了AI應(yīng)用在實際生產(chǎn)中的可靠性。

高質(zhì)量數(shù)據(jù)集建設(shè)正處于探索階段

《全國數(shù)據(jù)資源調(diào)查報告(2024年)》預(yù)測,2025年全國數(shù)據(jù)生產(chǎn)總量將突破50ZB。當(dāng)前,高質(zhì)量數(shù)據(jù)集主要面臨目標(biāo)定位模糊化、實施路徑碎片化與技術(shù)底座薄弱三重挑戰(zhàn)。

許多企業(yè)和機構(gòu)在建設(shè)高質(zhì)量數(shù)據(jù)集時,缺乏明確的目標(biāo)和定位。這導(dǎo)致在數(shù)據(jù)采集過程中出現(xiàn)盲目性,收集了大量無關(guān)或低質(zhì)量數(shù)據(jù)。

高質(zhì)量數(shù)據(jù)集建設(shè)涉及多個環(huán)節(jié),包括數(shù)據(jù)采集、清洗、標(biāo)注等。目前,這些環(huán)節(jié)之間缺乏有效的協(xié)同和整合,導(dǎo)致實施路徑碎片化。

高質(zhì)量數(shù)據(jù)集建設(shè)需要先進的技術(shù)支持,如數(shù)據(jù)存儲、處理和分析技術(shù)等。然而,一些企業(yè)和機構(gòu)的技術(shù)底座相對薄弱,無法滿足大規(guī)模、高復(fù)雜度數(shù)據(jù)處理的需求。

系統(tǒng)推進高質(zhì)量數(shù)據(jù)集建設(shè)

國家數(shù)據(jù)局副局長夏冰強調(diào),數(shù)據(jù)集的質(zhì)量和效率提升對于人工智能賦能實體經(jīng)濟的推動作用不容忽視。因此,需要從多個維度系統(tǒng)推進高質(zhì)量數(shù)據(jù)集建設(shè)工作。

首先,產(chǎn)業(yè)合作是推進高質(zhì)量數(shù)據(jù)集建設(shè)的重要途徑。不同企業(yè)和機構(gòu)在數(shù)據(jù)資源、技術(shù)能力和專業(yè)知識等方面存在差異。通過合作,他們可以共享數(shù)據(jù)資源,整合各方優(yōu)勢,共同打造高質(zhì)量數(shù)據(jù)集。

其次,數(shù)據(jù)標(biāo)注是高質(zhì)量數(shù)據(jù)集建設(shè)的關(guān)鍵環(huán)節(jié)。數(shù)據(jù)標(biāo)注的質(zhì)量直接影響到AI模型的學(xué)習(xí)效果。建立專業(yè)的數(shù)據(jù)標(biāo)注基地,能夠提供標(biāo)準(zhǔn)化、規(guī)范化的數(shù)據(jù)標(biāo)注服務(wù)。

最后,建設(shè)數(shù)據(jù)平臺是整合數(shù)據(jù)資源、提高數(shù)據(jù)管理效率的重要手段。數(shù)據(jù)平臺可以將各個部門和系統(tǒng)中的數(shù)據(jù)進行整合和集中存儲,采用先進的存儲技術(shù)和安全機制,保證數(shù)據(jù)的安全性和可靠性。

編 輯:章芳
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦新聞              
 
人物
韋樂平:大模型時代將開啟新一波“光進銅退”
精彩視頻
探訪中國移動低空經(jīng)濟 “移起向新 迎空而上”媒體行
飛象趣談第二十八期!織網(wǎng)六載,智聯(lián)萬物,中國5G牌照發(fā)放六周年
英雄灣的“智”變,探訪AI應(yīng)用標(biāo)桿示范村
卡奧斯馮興智:AI賦能工業(yè)互聯(lián)網(wǎng),重塑全球智造新生態(tài)
精彩專題
2025工業(yè)互聯(lián)網(wǎng)大會
2025世界電信和信息社會日大會
第八屆數(shù)字中國建設(shè)峰會
通信產(chǎn)業(yè)2024年業(yè)績盤點
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像