• <ul id="smc4e"></ul>
  • <ul id="smc4e"><sup id="smc4e"></sup></ul>
    <ul id="smc4e"><sup id="smc4e"></sup></ul>
    <ul id="smc4e"></ul>
  • <ul id="smc4e"></ul>
  • <abbr id="smc4e"></abbr>
  • <strike id="smc4e"></strike>
  • 人民網
    人民網>>四川頻道

    探訪自貢市人工智能數據標注基地

    一棟空樓 這樣吸引產業頭部項目

    2025年04月07日07:56 | 來源:四川日報
    小字號

    原標題:一棟空樓 這樣吸引產業頭部項目

    百度阿波羅智行(西南)人工智能基礎數據產業基地。

    騰訊云(自貢)數字經濟產業基地。

      4月2日,自貢市大安區釜溪河畔,一棟7層高的大樓里,1800多名被稱為“AI飼養員”的數據標注員正對著電腦屏幕操作,將圖片、文本、視頻等數據標注為滿足人工智能訓練要求的可讀數據編碼,為全國車道級導航、無人駕駛等人工智能應用提供“原料”。

      這棟大樓是自貢市展覽中心1號綜合樓,也是自貢市人工智能數據標注基地所在地。靠著給全國人工智能“投喂”標注數據,這棟大樓在2024年創造出超億元的產值。但在兩年前,這里還是一棟空樓。

      轉折點發生在2023年7月——隨著百度阿波羅智行(西南)人工智能基礎數據產業基地(簡稱百度自貢基地)在這棟大樓投運,自貢市數據標注產業發展駛入快車道。

      兩年時間里,瞄準數據標注這個“小切口”,這棟大樓逐漸集合了百度阿波羅、騰訊云、火山引擎等頭部數據標注項目。一棟空樓,已成長為一棟“億元樓”。

      從一棟空樓到“億元樓”

      自貢數據標注產業,用36天實現“從無到有”

      數據標注是對數據進行添加標記、說明、解釋、分類和編碼的過程,是提升人工智能算法、模型核心能力的關鍵環節。

      “這棟樓就是起點,它見證了自貢數據標注產業從無到有的發展。”百度自貢基地負責人唐玉蘭回憶。2023年6月18日,自貢市政府與北京百度網訊科技有限公司簽署戰略合作協議,百度阿波羅正式宣布入駐自貢;7月24日,百度自貢基地建成投運。自貢數據標注產業的這場巨變,發生在36天內,“此前百度從未有一個基地項目能這么快投運。”

      同年12月26日——百度地圖高精車道級導航在自貢上線,這也是百度自貢基地投運后出品的首個“自貢造”數字產線車道級導航產品。

      “有求必應,一事一議。”聊起百度自貢基地項目的快節奏推進,唐玉蘭用這兩個詞形容對自貢的印象。

      “項目落地后,當地政府迅速帶領工商、稅務、銀行等部門來到基地,為我們一次性集中辦理了四川連貢、卓越際聯等10家鏈屬企業注冊。”唐玉蘭透露,針對基地員工通勤難題,自貢還協調定制公交接送基地員工上下班。

      一花引來百花開。百度自貢基地投運后不久,2023年底,四川百嘉數字科技有限公司聯合自貢市政府、騰訊云共建騰訊云(自貢)數字經濟產業基地(簡稱騰訊云自貢基地)。而騰訊云自貢基地的選址,就在百度自貢基地樓下。

      同一棟大樓里,百度、騰訊這兩家數據標注龍頭企業成為樓上樓下的“鄰居”。龍頭企業抱團取暖、聚火成炬,這棟大樓正吸引著更多數據標注項目和企業入駐。

      大安區科技和經濟信息化局相關負責人介紹,隨著百度阿波羅、騰訊云、火山引擎等頭部項目落地,自貢市人工智能數據標注基地已經匯聚大連極艾特、杭州卓越際聯、長沙譜藍等36家數據標注企業,其中3家企業實現“升規入統”,實現自貢市規模以上互聯網信息服務行業企業“零的突破”。

      自貢的這棟“億元樓”,已經成為當地數據標注產業的一張名片。

      從一棟樓到一座園

      “億元樓”旁將添新伙伴,同時提升專業化、智能化及科技創新水平

      找到3D點云圖像中的汽車、行人、交通標志,拉框、打標……3月28日,騰訊自貢基地內,20歲的數據標注員明惠玲正坐在電腦前,完成針對無人駕駛業務的數據標注工作。

      “前面有多少智能,后面就有多少人工”,這雖是一句調侃,但也道出數據標注仍是勞動密集型產業的現狀。過去兩年時間里,招人,一直是自貢數據標注產業的主要任務。

      自貢背靠四川輕化工大學等高校資源、占據毗鄰成都都市圈等地理優勢,在這里當一名數據標注員,成為當地越來越多年輕人的就業選擇。如今,自貢市人工智能數據標注基地內的員工,幾乎都是和明惠玲一樣的年輕人,其中百度自貢基地員工平均年齡不過23歲。

      但數據標注產業的人才需求正在改變。“數據標注產業正加速由勞動密集型向知識密集型轉型。”唐玉蘭向記者分享了一組數據:目前,百度自貢基地95%的數據標注工作已經由機器完成。

      同一棟大樓里,百嘉數科副總經理譚建也有類似的感受。“以無人駕駛領域為例,傳統2D、3D數據標注的需求正逐漸下降,而端側多模態多維數據標注的需求則在急劇增長。”其中,多模態標注規則的復雜程度成倍增長,對數據標注的工具提出更高要求。

      為此,百嘉數科與電子科技大學、四川輕化工大學在2024年10月聯合申報立項了“基于深度學習的多模態數據自適應標注平臺研發”項目,旨在實現多模態數據的自動化標注。“平臺預計今年底發布,投用后將顯著提升騰訊自貢基地數據標注的智能化水平,大幅度提高標注的效率和準確率。”譚建介紹。

      與此同時,隨著智慧醫療、金融科技等應用普及,醫學影像、金融文本等數據標注需求也與日俱增。去年底,騰訊自貢基地導入AI大模型訓練業務,對醫療、金融、法律等專業數據標注人才需求激增。“我們基地未來計劃招聘約200名具備相關專業知識的員工。”譚建說。

      提升數據標注產業的專業化、智能化及科技創新能力水平,正成為這棟“億元樓”發展的最新主線。

      和主線任務一同推進的,還有另外一個計劃。與“億元樓”一街之隔,一棟新大樓正在修建。“這將是我們基地的新家。”譚建指著新樓告訴記者。“2026年,預計騰訊自貢基地的員工人數將達到1500人。”

      譚建提到的這棟新大樓,預計今年底將建成投用。屆時,“億元樓”身旁將迎來新伙伴。自貢市人工智能數據標注基地,也正由一棟樓向著一座園的形態進化。

    □四川日報全媒體記者 尹夢奇 行曉藝/文 李志強/圖

    (責編:袁菡苓、羅昱)

    分享讓更多人看到

    返回頂部