星塵數(shù)據(jù)是??華為云ModelArts首家標注平臺合作伙伴??,雙方聯(lián)合開發(fā)的標注訓練一體化方案已應用于多個車企項目,2023年起,星塵數(shù)據(jù)標注平臺通過華為云技術認證,成為其AI開發(fā)平臺的核心數(shù)據(jù)服務伙伴。
A市地鐵是全球領先的城市軌道交通系統(tǒng),也是國際地鐵聯(lián)盟(CoMET)的成員。隨著城市發(fā)展加速,原有系統(tǒng)面臨以下挑戰(zhàn):地鐵調(diào)度指揮中心正在部署智能分析系統(tǒng),通過“感知-分析-決策-執(zhí)行”的數(shù)字化閉環(huán),實現(xiàn)對生產(chǎn)工作的精準控制與高效管理 。
1、 數(shù)據(jù)格式復雜:
數(shù)據(jù)格式復雜,需融合的視頻流(RTSP/RTMP協(xié)議傳輸?shù)腍.264/H.265編碼監(jiān)控視頻)、SCADA實時數(shù)據(jù)(OPC UA接口的電力參數(shù)與設備狀態(tài)時序信號)、工單系統(tǒng)結(jié)構(gòu)化記錄(SQL數(shù)據(jù)庫存儲的維護日志)等數(shù)據(jù),在格式、頻率、維度上存在顯著差異。視頻流包含每秒25幀的4K分辨率圖像(單攝像頭日數(shù)據(jù)量達200GB),需專用解碼器提取行為特征;SCADA數(shù)據(jù)則以毫秒級頻率刷新(如接觸網(wǎng)電壓波動曲線),依賴時間序列分析引擎;工單數(shù)據(jù)涉及自然語言描述(如故障文本報告)與設備編碼對照表,需NLP技術映射實體關系。
更嚴峻的是多源數(shù)據(jù)時空基準不統(tǒng)一,視頻流時間戳與SCADA采樣周期存在300ms級偏差,軌道地理坐標系統(tǒng)與設備拓撲模型需動態(tài)校準。數(shù)據(jù)孤島導致跨系統(tǒng)分析時需開發(fā)定制化適配器(如將視頻流GPS坐標轉(zhuǎn)換為SCADA設備拓撲節(jié)點ID),單項目接口開發(fā)耗時占整體工期40%。某地鐵實測顯示,因視頻分析幀率(30fps)與SCADA數(shù)據(jù)采樣率(10Hz)未對齊,導致大客流預警模型誤報率高達22%。
2、 難例標注困難:
不同場景的“難例”標準不同,完全人工標注需要高成本的工程師。不同業(yè)務場景的標注標準差異顯著且動態(tài)變化,如設備運維需結(jié)合材料學與電氣特征(軌道裂縫檢測精度需達0.2mm級),乘客服務需融合視頻、票務、語音等多模態(tài)數(shù)據(jù),信號控制則依賴跨區(qū)段時序信號關聯(lián)分析。完全依賴人工標注需高薪工程師團隊(年均成本超80萬元/人)投入70%以上工時,且跨領域知識融合困難導致標注效率低下(單場景標注耗時超120小時/萬條)。
更嚴峻的是設備異構(gòu)性(多廠商信號機特征不兼容)迫使標注規(guī)則頻繁重構(gòu),人工標注錯誤率高達8.7%,單次漏標可能引發(fā)500萬元級事故損失。當前AI輔助標注在長尾場景(極端天氣/混合線路)中預標注誤判率仍超18%,形成“高成本、低效率、高風險”三重困局。
1、自主研發(fā)MorningStar垂域模型平臺對齊來自不同數(shù)據(jù)源的時間戳,多模態(tài)數(shù)據(jù)同時處理和標注,覆蓋模型開發(fā)各關鍵環(huán)節(jié),包括數(shù)據(jù)管理、數(shù)據(jù)處理、模型動態(tài)訓練、模型評估、人類反饋、數(shù)據(jù)挖掘等,提升模型迭代效率數(shù)倍。
2、智能標注支持RESTFul API的方式接入自動化標注模型,結(jié)合輔助標注算法對未經(jīng)過標注的數(shù)據(jù)進行自動標注,大幅提升數(shù)據(jù)標注效率。
3、該方案在AI數(shù)據(jù)全行業(yè)深耕的扎實knowhow中孵化誕生,有效幫助客戶解決AI落地中的痛點問題,助力客戶地鐵系統(tǒng)智慧升級,打造AI平臺與大模型融合,實現(xiàn)了城軌云平臺、AI開發(fā)平臺與大模型應用場景的從0到1突破。
據(jù)北京地鐵架構(gòu)圖01.png)
華為云在解決方案中的價值:
1、基于ModelArts一站式AI開發(fā)平臺共同開發(fā)和優(yōu)化算法、統(tǒng)一納管算法、自主開發(fā)算法模型,可節(jié)省模型升級費用約20%。
2、基于大模型更強泛化能力、更高模型優(yōu)化效率、更精準模型識別精度提高模型開發(fā)效率1倍,提高模型精準度5%~20%。
據(jù)北京地鐵架構(gòu)圖02.png)
從難例標注的角度來說,星塵數(shù)據(jù)的MorningStar確實給了我們很多驚喜。難例分析本身是極其依靠經(jīng)驗的,但是星塵數(shù)據(jù)的標注和分析給我們的日常工作提供了大量的指導性意見,確實幫助我們提高了效率。
華為云在數(shù)據(jù)方面我們是放心的,星塵數(shù)據(jù)在AI方面給了我們很多幫助,二者的結(jié)合讓我們無論在安全方面還是在技術方面都很放心,這種合作也是我們作為數(shù)據(jù)工作人員一直所期待的。
1、智能化能力建設
通過華為云,星塵數(shù)據(jù)與A市地鐵數(shù)據(jù)系統(tǒng)實現(xiàn)打通,在保證數(shù)據(jù)安全的情況下搭建智能分析系統(tǒng),完成供電智能管理、設備異常狀況監(jiān)控、乘客異常行為檢測等多個業(yè)務場景的智能化能力建設,系統(tǒng)平均準確率高達97%,響應速度比人工快10倍。
2、標注難例攻克
借助星塵數(shù)據(jù)與華為云的AI數(shù)據(jù)閉環(huán)與數(shù)據(jù)標注平臺MorningStar,實現(xiàn)了難例高準確性的標注,并優(yōu)化了整體流程。數(shù)據(jù)通過SCADA系統(tǒng)采集和顯示,實時監(jiān)測車輛段10kV供電系統(tǒng)運行狀態(tài),及時發(fā)現(xiàn)異常并處理,為運維人員大大減輕了工作量。

