亚洲狼友综合在线导航|国产在线拍揄自揄拍无码男男|跪求一个免费的黄色在线网址|国产r级片在线观看完整版视频|国产欧美亚洲日本视频|视频成人一二区啊轻点插|免费观看!毛片久热久|欧美成人高清导航|无码高清色情97视频在线|精品黄色成人网站在线观看

華為云語音語義創(chuàng)新Lab獲得國際權(quán)威WSDM Cup大賽金牌

近日,在美國休斯敦閉幕的第13屆網(wǎng)絡搜索與數(shù)據(jù)挖掘國際會議(WSDM 2020)上,華為云語音語義創(chuàng)新Lab帶領四所高校學生組成的聯(lián)合團隊摘得WSDM Cup大賽2020“論文引用意圖識別任務”金牌。

WSDM被譽為全球信息檢索領域最有影響力也最權(quán)威的會議之一,會議關(guān)注社交網(wǎng)絡上的搜索與數(shù)據(jù)挖掘,尤其關(guān)注搜索與數(shù)據(jù)挖掘模型、算法設計與分析、產(chǎn)業(yè)應用和提升準確性與效果的實驗分析。今年已經(jīng)是WSDM的第十三屆會議。


3.jpg


本次WSDM Cup共有三個賽題任務,華為云奪金賽題的出題方是微軟研究院,賽題內(nèi)容為“論文引用意圖識別”,即將網(wǎng)絡搜索和數(shù)據(jù)挖掘技術(shù)用于區(qū)分多余引文和引用真實性識別。比賽提供一個論文庫(約含80萬篇論文),同時提供對被引用論文的引用文本段落,來自論文中對同類研究的介紹。參賽選手需要根據(jù)論文引用描述從論文庫中匹配三篇最相關(guān)的論文。

論文是人類最前沿知識的媒介,因此如果可以理解論文中的數(shù)據(jù),可以極大地擴充計算機理解知識的能力和范圍。在論文中,作者經(jīng)常會引用其他論文,并對被引論文做出對應描述。如果我們可以自動地理解、識別描述對應的被引論文,不僅可以加深對科研脈絡的理解,還能在科研知識圖譜、科研自動問答系統(tǒng)和自動摘要系統(tǒng)等領域有所進步。

華為云語音語義創(chuàng)新Lab憑借在自然語言處理領域深厚的技術(shù)積累,帶領華南理工大學、華中科技大學、武漢大學、江南大學4名學生組成的聯(lián)合團隊,針對該問題制定了“整體召回+重排+集成”的方案。在整體召回階段,通過輕量化的文本相似度計算方法(如BM25、TFIDF、Word2Vec等),以較少的計算代價從大規(guī)模論文庫中檢索出給定查詢的可能相關(guān)的論文集合。在重排階段,通過計算量大但更準確的方法對這些候選論文中的每一篇論文計算和引用描述的相似度值并重新排序,例如采用基于深度學習的預訓練語言模型BERT等。華為云團隊觀察到所給語料都是生物醫(yī)學領域,因此采用了基于生物醫(yī)藥和科學領域語料進行預訓練的BioBERT和SciBERT語言模型對論文進行重排。最后,通過對所有模型的結(jié)果進行集成,得到最終的Top 3最相關(guān)的論文。

目前,華為云語音語義相關(guān)服務已經(jīng)成功應用于政務、金融、油氣、醫(yī)療、汽車、物流、保險、電商、稅務、媒體等具有語音識別、語言理解、知識管理等需求的業(yè)務領域。


隨時獲取華為云AI最新動態(tài),歡迎關(guān)注華為云AI公眾號:

B8483785-C43D-4374-9026-618F8EBE3597.png