來(lái)源:科技新聞
阿里巴巴的研究團(tuán)隊(duì)在全球在線舉辦的人工智能峰會(huì)SIGIR 2020上取得了優(yōu)異的成績(jī)。共有29項(xiàng)研究成果入選。據(jù)悉,阿里在多項(xiàng)成果中展示了AI在理解文本信息任務(wù)上的突破。
SIGIR是信息檢索研究領(lǐng)域最權(quán)威的學(xué)術(shù)會(huì)議,涵蓋文本分析、計(jì)算、機(jī)器學(xué)習(xí)和推薦系統(tǒng)等領(lǐng)域。微軟、谷歌、臉書等頂尖科技公司都在本次大會(huì)上公布了研究成果。據(jù)報(bào)道,SIGIR 2020收到了1180篇論文,但最終只有340篇入選。
與眾所周知的語(yǔ)音識(shí)別和圖像識(shí)別相比,理解復(fù)雜的文本信息是人工智能更困難的任務(wù)。此次,阿里巴巴研究團(tuán)隊(duì)在SIGIR 2020上率先提出了多種創(chuàng)新思路,可以大大提高機(jī)器理解文本信息的效率。
阿里的29篇論文入選人工智能峰會(huì)SIGIR 2020。
在其中一篇論文中,阿里提出了一種理解文本隱含意義的方法,通過(guò)對(duì)給定晦澀文本的全局語(yǔ)義、局部語(yǔ)義以及可能存在的噪音進(jìn)行推敲,有效地提高了模型識(shí)別晦澀文本是否包含色情、暴力等內(nèi)容的準(zhǔn)確率。
理工學(xué)院機(jī)器智能實(shí)驗(yàn)室主任金榮說(shuō):“信息檢索和自然語(yǔ)言處理技術(shù)是人工智能的基礎(chǔ)技術(shù)。要實(shí)現(xiàn)突破,不僅需要全新的模型,還需要更具創(chuàng)新性的結(jié)合實(shí)際應(yīng)用的訓(xùn)練和推理方法。阿里巴巴豐富的經(jīng)濟(jì)場(chǎng)景為自然語(yǔ)言處理等技術(shù)的研究提供了絕佳的條件。
近兩年來(lái),阿里在信息檢索CIKM杯、機(jī)器翻譯WMT、閱讀理解MS MARCO等頂級(jí)自然語(yǔ)言處理比賽中多次獲得世界冠軍。不僅如此,阿里還在情感識(shí)別等前沿領(lǐng)域處于領(lǐng)先地位,可以讓機(jī)器讀取人類的情感。目前,阿里自然語(yǔ)言技術(shù)已服務(wù)金融、新零售、通信、互聯(lián)網(wǎng)、醫(yī)療、電力等領(lǐng)域超十億用戶。