本網(wǎng)訊 近日,中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)推薦的A類(lèi)國(guó)際學(xué)術(shù)會(huì)議SIGKDD 2024論文接收結(jié)果公布。信息與人工智能學(xué)院辜麗川教授團(tuán)隊(duì)論文“Practical Single Domain Generalization via Training-time and Test-time Learning”被錄用。國(guó)際知識(shí)發(fā)現(xiàn)與數(shù)據(jù)挖掘大會(huì) (ACM SIGKDD Conference on Knowledge Discovery and Data Mining,簡(jiǎn)稱(chēng)KDD) 是數(shù)據(jù)挖掘領(lǐng)域的頂級(jí)會(huì)議,在國(guó)際上認(rèn)可度極高,KDD 2024的Research Track錄用率為20%,該論文錄用也是我校在CCF推薦A類(lèi)國(guó)際學(xué)術(shù)會(huì)議零的突破。

單源領(lǐng)域泛化的目標(biāo)是僅利用單個(gè)源領(lǐng)域中的數(shù)據(jù)構(gòu)建一個(gè)具有高泛化能力的預(yù)測(cè)模型, 其可以很好地泛化到未見(jiàn)過(guò)的目標(biāo)領(lǐng)域。現(xiàn)有的方法聚焦于在訓(xùn)練階段對(duì)模型進(jìn)行優(yōu)化,導(dǎo)致模型難以部署到域偏移較大的目標(biāo)領(lǐng)域上。針對(duì)上述問(wèn)題,該論文首次給出了實(shí)用單源領(lǐng)域泛化問(wèn)題設(shè)定,并設(shè)計(jì)了一種簡(jiǎn)單有效的求解方法。具體而言,該方法首先在訓(xùn)練階段利用源域知識(shí)建立具有良好泛化能力的模型,然后在測(cè)試階段利用無(wú)標(biāo)記目標(biāo)領(lǐng)域知識(shí)在線(xiàn)更新模型以適應(yīng)新到來(lái)的目標(biāo)領(lǐng)域數(shù)據(jù)。在訓(xùn)練階段,本論文提出了一個(gè)新的風(fēng)格生成器,其使用雙重仿生變換來(lái)生成風(fēng)格偏移較大的新數(shù)據(jù)。此外,本論文引入風(fēng)格多樣性正則化來(lái)持續(xù)不斷生成新風(fēng)格數(shù)據(jù)以擴(kuò)大訓(xùn)練數(shù)據(jù)的覆蓋范圍,并引入對(duì)象一致性正則化來(lái)捕獲當(dāng)前生成的數(shù)據(jù)與原始數(shù)據(jù)之間的一致性,使模型在訓(xùn)練階段過(guò)濾更多的風(fēng)格信息。在測(cè)試階段,本論文引入了一種樣本感知和銳度感知最小化方法,利用無(wú)標(biāo)記目標(biāo)領(lǐng)域中的知識(shí)尋找一個(gè)熵最小的平坦曲面來(lái)進(jìn)一步優(yōu)化模型。
安徽農(nóng)業(yè)大學(xué)為唯一完成單位,信息與人工智能學(xué)院計(jì)算機(jī)科學(xué)與技術(shù)系特任教授楊帥為第一作者,2022級(jí)計(jì)算機(jī)科學(xué)與技術(shù)專(zhuān)業(yè)研究生張震為第二作者,辜麗川教授為通訊作者。該研究得到了國(guó)家自然科學(xué)青年基金、安徽省自然基金面上項(xiàng)目、安徽省高校協(xié)同創(chuàng)新項(xiàng)目和安徽農(nóng)業(yè)大學(xué)人才啟動(dòng)基金的資助。(文圖/楊帥 編輯/鄧菁菁 預(yù)審/辜麗川 審核/夏曉昀)