央廣網(wǎng)合肥12月24日消息(記者劉軍 通訊員桂運(yùn)安)記者從中國(guó)科學(xué)技術(shù)大學(xué)獲悉,該校管理學(xué)院教授王學(xué)欽團(tuán)隊(duì)與美國(guó)耶魯大學(xué)公共衛(wèi)生學(xué)院教授張和平合作,針對(duì)線性回歸模型的基準(zhǔn)問題——最優(yōu)子集選取,提出一種新的快速算法,在有限步內(nèi)就能得到穩(wěn)定解。該成果日前發(fā)表于《美國(guó)科學(xué)院院刊》。
發(fā)現(xiàn)事物間的關(guān)系是大部分科學(xué)研究的目的,這在統(tǒng)計(jì)學(xué)中稱之為回歸分析。其中,線性回歸模型由于其簡(jiǎn)潔性和可解釋性,成為最有用的科學(xué)研究工具之一。最優(yōu)子集算法泛指多元回歸分析中自變量選擇時(shí)旨在尋找為數(shù)不多的,根據(jù)指定準(zhǔn)則是“最優(yōu)”回歸模型的計(jì)算方法。盡管線性回歸模型被如此廣泛使用,但其中一個(gè)很基本的問題——如何在一組變量中選擇最優(yōu)的子模型,尚未解決。
當(dāng)前,得益于現(xiàn)代科技的發(fā)展,數(shù)據(jù)的收集越來(lái)越便利,在典型的生物醫(yī)學(xué)研究中會(huì)收集到上百個(gè)變量,常規(guī)的全基因組研究中則涉及到成千上萬(wàn)甚至是百萬(wàn)級(jí)別的遺傳變異。然而,現(xiàn)有的算法難以在上萬(wàn)級(jí)別的實(shí)際問題中尋找到最優(yōu)子集。
為了解決這個(gè)問題,王學(xué)欽團(tuán)隊(duì)利用排序和剪接的思想,結(jié)合一個(gè)新的信息準(zhǔn)則發(fā)展出一種新的算法,使得算法在有限步內(nèi)就能得到穩(wěn)定解。同時(shí),他們證明了在一定條件下,依大概率,該算法具有多項(xiàng)式的時(shí)間復(fù)雜度,而且能夠選出最優(yōu)子集。




