本發(fā)明屬于診斷標(biāo)志物篩選,具體涉及一種診斷標(biāo)志物組合、卵巢子宮內(nèi)膜異位癥預(yù)測(cè)模型的構(gòu)建方法和應(yīng)用。
背景技術(shù):
1、子宮內(nèi)膜異位癥是一種常見(jiàn)的雌激素依賴的慢性炎癥婦科疾病,通常累及卵巢、子宮韌帶、直腸、膀胱等(giudice?lc.clinical?practice.endometriosis.n?engl?j?med2010,362(25):2389-2398.)。其突出臨床表現(xiàn)為慢性盆腔痛、痛經(jīng)、性交困難及不孕,嚴(yán)重影響了女性的工作和日常生活(vercellini?p,vigano?p,somigliana?e,fedelel.endometriosis:pathogenesis?and?treatment.nat?rev?endocrinol?2014,10(5):261-275.)。
2、尤其是異位到卵巢的子宮內(nèi)膜異位癥(ovarian?endometriosis,ove),是卵巢癌發(fā)生的高危因素之一(vercellini?p,vigano?p,somigliana?e,fedele?l.endometriosis:pathogenesis?and?treatment.nat?rev?endocrinol?2014,10(5):261-275.)。因此ove早診斷早治療對(duì)于女性健康生活異常重要。然而盡管ove延遲診斷的普遍性卻不容樂(lè)觀。研究表明ove通常會(huì)延遲8-10年才被發(fā)現(xiàn)(hudelist?g,fritzer?n,thomas?a,niehues?c,oppelt?p,haas?d,tammaa?a,salzer?h.diagnostic?delay?for?endometriosis?inaustria?and?germany:causes?and?possible?consequences.hum?reprod?2012,27(12):3412-3416.)。而延遲診斷不僅直接影響到疾病治療與預(yù)后,還可能增加ove復(fù)發(fā)的風(fēng)險(xiǎn)。因此,ove的診斷對(duì)于疾病治療與提升患者生命質(zhì)量均具有重要意義。目前,可結(jié)合臨床表現(xiàn)、體征及影像學(xué)檢查和生物標(biāo)志物等檢查進(jìn)行ove的臨床診斷(giudice?lc,kaolc.endometriosis.lancet?2004,364(9447):1789-1799.),但ove的臨床表現(xiàn)不典型、婦科檢查以及超聲檢查和磁共振成像(mri)的結(jié)果受醫(yī)師的經(jīng)驗(yàn)及技巧影響極大。此外,目前尚無(wú)一種能準(zhǔn)確診斷ove的生物標(biāo)志物。雖然血清ca125雖與ove存在一定的相關(guān)性,其特異性和敏感性均有限,不是ove的特異性指標(biāo)。該指標(biāo)檢測(cè)對(duì)于ove的診斷意義有限(hirsch?m,duffy?j,davis?cj,nieves?plana?m,khan?ks,international?collaboration?toharmonise?o,measures?for?e.diagnostic?accuracy?of?cancer?antigen?125forendometriosis:a?systematic?review?and?meta-analysis.bjog?2016,123(11):1761-1768.),其水平升高更多見(jiàn)于重度ove、子宮腺肌病者、盆腔存在明顯炎癥以及合并ove囊腫破裂者。臨床診斷對(duì)于ove的早期干預(yù)和治療具有非常重要的意義,而生物標(biāo)志物作為一種不受醫(yī)師經(jīng)驗(yàn)、技巧影響的客觀指標(biāo)(df,flores?i,waelkens?e,d'hooghe?t.noninvasivediagnosis?of?endometriosis:review?of?current?peripheral?blood?and?endometrialbiomarkers.best?pract?res?clin?obstet?gynaecol?2018,50:72-83.),因此急需篩選可輔助提升ove早期無(wú)創(chuàng)診斷的新指標(biāo)。
3、代謝組學(xué)作為近年來(lái)興起的研究領(lǐng)域,通過(guò)全面分析生物體內(nèi)小分子代謝物的變化,為疾病機(jī)制的解析和生物標(biāo)志物的挖掘提供了強(qiáng)有力的工具。該技術(shù)能夠捕捉到生物體在疾病狀態(tài)下代謝途徑的微妙變化,為理解ove提供了新的視角。在此背景下,機(jī)器學(xué)習(xí)技術(shù)的引入為代謝組學(xué)數(shù)據(jù)的深度挖掘提供了可能。特別是lasso方法,作為一種先進(jìn)的特征選擇技術(shù),能夠在高維數(shù)據(jù)中有效篩選出最具預(yù)測(cè)價(jià)值的特征,同時(shí)處理數(shù)據(jù)中的復(fù)共線性問(wèn)題,提高模型的穩(wěn)定性和準(zhǔn)確性。通過(guò)結(jié)合代謝組學(xué)與lasso機(jī)器學(xué)習(xí)算法,本發(fā)明旨在從復(fù)雜的代謝物數(shù)據(jù)中篩選出關(guān)鍵代謝生物標(biāo)志物。
技術(shù)實(shí)現(xiàn)思路
1、發(fā)明目的:本發(fā)明所要解決的技術(shù)問(wèn)題是提供卵巢子宮內(nèi)膜異位癥診斷標(biāo)志物及其篩選方法和應(yīng)用。
2、為了實(shí)現(xiàn)上述目的,本發(fā)明采用以下技術(shù)方案:本發(fā)明提供了一種診斷標(biāo)志物組合,所述標(biāo)志物組合包括n-乙酰-天冬氨酸、乳酸、(r)-3-羥基丁酸、馬尿酸、吲哚-3-乙酰纈氨酸和抗壞血酸。
3、本發(fā)明還提供了所述的診斷標(biāo)志物組合在制備卵巢子宮內(nèi)膜異位癥預(yù)測(cè)和/或診斷產(chǎn)品中的應(yīng)用。
4、本發(fā)明還提供了所述的診斷標(biāo)志物組合在構(gòu)建卵巢子宮內(nèi)膜異位癥預(yù)測(cè)模型中的應(yīng)用。
5、本發(fā)明還提供了一種卵巢子宮內(nèi)膜異位癥預(yù)測(cè)模型的構(gòu)建方法,包括如下步驟:
6、1)通過(guò)非靶代謝組學(xué)篩選比對(duì)卵巢子宮內(nèi)膜異位癥患者和正常健康女性的血清數(shù)據(jù)比對(duì),通過(guò)auc>0.7的基礎(chǔ)篩選出差異顯著的代謝物;
7、2)進(jìn)一步對(duì)差異顯著的代謝物進(jìn)行權(quán)重基因共表達(dá)網(wǎng)絡(luò)分析,根據(jù)代謝物的不同表達(dá)模式將差異顯著的代謝物分別與ove臨床特征進(jìn)行相關(guān)聯(lián),篩選與ove臨床特征顯著相關(guān)的參數(shù);
8、3)將auc>0.7和wgcna中的black?model取交集,進(jìn)一步確定特異性差異的代謝物;
9、4)擴(kuò)大樣本量進(jìn)行靶向代謝組學(xué)驗(yàn)證,并進(jìn)一步通過(guò)多種機(jī)器學(xué)習(xí)方法驗(yàn)證特異性差異的代謝物,進(jìn)一步通過(guò)lasso降維,最終篩選得到卵巢子宮內(nèi)膜異位癥預(yù)測(cè)的特征參數(shù)并構(gòu)建預(yù)測(cè)模型;
10、所述預(yù)測(cè)模型的計(jì)算公式為:
11、
12、其中,n=卵巢子宮內(nèi)膜異位癥預(yù)測(cè)的特征參數(shù)的數(shù)量,expi表示卵巢子宮內(nèi)膜異位癥預(yù)測(cè)的特征參數(shù)的表達(dá)值,βi表示卵巢子宮內(nèi)膜異位癥預(yù)測(cè)的特征參數(shù)的回歸系數(shù)。
13、其中,步驟2)中的與ove臨床特征顯著相關(guān)的參數(shù)包括痛經(jīng)和ca125。
14、其中,步驟3)中特異性差異的代謝物包括沒(méi)食子酸、n-乙酰-天門冬氨酸、天冬氨酸、丙氨酸、乳酸、異嗪皮啶、精氨酸、n-乙酰-dl-色氨酸、(r)-3-羥基丁酸、奎寧酸、馬尿酸、4-甲基傘形基硫酸鉀鹽、鞣花酸、秦皮素、厚樸酚、麥斯明、β-肌酐、吲哚-3-乙酰纈氨酸、抗壞血酸、褪黑素以及癸二酸。
15、其中,步驟4)中的多種機(jī)器學(xué)習(xí)方法包括卷積神經(jīng)網(wǎng)絡(luò)、樸素貝葉斯算法、隨機(jī)森林算法、支持向量機(jī)算法和lasso-logit回歸法中的一種或幾種。
16、其中,步驟4)中的卵巢子宮內(nèi)膜異位癥預(yù)測(cè)的特征參數(shù)包括n-乙酰-天冬氨酸、乳酸、(r)-3-羥基丁酸、馬尿酸、吲哚-3-乙酰纈氨酸、抗壞血酸、2個(gè)臨床指標(biāo)痛經(jīng)和ca125。
17、其中,步驟4)中的預(yù)測(cè)模型的公式為:total?score=22.471×n-乙酰-天冬氨酸+0.011×乳酸+0.008×(r)-3-羥基丁酸-0.333×馬尿酸+0.204×吲哚-3-乙酰纈氨酸-0.685×抗壞血酸+13.601×痛經(jīng)+17.728×ca125+141.159,total?score的閾值為170.17,當(dāng)個(gè)體患者評(píng)分中高于170.17被定義為患o(jì)ve的高風(fēng)險(xiǎn)人群,低于170.17被定義為患o(jì)ve的低風(fēng)險(xiǎn)人群。
18、本發(fā)明還提供了一種預(yù)測(cè)ove風(fēng)險(xiǎn)的診斷標(biāo)志物試劑盒,其含有所述的診斷標(biāo)志物組合。
19、本發(fā)明通過(guò)前期對(duì)ove隊(duì)列中34例ove和34例正常健康女性的血清使用高效液相色譜質(zhì)譜聯(lián)用技術(shù)行非靶代謝組學(xué)篩選,經(jīng)過(guò)數(shù)據(jù)庫(kù)比對(duì),總共篩選出56個(gè)差異顯著的代謝物,進(jìn)一步通過(guò)auc>0.7的基礎(chǔ)上,再輔助wgcna篩選,最后選出21個(gè)代謝物;擴(kuò)大樣本(107例ove和130例hc)進(jìn)行靶向代謝組學(xué),進(jìn)一步通過(guò)5種機(jī)器學(xué)習(xí)方法顯示,這21個(gè)代謝物在hc和ove中差異明顯,進(jìn)一步通過(guò)lasso降維,共篩選到6個(gè)代謝物(n-乙酰-天冬氨酸、乳酸、(r)-3-羥基丁酸、馬尿酸、吲哚-3-乙酰纈氨酸和抗壞血酸)和2個(gè)臨床指標(biāo)(痛經(jīng)和ca125)組成的預(yù)測(cè)模型。
20、有益效果:與現(xiàn)有技術(shù)相比,本發(fā)明具備以下優(yōu)點(diǎn):本發(fā)明采用血清代謝組學(xué)技術(shù)以及人工智能數(shù)據(jù)分析技術(shù)構(gòu)建ove患者發(fā)生風(fēng)險(xiǎn)的預(yù)測(cè)模型,本發(fā)明診斷標(biāo)志物篩選方法可操作性強(qiáng),模型構(gòu)建方法簡(jiǎn)單,所得診斷模型效果良好,僅通過(guò)取血就能進(jìn)行診斷,方便快捷無(wú)內(nèi)創(chuàng),對(duì)于預(yù)測(cè)ove發(fā)生風(fēng)險(xiǎn)靈敏度高、特異性好,具有很好的臨床應(yīng)用價(jià)值。本發(fā)明還提供了一種含有上述適合于預(yù)測(cè)ove風(fēng)險(xiǎn)的診斷標(biāo)志物試劑盒,可用于預(yù)測(cè)ove發(fā)生的風(fēng)險(xiǎn)。