ag百家乐怎样杀猪 文件精读:建立基于机器学习的HCC早期会诊展望模子

*仅供医学专科东谈主士阅读参考ag百家乐怎样杀猪

eHCC-pred模子将HCC早期会诊的准确率从78.15%提高至97%。

肝细胞癌(HCC)的会诊时时依赖于影像学查抄或组织活检。尽管大大皆HCC病例在影像学上具有特异性发达,但仍有约10%的(在直径为1-2cm的肿瘤中,这一比例可高达30%)浮泛典型的影像学特征[1]。在临床上怀疑HCC但影像学特征不典型的情况下,不应推迟进行活检或安排复查。若复查效果仍然不解确,则应进行活检[2]。然则,活检样本若收罗位置不精准,可能导致误诊(即假阴性效果)。关于从非肿瘤(如肝硬化或普通)组织中收罗到的HCC活检样本,小活检样本的会诊假阴性率约莫在30%-50%[3,4]。因此,建立新的分子标记物关于早期HCC的会诊尤为要津,畸形是在活检样本位置可能存在偏差的情况下。

近期,一项征询欺骗大样本数据,联接最小冗余最大关联性(mRMR)和最大关联性最大距离(MRMD)两种特征选拔身手,并交融八种基于机器学习的算法,建立出一种用于HCC早期展望的模子(eHCC-pred)。该模子将HCC早期会诊的准确率从78.15%提高至97%,有望在个体化水平上踏实地应用于临床扩充,助力HCC的早期会诊。该模子可于http://www.dulab.com.cn/eHCC-pred/免费获取[5]。医学界肿瘤频谈整理该征询履行如下,以供参考。

征询身手

本项征询选择了来自三个群众数据库(GEO、ICGC和TCGA)的46个数据集,诡计5586个组织样本,其中包含4045个肝细胞癌(HCC)样本、416个未发生HCC的肝硬化(CwoHCC)样本、334个伴有HCC的肝硬化(CwHCC)样本以及791个未发生HCC的普通肝组织(NwHCC)样本。

GEO数据库的44个转录组数据集包含3431个HCC样本、416个CwoHCC样本、334个CwHCC样本和741个NwHCC样本。数据通过Affymetrix、Agilent和Illumina平台检测,Affymetrix芯片数据集经RMA身手科罚,Agilent和Illumina芯片数据集使用预科罚数据。ICGC和TCGA数据集分别包含243个和371个HCC样本,以及50个NwHCC样本。征询还使用了HPA数据库下载的2902个分泌基因数据。

征询效果

▌1.HCC展望模子的推导

本征询的合座分析经过如图1所示。领先,基于988个HCC样本和332个CwoHCC样本的基因抒发谱,分别取得了25,341,086对和20,559,429对踏实的基因对。在这两组基因对中,有5765对基因对在HCC组织和CwoHCC组织之间发达出踏实的逆转关联。接着,通过筛选2902个分泌基因中的基因对,最终取得了242对基因对,这些基因对中的基因i和基因j均为分泌基因。随后,基于包含242个特征(基因对)的新数据集索取了最好特征。

图1. 合座分析经过

表1展示了基于准确率、F1分数符合函数和AUC值对不同展望模子分类性能的比较。表1的效果标明,包括mRMR + KNN、mRMR + SVM、mRMR + LR、mRMR + XGBoost、mRMR + LMT、MRMD + KNN、MRMD + SVM、MRMD + LR和MRMD + LMT在内的九种展望模子,在通盘性能预备上均发达优异,ag百家乐苹果版下载准确率、F1分数和AUC值均达到1。

在这九种展望模子中,mRMR + KNN和mRMR + SVM的基因对数目最少,仅包含11对基因对(表2)。

▌2.HCC展望模子的考证

使用寥寂数据集(包括测试集、GEO数据集、ICGC数据集和TCGA数据集)对各式算法的性能进行了考证。如表3所示,关于3057个HCC样本和84个CwoHCC样本,MRMD + SVM展望模子(包含28对基因对)在寥寂数据连络取得了最高的准确率和F1分数,其准确率、F1分数和AUC值分别为0.9834、0.9915和0.9278。而mRMR + SVM展望模子(包含11对基因对)在寥寂数据连络取得了最高的AUC值0.9384,高于其他展望模子。因此,在后续分析中要点关心这三个展望模子。他们在活检样本和手术样本中的守护考证效果如表4所示。

活检样本

在测试集(29个HCC样本和48个CwoHCC样本)中,mRMR + SVM展望模子和mRMR + KNN展望模子均兑现了1的明锐性和1的特异性,而MRMD + SVM展望模子的明锐性为1,特异性为0.8542。在GEO活检数据连络(GSE121248, GSE47197),mRMR + SVM展望模子正确分类了96.18%的HCC样本,mRMR + KNN展望模子正确分类了66.41%的HCC样本,而MRMD + SVM展望模子对131个HCC样本的分类准确率达到了100%。

手术样本

在测试集(220个HCC样本和36个CwoHCC样本)中,mRMR + SVM展望模子和mRMR + KNN展望模子的明锐性和特异性均为1,而MRMD + SVM展望模子的明锐性为1,特异性为0.8889。

这些效果标明,在使用活检样本时,mRMR + SVM展望模子、mRMR + KNN展望模子和MRMD + SVM展望模子均八成准确分离HCC和CwoHCC。

▌3.与现存展望模子的比较

关于1800个HCC样本,Ao援救团体建立的模子、本征询团队既往建立的模子以及本次建议的mRMR + SVM展望模子和MRMD + SVM展望模子的准确度分别为0.6639、0.7656、0.8428和0.9872。关于1931个HCC样本,Ao身手的准确度为0.6572,本征询团队既往身手的准确度为0.7815,而mRMR + SVM展望模子和MRMD + SVM展望模子的准确度分别提高到0.8503和0.97。上述效果标明,mRMR + SVM展望模子和MRMD + SVM展望模子在与现存展望模子比拟,发达更为优厚。

最终,本征询收效建立了一种基于机器学习的HCC早期会诊展望模子eHCC-pred。该模子集成了两种不同的机器学习展望算法:MRMD + SVM和mRMR + SVM,将HCC早期识别的准确率从78.15%提高至97%,将为临床医师提供了更为精准的器具,以期在HCC的早期阶段就进行有用的侵扰和调理。

精彩资讯等你来

参考文件:

[1]Llovet JM, Kelley RK, Villanueva A, et al. Hepatocellular carcinoma. Nat Rev Dis Primers. 2021 Jan 21;7(1):6. doi: 10.1038/s41572-020-00240-3. Erratum in: Nat Rev Dis Primers. 2024 Feb 12;10(1):10.

[2]Marrero JA, Kulik LM, Sirlin CB, et al. Diagnosis, Staging, and Management of Hepatocellular Carcinoma: 2018 Practice Guidance by the American Association for the Study of Liver Diseases. Hepatology. 2018 Aug;68(2):723-750.

[3]Forner A, Llovet JM, Bruix J. Hepatocellular carcinoma. Lancet. 2012 Mar 31;379(9822):1245-55.

[4]Villanueva A, Minguez B, Forner A, et al. Hepatocellular carcinoma: novel molecular approaches for diagnosis, prognosis, and therapy. Annu Rev Med. 2010;61:317-28.

[5]Zhang ZM, Huang Y, Liu G, et al. Development of machine learning-based predictors for early diagnosis of hepatocellular carcinoma. Sci Rep. 2024 Mar 4;14(1):5274.

审批编号:CN-150407 有用期至:2025-12-18

本材料由阿斯利康提供,仅供医疗卫生专科东谈主士参考