1 / 6
文档名称:

基于OPLS?DA和人工神经网络算法研究血细胞参数在乳腺癌诊断中的价值.pdf

格式:pdf   大小:2,811KB   页数:6页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于OPLS?DA和人工神经网络算法研究血细胞参数在乳腺癌诊断中的价值.pdf

上传人:抱琴 2023/3/19 文件大小:2.75 MB

下载得到文件列表

基于OPLS?DA和人工神经网络算法研究血细胞参数在乳腺癌诊断中的价值.pdf

文档介绍

文档介绍:该【基于OPLS?DA和人工神经网络算法研究血细胞参数在乳腺癌诊断中的价值 】是由【抱琴】上传分享,文档一共【6】页,该文档可以免费在线阅读,需要了解更多关于【基于OPLS?DA和人工神经网络算法研究血细胞参数在乳腺癌诊断中的价值 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。
实用医学杂志年第卷第期
·专题报道:乳腺癌·
OPLS⁃DA
基于和人工神经网络算法研究血细胞参数
在乳腺癌诊断中的价值
朱小飞钱世宁曹慧玲吴玲
210029
南京中医药大学附属医院医学检验科(南京)
OPLS⁃DA
【摘要】目的运用和人工神经网络算法发掘和研究血细胞参数对乳腺癌的诊断价值。
OPLS⁃DA
方法收集乳腺癌患者和健康女性的血细胞参数,通过发掘两者之间的主要差异血细胞参数;
ROC
通过法计算主要差异参数对乳腺癌诊断的灵敏度和特异性;基于主要差异参数,建立神经网络诊断
OPLS⁃DA
模型,用于乳腺癌的诊断预测。结果提示基于血细胞参数,乳腺癌患者和健康女性之间存在
MPVBA#PLT
显著差异,平均血小板体积()、嗜碱性粒细胞绝对值()、血小板计数()、平均红细胞体积
MCVRBCLY#
()、红细胞计数()和淋巴细胞绝对值()是两组之间的主要差异参数。上述参数对乳腺癌诊

断特异性分别为、、、、和,灵敏度分别为、、、、和

,曲线下面积()分别为、、、、和。基于种主要参数,通过

逆向传播算法经次迭代建立人工神经网络模型,对乳腺癌预测的灵敏度为,特异性为。
OPLS⁃DA
结论本文通过算法发掘了乳腺癌患者和健康女性之间的主要差异血细胞参数,成功建立了人
工神经网络的乳腺癌预测模型,对乳腺癌的诊断筛查具有一定价值。
OPLS⁃DA
【关键词】乳腺癌;血细胞参数;;人工神经网络;诊断
R4
【中图分类号】
StudyonthevalueofbloodcellparametersinthediagnosisofbreastcancerbasedonOPLS⁃DAandartifi⁃
cialneuralnetworkalgorithmZHUXiaofei,QIANShining,CAOHuiling,
LaboratoryAffiliatedHospitalofNanjingUniversityofChineseMedicine,Nanjing210029,China
Correspondingauthor:WULingE⁃mail:******@
InvestigatethevalueofbloodcellparametersinbreastcancerdiagnosisbyOPLS⁃DA
【Abstract】Objective

Methods
⁃DAalgorithmwasusedtocalculatethesignificantdifferencesbetweenbreast

,

⁃DAanalysisthereare
Results,
#
,,
PLTMCVRBCandLY#
,,

,,,,;

,,,,;,,,,
#PLTMCVRBCandLY#theartificialneuralnetworkmodelwasestab⁃
,,,,,

,
⁃DAalgorithmisusedinthisstudytoinvestigatethemaindifferentialparame⁃
Conclusion

onartificialneuralnetworkhasbeensuccessfullyestablishedwhichisofcertainvalueforbreastcancerscreening.
,
breastcancerbloodcellparameterOPLS⁃DAartificialneuralnetworkdiagnosis
【Keywords】;;;;
%
乳腺癌是女性常见的恶性肿瘤。年我国性肿瘤发病的;死亡病例约万例,占女性
%1-2
女性乳腺癌新发病例约万例,占女性全部恶全部恶性肿瘤死亡的[]。近年来,随着我国人
口老龄化的加速,工业化、城市化以及生活方式的
3-42020
.1006⁃,女性乳腺癌疾病负担日益加重[]。年
:
81503368
项目基金:国家自然科学基金项目(编号:)中国女性乳腺癌发病率为万,居全国女性
E⁃******@
通信作者:吴玲:恶性肿瘤发病谱首位[]。年中国女性乳腺癌

实用医学杂志年第卷第期
%MPV20
死亡率为万,居全国女性恶性肿瘤死亡谱细胞百分比()和平均血小板体积()共
45
第位[]。项参数。本研究涉及的病患数据通过南京中医药
提高早期乳腺癌的检出率并进行及时有效的大学附属医院伦理委员会批准。
治疗是降低乳腺癌死亡率的有效措施。
Xorthogonalpartialleast⁃squaresdiscrimination
癌的诊断指征主要依靠影像学证据包括射线、分析(
BanalysisOPLS⁃DA
核磁共振和超等。而实验室指标尚未纳入乳,)进行乳腺癌组和健康女性组主
6OPLS⁃DA
腺癌诊断指南[]。究其原因,单一实验室指标在要差异参数的筛选。提取筛选的主要

乳腺癌诊断中的特异性较差、灵敏度不高,难以差异参数经()软件以误差逆向
backpropagationBP1
达到临床对乳腺癌的筛查要求。外周血细胞分传播(,)算法(含个隐藏层和
2
析是临床常用的一种廉价和有效的实验室检个神经节)进行人工神经网络建模。正态分布的

查,外周血细胞参数对多种疾病的诊断和预后两组数据之间的比较使用t检验。软件
7-9ROC
都有价值[]。最近研究发现外周血细胞参数对用于曲线绘制和相关数据分析。
包括乳腺癌在内的多种肿瘤的诊断和预后也有
810-122结果
一定价值[,]。由于肿瘤对外周血的影响是多
方面因素的综合结果,
2016-2021
乳腺癌诊断意义有限。故而,有必要通过一种综收集年于我院初诊的乳腺癌患者血细
422
合全面的方法研究血细胞参数对乳腺癌的诊断胞分析数据共例以及其间于我院体检的健
172
价值。康女性血细胞分析数据共例。血细胞分析数
artificialneuralnetworkWBCRBC
以人工神经网络(,据包括白细胞计数()、红细胞计数()、血
ANNHGBPLT
)算法为基础的机器学****由于其具有的可以红蛋白()、血小板计数()、红细胞压积
HCTRDW
同时解决线性和非线性问题的优势,已经在包括()、红细胞分布宽度()、平均红细胞体积
1314MCVMCH
放射医学[]、超声医学[]等领域得到了长足应用,()、平均血红蛋白含量()、平均血红蛋白
MCHCNE#
显著提高了临床医生的诊疗效率。然而,在检验浓度()、中性粒细胞绝对值()、中性粒
NE%LY#
医学领域机器学****与实验室指标结合进行临床辅细胞百分比()、淋巴细胞绝对值()、淋巴
LY%MO#
助诊断的研究依然甚少。因此,本文首次将人工细胞百分比()、单核细胞绝对值()、单核
MO%EO#
神经网络算法结合外周血细胞参数特征,通过深细胞百分比()、嗜酸性粒细胞绝对值()、
BA%
度学****建立乳腺癌诊断模型,为外周血细胞参数嗜酸性粒细胞百分比()、嗜碱性粒细胞绝对
EO#BA%
用于乳腺癌辅助诊断和预后判断提供依据。值()、嗜碱性粒细胞百分比()和平均血
MPV20
小板体积()共项参数。通过正交偏最小
1材料与方法OPLS⁃DA
二乘法判别分析(),本文发现乳腺癌
2016-2021

4221AVIPVariableImportancein
乳腺癌患者血细胞分析数据共例[平均年龄(图)。进一步运用“(
±#PLT
()岁]以及其间体检的健康女性血细)”算法发掘、、、
±#
胞分析数据共例[平均年龄()岁]。、和是两组间的主要差异性参数(图
1B1C1DMPVBA#MCVLY#
纳入标准:经影像学和病理学确诊的乳腺癌患和)。其中(图),、、和
者术前检查的血细胞参数纳入乳腺癌组;总体年在乳腺癌患者组的表达水平显著高于健康人群组
<
龄匹配的健康体检女性的血细胞参数纳入正常对(P);而和在乳腺癌患者组的表
WBC<
照组。血细胞分析数据包括白细胞计数()、达水平则显著低于健康人群组(P)。上述
RBCHGB
红细胞计数()、血红蛋白()、血小板计结果说明乳腺癌患者和健康女性在血细胞参数上
PLTHCT
数()、红细胞压积()、红细胞分布宽度差异有统计学意义。
RDWMCV
()、平均红细胞体积()、
MCHMCHCROCMPVBA#PLTMCVRBC
含量()、平均血红蛋白浓度()、中性粒运用法研究、、、、和
NE#NE%LY#6
细胞绝对值()、中性粒细胞百分比()、淋共种主要差异参数对乳腺癌的诊断效率。
LY#LY%2
巴细胞绝对值()、淋巴细胞百分比()、单如图所示,上述参数对乳腺癌诊断的特异性分
MO#MO%
核细胞绝对值()、单核细胞百分比()、别为、、、、和,灵敏
EO#
嗜酸性粒细胞绝对值()、嗜酸性粒细胞百分度分别为、、、、和,
BA%EO#
比()、嗜碱性粒细胞绝对值()、嗜碱性粒曲线下面积()分别为、、、

实用医学杂志年第卷第期
BC
NC




]

)[
-
corr
(-
VIPpred
p
-
-

---
p1
PLT
LY#
BA#
ABNE#EO#C
HCT
RBC
MO#
HGB
[]MPV
LY%
MCV
MCH
WBCEO%
NE%
BA%
RDW
R2X1===%
[][][](MCHV)
13p<⁃16p<⁃16p<⁃09110p=⁃0812p=⁃09

1210010
4004

103006
803
MCV
LY#
MPV92004
BA#
PLT
70RBC
810022
60p=⁃12

NCBCNCBCNCBCNCBCNCBCNCBCD
ABCNCOPLS⁃DA3DBS⁃PlotCVIPD
注:,乳腺癌组()和健康女性()经的投影;,关键差异参数的筛选();,预测值分布图;,主要差异参
数在乳腺癌组和健康女性的分布
OPLS⁃DA
图1算法筛选主要差异参数
ScreeningofprimarydifferentialparametersbyOPLS⁃DAalgorithm


、和,诊断折点()分别为果提示差异血细胞参数对乳腺癌诊断具有一定

、、、、、。以上结价值。
MPVBA#PLT


(,)

(,)
(,)
::
:
灵敏度灵敏度灵敏度



特异度特异度特异度
MCVRBCLY#




(,)
(,)
:
:
灵敏度灵敏度(,)灵敏度:



特异度特异度特异度
ROC
图2主要差异血细胞参数的曲线
ROCcurveofprimarydifferentialbloodcellparameters


实用医学杂志年第卷第期
generalizedweightGW3B
(,)如图所示。运用人
建立和对乳腺癌的诊断预测将数据分为训练工神经网络模型对测试集的数据进行分析预测
=327=
集(乳腺癌例,健康女性例)和测试集(图)。结果见表,预测结果的准确度为
=95=4095%~
(乳腺癌例,健康女性例),运用人工神经(CI:),灵敏度为,特异

网络算法(含个隐藏层,个神经节)对训练集数性为,阳性预测值为,阴性预测值为

据进行次迭代,建立了基于差异血细胞参数。与单一差异血细胞参数比较,人工神经
3A
的人工神经网络模型(图)。各参数的广义权网络模型的诊断效率均有显著提高。

1500
-1
1000-
-2
GW500-
-3
0-

RBCBA#PLT










AB
791113**********
MPVLT#MCV





repstvratepositiveTrue


FalsepositiverateC
ABGWC
注:,神经网络模型的拓扑结构图;,各主要差异血细胞参数在人工神经网络模型中的广义权重();,人工神经网络模型对测
ROC
试组诊断预测的曲线
图3人工神经网络模型的建立
Establishmentofartificialneuralnetworkmodel

表1测试集经人工神经网络模型预测3讨论
Testsetpredictedbyartificialneuralnetworkmodel

%乳腺癌是女性最常见肿瘤,具有发病率高和
例()
病死率高的特点。早期筛查对于乳腺癌的早期发
--
分组模型预测乳腺癌模型预测健康女性合计现和预后具有重要价值。血细胞分析是临床上成
80989
乳腺癌
53540熟和廉价的一种检验方法,目前发现该项检查
健康女性
8544129同样在肿瘤疾病的发生和转归中具有重要意义。
合计MPV
譬如,既往研究显示是非小细胞肺癌患者

实用医学杂志年第卷第期
NSCLC15
()预后不良的危险因素[],同时也是区分肝统和感染性疾病的直接相关之外,也可能间接反
16ALHASAN
内胆管癌和肝细胞癌的重要指标[]。应其他疾病的发生发展情况。然而血细胞参数的
17MPV
等[]发现无论肿瘤的解剖位置如何,和嗜碱单一指标往往不足以反应肿瘤等疾病的全貌,因
性粒细胞绝对数都可以作为治疗前大肠癌患者预此血细胞参数对于肿瘤等疾病的诊断价值一直存
PLT25-26
后的生物标志物。不仅如此,也在包括肺癌、在很大争议[]。通过机器学****算法纳入血细胞
结肠癌在内的多种肿瘤患者中都有不同程度的升参数的多项指标,更能全面地逼近个体的血细胞
18-19
高[]。究其原因,肿瘤微环境具有高凝、高炎症特征全貌,从而基于算法模型对血细胞全貌的综
反应等特征,由于肿瘤血供和体内血液循环直接合评估使肿瘤患者和健康人群得以区分。鉴于本
联通的病理特征,外周血中的各类细胞可能直接文中基于血细胞参数的乳腺癌患者诊断预测人工
或间接参与了肿瘤发生、免疫微环境塑造等过程,神经网络模型的成功建立,通过机器学****建立基
而肿瘤的免疫状态也可能间接地反映在外周血细于实验室常用指标(包括血细胞分析、临床生化和
20-21
胞的组成上[]。例如,单核细胞可以分化为肿免疫学指标等参数)的算法模型,将可能使“老指
瘤相关巨噬细胞促进肿瘤进展,同时分泌多种促标”焕发出“新生机”,从而在疾病诊断相关分组
IL⁃1IL⁃6diagnosisrelatedgroupsDRG
进炎症的细胞因子,如、等促进肿瘤相关(,)医保支付改革的大
22
血管的生成和转移[]。因此通过观察血细胞各项背景下,为控制医保支出,减轻患者负担,同时提
参数的变化进而反映肿瘤发生发展成为可能。本高临床疾病的诊疗效率做出贡献。
MPV
研究同样发现等参数在乳腺癌和健康女性之本研究尚存在不足之处,如使用的数据是单
间存在显著差异,说明乳腺癌肿瘤微环境同样可一医院的检测数据,可能存在人群、疾病谱、诊疗
能通过上述机制影响血细胞各项参数变化。因策略等差异,由此建立的诊断预测模型在应用于
此,根据患者外周血细胞的各项参数有可能推断更广泛人群的诊断评估时仍需要优化以提高
患者免疫状态、肿瘤发生乃至进展情况。本研究性能。
OPLS⁃DA
首先通过算法筛选获得乳腺癌患者和综上,本文发掘了乳腺癌患者和健康女性的
MPVBA#PLT
健康女性的主要差异参数包括、、、关键差异血细胞参数,运用误差逆向传播算法建
MCVRBCLY#
、和。但是上述参数对乳腺癌的诊立人工神经网络模型,对乳腺癌疾病的诊断筛查
断效率并不高,可能原因是单一血细胞参数不足具有潜在价值。
以反映肿瘤组织的复杂特征。因此,有必要建立
参考文献
一种复杂算法模型综合评估血细胞参数对乳腺癌

[],,,
的诊断价值。cancerstatistics2018GLOBOCANestimatesofincidenceand
machinelearningML:
机器学****
[]
cerJClin2018686394⁃424.
概率论、统计学和复杂算法理论等多种学科的新,,():

兴交叉学科[]。通过对大数据的复杂处理,机器[]郑荣寿,孙可欣,张思维,等年中国恶性肿瘤流行情
⁃28.
学****训练模型从而达到利用模型进行预测的目况分析[]中华肿瘤杂志,,():

ANN[],,,
的。人工神经网络()⁃451.
,[],,():
络行为特征,
BP[],,,
⁃132.
型。误差逆向传播()算法是医学领域最常用的,[],,():

一种算法,其特点是在训练过程中将输出值[],,
vatoryCancertodayEB/⁃02⁃//gcoiarcfr/
与实际值的差异不断地逆向传播给神经网络,调:[]:
today
:
节神经元之间的权重大小,使得实际值与理论值6.
246[]赫捷,陈万青,李霓,等中国女性乳腺癌筛查与早诊早治
的误差最小[]。为此,⁃382.
BP指南(,北京)[]中华肿瘤杂志,,():

础,以算法建立人工神经网络模型。与单一血[],,,
细胞参数相比,该模型对乳腺癌预测的灵敏度tiowasanindependentprognosticpredictorinacutemyeloidleu⁃
⁃430.
()显著提高,符合临床筛查指标应具有较[],,():

高灵敏度的要求;同时该模型的预测诊断特异性[],,,
⁃relatedlymphocyte/monocyteratioinstage⁃breast
为,
[],,:
在能力。782383.
⁃to⁃mono⁃
血细胞分析是临床常用的一种价格低廉、检[],,,
cyteratiobeforechemoradiotherapyrepresentsaprognosticpre⁃
查方便快捷的实验室指标。该指标除了与血液系

实用医学杂志年第卷第期

[]:
Ther2017105575⁃⁃.
,,:[],,():
⁃⁃
[],,,[],
upwithabsolutelymphocytecountinpatientsundergoingeribu⁃canceofpreoperativeplasmafibrinogenlevelsandplatelet
lintreatmentforearlydetectionofprogressiveadvancedormeta⁃
[],
⁃202119169.
[],,():,():

[],,,
⁃to⁃lymphocytera⁃letsThepointofinterconnectionamongcancerinflammation
[],,,:,
tioandC⁃reactiveproteinasmarkersforcolorectalpolyphisto⁃
[],,
⁃546.
[],,():():
⁃⁃inflammationax⁃
[],,,[],
phil⁃to⁃