文档介绍:博士学位论文答辩评阅意见书
论文题目: 变量选择和变换的新方法研究
博 士 生: 唐凯临
学 号: 0410104002
院(系、所): 化学系
专 业: 无机化学
指导教师: 李通化 教授
年 月 日
教授:
鉴于您在本学科的造诣和学术声望,特聘请您对我校 化学系
无机化学 专业博士生 唐凯临 的学位论文进行评阅。现呈上该生论文,请您在百忙中抽时间给予审阅(请重点审阅论文的创新性、学术性)。并将评阅意见于 年 月 日前邮寄或送达博士生所在
学院 收
地址:上海市四平路1239号 邮政编码:200092
谢谢您的支持!
同济大学研究生院
(学院代章)
申请人姓名
唐凯临
专业
无机化学 入学年月
论文题目
变量选择和变换的新方法研究
申请人对学位论文的自评
序号
主要创新点
(每点不超过100字)
1
对于多变量少样本的超大规模数据先将其利用函数映射至特征空间,经转换之后的变量以样本之间的关系代替了原先的变量之间的关系。这样许多在原样本空间用线性方法难以解决的问题,在特征空间中可以轻而易举地完成。
2
将质谱数据分为若干区间,计算每个区间的多阶统计量,以这些反映了波形特点的多阶统计量作为新的变量进行分类计算。不仅大大减少了变量还使用了数据的局部信息,分类效果也得到进一步提高。
3
提出了一种将连续变量转换成离散变量从而寻找特异模式的方法。首先将连续变化的谱转为离散变量。然后经过模式生成,模式比较,模式精化,找到肿瘤和正常两类各自特有的模式,得到有意义的生物标记物。
申请人对学位论文的自评
不足之处(含原因及改进方法)
1、核函数在本文的分类和回归问题中起着非常重要的作用。不同的核函数往往对拟合结果有很大影啊。对于核函数类型,本文中还是凭经验选择,目前还没有系统的理论指导方法,这一方面需要进一步的理论研究。
2、模式变量选择中对于区间的划分、多种模式选择的方法还需要进一步的研究。对于多种蛋白的共同作用,biomarker的确定还需要生物化学实验的确认。
3、分子对接结果用于QSAR研究还需要进一步的尝试。
导师对预审后论文修改情况的意见:
对多阶统计量和模式变量的计算结果做了进一步的探讨。
合并了部分相关章节的内容,突出了工作重点。
加强了实际体系应用的理论指导。
导师签名:
年 月 日
攻读博士学位期间已经发表(包括已接受待发表)的论文、或已通过鉴定的项目、或已申请到的专利填入下表
序
号
作者(全体作者,按顺序排列)
发表论文题目/
获奖成果名称
刊物名称/
授奖部门、级别
发表/
获奖时间
对应学位
论文章节
与学位论文关联度(此栏由论文评阅人填写,请打“√”)
大
较
大
中
小
无
1
唐凯临,李通化
Application of Kernel Method to Classify SELDI-TOF Proteomics Data
计算机与应用化学
2007
3
√
2
唐凯临,李通化
卵巢癌SELDI-TOF数据分类方法初探
2006年全国博士生学术论坛
2006
3
√
3
Tang kailin,Li tonghua
Classification of proteomics data by kernel methods
Abstracts of Papers, 233rd ACS National Meeting
2006
4
√
4
Tang kailin,Li tonghua
Pattern v