文档介绍:基于数据挖掘的网上拍卖信誉研究
摘要
C2C网上拍卖已成为电子商务中最活跃的领域之一,以eBay为例,
1999年网上拍卖市场份额每月增长12%, 2002年交易额达到$
亿,,。然而,自
从C2C网上拍卖产生开始就始终无法摆脱欺诈的发生,National
Consumer League 的报告指出eBay在2005年上半年大约有24,318起
拍卖投诉,占交易量的81%。根据36,802份网上顾客的投诉,发现网
上拍卖的欺诈行为在网上十大欺诈行为中排名第一,占所有网上欺诈
行为的90%。为了减少或避免遭受欺诈,诸多学者开始网上信誉评价
方面的研究,因此网上信誉评价成为国际性研究热点。
本文首先研究和比较了现有的信誉评价反馈系统, 并选择世界
上最大的网上拍卖市场 eBay 拍卖方的信誉反馈数据进行分析;通过
分析发现该数据特征适合采用粗糙集算法进行数据挖掘,通过挖掘
eBay 拍卖方信誉评价反馈中的数据,找出是哪部分反馈信息对 eBay
当前拍卖方的信誉有决定性影响;选用 Rosetta 软件(实现粗糙集算
法的软件工具)对 eBay 拍卖方的数据进行数据预处理和属性约简,
导出对 eBay 当前拍卖方的信誉有决定性影响的信息规则。
论文详细阐述了选取和处理分析数据的过程及相应的算法,最终
I
通过实验各种约简算法找出合适的实验算法并导出有效的规则,再通
过无序矩阵(confusion matrix)来验证所挖掘出规则的有效性。最
后根据挖掘得到的规则,从已知信誉管理系统中的数据更科学、正确
地判断出卖方的信誉高低;指出了现有 eBay 拍卖方的信誉评价反馈
系统为不同颜色的星星进行定义时,所作的分类使这些各颜色的星状
符号不能正确反映信誉方面的信息,也就是说,买方不能根据它来判
断拍卖方的信誉高低,因此根据挖掘所得出的规则给 eBay 提出完善
和改进其星状系统的建议。
最后,对全文工作进行了总结,找出本课题研究中存在的问题和
对今后研究工作的展望;并希望本论文的研究结论能被将来国内的网
上拍卖市场所借鉴和应用,从而降低国内网上拍卖购物的风险。
关键词:粗糙集,网上拍卖,信誉,数据挖掘
II
RESEARCH ON REPUTATION IN ONLINE AUCTION
MARKET BASED ON DATA MINING
ABSTRACT
The consumer-to-consumer (C2C) online auction is one of the most
active segments of e-business in the world at present. eBay, the biggest
C2C online pany, sees the variance of the C2C online auction.
The market size of eBay raised 12% per month in 1999(Lucking-Reiley,
2000), and its total amount of trading rose to $ billion in 2002, in
2003 the amount modities exceeded 12 million with more than
18,000 categories in any given day. However, online auction market can
not keep away from the fraud as C2C online auction market emerged
(Albert, 2002). eBay received around 24,plains during the first
half year of 2005. National Consumer League (2005) reported that, by the
end of 2004, 81% of the Americans participating in online auctions had
encountered fraud-related problems. The online auction fraud ranked
among the top 10 frauds with a proportion