1 / 10
文档名称:

经典的机器学习方面源代码库.docx

格式:docx   大小:276KB   页数:10页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

经典的机器学习方面源代码库.docx

上传人:JZZQ12 2018/3/26 文件大小:276 KB

下载得到文件列表

经典的机器学习方面源代码库.docx

相关文档

文档介绍

文档介绍:经典的机器学****方面源代码库
编程语言:搞实验个人认为当然matlab最灵活了(但是正版很贵),但是更为前途的是python(numpy+scipy+matplotlib)和C/C++,这样组合既可搞研究,也可搞商业开发,易用性不比matlab差,功能组合更为强大,个人认为,当然R和java也不错.
(收录了各种机器学****的各种编程语言学术与商业的开源软件)
2偶尔找到的机器学****资源网:(也非常全,1和2基本收录了所有ML的经典开源软件了)
puters/Artificial_Intelligence/Machine_Learning/Software/
3libsvm(支持向量机界最牛的,不用多说了,台湾大学的林教授的杰作)
.tw/~cjlin/libsvm/
4WEKA(基于java的机器学****算法最全面最易用的开源软件)
./
5scikit(本人最喜欢的一个基于python的机器学****软件,代码写得非常好,而且官方的文档非常全,所有都有例子,算法也齐全,开发也活跃
,强烈推荐给大家用)
http://scikit-/stable/
6OpenCv(最牛的开源计算机视觉库了,前途无可限量,做图像处理与模式识别的一定要用,总不能整天抱着matlab做实验和工业界脱节吧,但是有一定难度)
http://opencv./wiki/
7Orange(基于c++和python接口的机器学****软件,界面漂亮,调用方便,可以同时学****C++和python,还有可视化的功能,)
/
8Mallet(基于JAVA实现的机器学****库,主要用于自然语言处理方面,特色是马尔可夫模型和随机域做得好,可和WEKA互补)
/
9NLTK(PYTHON的自然处理开源库,非常易用,也强大,还有几本orelly的经典教程)
/
10lucene(基于java的包括nutch,solr,hadoop,mahout等全套,是做信息检索和搜索引擎的同志们必学的开源软件了,学JAVA的必学)
http://lucene./
-ManagingGigabytesforJava
MG4J可以让你通过内插编码(interpolativecoding)技术,为大量的文档集合构建一个被压缩的全文本索引。与Lucene主要区别是,它提供了cluster功能,具有更OO的设计方式。虽然MG4J不是一个像Lucene、Egothor和Xapian那样的信息检索库,但是相信每一位搜索工程师都应该知道它,因为它对构建Java信息检索库提供了低水平的支持。MG4J是在一本很流行的书问世之后被命名的,,AlistairMoffat和Timothy所写,名字是《管理十亿字节:压缩并且索引文档和图片》。在使用他们的分布式、可容错的网页爬虫UbiCrawler收集到大量的网页数据后,它的作者需要一个软件来解析那些收集来的数据,由于这个需求,MG4J诞生了。MG4J的库提供了优化的类来处理I/O,转化索引文件的压缩等等。
-InformationRetrievalPlatform