1 / 3
文档名称:

IBMWatson的基本原理和大数据分析.doc

格式:doc   大小:83KB   页数:3页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

IBMWatson的基本原理和大数据分析.doc

上传人:小健 2022/5/20 文件大小:83 KB

下载得到文件列表

IBMWatson的基本原理和大数据分析.doc

文档介绍

文档介绍:IBM Watson的基本原理和大数据分析
作为IT业界的顶级公司,IBM通过其认证确定了产品专家的 标准,可以说IBM在业界的声望和IBM产品的市场占有率提升了其 认证工程师的含金量。下面是收集的关于IBMWatson的基本原理和 大数IBM Watson的基本原理和大数据分析
作为IT业界的顶级公司,IBM通过其认证确定了产品专家的 标准,可以说IBM在业界的声望和IBM产品的市场占有率提升了其 认证工程师的含金量。下面是收集的关于IBMWatson的基本原理和 大数据分析,希望大家认真阅读!
第一个服务器是演示服务器。这里是你需要编写Java程序来 支持提问和回答的逻辑与思考过程的地方,我们可以称其为查询面 板。你会在查询面板部署GUI,用来输入你的问题、处理问题以及 寻找答案。这也是你安装OpenNLP的地方。OpenNLP是能“理解” 写入查询面板的问题的应用。问题的“答案”现在就能从NFS驱动 器里搜索。查询面板是一个图形用户界面,用来输入问题和显示答 案。在这个界面之下它所做的是通过将问题传递给一个安装在此计 算机上的叫做OpenNLP的应用来尝试“理解”这个问题。一旦问题 被理解了,它就会检索答案。在输入一个问题之前,你需要告诉查 询面板从哪里来寻找答案。我们将会引导查询面板从一个网络文件 系统驱动器中寻找答案。这个驱动器包含了其它服务器的从非结构 化数据到结构化数据的转换结果。在我们的这个原型体系中,所有 被处理的数据都会被存储在共享的NFS驱动器里。
这是演示服务器的基本组件:Linux64位;最小8GB内存;兼容
64位CPU;50GB硬盘空间;JavaSDK;查询面板;OpenNLP;可以访问NFS 驱动器;已联网,可以访问内网和互联网。
业务逻辑服务器就是你的“思考”或者说分析计算机。对这个 服务器里,你需要安装JavaSDK、Eclipse和UIMASDK。创建UIMA 应用可以将非结构化数据转换为结构化数据,这些应用例如:类型 描述;注释器;分析引擎描述符;通用分析结构(CAS); 一些Java
类;CAS数据处理控件。(这个服务器里还有)UIMA将要处理的以非结 构化数据形式存在的内容。它的基本工作方式是——我们会用UIMA 组件来从一个非结构化数据池中获得数据,这是通过编写基于 Java-UIMA的应用来设定我们需要的关键词。这些UIMA组件会采集 关键词并将其放入CAS或者说通用分析结构。这些采集完的项就是 我们希望找到的基于某种条件的东西。一旦到了 CAS,我们编写好 的CAS处理控件就会将数据写为一个结构化的形式,例如数据库、 CSV平面文件或者是XML。你也将在此处创建你的UIMA应用,以建 立你的采集处理引擎。这些应用是:类型描述;注释器;分析引擎描 述符;通用分析结构(CAS); 一些Java类;CAS数据处理控件。
这些是业务逻辑服务器的组件:Linux64位;最小8GB内存;兼 容 64 位 CPU; 50GB 硬盘空间;JavaSDK; UIMASDK;使用 了 UIMA 的一些 Java程序;联网的共享的NFS驱动器;网络连接,可访问内网和英特 网。
第三台机器是文件和数据库服务器。在这个地方你将存储被其 它系统需要的文件,这里也是输出的文件被存放的