1 / 19
文档名称:

AI行业系列点评AI大模型竞争加剧,国内海外多点开花-申万宏源.docx

格式:docx   大小:391KB   页数:19页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

AI行业系列点评AI大模型竞争加剧,国内海外多点开花-申万宏源.docx

上传人:chemcary 2024/3/24 文件大小:391 KB

下载得到文件列表

AI行业系列点评AI大模型竞争加剧,国内海外多点开花-申万宏源.docx

相关文档

文档介绍

文档介绍:该【AI行业系列点评AI大模型竞争加剧,国内海外多点开花-申万宏源 】是由【chemcary】上传分享,文档一共【19】页,该文档可以免费在线阅读,需要了解更多关于【AI行业系列点评AI大模型竞争加剧,国内海外多点开花-申万宏源 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。计算机2024年03月11日AI大模型竞争加剧,国内海外多点开花看好——AI行业系列点评相关研究"华为2024年合作伙伴大会核心看点有哪些?-全年关注计算+鸿蒙+盘古+Meta"2024年3月10日"AI大模型多点开花!新质生产力落地新型工业化!-计算机行业周报20240304-20240308"2024年3月9日本期投资提示:.国产大模型Kimi、海外大模型Claude3新发布,可以达到GPT-4的大模型继续增加!Kimi和Claude3均有超预期性能表现。.Kimichat是月之暗面推出的对话助手工具,于2023年10月10日发布,发布之初即定位长文本。支持输入20万汉字,是目前国产大模型中支持的最长上下文输入长度,2024年2月,kimi迭代了网站、多问题搜索能力,可用性继续提升。Kimi中英文生成能力已接近GPT-4水平,主要优势在语言理解和长文本处理,复杂逻辑推理、数学解题和多模态能力暂缺或稍弱。内部实测其长文本处理能力让论文总结、会议纪要变得更具可用性,加上联网搜索功能,对于需要查阅大量信息和处理会议纪要的办公人群有极大助力,未来办公类AI应用或将受益。Kimi成功启示:我们认为团队成员能力、资金储备、时间可能是Kimi目前较为成功的原因。.截至目前,国内大模型的文字生成能力已经整体接近GPT-4Turbo。,不少国内厂商近期新发布的模型在多个能力维度上正在快速缩小与GPT-4Turbo的差距,包括智谱清言GLM-4、阿里Qwen-Max、。我们认为在2点上仍有差距:1)大模型普遍在复杂推理能力上有提升空间,包括GPT4-Turbo,但明显领先国内商业和开源模型。2)图生文能力,目前阿里Qwen-VL暂时能力位居前列,实测来看能够理解简单图片,初步具备基于视觉完成复杂推理的能力,但复杂计算及视觉问题上较GPT4V仍有提升空间。证券分析师洪依真A0230519060003hongyz@刘洋A0230513050006liuyang2@研究支持洪依真A0230519060003hongyz@联系人洪依真(8621)23297818×******@.3月4日,OpenAI竞争对手之一Anthropic推出最新Claude3大模型,效果好于Gemini。中英文生成、理解、推理,多模态图片理解能力均与GPT-4接近,且实际使用中生成速度快于GPT-4和Gemini。内部实测我们认为Claude3在如下几点能力上有提升和突破:1)更快的响应速度。2)多模态能力。3)更强小语种能力。.整体来看,市场可能认为海外大模型迭代放缓,但我们认为2024年模型能力仍然快速迭代。包括OpenAI以外的其他模型能力追赶、Llama3等开源大模型发布、下半年OpenAI的新模型迭代等。.推荐标的:1)AI办公应用:金山办公、福昕软件;2)多模态算法布局:科大讯飞、虹软科技、万兴科技、大华股份;3)多模态应用:焦点科技(互联网传媒)、上海电影(互联网传媒)、光线传媒(互联网传媒)、巨人网络(互联网传媒)、华策影视(互联网传媒)、易点天下(互联网传媒).风险提示:大模型技术中美仍存在差异,部分技术尚处于早期实验室阶段,存在落地风险竞争加剧影响利润率风险;AIGC技术演变过快风险。请务必仔细阅读正文之后的各项信息披露与声明业及产业行业研究/行业点评证券研究报告行业点评请务必仔细阅读正文之后的各项信息披露与声明简单金融成就梦想一、国产大模型Kimi、海外大模型Claude3新发布,可以达到GPT-4的大模型继续增加!根据我们内部测评:Kimi中英文生成能力已经接近GPT-4水平,尽管实际测试中复杂逻辑、数学能力仍有差距,且主打文字生成、目前无多模态能力;Cluade3中英文生成、理解、推理,多模态图片理解能力均与GPT-4接近,效果好于Gemini,且实际使用中生成速度快于GPT-4和Gemini。表1:内部测评各模型中英文文字生成能力情况 中文题得分情况国内团队美国团队欧洲团队kimiChatGLM-4GPT4claude3mistral10题中正确题目数89983英文题得分情况国内团队美国团队欧洲团队kimiChatGLM-4GPT4claude3mistral5题中正确题目数34334资料来源:Kimi、ChatGLM-4、OpenAI、Claude、Mistral等官网,申万宏源研究Kimi:国产大模型长文本能力突破,实测文字生成、文本总结等能力接近GPT-4。Kimichat是月之暗面推出的对话助手工具,于2023年10月10日发布,发布之初即定位长文本。支持输入20万汉字,是目前国产大模型中支持的最长上下文输入长度,2024年2月,kimi迭代了网站、多问题搜索能力,可用性继续提升。我们认为其在长文本单点能力上实现突破,精准定位办公人群。Kimi支持20万汉字的长文本输入,对比来看,GPT-4Turbo-128k的能力是约10万汉字,Claude3200k上下文是约16万汉字。因此,Kimi更适用于高效阅读、专业文件解读、资料查询、资料整理总结等方面。1)专业论文要点归纳总结任务的表现和GPT4大致相同,响应迅速,约10秒可以读完论文并给出回答。回答内容简要,能够根据文档精准回复追问,体现了模型较好的逻辑推理能力。图1kimi处理14万字左右论文行业点评请务必仔细阅读正文之后的各项信息披露与声明简单金融成就梦想资料来源:kimichat,申万宏源研究图2针对论文内容追问的回答资料来源:kimichat,申万宏源研究行业点评请务必仔细阅读正文之后的各项信息披露与声明简单金融成就梦想请务必仔细阅读正文之后的各项信息披露与声明简单金融成就梦想2)资料整理总结方面kimi在会议纪要总结能力上具有优势,选取一场会议的录音转录文本(分成两份pdf)给到模型进行文本纠错和全文总结,kimi的纠错能力和总结能力强于GPT4,例如kimi能根据上下文将“贝尔BT这个T23,T五”这个乱码纠正为“BERT”,并告知可能指BERT模型,其全文总结结果也比GPT4结果更具可用性。行业点评图3kimi对会议纪要的纠错及总结资料来源:kimichat,申万宏源研究图4GPT4对会议纪要的纠错及总结资料来源:chatgpt,申万宏源研究请务必仔细阅读正文之后的各项信息披露与声明简单金融成就梦想行业点评3)能够针对提问自动联网搜索总结回答,答案提供信息来源,更具可靠性。例如下图问kimi关于谷歌2024的最新新闻,基本涵盖了所有要点新闻,总结也到位。图5kimi联网搜索新闻信息并总结要点请务必仔细阅读正文之后的各项信息披露与声明简单金融成就梦想行业点评资料来源:kimichat,申万宏源研究请务必仔细阅读正文之后的各项信息披露与声明简单金融成就梦想行业点评请务必仔细阅读正文之后的各项信息披露与声明简单金融成就梦想总体来说,我们认为kimi的优势在语言理解、长文本处理、逻辑推理能力上,数学解题和多模态能力暂缺或稍弱。其长文本处理能力让论文总结、会议纪要变得更具可用性,加上联网搜索功能,对于需要查阅大量信息和处理会议纪要的办公人群有极大助力,未来办公类AI应用或将受益。Kimi成功启示:我们认为团队成员能力、资金储备、时间可能是Kimi目前较为成功的原因。1)月之暗面(Moonshot)由清华大学交叉信息学院杨植麟教授领衔,团队成员包括来自Google、Meta、Amazon等国际科技巨头的人才,在Gemini、盘古NLP、悟道等多个大模型研发中有参与;2)公司成立后获红杉中国、真格基金等机构投资,最新一轮融资超10亿美元,投资方包括阿里、红杉中国、小红书、美团等,估值达25亿美金;3)月之暗面成立于2023年3月,此时chatgpt的全面成功,使得业界大模型已基本确认Decoder-only+VQA的技术路线,有效避免了此前由于技术路线分歧造成的开发资源浪费。相关标的:文字类、对PDF等长文本能力提出要求的应用,福昕软件、金山办公;提升查找能力、对回答精确度贡献的向量数据库,星环科技。截至目前,国内大模型的文字生成能力已经整体接近GPT-4Turbo。1月30日,上海人工智能实验室发布了大模型开源开放评测体系司南()1,结果显示,不少国内厂商近期新发布的模型在多个能力维度上正在快速缩小与GPT-4Turbo的差距,包括智谱清言GLM-4、阿里巴巴Qwen-Max、。图6:(客观评测-百分制)行业点评请务必仔细阅读正文之后的各项信息披露与声明简单金融成就梦想1https://rank..cn/home行业点评请务必仔细阅读正文之后的各项信息披露与声明简单金融成就梦想资料来源:上海人工智能实验室、申万宏源研究但同时根据评测,复杂推理相关能力是大模型普遍面临的难题,国内大模型相比于GPT-4还存在差距。评测显示,推理、数学、代码、智能体是国内大模型的短板。GPT-4Turbo在涉及复杂推理的场景虽然亦有提升空间,但已明显领先于国内的商业模型和开源模型。这是大模型在金融、工业等要求可靠的场景落地需要的关键能力。国产大模型在“文生图”能力上迭代,但“图生文”能力展示仍然较少,目前主流模型中阿里Qwen-VL暂时能力位居前列。阿里更新多模态大模型Qwen-VL,展示了部分“图生文”能力。2024年1月,阿里升级了通义千问视觉语言模型Qwen-VL2,继Plus版本之后,又推出Max版本。截至目前,Qwen-VL-。()行业点评请务必仔细阅读正文之后的各项信息披露与声明简单金融成就梦想资料来源:上海人工智能实验室、申万宏源研究2-cafbecbd行业点评