“模型”竹间智能总裁兼COO孙彬：大语言模型如何在企业落地

2023-06-12 19:05:27来源：i黑马

今天，很高兴为大家分享来自i黑马的竹间智能总裁兼COO孙彬：大语言模型如何在企业落地，如果您对竹间智能总裁兼COO孙彬：大语言模型如何在企业落地感兴趣，请往下看。

来源：i黑马

风起AIGC

AIGC已经成为我们这个时代新的商业分水岭，引领着内容和创意的“寒武纪大爆发”。无论是前沿科技产业还是整个经济社会格局，都将因此产生巨大的变化。为了让创业者更好地拥抱这个时代，创业黑马将以中国AIGC第一服务平台为己任，通过走访多位业内知名企业家、投资人、专家学者和创业实践者，从软硬件平台视角、投资人视角、行业应用视角等维度进行系列报道，共话大模型时代新机会，展现产业新力量。本篇为第八篇。

本期的分享嘉宾是竹间智能总裁兼COO孙彬。竹间智能由前微软（亚洲）互联网工程院副院长简仁贤于2015年创办，是认知AI时代下以大小模型双轮驱动的NLP为核心技术的国内领先人工智能企业，通过对话、知识、培训和生成四大产品平台，实现跨行业、跨场景的规模化落地，已累计服务500多家大中型企业。在以ChatGPT为代表的LLM（大语言模型）技术掀起全球浪潮之际，竹间对所有产品系列进行了全线升级，并推出运用多种LLM技术的成熟AIGC企业级产品，帮助白领等知识生产者提高生产力，助力企业完成数智化转型。

在6月8日的黑马AIGC主题系列直播第二季中，孙彬以《大语言模型在To B领域的落地和探索》为主题进行了分享，并展示了竹间智能在生成式AI技术落地方面的商业洞察、布局和重要成果。

以下为本次直播实录整理：

今天我来分享一下，作为NLP（自然语言处理）从业团队，过去亲身经历过的大语言模型发展历程，以及我们看到的未来。

我相信很多人都是最近在网上了解到 Chat GPT这种大语言模型，也分析过很多关于大语言模型和生成式AI的特点、优势或短板。但是其实大语言模型，包括我们所从事的NLP（自然语言处理）产业已经发展了很长时间了。竹间智能团队聚焦NLP已经有8年了，这8年也是NLP真正实现产业化的时期。在此期间，我们一直身处NLP赛道，研究如何将NLP服务商业化，如何进行营销，如何为企业提供服务，如何在C端实现成长，也积累了一些经验和客户。

01行业变局与四大挑战

在人工智能领域，图像、语音、语义的处理都是一些重要的赛道，NLP就是其中关于自然语义理解的部分。

实际上，在人工智能的语义理解方面，具体可以分为两个部分：一是大家非常熟悉的人机问答，我们叫它短文本，是用来交互的；另一个是长文本，让机器能够对现有的非结构化的文件、文章进行阅读、理解、抽取、提取。这两大领域都是NLP的强势领域，也恰恰是产业化落地的领域。今天我们所熟悉的大语言模型，给大家展示了对话中的高理解、高对话能力，但它更让大家惊艳的地方却是生成的文章、写出的代码、翻译成的语言。

在这两大领域（短文本和长文本），过去各个NLP团队也取得了很多成果，但是在它们落地发展过程中，主要面临四大挑战，而现在大语言模型的出现，则让情况产生了很大的改变。

首先，是深度语义理解及推理。在大语言模型爆发之前，所有的语言模型相对来说都比较轻量，针对一些具体场景，那时首先面临的挑战就是如何能够准确理解客户的意思，大家都不断地在用新的模型优化算法，去了解客户的意图，理解客户的上下文和他们的情绪，但是现在大语言模型极大地拉升了这方面能力。

第二，是基于知识图谱的智能问答。这也是现在大家对大模型最为诟病的地方，因为大模型的知识不是很准确。过去的最佳实践方案，是我们用NLP的模型去理解客户的对话意图，然后用客户方给到的知识和答案实现精准匹配，这样可以帮助对话机器人给出正确回复。

第三个挑战是如何通过语义训练实现问答精准匹配。比如在金融行业，关于信用卡的服务内容其实是有标准答案的，但是客户的问法千差万别，我们如何用语言模型理解客户的意图是一个难题。在To B服务领域，对答案的准确度要求是非常高的，否则会对客户产生误导或造成损害，这一挑战依然延续到大语言模型时代。

第四个挑战，就是任务的流程。大家知道，任何一个大语言模型的聊天能力都很强，但是你要让它完成一个工作，比如说办一张信用卡、重出一张机票，或查询一个工单信息，就有些困难。这种多轮的流程式的对话方式，对大语言模型来说可以很容易去模仿，但是要精准地提供这些数据，还需要另外一层的技术控制。

过去NLP产业落地的这四大挑战，现在依然还存在，但是在很大程度上来说，用大语言模型可以更容易地解决，这就是技术变革给产业带来的好处。在这方面，我们已经应用大模型做出了一些案例，获得了客户的认可。比如一家证券客户的客服中心原先使用的是传统的客服机器人，在使用中暴露出诸多问题，比如业务知识与闲聊混合管理不便于维护，大量知识材料内容和分组不匹配，回答准确率过低等等，40%~50%的电话最后还是要转到人工服务。但是经过技术的加持，机器人的服务占比可以提升30个百分点，就能很大地节约人力，提高效率。

所以，今天的 AI在应用过程中，特别是在To B产业，其实并不像大家想象的那样，一个模型就能够解决所有问题。它实际上是一个像下图这样的平台逻辑：

最底层是基础技术，上面是AI模块，还要通过一些API的方式进行二次开发，最后接入客户的业务场景。最近大家都把聚焦点放在大语言模型的写作能力和对话能力方面，但是从为企业服务的从业者视角来看，虽然目前底层的模型能力有了极大的突破，但要想更好地实现应用，还有很多的能力需要完善。

在今天这个大语言模型产业爆发之际，我们更呼吁所有在赛道中有经验的专业团队，都应该驾驭好大模型，让大模型能够在多场景中落地，实现产业化发展。不但大模型自身要高速发展，大模型带来的创新业务也应该实现高速发展。

02产业的未来

接下来，我来分享一下站在从业者的视角分析，大语言模型会给产业带来哪些变革？

首先想一下，Chat GPT现象的本质是什么，它给大家带来的经验是什么？相信所有跟它做过对话的人都不仅仅是为了好玩，大家会感觉到“我是在跟一个智能体对话”。这代表了什么？代表人类可以跟语言模型进行沟通了。它能理解你，能回答你，能帮你去执行。大语言模型最好的一点就是它用一种“暴力”的方式带来了足够多的知识，然后又可以理解人的情绪，可以跟人对话，这恰恰将以前人和机器交互的瓶颈问题解决了。

从这一点出发，我的第一个判断，是大模型会改变我们现在的软件范式。相信做IT的同事们对此都有切身体会，当PC出现的时候，当互联网到来的时候，当手机应用开始爆发的时候，软件范式都曾发生过改变，从工业软件到PC软件，到网站和手机APP，再到现在的大模型热潮，软件范式又将被改写一次。

那么，大语言模型来了以后，软件应用会是什么范式？我们通过对话的方式就可以调动各种各样的应用。如果说以前我们是应用为主导，今后我们可以非常明确地想象，人会跟手机或者智能硬件沟通，然后由它来完成相应的软件操作，所有应用之间的屏蔽会被打破，应用的能力会被调用，大语言模型直接调动应用能力会形成新的交互方式，这将是一个新的操作系统，新的“iPhone 时刻”。

在未来2~3年内,我们大量的C端应用，都会因为对话方式的改变而改变，很有可能不再是触摸式输入，而是语音输入，很多行动也会打破应用的边界，可能每个手机都会有个AI助手，它可以通过对话的方式调度多个应用能力，下单、叫车、购买都可以通过语音来完成，接下来会有千千万万个基于类ChatGPT模型的应用出现。

以上是C端的变化，那么B端会怎样变化？我的第二个判断是，在B端，企业/行业的私域知识会变得至关重要，产生大量的企业Chat GPT、行业Chat GPT。

目前，大语言模型的特点是它可以高度理解人的语义，并且可以做一些深层次的工作，比如写作、推理、分析等等，但是它的知识是不可被依赖的。这是因为用来训练的互联网数据是不可靠的，今天的大语言模型实际上是一个对话模型，并不是一个问答模型。它是为了对话而产生的，所以它会妥协，会认错，为了让对话继续进行下去，它会根据对话的人的喜好改变内容，但是它并不是一个具备正确知识的模型。

但对企业客户来说，我们的行业总监、客服、营销人员、政策咨询人员，绝对不能给客户不准确的知识。所以，在B端一定会发展成这样的范式：大语言模型做沟通和理解，加上私域知识——准确的私域知识——然后驱动行业/企业的应用，行业/企业的应用也会因为这一变化而变化。

那么，企业的私域知识怎样构建？我们可以回顾一下企业数字化的发展过程，最早的时候，我们把设备联网叫数字化，这是第一代的生产数字化；第二步，我们将ERP，包括生产制造系统使用起来，实现全业务流程IT化，这是第二代的资产数字化。

现在，我们有了大语言模型，有了行业/企业的私域知识，真正地让企业的hr部门、行政部门、销售部门、客服部门……所有的知识全部用对话或者阅读的方式表达出来，就真正让企业智能化了。

人工智能发展到一定阶段之后，可以将知识利用起来，就实现了进化，我们将从数字化时代进化到数智化时代。

在接下来的时间，我们会看到越来越多的企业将部门的知识、企业的知识甚至行业的知识利用人工智能技术变成知识库，变成可以被AI构建和调用的知识，形成知识流，然后让这些知识变成数字人，服务我们的企业，服务我们的客户。

我们可以预测,在未来的一年，企业服务的这些内容会呈现指数级的增长，会提升至少10倍以上。从事To B行业的创业者，一定要对此做好准备。

03未来的四个新挑战

那么，未来大模型发展将面临哪些新挑战？

除了前面提到的四大挑战之外，作为技术从业者，我在这里跟大家分享几个我们看到的新挑战：

第一个挑战就是大模型阅读 or 知识图谱预建？过去我们做了很多的知识图谱，但是今天的大语言模型可以阅读文档，可以阅读那些非结构化的数据。那么，到底是不是还需要建立知识图谱？换一种说法，就是今天是要预设好答案，方便来问答和查询，还是要让大语言模型自己去阅读内容，然后给你答案？

其实，这两种实践路径都可以完成很多的内容查询，但是最终哪个效果好，哪个准确率高，我相信应该是不同的场景使用不同的模式。也许有人会问两种结合在一起会不会更好？答案很值得期待，希望我们的从业团队用工程能力给出结果。

第二个新挑战是“Prompt？Embedding？Fine-tuning? ”这三个词都是现在特别热的词。Prompt是提示词，Embedding指嵌入接口，Fine-tuning指模型微调，都是训练大模型要做的工作。但目前其实并没有多少团队能够把模型调好，可能在微调的过程中间，越调越差。所以今天我给到大家的建议，就是不要迷恋对大语言模型进行微调，最终要以结果可控和高质量目标作为标准。利用大语言模型的能力加上自身的工程能力，比如对知识图谱、对客户数据的调用，然后利用数据的能力，最终满足客户的需要才是王道。

第三个新挑战，到底是应该做大语言模型，还是做专业模型？我的观点是通用大语言模型有它的优势，专业模型也有它的场景，每个模型其实都有它的能力特点。我们认为通用大语言模型适合于To C端进行对话和训练，专业的模型适合于在行业内调取专业的知识，完成专业的任务。

第四个新挑战：大模型应该云端调用还是私域部署？在10年前，大家就在讨论公有云好还是私有云好，其实我们看到今天这两者是并存的。云计算和AIGC产业发展有相似之处，通用模型适合于各种各样的中小企业，通用灵活；专业模型安全性高，数据可以控制，它要为企业服务，数据要准确，要完成不同的任务。所以我们可以这样预测，未来会有几个头部的企业提供最优秀的大语言模型来为大家服务，但同时也会有千千万万的行业私有云、企业私有云，千千万万的行业模型和企业模型。

未来，公有的大模型一定会越做越强，会由头部的几个企业来领导，行业的私有模型一定会百花齐放，这也是我们很多To B企业的商机。

我们相信，ChatGPT现象将给我们带来巨大的AIGC红利。写作类、绘画类、创作类的职业会实现巨大的提效。大模型归根到底是一个工具，会使用工具的人将会淘汰不会用工具的人。

智能家居行业会有很大的发展，过去每个家庭的环境太复杂，所以大家没有办法在家庭环境中预设好各种对话，现在大语言模型应用之后，对智能家居行业又会有很大的促进。

同样还有个人助手类的应用，我认为会有极大的发展。AI可以帮你订机票、订餐、更改日期，还有去执行一些预约，甚至去购买一些东西，我们期待着今年下半年会有很多个人助理类的应用大爆发。

此外，还有元宇宙的“ IP 众包”模式、情感陪伴类产品等等，都会迎来爆发。

竹间智能是2015年成立的一家NLP专业公司，我们的核心能力就是将短文本NLP和长文本NLP处理能力，结合我们的专业模型，以及现有的大语言模型，实现不同的应用场景落地，做出不同的数字员工，来为企业和个人提供服务。我们也希望能够跟行业内所有的玩家共勉，一起来享受 AIGC带来的产业爆发，共同做好AI在各个行业的落地。

好了，关于竹间智能总裁兼COO孙彬：大语言模型如何在企业落地就讲到这。

返回科技金融网首页 >>

版权及免责声明：凡本网所属版权作品，转载时须获得授权并注明来源“科技金融网”，违者本网将保留追究其相关法律责任的权力。凡转载文章，不代表本网观点和立场，如有侵权，请联系我们删除。