联想研究院范建平:AIPC的解决方案是多层次混合智能

关注
个人智能体模型与PC的结合

8月22日,2024AGI商业趋势大会在深圳成功举行。大会由创业邦主办,南山区科技创新局、西丽湖国际科教城融合创新中心、深圳市“模力营”AI生态社区为支持单位,揽胜运动为大会指定用车,搜狐为战略合作媒体。现场汇聚数十位AI业界重量级行业人士,共话AIGC与大模型的技术趋势和商业未来。

image.gif

在下午的演讲环节,联想集团副总裁、联想研究院人工智能实验室负责人范建平博士展示了联想在AI PC领域的端侧个人智能体。

通过大模型压缩、定向增强、异构推理加速和混合意图理解等技术,联想成功地将大模型部署到了端侧设备中,并在业界率先推出具备五大特性的真正意义上的AI PC:内置个人大模型与用户自然交互的智能体、本地异构算力(CPU/GPU/NPU)、个人知识库、开放人工智能应用生态、个人数据和隐私安全保护。

以下为演讲内容,经创业邦整理后发布。

AI PC的关键能力:记忆、规划、知识、理解和自我认知

自从大型模型问世以来,我们知道它们非常强大,但同时也非常庞大。如何将这些庞大的模型集成到个人电脑中?这就像是在狭小的空间里施展技艺,极具挑战。我们需要保持必要的功能,同时去除不必要的部分。

因此,我们采用终端侧的大型模型作为智能体的大脑。显然,由于它比ChatGPT小,模型本身的能力可能不如ChatGPT。但我们可以通过增强额外的能力,比如记忆能力,任务规划能力,将复杂任务分解为能够完成的多个小任务,从而实现更棒的个性化服务和更好的交互体验。同时因为个人电脑是生产力工具,还需要构建知识库和工具库。如何让我们的PC用户更有效地完成日常工作,更好地理解用户,这是知识库和工具库的任务。

另一个是理解能力,如何通过多样化的客户输入来理解其意图,并根据意图完成任务。

还有智能体的画像。实现智能一个重要的标志是清晰地知道自己的能力边界,所以明白自己能做什么不能做什么,对于智能体来说也非常重要。

总之,我们构建了高性能的本地个人智能体的架构。除了大型模型,我们还要添加其他独特的组件,以更好地高效地完成客户的任务。

联想之AI_PC创新:个人智能体模型与PC的结合

第一,我们面对首一项任务是如何将大型模型集成到个人电脑中。个人电脑的内存是有限的,而大型模型的特点是大。首先要做的就是压缩,如何将大型模型压缩到几乎不影响其性能,并且能够部署到个人电脑中,我需要进行大量的高质量压缩工作。

通过对大型模型的理解,我们发现它们像人一样,知识是分层的。我们可以对不同的区域、不同的层采用不同的量化标准。不必要的部分,我们可以去除。就像有些人即使没有小脑也能思考一样。通过这样的一系列量化工作,我们成功地将大模型部署到个人电脑中并运行。

第二,我们所说的AI PC与传统的ChatGPT有相似之处,也有不同之处。我们希望它是一个智能的设备,不同于ChatGPT的闲聊功能。我们的产品是用来完成工作的,所以我们要强调它完成任务的能力,并抑制一些无关紧要的闲聊功能。

因此,我们需要对大型模型的能力进行有针对性的增强,并加入许多行业知识,使其具备解决问题的能力。这是我们的第二项工作。

第三,我们知道所有这些大型模型的运行都需要环境,就像人的成长需要环境一样,大型模型的运行也需要环境,我们称之为推理引擎。如何让推理引擎更好地运行大型模型?我们创造性地改进了GGUF,编写了许多底层算子来优化GGUF,形成了我们联想自己的版本。

这套全新版本其推理性能甚至超过了几个国外主流芯片公司自己的架构,导致发展到现在,他们都主动提出希望我们与他们合作,优化大型模型在他们的硬件平台上的运行能力。这在以前是完全不可想像的。

此外,我们需要真实理解用户的意图。我们知道用户的需求是多样化的,文化层次也不同,他们的输入可能与我们想象的用户需求完全不同。如何进行查询扩展,完成这些工作,以及如何理解他们的意图我们都做了一系列创新工作。

比如:当用户使用我们的AI PC时,他们想要我们做什么,是调整设备还是工具,需要进行意图理解。为此,我们提出了分层意图理解,将意图分为多个层次来理解。最重要的一步是构建所谓的知识库。因为我们知道,当大型模型缺乏私有信息时,它们是没有个性化信息的。如何让大型模型拥有自己的私有信息,同时成为一个个性化的智能体,我们需要对其进行增强。

我们已经讨论过检索和查询的增强。我们需要打开RAG,让每个组件形成一个强大的流程去做自动化,这样才能提供更好的理解和解释。我们还添加其他组件,让他们联合起来以提供更好的交互体验。

例如,知识库可以提供更好的交互体验,规划可以提供更好的交互体验增强,特别是在处理多条问题时,没有规划是无法回答问题的。还有记忆,就像人一样。每次遇到新任务时,尤其是公司的老员工,我们都会问自己:我昨天做过同样的事情吗?如果有,那我就可以调用昨天的解决方案。而且调用昨天的解决方案后,我还可以做一些小的调整,使其成为当前问题的解决方案。

把这些层次都有机结合在一起时,我们AI PC中的任务就是这样处理的。客户有多样化的输入进来,我们会进行信用评估、愉悦度提升、扩展,还会去理解其意图,会去搜索记忆,如果记忆中有相关信息,我们会进行增强的推理。如果是新任务,我们会进行任务组合,然后去调用知识库,形成更好的上下文,最后返回到大模型中,它能够与你交互,给出相关响应,而不会胡说八道。这就是我们所说的AI PC,实际上我们给个人电脑装上了一个大脑,外加一套我们自己建立的搜索引擎和理解规划引擎。

AI PC的生态系统解决方案:混合智能

其实联想是一家非常国际化的公司,非常重视生态系统,不仅仅是个人电脑,还有智能手机和整个产业链上的所有设备。当它们加上联想智能体后,可以变成一个个真正意义上的智能设备。

所谓的智能解决方案就是,我们根据客户的需求理解和安全要求来进行处理。如果这个请求非常适合个人业务,那么我们就会在个人电脑中寻找答案;如果用户意图与企业级的知识相关,那么我们会在企业级知识库中寻找答案;如果只是纯粹的闲聊,那么我们偶尔会把它交给第三方大模型,让它随意地进行闲聊。

这就涉及混合智能,而且它多层次的,除了上面提到的生态系统中的混合智能设备,还涉及端侧模型,云端大型模型,以及企业的私有大模型,当然也包括混合理解。例如,过去一两年的AI,主流是数据驱动的深度学习。现在我们则是在考虑结合了数据驱动和知识驱动的AI。

我们希望能够将这两样东西有效地整合,发挥各自的优势。记得我在中科院读博士的时候,我们当时要做一套纠错系统,如果你年龄稍微大一点的话,你就知道那时中国的VCD机最大的特点是什么错都能纠。我们创造性地采用了长短码两种设计,当时的想法是这样的,让天才去做天才的事情,让苦力劳动者做苦力的事情。相互之间发挥各自的优势。

回到AI PC,其实它也需要数据和知识联合微调。因为通用大模型它是没有企业数据的,我们如何进行知识和数据的联合微调?而且还有非常重要的一点是,AI PC是一个异构计算系统,需要CPU、NPU、GPU的联合推理,根据各自的可用性和各自的能力,去调配我们的任务。

还有一个混合就是大小模型,就是我们的工具箱里有很多小模型在一起,我们的大模型可以灵活地调用这些小模型,来实现最好的性能。

我们未来还会去做所谓的MOE,就是我们不是混合专家,更像是一个混合AI代理。我们团队做过混合还有深度提升等技术,这些都可以给我们提供很好的思路和背景,来做好未来的混合AI代理。


9月19-20日,更多的创新者将登上2024 DEMO CHINA的舞台。让我们相约·成都,一起见证更多超能勇士的崛起。

WX20240827-184601@2x.png

反馈
联系我们
推荐订阅