国产大模型Kimi能否“登月”

才艺展示 76280

  近日,能一气吞下200万字的国产大模型Kimi爆火,引燃人工智能领域新一轮投资热情。Kimi由成立仅一年的人工智能初创公司月之暗面(Moonshot AI)研发,公司创始人杨植麟多次用“登月”来描绘他的通用人工智能(AGI)梦想。Kimi能否如愿“登月”?

  一看目标是否远大。

  通用人工智能,指具备与人类同等智能或超越人类的人工智能。短短几年前,大部分人还认为通用人工智能是一个遥不可及的目标。一年多前,美国公司OpenAI的ChatGPT产品引爆人工智能大模型热潮,让不少人觉得通用人工智能实现在望,大模型赛道出现百舸争流盛况。截至2023年年底,我国累计发布了200多个人工智能大模型。大模型的巨大投入和高风险,让一些业内人士持观望批评态度。甚至有人认为国内大模型与美国差距太大,跟不上,白烧钱,不如采取底层技术搭美国便车、用开源大模型做应用层创新的跟进策略。

  盲目烧钱一哄而上,诚然不可取。然而树无根不长,人无志不立。如果将实现通用人工智能比作登月工程,ChatGPT并未登上月球,而是跟其他大模型一样处于火箭原型测试阶段。大模型爆火一年多来,中美之间的实际差距在缩小,我们完全没必要轻言放弃。瞄准人工智能领域的第一性原理,通用人工智能就是核心,第一个拿到AGI门票的公司可以从那一刻起降维打击,实现赢家通吃。月之暗面公司以初生牛犊不怕虎的精神志指“登月”,堪称目标远大,值得期许。

  二看特长是否突出。

  人工智能也需要差异化竞争。月之暗面公司精准把握用户需求和应用场景,打造出具有记忆点的产品Kimi智能助手,引领了人工智能的“长文本”时代。OpenAI官方去年11月发布的GPT-4 Turbo支持128k上下文,大约相当于10万汉字。而Kimi智能助手在去年10月首次亮相时,就可支持20万汉字的无损上下文长度,是大模型产品里这一单项能力的冠军。仅仅5个月后,月之暗面公司就宣布把Kimi的这一能力提升到了全新的数量级200万汉字。

  升级后,过去人类要10000小时才能成为专家的领域,现在交给Kimi智能助手,只需要10分钟。有一个演示鲜明地展现了Kimi高超的“吃瓜”智能。使用者将《甄�执�》剧本传给Kimi,再问它哪些细节表明甄�值暮⒆邮枪�郡王的?Kimi能在不同时间段、各个场景的故事情节中,深入挖掘出相关线索并一一列出,堪比一个看了几十遍电视剧的“甄”学家。

  文本长度受限带来的“碎片化”输入,常常降低人工智能的“智能”。一篇英语长文如果让大模型来翻译,受限于输入长度要分割成几块,就可能出现前后不一致,比如“chair”在第一段输入时被译成“主席”,在第二段输入时被译作“椅子”。Kimi的长文本输入就解决了这个问题,比起“聊天机器人”,更像一个“智能助手”。Kimi远超同侪的长文本能力解锁了更多可能,包括完整代码库的分析理解、可以自主帮人类完成多步骤复杂任务的智能体、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等。这也让“长文本”有望成为“登月”的第一步。

  当然,目标远大、特长突出,只是“登月”的必要条件,而不是充分条件。展望未来,最成功的AGI公司必将超越现在的所有人工智能公司。它不一定是OpenAI,也不一定是月之暗面,但中国公司需要“登月”这样目标远大的理想,国产大模型也需要“登月”这样富有竞争力的技术储备。 (本文来源:经济日报 作者:佘惠敏)