9月25日,百川智能发布baichuan2-53b 闭源大模型,全面升级了baichuan1-53b的各项能力。baichuan2-53b不仅数学和逻辑推理能力提升显著,还通过高质量数据体系和搜索增强极大降低了模型幻觉。

作为首批通过备案的大模型企业,百川智能此次还开放了baichuan2-53b api接口,正式进军to b领域,开启商业化进程。

此次开放api后,百川智能将把行业领先的大模型能力赋能给各行各业的尊龙ag旗舰官网的合作伙伴,助力万千企业智能化发展。

baichuan2-53b是百川智能发布的第6款大模型,自4月10日成立以来,该公司以平均每28天推出一个大模型的速度持续创新。

能力全面升级,数学和逻辑推理能力大幅提升

百川智能于2023年8月8日发布baichuan-53b搜索增强大模型,模型在知识问答、文学创作等方面表现优异,展现出商业文案创作、文学创作(故事续写、诗词创作)、中文理解(语义识别、成语含义、诗词分析)等多种任务场景下的强大能力。

大模型的数学和逻辑推理能力一直是业内的关注焦点,也是评价一款大模型是否领先的重要指标。在baichuan-53b的基础上,baichuan2-53b不仅重点强化了以上两个维度的能力,并且对整体能力进行了全面升级。其中,逻辑推理能力提升100%,数学能力提升31%,语言理解能力提升29%,文本创作提升18%,知识问答提升9%。

高质量数据体系和搜索增强技术加持,有效降低模型幻觉

幻觉是大模型落地应用必须跨越的鸿沟。通常而言,解决这一问题有两种方式,一种是不断增加模型的数据规模、提升数据质量;另一种是通过调用搜索等外部工具让模型能够获取实时信息。

baichuan2-53b在两个方面均做了大量优化。高质量数据构建方面,baichuan2-53b独创了一套数据质量体系。以低质、优质为标准将数据进行分类,确保baichuan-53b始终使用优质数据进行预训练。

信息获取方面,baichuan2-53b对多个模块进行了升级,包括指令意图理解、智能搜索和结果增强等关键组件。这一综合体系通过深入理解用户指令,精确驱动查询词的搜索,最终结合大语言模型技术,优化模型结果生成的可靠性,实现更精确、更智能的模型回答结果,减少模型幻觉。

在高质量数据体系和搜索增强技术的加持下,baichuan2-53b有效降低了模型幻觉。百川智能使用factool评测后的结果显示,baichuan2-53b 的综合得分为140.5,在主流基础大模型中仅排在gpt-4之后,处于国内领先水平。

factool是由上海交通大学、卡内基梅隆大学、香港城市大学、meta 等机构学者共同提出的一款通用框架,能够查核大模型生成内容的事实准确性。

开放api, 全面进军to b领域

除了能力全面升级,baichuan2-53b 还开放了api接口,企业和开发者可以通过api将baichuan2-53b集成至他们的应用程序和服务中。baichuan2-53b融合了最前沿的大模型技术,可以很好的适配不同企业的各种业务需求,无论是智能客服、智能写作还是智能推荐等各个方面。

baichuan2-53b的api接口便捷易用,客户只需要简单的配置和集成即可接入,同时其对openai的接口高度兼容,客户可以快速迁移,极大降低了模型的部署和转换成本。

对于企业用户最关注的安全合规问题,作为首批通过《生成式人工智能服务管理暂行办法》备案的大模型企业,百川智能为baichuan2-53b打造了覆盖大模型预训练、精调、推理全周期的安全增强,能够为客户和尊龙ag旗舰官网的合作伙伴提供全流程的安全保障。

借助baichuan2-53b丰富且强大的模型能力,企业用户不仅可以升级自身已有业务,提高效率、减少成本,还能够探索更多应用场景,拓展创新的边界。

未来,百川智能将持续探索大模型的能力边界,不断探索大模型技术的前沿创新,更好地赋能千行百业的智能化进程。