“湖北造”原创深度思考大模型来了 全球首创数推分离
当前,人工智能产业加速发展,人工智能大模型也在不断迭代升级。
在湖北,由传神语联全原创自主开发的任度大模型,今天全新升级。全新发布的任度双脑深度思考大模型-T1,也和DeepSeek等开源大模型一样支持深度思考。但,这个“湖北造”大模型,不仅从底层算法框架到上层应用的全部自主研发,而且算力等成本将下降至十分之一。
在传神语联,长江云新闻记者体验了全新发布的任度双脑深度思考大模型-T1,输入一道数学题,系统立刻开始了深度思考。十几秒时间,从解题思路到选取公式,再到计算步骤,系统清晰展示了大模型解答数学题的完整思路,并最终给出答案。
“他对问题本身的理解其实更接近于人脑”,传神语联网网络科技股份有限公司研发部总监吕华在接受长江云新闻记者采访时介绍,“他对用户所提供的问题、上下文的理解会更加深入,会不断去校正答案,更加理解用户意图,然后给出更加准确的答案。”
与此同时,任度双脑深度思考大模型-T1还能将这个思考的过程通过结构化的方式展示出来,提升用户体验。“不管是在用户的体感上还是系统性能上,基本上跟现在市场上的主流大模式没有差距。”吕华介绍说。
支持深度思考的功能背后,其实是一套全部由传神语联自研原创的算法框架和上层应用。“其实市场上不管是一些商业的大模型,还是一些主流的开源大模型,其实都是基于现在国际上主流传统的架构上去构建自己的大模型,也就是说我们底层核心的基座其实是在国外企业,包括一些国外开源社区手上。”吕华介绍,在20年前,传神语联创立之初,就在走自主研发道路。目前已经实现了从底层算法框架到上层应用的全技术栈自主研发成果,未使用任何开源代码和框架。“每一行代码都是由我们自主研发的,完全安全,自主可控,没有任何开源的依赖,如果说项目对数据安全要求特别高,那么这套系统就具备优势。”目前,任度大模型也已经通过中国信息通信研究院“零开源依赖”的评测。
常见的大模型多采用数据和推理一体化模式,如同只有一个“大脑”进行集中式处理;而任度大模型全球首创的“数推分离”模式,相当于在同一体系中拥有数据网络和推理模型两个独立运作的“大脑”。在完成训练阶段后,推理网络能够阶段性固定,确保已有推理能力稳定可靠;而数据学习网络则保持开放状态。“就像U盘一样,把新数据直接插到我们的数据网络上面,不用在训练引擎里面再重新训练一遍。”吕华介绍。
这也意味着,模型参数的下降,应用成本的降低。“基本上市面上现在主流的大模型都会在六七千亿甚至上万亿的参数规模,背后其实需要大量的算力去支撑这些模型运行,我们的参数规模是他们的1%,对应的训练也下降了,基本上五分之一至十分之一。”吕华介绍说。
大模型如何应用落地?不少企业选择本地去部署大模型,保障数据安全。从传神语联最新发布的数据来看,任度大模型部署成本也可以达到同等性能大模型的二分之一到五分之一。
目前,任度大模型已经成功应用在金融、医疗、教育等多个领域。吕华介绍,“下一步,传神语联还将推进成立根原创联盟,将整合更多的国内优秀企业,一起共同去推进国产完全自主可控的AI研究和应用的落地。进一步打造国产原创的大模型生态,让国产大模型从底层架构到行业垂直应用落地,全面自主可控。”
长江云新闻记者 李悦 陈芳芳 通讯员 龚吉祥
编审 向秀
