图说:星环科技大厅展示的数据+AI基础设施产品魔方 新民晚报记者 陶磊 摄(下同)

7月初,2024世界人工智能大会又将如约在上海拉开大幕。不用说,今年的关键词一定是“大模型”。据介绍,目前全市已有34款大模型通过备案,产生了制造业、金融、具身智能机器人等垂类领域应用。

20日,记者跟随大会主办方走进两家人工智能头部企业,一探大模型的行业现状。

把大模型训练成“理科生”

星环科技致力于打造企业级大数据与人工智能基础软件,围绕数据的集成、存储、治理、建模、分析、挖掘和流通等数据全生命周期提供基础软件产品,构建明日数据世界。“大模型相关技术已融入企业生产经营的方方面面。”星环科技创始人、CEO孙元浩指出,“大模型主要优势是提供了自然语言理解能力,还有简单的推理能力,并能在个人指导下调动工具。”

孙元浩说,目前来看,大模型落地过程中遇到了很多挑战,今年以来大家开始理性看待大模型具体能带来什么,“在大模型落地过程中,逐渐显现出一些难点,如技术执行、实施成本、相关技术人才的缺乏、生成式人工智能的治理、数据可用性等等。”

图说:工作人员演示星环科技大模型产品

立足于大数据基础软件优势,星环科技是国内第一批推出自研大模型的软件信息公司。早在2023年5月,公司就推出了业界首创的金融大模型“无涯”,以及大数据分析大模型SoLar“求索”。在孙元浩看来,当下众多AI大模型更像“文科生”,而星环科技的目标是将大模型训练成“理科生”,能够进行数学分析,懂得自然科学的各个学科,从而解决企业运营过程中的实际问题。

就在不久前,星环科技推出了“问知”AIPC版,它支持多格式、不限长度的文件资料入库,还支持影、音、图、文等多模态数据的“知识化”处理,以及“语义化”查询和应用能力。值得关注的是,这是一款为个人用户设计的大模型应用产品,可以在配备Intel新一代CPU的主流个人电脑上,基于集成显卡和NPU流畅运行。

“模型的建构和人的发展有诸多相似之处。一个人很难熟知所有科学知识,这就需要不同领域的专家,专业模型亦是如此。”孙元浩告诉记者,“星环科技通过收窄模型的应用领域,训练出不同垂类的专业模型,然后将这些专业模型组合成大模型。这在保证模型专业度的同时,大大降低了模型的训练代价和推理代价。”

坚信Scaling Law 选择“厚积薄发”

阶跃星辰是一家通用大模型创业公司,自成立起在算力、系统、数据和算法这四大要素上综合布局,已对外发布Step系列大模型;同时,通过自有产品和合作产品两种方式探索C端应用,已推出的产品包括个人效率助手“跃问”和 AI 开放世界平台“冒泡鸭”。

图说:阶跃星辰展厅展示的文生广告图

“GPT-4有万亿参数,而人脑的神经元连接是200万亿。”阶跃星辰系统负责人朱亦博博士打比方说,这家坐落于徐汇西岸智塔的初创公司信仰Scaling Law(规模法则),认为在肉眼可见的未来,至少还有十万亿和百万亿两个数量级的大模型。面对喧嚣的“百模大战”,阶跃星辰选择了“厚积薄发”,朱亦博说,攀登Scaling Law的巅峰,毕竟是一个包含算力、系统、数据和算法的“铁人四项”超级工程。

低调了近一年,阶跃星辰在今年三月“初露锋芒”——发布Step系列大模型,包含了Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型,以及Step-2万亿参数MoE(混合专家架构)语言大模型预览版。“Step-1V一经发布便登上了权威大模型评测平台‘司南’的多模态大模型3月榜榜首。”朱亦博介绍,“Step-1V的多模理解能力突出,可以精准描述和理解图像中的文字、数据、图表等信息,并根据图像信息实现内容创作、逻辑推理、数据分析等多项任务。”

阶跃星辰的研发团队觉得,通用大模型未来还能走得更远,“模型要大,多模态理解和生成的统一是通往AGI的必经之路。”作为一家初创公司,阶跃星辰也很务实,会大方地承认“还在追赶GPT-4”。“OpenAI发布的模型在不断迭代,我们现在的模型也还在打磨。希望不久的将来,能有对标GPT-4的水平。”朱亦博坦言。

图说:阶跃星辰工作人员介绍AI智能助手“跃问”

朱亦博告诉记者,如果大语言模型要上万亿参数,MoE架构可以说是最优解,“MoE是在性能、参数量、训练成本、推理成本这些维度权衡下的最佳选择。”

值得一提的是,阶跃星辰Step系列通用大模型凭借其技术创新和广泛的落地应用,已经成功入选2024世界人工智能大会SAIL奖30强榜单。阶跃星辰基于Step系列大模型推出了一款个人效率助手“跃问”,在本届世界人工智能大会上也会带来最新的产品功能体验。

新民晚报记者 郜阳

友情提示

本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!

联系邮箱:1042463605@qq.com