21世纪经济报道记者杨清清、实习生陈雨若 北京报道
4月20日,出门问问在2023 AIGC战略发布会上宣布内测探索大模型“序列猴子”。
(相关资料图)
据介绍,出门问问大模型“序列猴子”是一款具备多模态生成能力的大语言模型,模型以语言为核心的能力体系涵盖“知识、对话、数学、逻辑、推理、规划”六个维度,能够同时支持文字生成、图片生成、3D内容生成、语音生成和语音识别等不同任务。
从现场演示看,“序列猴子”已经具备一定自然语言理解、知识、逻辑以及推理等能力,对于“湖南和湖北哪一个省会的人口更多?”这类比较复杂的问题,能快速给出准确结果。
“如果说GPT-4是100分,我们的模型是50分。”出门问问创始人兼CEO李志飞坦言。他指出,目前“序列猴子”还需解决三大问题:结合个性化数据回答问题、降低胡说八道的概率和增强上下文的记忆能力。
李志飞表示,“序列猴子”在训练过程中已经展现出了“涌现”能力,目前正处于“顿悟”阶段,未来提升的速度会越来越快。
据介绍,出门问问自研大模型中文名“序列猴子”的灵感,来源于数学家埃米尔·波雷尔在20世纪初提出的“无限猴子”定理。根据该定理,如果一群猴子随机地敲打一台打字机,最终一定会产生完整的莎士比亚作品。这个定理基于概率论和组合数学,阐释了概率的统一性。
出门问问自研大模型的构建原理与“无限猴子”类似,海量文本序列通过出门问问自主算法的不断训练,经由大规模算力消化理解,便练成了“序列猴子”。
李志飞还表示,大模型不只是参数量大,当今的大模型是互联网文本的深度建模,而互联网文本是世界知识的映射,因此大模型是一个认知模型,是对语言的建模。而语言是思维的边界,所以大模型拥有无限想象空间。
除推出大模型之外,出门问问还同步推出面向创作者的CoPilot产品矩阵、面向C端的升级版语音助手魔法小问。其中,面向创作者的CoPilot产品矩阵包含AI写作平台“奇妙文”、AI绘画平台“言之画”、AI配音平台“魔音工坊”和数字人视频与直播平台“奇妙元”。
与此同时,基于“序列猴子”大模型的底层能力,出门问问还推出面向B端的企业专属大模型的内测探索。有需求的企业用户可以登陆web端调用API服务,并且能通过上传文档的方式,对行业专有内容进行训练,从而实现定制化语音交互。目前,出门问问已经与首批十大行业的内测探索伙伴达成合作,包括汽车、教育、律所、金融、医疗、旅游等。
关键词: