选取一段核酸酶的基因序列,一键预测蛋白质结构;通过更改碱基对,一键设计优化蛋白质结构。这是上海衍因科技有限公司(以下简称“衍因科技”)创始人陈泽平在昨天举行的新品发布会上所展示的内容。
以大模型、人工智能为代表的数智化技术在各行各业引发了一场效率变革。在细胞与基因治疗、合成生物学等新兴赛道的科学研究过程中,数智化技术如何提升科研工作者的效率,正成为浦东科技企业积极探索的课题。
12月12日,浦东企业衍因科技基于自研的生物医药垂类大模型,推出国内首个基因组尺度大模型平台——衍因智研云®MEGASphere,将实现从分子到基因组尺度的序列建模与设计,为基因组编辑、基因治疗等领域提供强大的技术支持,助力生物医药研发智能化变革。
未来5年 服务10万名生物医药科研工作者
今年诺贝尔奖公布后,AI成了最大赢家。基础科研领域,人工智能的加速作用受到科研工作者的关注。那么在注重研发的生物医药领域,人工智能、大模型技术将如何引领技术变革呢?
发布会上,陈泽平展示了蛋白质3D结构、自动引物设计等多种应用场景。据悉,在利用该平台技术应用的自动引物设计场景方面,衍因科技将携手合作伙伴共同推出基因编辑CRISPR实验设计智能体。
“我们希望通过AI大模型算法,专注于CRISPR-Cas系统设计、蛋白质功能预测、基因组建模,以及利用小样本强化学习提升研究效率。”谈到最新发布的国内首个基因组尺度大模型平台,陈泽平表示。此外,在模型层面,衍因科技还将构建DNA、RNA,蛋白质和密码子的语言模型,以及长上下文基因组基础模型,深入解析生物信息。
据悉,衍因智研云®MEGASphere是面向生物基础科研领域的大模型平台,涵盖了基于该平台构建的智能应用。其模型平台包括生物基础模型、科研垂类模型和科研知识模型三大类别的自研和开源模型,提供了训推一体的模型服务中台;其智能应用包括智能生物大分子建模和模拟、智能实验设计和任务管理、智能知识和科研数据管理三大方面,覆盖了生物科研实验的核心环节,为生物基础科研提供了智能化的解决方案。
“未来5年衍因科技将打造全国最大的生物医药科研协作社区,免费帮助10万名从事生物医药研究的科研工作者、在校学生,真正让科研人员用得起来,用得顺手,用得放心。”陈泽平说。
“模力社区” 推动更多大模型应用场景落地
据了解,衍因科技成立于2023年,专注于生物医药AI大模型科研领域的垂直应用,利用智能分子克隆、AI自动引物设计、AI智能文献等技术,为全国各大院校、研究机构和制药企业提供高效、智能的科研服务。记者注意到,作为首批入驻浦东产业新地标“模力社区”的科技企业,衍因科技目前已入选《浦东生命科学产业服务生态图谱V1.0》,并受邀加入张江AI新药研发联盟。
如今,数智化技术在提升生物医药企业设备、样品、库存等管理效率方面发挥着日益重要的作用。衍因科技还在线发布了智研云平台最新的迭代模块——智研库存、智研设备、智研样品、智研知识库。随着这四大模块的迭代升级,衍因科技基于AI大模型企业级生物科研协作平台1.0正式推向市场。
该公司于今年4月就已推出衍因智研云1.0产品,目前该产品用户已覆盖30多家创新药企、190家科研院所和医院、300多所高等院校,其中生物科学专业前100所高校覆盖率达到94%。在此基础上,衍因科技根据客户应用反馈,研发出更多的科研实验室管理功能,如实验室的库存管理、设备管理、样品管理以及文献知识管理。
陈泽平介绍,样品管理是医药科技企业亟须解决的问题。而最新上线的智研样品模块,通过样品库结构设计、位置设定等配置,实现了样品从注册到申领的全流程管理。知识库管理模块收录了上万篇顶级生物期刊文献,可以向用户推荐最新的热门实验方法,并利用人工智能技术解读实验方法实现多轮问答,推荐上下文,提升用户的阅读效率。
“未来5-10年的智慧科研实验室,一定会实现三大融合,即干实验与湿实验的融合、数据与科研实验室的融合、AI与科研实验室的融合。在科研的设计、采购、执行、分析过程中,AI和自动化技术会发挥更大的作用。”他表示。
在此理念下,衍因科技针对科研实验室搭建设计为四个步骤:搭建科研数据管理平台;在数据建模完善的情况下,将实验执行阶段逐步数字化;通过大模型AI Agent的使用,实现实验设计的数字化;将干湿实验所有的数据建模分析,实现完整的实验ROI分析。
“灵活性、成长性、开放性”,是此次发布的企业级生物科研协作平台具有的三大特色。未来,科研人员使用协作工具时,可以在线协作,提升效率,为公司留下重要的实验原始数据;项目管理者使用管理功能时,可以提升科研效率,降低科研成本,为公司保存完整的研发数据和ROI提效管理;企业则可以与上下游CRO连接时,从物料订单到合成订单,完整的上下游交易数据,轻松核对台账。