RDAgent
🤖 自动化模型研发协作助手
📖 背景
在快速发展的人工智能领域,每年发表的学术论文数量呈爆炸式增长。这些论文引入了新的模型、技术和方法,可以显著推动该领域的进步。然而,复现和实现这些模型是一项艰巨的任务,需要大量的时间和专业知识。研究人员在从论文中提取关键细节并将其转化为功能性代码时,经常面临挑战。这正是**通用模型协作助手(General Model Copilot)**发挥作用的地方。
🎥 演示
🌟 简介
在此场景中,我们的自动化系统在一个持续、迭代的过程中,进行假设提出、模型构建、代码实现、回测分析,并利用反馈。该系统旨在自动优化 Qlib 库中的性能指标,并通过自主研发找到最优代码。
模型研发协作助手场景
概览
此演示自动化了从学术论文中提取和迭代开发模型的过程,确保其功能性和正确性。该场景通过阅读学术论文或其他来源,自动化 PyTorch 模型的开发。它支持多种数据类型,包括表格数据、时间序列数据和图数据。主要工作流程涉及两个核心组件:阅读器(Reader)和编码器(Coder)。
工作流程组件
-
阅读器
-
解析并从学术论文或来源中提取相关的模型信息,包括架构、参数和实现细节。
-
使用大型语言模型将内容转换为编码器可用的结构化格式。
-
-
演进式编码器
-
将阅读器提供的结构化信息转换为可执行的 PyTorch 代码。
-
利用演进式编码机制,通过使用样本输入张量验证,确保张量形状正确无误。
-
迭代优化代码,使其与源材料的规范保持一致。
-
支持的数据类型
-
表格数据: 具有行和列的结构化数据,例如电子表格或数据库。
-
时间序列数据: 按时间顺序索引的连续数据点,对预测和时间模式识别非常有用。
-
图数据: 以节点和边形式组织的数据,适用于网络分析和关系型任务。
⚡ 快速入门
请参考**《安装与配置》**文档中的安装部分,以准备您的系统依赖项。
您可以通过运行以下命令来尝试我们的演示:
🐍 创建 Conda 环境
使用 Python 创建一个新的 Conda 环境(我们的持续集成环境已对 Python 3.10 和 3.11 进行了充分测试):
conda create -n rdagent python=3.10
激活环境:
conda activate rdagent
📦 安装 RDAgent
您可以从 PyPI 安装 RDAgent 包:
pip install rdagent
🚀 运行应用
将相关论文(PDF 格式)上传到以下目录,并复制其路径作为 report_file_path
。
rdagent/scenarios/general_model
在同一虚拟环境中,在您的终端中运行以下命令:
rdagent general_model --report_file_path=<pdf文件的路径>
使用 MongoDB Atlas,您可以轻松构建由生成式人工智能(GenAI)驱动的应用程序,无需单独的数据库。