Relari logo

Relari用于 GenAI 系统的测试和模拟堆栈

Relari 帮助 AI 团队在整个开发生命周期中模拟、测试和验证复杂的 AI 应用程序。 我们是 continuous-eval 背后的公司,continuous-eval 是一个开源模块化评估框架,其中包含涵盖文本生成、代码生成、检索、分类、代理和其他 LLM 用例的指标。我们的云平台生成自定义合成数据并模拟用户行为,以对 GenAI 应用程序进行压力测试并使其更加健壮。

2024-03-08
Active
Early
W24
2
B2B
Unspecified
Relari screenshot
更多关于 Relari 的信息

Relari AI - 用于评估和改进 LLM 应用程序的数据驱动型工具包

简介

Relari AI 是唯一一款专为评估和改进您的 LLM(大型语言模型)应用程序而设计的数据驱动型工具包。告别猜测,并通过自定义、高质量的数据更快地从原型到生产。

主要功能

  • 自动提示优化器: 自动改进提示以在自定义指标上表现更好。
  • 自定义评估器: 定制评估指标以衡量对您的用户最重要的内容。
  • 合成黄金数据集: 生成高质量的合成数据集以进行稳健的测试。
  • 系统化微调: 系统化地微调您的模型以提高性能。
  • 运行时监控: 实时监控应用程序的性能。

用例

  • 安全合规 AI: 利用合成黄金数据集改进迭代速度并做出明智的决策。
  • 企业 RAG: 使用合成数据集生成和确定性评估开发高质量的 LLM 体验。
  • 企业搜索: 使用自定义合成数据集对搜索引擎进行压力测试并指导关键产品决策。
  • 合规 AI: 使用自定义指标快速自动评估 LLM 管道中的更改。
  • 编码代理: 使用高质量的合成数据集对代理性能进行基准测试和验证。

定价

免费

非常适合有兴趣在本地运行开源指标的个人开发人员和研究人员。

  • 30 多个开源指标
  • 开源评估框架
  • 社区支持 (Discord、GitHub)

入门

非常适合希望通过云 API 和 UI 利用完整的数据驱动型工具套件的个人开发人员。

  • 1 个席位
  • 1 个合成数据集
  • 1,000 个使用积分/月
  • 标准评估指标
  • 自动提示优化器
  • 社区支持

团队

最适合希望通过 Relari 的专用支持大规模部署可靠 LLM 应用程序的 AI 团队。

  • 1,000 美元/月
  • 最多 5 个席位
  • 无限合成数据集
  • 10,000 个使用积分/月
  • 标准和自定义评估指标
  • 自动提示优化器
  • 专属支持 (联合 Slack 频道)

企业

最适合具有企业功能需求的 AI 团队。

  • 自定义定价
  • 自定义席位数量
  • 无限合成数据集
  • 自定义使用积分/月
  • 标准和自定义评估指标
  • 自动提示优化器
  • CI/CD 集成
  • 虚拟专用云部署
  • 内部部署
  • 具有 SLA 的专用支持

团队

Relari AI 受各个行业的 AI 先驱和团队的信赖。从安全合规到企业搜索,我们的数据驱动型方法可以帮助团队通过使用自定义合成数据集和高质量指标进行快速实验来系统地改进 AI 性能。

停止猜测并使用 Relari 的数据驱动型开发平台更快地发布。立即免费开始并增强您的 LLM 产品。