Thunder Compute 创建了虚拟 GPU-over-TCP 技术(我们称之为 PCI-v),它支持一种新型的云实例。我们可以用一条命令立即连接或断开任意数量的 GPU,高效地在任务之间切换,并共享单个 GPU。 这将创建一个能够适应任何开发工作流的云实例。 详细说明,这种灵活的环境可以从廉价的仅 CPU 开发机器开始,并立即扩展到成为一个大型集群。开发人员可以直接访问他们需要的资源,以消除在官僚审批流程和配置上花费的时间。 此外,这项技术可以通过几种方式为组织降低成本: 1) 我们可以使用动态内存共享,将多个工作负载同时放在一个 GPU 上。这使得能够实现类似于今天在 AWS 上看到的 vCPU 的系统,其中每个用户都能完全访问整个 GPU,同时允许我们使用物理 GPU 上的任何空闲容量来为其他用户提供服务。 2) 开发人员可以与共享池化 GPU 资源的仅 CPU 实例交互。这消除了预留的概念,并创建了一个系统,在这个系统中,GPU 永远不会绑定到单台机器。 有趣的是,这似乎是为无服务器 GPU 计算提供的最有效的技术。我们通过将 GPU 环境与物理 GPU 分离,实现了实际上是瞬时的冷启动,从而允许任何 GPU 立即在任何任务之间切换,而无需通过加载新环境来执行 \"冷启动\"。
实时保存、迁移和恢复计算作业
GPU 云市场
Aedilic 正在构建 gpudeploy.com
快速开发 AI 项目
在您的云计算上运行本地 Jupyter 笔记本
为微调和推理LLMs提供快速、可扩展的基础设施。
与志同道合的专业人士进行一对一对话
从 Slack 混乱到清晰,只需几分钟
在不到 30 分钟的时间内个性化数千个着陆页
首个用于文档解析的 LLM,兼具准确性和速度
面向 SaaS 专业人士的 AI 助手
带实时翻译功能的 AI 电话应用程序
令人愉快的 AI 支持的互动演示—现在无需登录
AI 动态图形副驾驶
抛洒彩带,摆脱压力和焦虑,100% 无需人工智能
SaaS 的顺畅支付