NVLM 1.0

NVLM 1.0画像とテキストを理解する、次世代のマルチモーダル LLM

NVLM 1.0 は、最先端の画像とテキストを組み合わせたマルチモーダル LLM のファミリーです。GPT-4o や Llama 3-V 405B、InternVL 2 などの主要なプロプライエタリモデルおよびオープンアクセスモデルに匹敵する、最先端の結果を画像とテキストのタスクで達成します。

マルチモーダル AI

ビジョン言語タスク

オープンソースLLM

NVLM 1.0の代替品

Unsloth AI

Unsloth AI

LLMs のオープンソーストレーニングとファインチューニング

Llama 3.1 by Meta

Llama 3.1 by Meta

どこでもカスタマイズして展開できるオープンソースAI

BerriAI

BerriAI

すべての LLM API を OpenAI のように呼び出します [100 以上 LLM]

GradientJ

GradientJ

大規模言語モデルアプリケーションを構築するためのプラットフォーム

Airtrain AI

Airtrain AI

ノーコードの LLM ファインチューニングと評価。

Llama

Llama

3.1-405B: GPT-4o / Claude-3.5に匹敵するオープンソースモデル

Xylem AI

Xylem AI

LLM のファインチューニングと推論のための高速でスケーラブルなインフラストラクチャ。

Automorphic

Automorphic

わずか10個のサンプルで、言語モデルに知識を注入

Atla

Atla

私たちは、世界で最も優れたAI評価モデルと、開発者向けの言語モデルの潜在能力を最大限に引き出すためのツールを構築しています。

Ollama

Ollama

大規模言語モデルをローカルで使い始めましょう

Encord

Encord

より良いビジョンモデルをより速く構築するために必要なすべてのツール

Felafax

Felafax

NVIDIA を超えた AI インフラストラクチャの拡大

Datacurve

Datacurve

LLMトレーニングのためのキュレートされたデータ

NVLM 1.0 screenshot

NVLM 1.0

NVLM 1.0は、最先端のマルチモーダル大規模言語モデル（LLM）のファミリーであり、ビジョンと言語のタスクで最先端の結果を達成し、主要なプロプライエタリモデル（例：GPT-4o）やオープンアクセスモデル（例：Llama 3-V 405BおよびInternVL 2）に匹敵します。注目すべきは、マルチモーダルトレーニング後、NVLM 1.0は、そのLLMバックボーンよりも、テキストのみのタスクで精度が向上していることです。私たちは、コミュニティのために、Megatron-Coreのモデルウェイトとトレーニングコードをオープンソース化しています。

Product Highlights

機能1: ビジョンと言語のタスクで最先端の結果を達成します。
機能2: テキストのみのタスクで精度が向上します。
機能3: オープンソースです。

Use Cases

ユースケース1: NVLM 1.0は、画像とテキストに関連する質問に答えるために使用されます。
ユースケース2: NVLM 1.0は、画像の記述的なテキストを生成するために使用されます。
ユースケース3: NVLM 1.0は、テキストと画像を分析し、論理的な推論を実行するために使用されます。

Target Audience

NVLM 1.0は、マルチモーダルアプリケーションの構築に関心のある研究者や開発者によって使用されます。

NVLM 1.0の代替品

Unsloth AI

Unsloth AI

LLMs のオープンソーストレーニングとファインチューニング

Llama 3.1 by Meta

Llama 3.1 by Meta

どこでもカスタマイズして展開できるオープンソースAI

BerriAI

BerriAI

すべての LLM API を OpenAI のように呼び出します [100 以上 LLM]

GradientJ

GradientJ

大規模言語モデルアプリケーションを構築するためのプラットフォーム

Airtrain AI

Airtrain AI

ノーコードの LLM ファインチューニングと評価。

Llama

Llama

3.1-405B: GPT-4o / Claude-3.5に匹敵するオープンソースモデル

Xylem AI

Xylem AI

LLM のファインチューニングと推論のための高速でスケーラブルなインフラストラクチャ。

Automorphic

Automorphic

わずか10個のサンプルで、言語モデルに知識を注入

Atla

Atla

私たちは、世界で最も優れたAI評価モデルと、開発者向けの言語モデルの潜在能力を最大限に引き出すためのツールを構築しています。

Ollama

Ollama

大規模言語モデルをローカルで使い始めましょう

Encord

Encord

より良いビジョンモデルをより速く構築するために必要なすべてのツール

Felafax

Felafax

NVIDIA を超えた AI インフラストラクチャの拡大

Datacurve

Datacurve

LLMトレーニングのためのキュレートされたデータ

週間トップ10製品