
MolmoWeb
ウェブサイトの操作を理解し、自動的に実行できる、オープンソースのマルチモーダルAIシステム。
MolmoWebは、Allen Institute for AI (AI2) が開発した、ウェブタスクを自動化するためのオープンなビジュアルウェブエージェントです。オープンモデルとトレーニングデータ、評価ツールを提供します。

MolmoWebについてもっと知る
MolmoWeb
MolmoWebは、ウェブタスクを自動化するためのオープンなビジュアルウェブエージェントです。Molmo 2のマルチモーダルモデルファミリーを基盤とし、ウェブサイトのナビゲーション、フォームへの入力、情報の抽出など、幅広いタスクを処理できます。自己ホスト型の展開が可能で、研究者や開発者が自由に利用できます。
- •ウェブサイトの視覚的理解:スクリーンショットからウェブサイトを理解し、人間の操作と同様に、クリック、入力、スクロールなどのアクションを実行します。
- •オープンソースのトレーニングデータ:MolmoWebMixは、人間によるアノテーションと合成データで構成され、ウェブエージェントのトレーニングに特化した大規模なデータセットを提供します。
- •多様なウェブタスク対応:複数のページにわたるナビゲーション、フォームへの入力、検索、製品リストのフィルタリングなど、様々な日常的なウェブタスクを処理します。
- •自己ホスト型展開:ローカルまたはクラウドサービスで自己ホストできるため、ユーザーはMolmoWebを自由にカスタマイズし、特定の用途に最適化できます。
- •リアルタイムなブラウザ操作:タスク指示と現在のウェブページに基づいて、次のステップを予測し、ブラウザアクションを実行します。
- •オープンなモデルとコード:モデル、トレーニングデータ、コード、評価ツールを公開し、研究開発の透明性と再現性を高めます。
MolmoWebは、ウェブを理解し、操作する能力を持つ画期的なツールです。これにより、情報へのアクセスが向上し、デジタルサービスの利用が容易になります。MolmoWebのオープンな性質は、安全なウェブ自動化のための研究開発を促進し、ウェブエージェントの可能性を広げます。










