Woven City AI Vision Engine は、動画および画像コンテンツの解析を目的として設計された高度な Vision Language Model です。
このモデルは、カスタムプロンプトや、事前定義されたシステムプロンプトを与えることが可能で、提示された特定の問いや目的に合わせた結果を出力することができます。
これにより、正確な意図の抽出と、ユーザーのニーズに合わせた AI アプリケーションの開発が実現できます。
製品ハイライト:
● 時空間動画像認識においてトップレベルの性能*
● 様々な産業分野における画像および動画理解のサポート
● 複雑な視覚理解を可能にする短尺・長尺動画双方のサポート
● 制約環境での利用に適したエッジ最適化モデル
*公開されている MVBench リーダーボードにてトップレベルの動画認識性能を達成。
*最優秀技術成果として GENIAC Model Prize を受賞。詳細については、こちらをご参照ください。
*本製品の保証/サポートについては、提供元の規定をご参照ください。