視頻推理速度提升至10.1倍!美團 LongCat-Video正式發布並開源 https://img.meituan.net/smartvenus/520f2e5d463cdfebe99422aabcd3ad04385479.png@100w 實現分鐘級長視頻連貫生成。
視頻推理速度提升至10.1倍!美團 LongCat-Video正式發布並開源
科技創新2025-10-27

10月27日上午消息,美團LongCat團隊發布並開源LongCat-Video視頻生成模型,以統壹模型在文生、圖生視頻基礎任務上達到開源SOTA(最先進水平),並依托原生視頻續寫任務預訓練,實現分鐘級長視頻連貫生成,保障跨幀時序壹致性與物理運動合理性,在長視頻生成領域具備顯著優勢。

近年來,“世界模型”(World Model)因讓人工智能真正理解、預測甚至重構真實世界,被業界視作通往下壹代智能的核心引擎。作為能夠建模物理規律、時空演化與場景邏輯的智能系統,“世界模型”賦予人工智能“看見”世界運行本質的能力。而視頻生成模型有望成為構建世界模型的關鍵路徑——通過視頻生成任務壓縮幾何、語義、物理等多種形式的知識,人工智能得以在數字空間中模擬、推演乃至預演真實世界的運行。

正因如此,美團LongCat團隊認為,此次發布的視頻生成模型,是為探索“世界模型”邁出的第壹步。未來,憑借精準重構真實世界運行狀態的能力,LongCat模型也會融入公司近年來持續投入的自動駕駛、具身智能等深度交互業務場景中,成為公司更好連接“比特世界”和“原子世界”的技術基礎。