World Models
May 24, 2026
|AI
Free AccessAbstract
نستعرض في هذا البحث بناء نماذج شبكات عصبية توليدية لبيئات التعلم التعزيزي الشائعة. يمكن تدريب "نموذج العالم" الخاص بنا بسرعة وبطريقة غير خاضعة للإشراف لتعلم تمثيل مضغوط للمكان والزمان للبيئة المحيطة. من خلال استخدام الخصائص المستخرجة من نموذج العالم كمدخلات لوكيل اصطناعي، يمكننا تدريب سياسة بسيطة ومدمجة للغاية قادرة على حل المهمة المطلوبة. بل ويمكننا أيضاً تدريب وكيلنا بالكامل داخل أحلامه المهلوسة التي يتم توليدها بواسطة نموذج العالم الخاص به، ومن ثم نقل هذه السياسة مرة أخرى إلى البيئة الفعلية.
Comments
1 comment
Please sign in to join the peer discussion timeline.
Sign InI recently saw Google has Genie 3 as a world model ( where you can prompt a play the game, or play it from a screenshot/image ). https://deepmind.google/blog/genie-3-a-new-frontier-for-world-models/