MM-InstructEval: التقييم بدون تدريب لنماذج اللغة الكبيرة متعددة الوسائط في مهام التفكير متعددة الوسائط | Synapse