Avanços recentes em IA Generativa multimodal têm o potencial de democratizar tarefas arquitetônicas especializadas, como interpretar desenhos técnicos e criar modelos CAD 3D, que tradicionalmente requerem conhecimento especializado. Este artigo apresenta uma avaliação comparativa de dois sistemas: GPT-4o e Claude 3.5, na tarefa de síntese arquitetônica 3D. Conduzimos um estudo de caso em dois edifícios dos Quatro Livros de Arquitetura de Palladio (1965): Villa Rotonda e Palazzo Porto. Modelos e desenhos arquitetônicos de alto nível desses edifícios foram preparados, inspirados nos textos e desenhos originais de Palladio. Através de solicitações sequenciais de texto e imagem, avaliamos as capacidades dos sistemas em (1) interpretar representações 2D e 3D de edifícios a partir de desenhos, (2) codificar os edifícios em um script de software CAD e (3) autoaperfeiçoar-se com base nas saídas. Embora ambos os sistemas gerem partes individuais com sucesso, eles têm dificuldade em montar com precisão essas partes nas relações espaciais desejadas, com Claude 3.5 demonstrando melhor desempenho, particularmente na auto-correção de suas saídas. Este estudo contribui para pesquisas em andamento sobre a avaliação das forças e fraquezas de sistemas de IA prontos para uso em realizar tarefas inteligentes que requerem conhecimento específico de disciplinas. Os resultados destacam o potencial de sistemas de IA habilitados por linguagem para atuarem como assistentes técnicos colaborativos no processo de design arquitetônico.
Huang et al. (Terça,) estudaram essa questão.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: