تم التحقيق في العاطفة في إشارات الصوت الصوتية، كما تم توليدها بواسطة تقنيات تحويل النص إلى كلام (TTS)، لصياغة نظرية للتعبير لتصميم واجهة المستخدم. تم تحديد المعايير العاطفية باستخدام علامات الوسم، وتم تعديل الصوت الناتج بشكل إضافي باستخدام تقنيات المعالجة اللاحقة. ثم تم تطوير برنامج لربط مُولد TTS مختار بمحرك التعرف على الكلام التلقائي (ASR)، مما أسفر عن إنشاء روبوت دردشة قادر على التحدث والاستماع. باستخدام هذين النظامين الفرعيين من الصوت الاصطناعي، استكشف الباحثون مضامين فنية ونفسية لكل من العاطفة الكلامية الاصطناعية. كانت أهداف التحقيق متعددة التخصصات، مع اهتمام في التكوين الموسيقي، والتواصل التكميلي والبديل (AAC)، وتطبيقات الإعلانات الصوتية التجارية، والتفاعل بين الإنسان والحاسوب (HCI)، والذكاء الاصطناعي (AI). تشير الأعمال الجارية إلى وجود أنطولوجيا متعددة التخصصات ناشئة للأصوات الاصطناعية. وكأحد نتائج الدراسة، يتم اقتراح أدوات HCI للتعاون المستقبلي.
درس باوليتو وآخرون هذا السؤال.