Darius Baruo
19 de dez. de 2025 02:12
A Together AI anuncia a integração dos modelos Rime Arcana v2 e Mist v2 para melhorar as capacidades de conversão de texto para fala, oferecendo maior expressividade e controlo de pronúncia para aplicações empresariais.
A Together AI introduziu dois modelos avançados de conversão de texto para fala (TTS) Rime, Arcana v2 e Mist v2, na sua plataforma, aprimorando as suas ofertas de computação nuvem nativa de IA. Estes modelos, conforme relatado pela Together AI, pretendem fornecer soluções de voz de nível empresarial com maior expressividade e precisão de pronúncia.
Avanços na Tecnologia TTS
O Arcana v2 e o Mist v2 são concebidos para se integrarem perfeitamente com os modelos de linguagem de grande escala (LLM) e sistemas de conversão de fala para texto (STT) existentes, permitindo aos utilizadores gerir a sua infraestrutura de tecnologia de voz de forma mais eficiente. Os modelos estão alojados na infraestrutura de computação nuvem dedicada da Together AI, garantindo baixa latência e elevada fiabilidade essenciais para aplicações empresariais.
Arcana v2: Expressividade Conversacional Aprimorada
O Arcana v2 é adaptado para expressividade, oferecendo mais de 40 vozes em múltiplos idiomas e dialetos para atender a diversos cenários de atendimento ao cliente. É particularmente eficaz em ambientes que exigem capacidades conversacionais diferenciadas, como vendas e suporte, onde demonstrou melhorar métricas como taxas de conversão de vendas e sucesso de chamadas.
Mist v2: Precisão na Pronúncia
O Mist v2 concentra-se na pronúncia determinística, essencial para aplicações de alto volume onde a consistência é crítica. Este modelo permite aos utilizadores definir a pronúncia uma vez, garantindo uniformidade em diferentes vozes e plataformas. Tal precisão é crucial em setores como a saúde e as finanças, onde a comunicação precisa é vital.
Impacto nas Aplicações Empresariais
Ambos os modelos já estão implementados em vários setores, desde empresas Fortune 500 até startups. A capacidade do Arcana v2 de aprimorar a interação conversacional levou a melhorias significativas no envolvimento do cliente. Entretanto, a fiabilidade do Mist v2 no controlo de pronúncia suporta ambientes de alto risco, como sistemas de atendimento ao cliente e resposta de voz interativa (IVR).
Infraestrutura e Conformidade
A Together AI fornece uma infraestrutura robusta que suporta estes modelos, com recursos de GPU dedicados e conformidade com os padrões SOC 2 Type II e HIPAA. Esta configuração garante que as empresas possam implementar soluções de voz que cumprem requisitos regulamentares rigorosos, mantendo alto desempenho e disponibilidade.
Perspetivas Futuras
Com a integração destes modelos, a Together AI continua a avançar a sua plataforma, oferecendo um conjunto abrangente de soluções de voz que atendem às variadas necessidades das empresas. Este desenvolvimento marca um passo significativo na evolução das tecnologias de voz impulsionadas por IA, prometendo interações mais naturais e eficazes em sistemas automatizados.
Fonte da imagem: Shutterstock
Fonte: https://blockchain.news/news/together-ai-integrates-rime-voice-models-enhanced-tts-solutions


